芯流独家:瑞芯微开发端侧算力芯片,AloT市场保卫战打响

【摘要】据知情人士透露,瑞芯微正开发一款代号为 " 贡嘎一号 " 的端侧大模型算力芯片,采用 Wafer on Wafer ( 3D 堆叠 ) 的结构设计。
值得关注的是,该芯片带宽相较于目前主流端侧芯片带宽指标有明显提升。
瑞芯微开发这一带宽性能芯片,旨在应对视觉、智能座舱等领域客户被竞争对手蚕食的潜在风险,是其巩固 AIoT(智能物联网)市场的关键一步。
以下为正文:
据知情人士透露,瑞芯微正开发一款代号为 " 贡嘎一号 " 的端侧大模型算力芯片,采用 Wafer on Wafer ( 3D 堆叠 ) 的结构设计。
该产品最核心的亮点在于芯片带宽。
据悉,该芯片可以覆盖 3B 至 7B 范围内的端侧大模型。
从技术上看,芯片运行端侧大模型主要取决于两大指标。
其中,算力决定了大模型首次计算的延迟程度,算力越大延迟往往越低,而后续的计算与输出基于初次计算的积累,对算力及数据量要求并不高。
此时,带宽成为决定大模型后续输出速度的另一核心指标。
该指标关乎存储模块与芯片间互联的性能,决定从 DDR 接口到计算单元缓存的速度。
目前,主流端侧芯片带宽多为 100G,瑞芯微的带宽有明显提升,就该指标来看,瑞芯微正在开发的端侧芯片具有较高的市场竞争力,而具体性能表现,还要看后续市场应用情况。
那么,瑞芯微为何要卷带宽呢?
从业务布局来看,瑞芯微在 AIoT(智能物联网)领域深耕多年,其 RK3588 系列芯片广泛应用于摄像头、车载座舱、工业控制等领域。
然而,随着 AI 大模型向端侧渗透,市场对于大模型实时处理与快速反应的能力提出了更高要求,瑞芯微的市场份额受到业内部分企业的冲击。
尽管公司在短时间内满足车规级端侧芯片的性能要求,但凭借着高带宽带来的输出效率提升,或可巩固原有视觉及端侧座舱领域的客户。
业内人士表示,高带宽端侧芯片的成本往往较高,瑞芯微的芯片可降低部分成本。
端侧芯片的竞争已经从单纯算力比拼,转向算力与带宽的综合较量。
瑞芯微能否凭借带宽芯片稳住市场份额,还要看市场的真实反馈。