全球AI产业正面临前所未有的“算力悖论”。当ChatGPT掀起的大模型热潮将云端算力需求推向极致时,物理世界的刚性约束正在成为无法逾越的鸿沟。国际能源署(International Energy Agency)发布的《电力2024》报告显示,2026年全球数据中心的最高总用电量预计达1.05万亿千瓦时(kW·h),即超过1万亿度电,几乎等同于日本全年用电量。而模型训练成本同样逐年飙升。
这种不可持续的发展模式,正在将AI产业推向临界点。
“我们正目睹一场算力供给与场景需求的结构性错配。”爱芯元智创始人、董事长仇肖莘博士在与《电子工程专辑》的对话中说。事实上,当科技巨头沉迷于万亿参数竞赛时,工业现场的高精度质检设备仍在为几毫秒的延迟苦苦挣扎。
爱芯元智创始人、董事长仇肖莘博士
她认为,这种矛盾在三个维度表现得尤为突出:
- 首先是能耗墙的制约。传统GPU架构在诸多边缘场景的能效表现堪忧。
- 其次是实时性困境。在辅助驾驶、工业控制等关键领域,哪怕毫秒级的云端往返延迟,也可能导致重大事故。
- 更棘手的是数据主权问题,欧盟GDPR等法规的落地,使得医疗、金融等敏感数据越来越难以自由流动。
行业内曾有一个形象比喻,“这就像给短跑运动员穿上潜水服”。精准揭示了问题本质。云端AI的“重型装备”在边缘场景严重水土不服,而行业却迟迟未能提供系统性的解决方案。
究其根源,仇肖莘将其归结于产业长期存在的三大认知误区:将算力规模等同于智能水平、忽视物理世界的约束条件、低估场景差异化的技术挑战。这意味着,绝大多数企业仍在用错误的方式解决错误的问题。
结构性困境正在催生产业链的自我革命。
当荷兰半导体巨头恩智浦斥资3.07亿美元收购Kinara,高通接连吞下Edge Impulse和MovianAI,头部企业战略动作传递的讯号再清晰不过,边缘计算已从技术补充升级为战略必需。
破局之道:边缘原生的技术范式创新
产业变革往往始于技术范式的颠覆。
在边缘计算领域,仇肖莘认为,这场革命的核心是从“云端裁剪”到“边缘原生”的理念转变。TinyML技术的兴起颇具代表性。这种能在毫瓦级功耗、KB级存储的极端条件下运行AI模型的技术,正在重新定义智能的边界,爱芯元智认为,“边缘AI芯片是撬动智能世界的新支点”。
范式创新首先体现在架构设计上。传统思路是将云端架构简单压缩,而边缘原生则要求从第一性原理出发重构技术架构。
以爱芯元智的混合精度NPU为例,其采用的算子指令集+可编程数据流架构,是针对AI应用的原生AI处理器,能够高能效的运行AI网络,在工业质检场景实现能效比提升1个数量级。这种“量体裁衣”的设计哲学,与当前不少有识之士提出的“场景性能优先”战略不谋而合。
更深刻的变革发生在算力分配层面。“大小模型协同”趋势正在形成产业共识。大模型负责云端的“慢思考”,小模型专注边缘的实时响应。“爱芯元智推出的AX650N芯片原生支持Transformer架构,正是为了构建这样的协同生态。”仇肖莘说。
而新近发布的边缘智能芯片AX8850,则通过“算子指令集+数据流微架构”设计,将能效比提升至传统GPU的10倍,使AI计算成本降至工业级可接受范围。“这一突破不仅降低了AI落地的门槛,更让边缘设备在有限功耗下实现高性能推理成为可能。”
成熟易用的工具链是另一大突破点。边缘场景的碎片化特征,使得开发效率成为关键瓶颈。Edge Impulse的案例显示,优秀的工具链可将模型部署时间从数月缩短至数天。爱芯元智工具链以及开源社区AXERA-TECH提供的“一小时上手”体验,正是瞄准了这一痛点。
“降低技术门槛的努力,正在加速边缘计算的普惠化进程。”
未来已来:边缘智能的产业新图景
边缘计算的终极价值,在于其重构产业生态的系统性能力。变革不是简单的技术替代,而是整个价值网络的深度重组。行业预测,到2032年边缘AI市场将达396亿美元,其增长动能正来自三个维度的范式转移。
首先是算力分布的灵活化。仇肖莘指出,当高通收购Edge Impulse布局TinyML,爱芯元智的智能模组大规模进入边端设备,这意味着算力正在从集中走向分布。“这种‘算力下沉’趋势正在催生新一代的基础设施范式”。
其次是数据价值的链式释放。“多模态感知+AI计算”垂直整合,实际上构建了数据闭环的飞轮。对此,仇肖莘进一步表示,“爱芯元智的实践表明,通过边端数据持续优化模型,可使边缘设备从执行终端升级为智能节点”。
最具颠覆性的是产业关系的重构。近年来的半导体巨头收购潮,本质上是产业链的垂直整合。按照仇肖莘的看法,业内有两种不同的商业模式,“一种是垂直整合模式,一种是行业分工模式,两种模式肯定会长期并存”。而爱芯元智边缘计算芯片与客户打造的“边缘计算+5G+大模型”生态,则充分展现了行业分工+生态合作的价值重构。
让“边缘”成为下一个十年的主流
当边缘计算遇上AI大模型,更宏大的图景正在展开。爱芯元智的边缘智能芯片已能支持Qwen2、DeepSeek等大模型部署,意味着边缘设备正获得“理解”物理世界的能力。仇肖莘表示,“边缘智能+云端知识的协同范式,很可能重塑下一个十年的产业格局。”
“我们希望当客户想要落地边缘智能时,不但能想到爱芯提供的各种解决方案,同时也能够很方便的获取到相关硬件、软件、解决方案的资源,实现低成本的快速落地,解决客户实际场景中的具体问题”,仇肖莘说。
站在更宏观的视角,这场变革的本质是数字经济与实体经济深度融合。当爱芯元智的芯片在工业车间、智能路侧、医疗设备中大规模落地,当边缘计算成为连接数字世界与物理世界的神经末梢,我们正在见证的不仅是一场技术革命,更是人类生产方式的范式跃迁。
在这个意义上,边缘计算的真正价值,或许才刚刚开始显现。
对话爱芯元智仇肖莘:边缘AI芯片如何成为撬动智能世界的新支点
当巨头们追逐万亿参数大模型时,爱芯元智却选择了一条截然不同的道路。您如何看待当前AI产业的发展态势?
仇肖莘:我们在长三角的工业车间里看到了更真实的AI革命场景,搭载我们边缘智能芯片的质检设备,能以毫米级精度扫描精密部件。这提醒我们,AI的价值重构正在发生:当ChatGPT掀起的算力崇拜遭遇物理世界的刚性约束——功耗、成本、时延……真正的战场在这里。
训练芯片市场已被巨头垄断,爱芯为何选择边缘推理这条赛道?
仇肖莘:这是个生存问题,更是价值判断。全球边缘AI芯片市场规模日益扩大,但大多数方案仍停留在“云端裁剪”阶段。这就像给攀岩运动员穿西服套装。我们必须纠正这种架构错配。边缘侧芯片不仅要计算,更要完成物理世界信息的数字化、智能化转换,这是原生设计理念与裁剪方案的本质区别。
爱芯通元AI处理器的推出似乎印证了这个理念?
仇肖莘:没错。我们基于爱芯通元NPU研发的专用AI处理器,正是通过“算子指令集+数据流微架构”设计,将其能效比提升至传统GPU的10倍,使AI计算成本降到边缘端可接受的范围,在算力密度与能效间找到了一个平衡点。更重要的是,我们提前预判了Transformer趋势,原生支持使其在边缘大模型落地时仍保持能效优势。
您提到“普惠AI”是使命,如何理解这个定位?
仇肖莘:我们的边缘产品矩阵既包含支持被动散热的3T低功耗模组,也具备支持Transformer大模型的百T级边缘服务器芯片,核心在于通过可扩展架构实现“场景定义算力”的产品理念。穿透场景,AI即实现普惠。但必须强调的是,所谓普惠不是低价,而是让客户能快速上手,低成本部署AI。比如我们开源了AXERA-TECH社区,工具链支持一键复现Demo,这才是降低门槛的关键。
但工业IoT等垂直领域存在强烈的定制化需求,如何平衡通用性?
仇肖莘:就像乐高积木,基础算子完备性保障通用性,通过模型参数和结构调整适配场景需求。我们某个行业头部客户的案例就很典型:他们用我们边缘智能芯片部署大模型与轻量化专用模型,实现了万物可搜、可控的智能引擎。这证明“大而精”与“小而强”可以并存。
车载芯片的快速量产令人印象深刻,两年数十万的出货量背后有什么故事?
仇肖莘:共同的技术底座,以及高频迭代场景技术外溢到低频迭代场景。爱芯的核心技术是AI-ISP和混合精度NPU,只要是视觉为主的多模态感知、分析、决策场景中,都是爱芯可以覆盖的应用场景。在边缘计算和终端计算这样高频迭代的场景下打磨成熟的技术,应用到低频迭代的场景中时,能够获得明显的技术领先优势和成熟应用的生态优势。融感科技基于爱芯边缘平台研发的4D雷达融合方案也证明,边缘计算同样在优化汽车感知范式。
您多次强调“场景”,这与传统算力竞赛有何不同?
仇肖莘:云端芯片像重炮集群,而我们是在打造瑞士军刀。当边缘设备开始自主感知——决策——进化时,芯片就不再是算力载体,而是编辑物理世界的数字生命体。
现在,爱芯元智边缘AI计算芯片产品已经在不少领域落地实践。比如立体声环绕产品,就是在我们的边缘芯片平台上实现了可以类比“杜比”音效的VR+AR+AI声音技术。只要戴上普通立体声耳机,就能感受到沉浸式的环绕声效果,非常适合小成本打造虚拟数字家庭影院。
再比如实时翻译机,主播开播时,翻译机能在主播本地录播设备上将内容同步翻译成不同语音,实时性效果非常好,是边缘计算在媒体社交化场景的成功应用案例。
这些案例都在证明,边缘智能是产业效率的“非线性放大器”。
展望未来,边缘智能的终极形态是什么?
仇肖莘:让机器像生命体一样理解物理法则,和物理世界完成互动,这不是科幻。当边缘计算与AI的融合为数据处理装上“高速引擎”,我们就能在靠近物理世界的地方完成实时决策并改造物理世界。这场变革需要跨产业链协作,所以我们正在扩大NPU IP授权,特别是在机器人领域。
最后,作为经历过芯片行业完整周期的科学家、创业者,您想对同行说什么?
仇肖莘:长期主义不是口号。我们坚持为每个细分赛道单独设计芯片,看似耗时,但目标是将每个赛道和场景打穿。当行业从算力比拼转向场景落地能力时,你会发现,那些精准设计的“杠杆支点”,比盲目堆砌的“蛮力”更有价值。
本文为《电子工程专辑》2025年6月刊杂志文章。免费杂志订阅申请点击这里。
- 仇博这篇好多金句,判断也很到位。
