“标记化(Tokenization)”为 “将传感器模态转化为神经编码的过程”,其核心价值在于将图像、语音等多模态数据归一化为统一的低维向量表示,实现跨设备高效传输与处理。

多模态AI是当下的热门概念,其结合了文本、语音、图像、视频、传感器数据、3D环境感知和图形等多种模态,通过标记化后送入大语言模型(LLM),可以实现更自然、高效的处理。

“通过将传感器数据转化为统一的神经编码(Token),可穿戴设备有望突破算力与带宽瓶颈,成为多模态 AI 生态的核心交互节点”。在 4 月 16 日举办的芯原股份可穿戴专题技术论坛上,芯原 NPU IP 研发副总裁查凯南发表《分布式神经级联中的图像标记化》主题演讲,深度解析 “神经级联” 架构如何通过图像标记化(Tokenization)技术,实现端侧设备与云端 / 边缘端的高效协同计算 。

芯原 NPU IP 研发副总裁查凯南

图像标记化:从数据采集到神经编码

查凯南首先定义 “标记化(Tokenization)”为 “将传感器模态转化为神经编码的过程”,其核心价值在于将图像、语音等多模态数据归一化为统一的低维向量表示,实现跨设备高效传输与处理。他以经典视觉模型为例:

  • ResNet 等卷积网络通过特征提取生成图像标记,为目标检测、分割等任务提供高层语义表示;
  • 自动编码器(AutoEncoder通过压缩编码,在保持关键信息的同时减少数据量,实现 “传输功耗与存储容量的双重优化”。

这种技术突破使多模态 AI 基础模型(如谷歌 PaliGemma)能够高效处理跨模态数据:SigLIP 视觉编码器将图像转化为 Token,与 Gemma 语言模型的文本 Token 融合,最终实现‘拍照的人躺在海边吊床’等复杂场景的自然语言理解”,展现了标记化技术在多模态交互中的核心作用。

神经级联架构:端云协同实现算力分配

针对大模型算力需求与端侧设备限制的矛盾,查凯南介绍了 “分布式神经级联”方案:通过轻量化门控模型(Gating Model)在端侧进行数据筛选,仅将有效 Token 传输至边缘或云端,形成 “端侧感知 - 边缘决策 - 云端推理” 的三级协同架构。

端侧预处理方面,可穿戴设备搭载轻量级 Token 化模型(如蒸馏后的学生模型),实时检测环境信息(如 “是否存在动物”),仅向云端传输有效 Token,减少无效数据传输。实测显示,该机制可降低 70% 的网络带宽消耗,适配 AR 眼镜等低功耗设备。

跨设备协同方面,以谷歌智能家居生态为例,摄像头、手表、眼镜等端侧设备通过 Token 化技术统一数据格式,边缘服务器基于门控模型动态分配算力,实现 “本地设备快速响应 + 云端复杂推理” 的无缝协作。

神经级联可以协调边缘设备和云端设备,实现新的GenAI体验。芯原与谷歌合作的Open Se Cura项目已验证该方案的可行性。通过RISC-V架构的Kelvin处理器(256+ MACs/Cycle)与VIP9X00系列NPU的协同,实现了从端侧AR眼镜到云端服务器的无缝衔接。

查凯南强调,“这种架构让端侧设备从‘数据采集器’升级为‘智能过滤器’,显著提升系统整体能效比”

如何从IP产品到技术落地

查凯南表示,芯原致力于通过 “硬件 IP + 软件框架”双重布局,推动标记化技术商业化落地。

在端云协同上,芯原的 IP 矩阵包括:

  • 端侧的VIP9X00 系列 NPU:支持 40TOPS 算力(适配 7B 参数模型)至 160TOPS(支持 70B 模型),支持INT4/INT8量化,加上DECNano数据压缩技术可满足从智能手表到 AI 眼镜的差异化算力需求;
  • 边缘侧的VIP9X00CC异构IP(NPU+GPGPU),提供​​3D堆叠内存架构​,满足256TOPS算力需求;
  • 云端​​的CC9X00TC-MP训练芯片,支持Transformer模型分布式训练。

据悉芯原积极推动Open Se Cura 生态计划,联合谷歌构建端云协同开发框架,提供从 Token 化模型蒸馏、量化到跨设备通信协议的全套工具链。典型案例中,图像 Token 传输量较原始数据压缩 90% 以上,端云协同延迟控制在 20 毫秒以内,为实时翻译、工业巡检等场景提供技术支撑。

行业挑战与未来方向

面对分布式神经级联的技术落地,查凯南坦言三大挑战:

  1. 算力与能效平衡:边缘设备需在无 DDR 内存条件下运行轻量化模型,依赖稀疏化、低比特量化等技术进一步压缩模型规模;
  2. 软件生态统一:需定义跨设备 API 标准,解决不同品牌终端(如手表、眼镜、手机)的协同协议兼容性问题;
  3. 数据安全与隐私:在 Token 传输过程中引入 CHERI 安全扩展等技术,确保用户数据在端云交互中的安全性。

另外,​模型碎片化需要不同设备需适配多样化的压缩与蒸馏策略;硬件异构性​需要考虑从RISC-V到ARM架构的兼容性问题;生态协同​上则要考虑如何建立统一的API标准与数据交换协议。

展望未来,他指出 “标记化技术将推动可穿戴设备从‘功能孤岛’融入‘分布式 AI 网络’,成为连接物理世界与数字生态的神经节点”。随着芯原 端侧感知、移动端的VIP9X00系列和云端的CC9X00TC架构在客户项目中的落地,2025 年有望成为端云协同 AI 大规模商用的元年。

责编:Luffy
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
从“Perception AI”(感知AI)到“Agentic AI”(代理式AI),人工智能发展至今,已完成三次重大技术范式革新。展望未来,物理智能(Physical AI)更将打破数字与物理世界的边界,赋予AI影响现实环境的能力。
整体来看,特朗普政府的AI芯片出口规则调整本质是通过 “技术霸权+贸易保护” 重塑全球贸易秩序。
地缘政治动荡风险是另一个关键挑战。特朗普政府的“美国优先”政策加剧了市场的不确定性,特别是在中美贸易摩擦和技术封锁背景下,全球半导体供应链的稳定性受到严重威胁。
亚马逊Alexa、谷歌助手和苹果Siri等消费者语音平台的兴起从根本上重塑了人们对语音交互的期望。这些在智能家居和个人设备中无处不在的平台催生了对汽车中对话式直观语音系统的需求,而免提交互已成为新车买家对安全性和便利性的期望。
NVIDIA前不久发布的CPO硅光芯片,今年下半年就要量产了。它对AI数据中心而言,究竟有什么用?
面向人工智能数据中心的电力电子技术正在迅速发展,以满足日益复杂的工作负载,同时提高能效。
这是迄今为止联想笔记本电脑最小体积的65W INBOX电源适配器……
在2025年一季度,SK海力士凭借在HBM领域的绝对优势,终结三星长达四十多年的市场统治地位,以36.7%的市场份额首度登顶全球DRAM市场第一。
新型CoolSiC™ JFET产品系列拥有极低的导通损耗、出色的关断能力和高可靠性,使其成为先进固态保护与配电系统的理想之选。
全新PXI与PXIe仿真模块支持高达130,000转/分钟的旋转速度,满足新一代伺服系统测试需求
博主数码闲聊站爆料,2026年苹果将带来屏下摄像头技术,iPhone 18系列和折叠屏iPhone将会首发搭载。他还爆料,折叠屏iPhone也是2026年登场,出货量规划是千万级。需要指出的是,搭载屏
编者语:后台回复“入群”,加入「智驾最前沿」微信交流群随着自动驾驶越来越具像化,政府监管机构也出台多项政策,以完善道路测试许可、技术评估和安全事故处理流程,为产业发展提供了明确的制度保障。但在自动驾驶
2025上海车展前瞻:自主新势力高阶智驾新品密集发布合资逐步布局高端智能产品2025上海车展前瞻报告:创新智联 自主竞逐高端2025年上海车展展前洞察报告2025年上海车展展前指南分析报告2025上海
  实验名称:铁电陶瓷大信号径向谐振响应测试   实验目的:研究大信号驱动交流电场对Sm-PMN-PT的影响   测
2025年汽车行业报告汇总(点击进入)电子水阀在电动汽车的热管理系统中起了调节冷暖水流混合比的作用,是电动汽车的一个重要部件。电子水阀包括一个容器、一个电磁阀体和一个可控制的电磁线圈。当电流流经电磁线
  实验名称:多层陶瓷的振动性能研究   测试设备:电压放大器、波形发生器、机械振动测试仪、激光发射器、计算机等。  &ems
报告摘要:三阶段跨越式发展,并购整合驱动全球扩张。均胜电子的发展历程可划分为“内生积累-并购扩张-技术深耕”三大战略阶段,通过精准的资本运作与全球化整合,实现从区域汽零供应商到全球汽车安全与电子龙头的
这两天,关于苹果的爆料可真不少,其中就包括传闻已久的折叠屏iPhone,爆料称将在2026年发布。日前,知名科技记者马克·古尔曼称,与其他折叠屏手机相比,折叠iPhone将具备两大关键优势。首先,折叠
在半导体制造的早期阶段,芯片制造主要遵循从电路设计到生产制造的单向线性流程。各个关键步骤间的信息传递和交接方法相对简单直接。例如,物理设计、掩膜合成、掩膜板写入、光刻优化、工艺优化、检测与量测以及最终
  超声焊接是一种广泛应用于工业生产中的加工技术,它通过高频振动引发的摩擦产生热量,将材料连接在一起。高压功率放大器在这一领域中扮演着至关重要的角色,它们提供了必要的电能和控制,以