DeepSeek和智能体的推出,带火了整个人工智能市场,使得端测大模型本地化部署成为可能。具身智能机器人在不同场景下的开始落地,例如北京人形机器人马拉松的开跑,标志具身智能开始正式融入人们生活的日常。但具身智能产业飞速发展之际,仍面临诸多问题,作为上游的芯片行业如何去面对和解决?
“具身智能的本质是‘大脑+小脑+感知系统’的协同进化。当前,尽管DeepSeek等大模型已显著提升机器人的认知能力,但物理世界的交互仍受限于感知精度与执行效率。”在第十五届松山湖中国 IC 创新高峰论坛 “具身智慧机器人” 主题论坛上,上海为旌科技有限公司市场总监黄智发表《VS859:面向具身智能的高性能 “感算控” 一体化芯片》演讲,深度解析了具身智能产业痛点,为智能机器人落地提供关键算力支撑方案。
上海为旌科技有限公司市场总监 黄智
具身智能是从 “类人” 到 “专用” 的产业突围
“具身智能是人工智能与机器人技术交汇的必然产物,也是 AI 从‘云端认知’迈向‘物理执行’的关键跨越,朝着智能‘人’方向发展。” 黄智在演讲中指出,当前具身智能正从早期依赖人类指令的 “结构驱动” 阶段,向具备自主感知决策的 “算法驱动” 阶段进化,整体处于 L3(环境感知)向 L4(任务推理)转化的关键期。
机器人不再只是执行预设任务的工具,而是开始具备自主感知、分析、决策和执行的能力,逐步适应复杂、未知的环境。
以 2024 年亦庄人形机器人马拉松为例,尽管机器人已能完成复杂运动,但仍需人工辅助处理辅助降温、换电池,甚至偏离赛道等基础问题,“这表明完全类人化的具身智能尚未成熟,而聚焦特定场景的‘专用智能体’—— 如工业巡检机器人、农业作业机械臂等,才是未来几年产业落地的核心方向。” 黄智说道。
谈及产业挑战,黄智强调三大痛点:感知层虽已实现多模态融合(视觉、雷达、触觉等),但时序同步精度与极端环境适应性仍需突破;认知层依赖大模型带来的知识储备,但在复杂语义理解、场景动态决策等方面仍处初级阶段,“人类积累数十亿公里自动驾驶数据才实现 L2+,通用机器人的数据积累差距更大”;执行层则面临低延时控制、安全可靠交互的严苛要求。
“具身智能的本质是‘大脑(认知)+ 小脑(控制)+ 感官(感知)’的协同进化,需要芯片层面实现三者深度融合。”他总结道。
VS859 芯片的 “感算控” 一体化架构
针对上述挑战,为旌科技在 2024 年北京安博会推出的 VS859 芯片,以 “高性能、超均衡、全场景” 为核心,打造端侧智能核心算力平台:
- 极致感知:构建全天候环境 “数字眼”
芯片集成自研 “瑶光Ⓡ” 全自主 ISP,支持 8 路摄像头并行接入(可扩展至 16 路),实现 1.2G 像素 / 秒处理能力,支持 8K@30fps 超高清编码与 360° 全景拼接,即使在星光级微光、140dB 超宽动态等极端场景下,仍能通过 RAW 域 3DNR 降噪与局部色调映射(LTM)技术,确保 “亮区不过曝、暗区看得清”,为机器人提供全天候精准环境感知。
- 异构计算:释放大模型端侧部署潜力
硬件架构采用 “8 核 A55+2 核 NPU+2 核 DSP+2 核 GPU” 多核异构设计,CPU 算力达 1.5GHz,NPU 算力 6TOPS@INT8,支持 INT8/INT16/FP16 混合精度量化,尤其针对 Transformer 架构优化,相比主流同档位芯片实现 6 倍计算效率提升,轻松承载端侧 BEV 感知、大模型轻量化部署等复杂任务。自研 “天权 TM” NPU 支持 200 + 算子可编程,可自定义扩展神经网络层,适配机器人视觉导航、手势识别等差异化算法需求。
- 低时延协同:打造毫秒级控制闭环
通过硬件级通路优化,实现从图像采集到 NPU 推理、CPU 决策的端到端时延控制在 10 毫秒级,满足机器人实时避障、精准抓取等动态控制需求。支持 TSN(时间敏感网络)与 CANFD 等工业级通信协议,保障多传感器时序同步与数据安全交互,构建 “感知 - 推理 - 执行” 高效闭环。
- 场景适配:从工业到消费的全领域覆盖
VS859 典型方案支持巡检无人机、服务机器人、机器狗等设备,可接入激光雷达、超声波传感器、IMU 等多模态外设,实现环境融合定位、路径规划与动态决策。在智慧城市领域,其 8K 超高清编码与行为分析能力,可赋能人脸布控、车辆轨迹跟踪;在消费电子场景,支持全景相机、直播设备等快速落地,真正实现 “一芯多用”。
为旌科技的 “端侧智能” 突围之路
作为 2020 年成立的国产芯片新势力,为旌科技汇聚来自海思、中兴微、高通等企业的资深团队,聚焦高端智能感知 SoC 研发,已形成覆盖智能驾驶、智慧城市、机器人的产品矩阵。VS859 的量产,标志着我国在端侧具身智能芯片领域突破国外垄断,实现从 “跟跑” 到 “并跑” 的跨越。
为旌科技认为,针对特定场景的小型化智能体,将是未来几年能够真正产业落地的方向。这些智能体能够在特定场景中自主感知和分析信息,执行特定任务,如工业智造、农业智造、智慧城市等领域的巡检、监控、数据采集等。与之相对的是,目前具身智能在感知层已接近成熟,多模态融合实现产业化,但在认知层仍处于初级阶段。大模型如DeepSeek虽使机器知识库超越人类,但逻辑、认知和理解能力仍需进一步发展,尤其在不同场景下对同一信息的识别和理解方面,仍面临诸多挑战。
“所以我们不追求‘大而全’的通用芯片,而是聚焦端侧场景,让每一颗芯片都成为智能体的‘神经中枢’。” 黄智表示,未来为旌科技将持续深耕 AI 计算、异构架构与高能效设计,计划 2025 年推出支持更大模型部署的迭代产品,助力 “万物智能” 时代加速到来。
