从“Perception AI”(感知AI)到“Agentic AI”(代理式AI),人工智能发展至今,已完成三次重大技术范式革新。展望未来,物理智能(Physical AI)更将打破数字与物理世界的边界,赋予AI影响现实环境的能力。

人工智能发展至今,已完成三次重大技术范式革新。从早期聚焦语音、图像识别的“Perception AI”(感知AI),到掀起内容创作革命的“Generative AI”(生成式AI),再到如今能够模拟人类决策的“Agentic AI”(代理式AI),技术迭代的脚步从未停歇。展望未来,物理智能(Physical AI)更将打破数字与物理世界的边界,赋予AI影响现实环境的能力。

而每一次技术跃迁,都伴随着计算模式的深刻变革。从以AlexNet为代表的传统模型依赖检索式计算,到ChatGPT开启的生成式时代,通过复杂算法架构动态生成内容的这种转变,对算力提出了更高要求。

正如NVIDIA首席执行官黄仁勋所言,AI领域正迎来“测试阶段的Scaling Law”革命——在模型推理过程中,根据任务复杂度动态调配计算资源成为新趋势。比如,面对复杂问题时自动延长推理时间,或通过多轮推理生成多个候选答案,再从中筛选最优解。尤其在处理百万级Token的复杂决策任务,以及客服咨询、医疗诊断等场景时,算力需求呈指数级增长,这类场景也成为企业AI落地的核心战场。

为应对技术演进带来的挑战,黄仁勋在GTC 2025上强调,NVIDIA将持续推进全栈优化战略。在技术层面,依托CUDA-X工具链与Megatron框架,构建从数据预处理到推理的全流程加速体系,显著降低单位Token的计算成本;在基础设施层面,不断完善可扩展的算力架构,为企业级客户提供稳定、高效的AI服务支持。

扩大商业版图,加速物理AI普及

从当前AI发展路径来看,当AI开始运用思维链进行逐步推理与路径规划时,就不再局限于生成单个Token或单词,而是输出包含推理步骤的单词序列,这使得生成的Token数量出现暴增,甚至增加百倍以上。显然,面对呈指数级攀升的计算需求和日益增长的计算成本,唯有通过全栈创新才能降低成本/Tokens。

新一代NVIDIA Cosmos世界基础模型(WFM)的重大更新,无疑为Physical AI开发引入了一个开放式和可完全定制的推理模型,并为开发者提供了前所未有的世界生成控制能力。

“使用 Omniverse来调节Cosmos,并通过Cosmos生成无限数量的环境,从而支持我们能够创建既扎根于现实、由我们掌控,同时又在系统上可以实现无限的数据。”黄仁勋表示,NVIDIA始终致力于推进先进模型开源,并融合合成数据生成、仿真与训练技术,积极推动AI应用的更广泛落地。

在GTC 2025大会上,NVIDIA发布的两大重磅成果:全球首个开源人形机器人基础模型Isaac GR00T N1,以及与GE医疗联合打造的医疗AI仿真平台,标志着Physical AI的发展新方向——将物理规律深度融入AI训练,利用合成数据弥补人类经验的稀缺性,助力机器人不仅能感知世界,更能理解世界运行机制,推动AI技术向物理世界的纵深发展。

具有推理功能的开放NVIDIA Llama Nemotron模型系列其实也很值得一提。这一推理模型系列是基于Llama模型构建的,能够提供按需AI推理功能。NVIDIA在后训练期间对该推理模型系列进行了增强,以提升多步数学运算、编码、推理和复杂决策能力。

它可以在任何地方运行,包括DGX Spark、DGX Station以及OEM制造的服务器上,甚至可以将其集成到任何Agentic AI框架中。NVIDIA方面希望借此为开发者和企业提供业务就绪型基础,从而构建能够独立工作或以团队形式完成复杂任务的高级AI智能体。

赋予人形机器人通用与推理技能

作为全球首个开源且可定制的基础模型,NVIDIA Isaac GR00T N1支持通用人形机器人实现复杂推理与多样化技能,是NVIDIA一系列可定制模型系列的开篇之作,目前已经面向全球开发者开放。与之同步推出的,还包括全新仿真框架与技术蓝图:用于合成数据生成的Isaac GR00T Blueprint,与Google DeepMind、Disney Research共同开发的开源物理引擎Newton。

全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1

按照黄仁勋的说法,“机器人是下一个10万亿美元的产业”。预测到2030年年底,全球将面临至少5000万劳动力短缺的问题。借助NVIDIA Isaac GR00T N1以及新的数据生成和机器人学习框架,全球机器人开发者将开启AI时代的全新篇章。

GR00T N1基础模型采用双系统架构,灵感源自人类认知机制:“系统 1”作为快速反应的动作模型,模拟人类本能与直觉;“系统 2”则承担深度决策任务,由视觉语言模型驱动,可对环境和指令进行推理规划,再由“系统 1”将规划转化为精准的机器人动作。其中,“系统 1”基于人类演示数据与Omniverse生成的海量合成数据训练,使其具备强大的适应性。

在实际应用中,GR00T N1展现出卓越的通用任务处理能力,涵盖单手/双手抓取、物体转移、多步骤复杂任务等操作,适用于物品搬运、包装质检等多元场景。开发者还可利用真实或合成数据,针对特定机器人与任务对模型进行后训练优化。

在GTC大会上,1X人形机器人基于GR00T N1后训练策略,成功完成室内清理任务,这一成果正是1X与NVIDIA AI协作的结晶。1X Technologies首席执行官Bernt Børnich强调,GR00T N1在推理与技能上的突破,大幅降低了后训练数据需求,Agility Robotics、波士顿动力、Mentee Robotics 和 NEURA Robotics等头部企业已将其纳入开发体系。

为了让机器人学习如何以更高精度处理复杂任务,NVIDIA 还与Google DeepMind、Disney Research展开合作,共同开发开源物理引擎Newton。该引擎基于NVIDIA Warp框架开发,专为机器人学习优化,兼容MuJoCo等主流仿真框架,并计划整合迪士尼物理引擎技术。Disney Research已率先应用Newton推动娱乐机器人平台发展,GTC亮相的星球大战主题BDX机器人便是其成果之一。

此外,应对机器人后训练发展的数据问题,NVIDIA宣布了用于合成运动生成的 NVIDIA Isaac GR00T Blueprint。它基于GR00T-Teleop 和GR00T-Mimic 完成机器人遥操作运动轨迹的采集和扩增,然后通过基于Omniverse与Cosmos Transfer构建的GR00T-Gen 完成数据集的进一步扩增,可通过少量人工演示快速生成海量合成运动数据。

实测数据显示,NVIDIA在11小时内生成了78万个合成轨迹,相当于6500小时或连续九个月的人类演示数据。再将合成数据与真实数据结合后,GR00T N1的性能提升了40%。为进一步为开发者社区提供有价值的训练数据,NVIDIA还将GR00T N1 数据集作为开源物理AI数据集的一部分,通过Hugging Face平台开放下载。

此外,为进一步降低开发门槛,NVIDIA还宣布推出个人AI超级计算机DGX Spark。该系统支持开发者将GR00T N1能力快速拓展至新场景,无需繁琐的自定义编程,为机器人开发者提供了高效便捷的一站式解决方案。

将物理AI引入自主诊断成像开发

在医疗AI领域,NVIDIA与GE医疗达成重磅合作,聚焦自主成像技术创新,重点发力自主X射线技术与超声应用开发。为加速研发进程,GE医疗引入全新的NVIDIA Isaac for Healthcare医疗设备仿真平台。该平台集成预训练模型,结合基于物理的传感器、解剖结构与环境仿真能力,支持GE医疗在虚拟环境中完成自主成像系统的训练、测试与验证,显著提升研发效率。

当前,医疗服务需求与供给间存在巨大缺口。作为最常用的诊断成像手段,超声与X射线检查仍难以覆盖全球近三分之二的人口。在此背景下,为成像系统赋予机器人能力成为扩大医疗服务可及性的关键突破口。NVIDIA计划通过Isaac for Healthcare平台,协助更多客户搭建仿真环境用例,让机器人系统在高度还原现实场景的虚拟空间中学习技能,突破手术等复杂医疗场景难以复现的训练难题。

NVIDIA Isaac for Healthcare依托NVIDIA DGX、Omniverse和 Holoscan三大机器人计算平台构建,是专为医疗领域设计的物理AI平台。它内置优化后的医疗机器人AI模型,通过强化视觉与语言处理能力,实现医疗场景下的智能感知、决策与行动;同时提供高精度仿真框架,支持开发者构建医疗环境的数字孪生,自由导入定制传感器、器械及解剖结构,有效解决医疗传感器仿真选项匮乏的问题。

此外,借助边缘AI计算平台NVIDIA Holoscan,平台可实现机器人的实时决策,显著缩小虚拟仿真与临床实践间的差距,加速医疗机器人的数字原型设计。

该平台具备多尺度仿真能力,可模拟从微观组织结构到完整医院设施的各类场景。通过反复训练,机器人系统能够掌握手术室应急处理、辅助医生决策及患者护理等复杂技能。NVIDIA Isaac for Healthcare正通过仿真复杂医疗场景、优化手术机器人、内窥镜及心血管介入等应用,推动医疗机器人解决方案的快速落地。

目前,Moon Surgical、Neptune Medical和Xcath等机构已率先应用NVIDIA Isaac for Healthcare平台,实现仿真工具、传感器与机器人系统的无缝集成。Ansys、Franka、ImFusion等生态合作伙伴也已启动平台功能部署,共同推动医疗AI技术的创新发展。

结语

从全栈优化战略应对技术挑战,到开源模型与创新平台推动物理AI在机器人和医疗领域落地,显然,NVIDIA这种“通用+垂直”的并行策略,既保证了技术底座的可扩展性,又能在细分市场快速建立竞争优势,为物理AI技术的发展与应用拓展了广阔空间。

我们有理由相信,随着越来越多开发者和企业基于NVIDIA的技术开展创新实践,物理AI 将深度融入各行各业,在提升生产效率、改善医疗服务、丰富生活体验等方面发挥巨大作用,引领人类社会迈向智能化的新时代。

责编:Lefeng.shao
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
英伟达已正式通知中国显卡厂商,原计划于第二季度上市的 RTX 5090 D 将全面暂停供货,已下单的未交付芯片也被取消。
根据 TrendForce 最新报告,AMD 此次调整主要基于三星 SF4X 工艺的良率问题。
面对美国商务部设定的 “算力阈值”(单精度浮点算力≤1.12 PFLOPS),英伟达陷入两难困境。是继续沿用 GPU 架构,还是向 ASIC路线?
此次收购将帮助 OpenAI 在竞争激烈的 AI 编程助手市场中进一步巩固其地位,并整合技术资产以应对市场竞争。
当前,国内已形成涵盖训练、推理、图形渲染的全栈 GPU 产品矩阵,主要厂商及技术突破如下……
生成式 AI 技术推动产业格局重塑,大语言模型等成为技术发展的核心方向。AI从云端向端侧延伸,对高性能、低延迟、本地处理能力的需求日益迫切,也折射出了当前算力产业面临三大痛点……
这是迄今为止联想笔记本电脑最小体积的65W INBOX电源适配器……
在2025年一季度,SK海力士凭借在HBM领域的绝对优势,终结三星长达四十多年的市场统治地位,以36.7%的市场份额首度登顶全球DRAM市场第一。
新型CoolSiC™ JFET产品系列拥有极低的导通损耗、出色的关断能力和高可靠性,使其成为先进固态保护与配电系统的理想之选。
全新PXI与PXIe仿真模块支持高达130,000转/分钟的旋转速度,满足新一代伺服系统测试需求
编者语:后台回复“入群”,加入「智驾最前沿」微信交流群随着自动驾驶越来越具像化,政府监管机构也出台多项政策,以完善道路测试许可、技术评估和安全事故处理流程,为产业发展提供了明确的制度保障。但在自动驾驶
2025上海车展前瞻:自主新势力高阶智驾新品密集发布合资逐步布局高端智能产品2025上海车展前瞻报告:创新智联 自主竞逐高端2025年上海车展展前洞察报告2025年上海车展展前指南分析报告2025上海
核心观点2024 年公司营收101.6 亿元,同比增长43%。公司2024 年实现营收101.6亿元,同比增加42.3%,归母净利润6.5 亿元,同比增加40.1%。公司2024Q4 实现营收33.2
▲ 点击上方蓝字关注我们,不错过任何一篇干货文章!本次直播,您将了解到:1、基于 DLP 技术的新型双焦段 AR HUD 产品介绍 • 通过 DLP 车规级芯片组实现近场+远场的双焦段融合显示,在挡风
近日,一位客户在咨询电路板抄板服务时引发了一场关于行业收费标准的激烈讨论。客户表示需要将一块电路板"抄出来",询问收费标准,随即有同行好友给出报价:反推原理图按每个引脚(pin)2.5元收费,若需同时
最近,ARM重大安全漏洞不断被发现。由于国内ARM阵营IC设计厂商普遍从ARM公司购买技术授权,核心技术和源代码源自ARM,导致ARM自身携带的大量先天硬件漏洞后门无法通过软件修复,从而让国产ARM 
2025年汽车行业报告汇总(点击进入)电子水阀在电动汽车的热管理系统中起了调节冷暖水流混合比的作用,是电动汽车的一个重要部件。电子水阀包括一个容器、一个电磁阀体和一个可控制的电磁线圈。当电流流经电磁线
▲ 点击上方蓝字关注我们,不错过任何一篇干货文章!据外媒报道,近日,一名美国议员计划在未来几周内提出一项立法提案,旨在建立机制以核实英伟达等公司生产的人工智能芯片销售后的实际位置。这一旨在监控芯片流向
2025年5月6日,华尔街券商Benchmark发布了一份关于嘉楠科技(CAN.US)的深度研究报告,并宣布正式将嘉楠科技纳入其研究范围,给予“买入”评级,目标价定为每股3美元,较目前股价高出5倍。
根据Counterpoint市场监测服务的最新研究,2025年第一季度,全球智能手机市场收入同比增长3%,与出货量变化相同;全球智能手机平均售价(ASP)同比增长1%至364 美元,创下一季度历史新高