人工智能发展至今,已完成三次重大技术范式革新。从早期聚焦语音、图像识别的“Perception AI”(感知AI),到掀起内容创作革命的“Generative AI”(生成式AI),再到如今能够模拟人类决策的“Agentic AI”(代理式AI),技术迭代的脚步从未停歇。展望未来,物理智能(Physical AI)更将打破数字与物理世界的边界,赋予AI影响现实环境的能力。
而每一次技术跃迁,都伴随着计算模式的深刻变革。从以AlexNet为代表的传统模型依赖检索式计算,到ChatGPT开启的生成式时代,通过复杂算法架构动态生成内容的这种转变,对算力提出了更高要求。
正如NVIDIA首席执行官黄仁勋所言,AI领域正迎来“测试阶段的Scaling Law”革命——在模型推理过程中,根据任务复杂度动态调配计算资源成为新趋势。比如,面对复杂问题时自动延长推理时间,或通过多轮推理生成多个候选答案,再从中筛选最优解。尤其在处理百万级Token的复杂决策任务,以及客服咨询、医疗诊断等场景时,算力需求呈指数级增长,这类场景也成为企业AI落地的核心战场。
为应对技术演进带来的挑战,黄仁勋在GTC 2025上强调,NVIDIA将持续推进全栈优化战略。在技术层面,依托CUDA-X工具链与Megatron框架,构建从数据预处理到推理的全流程加速体系,显著降低单位Token的计算成本;在基础设施层面,不断完善可扩展的算力架构,为企业级客户提供稳定、高效的AI服务支持。
扩大商业版图,加速物理AI普及
从当前AI发展路径来看,当AI开始运用思维链进行逐步推理与路径规划时,就不再局限于生成单个Token或单词,而是输出包含推理步骤的单词序列,这使得生成的Token数量出现暴增,甚至增加百倍以上。显然,面对呈指数级攀升的计算需求和日益增长的计算成本,唯有通过全栈创新才能降低成本/Tokens。
新一代NVIDIA Cosmos世界基础模型(WFM)的重大更新,无疑为Physical AI开发引入了一个开放式和可完全定制的推理模型,并为开发者提供了前所未有的世界生成控制能力。
“使用 Omniverse来调节Cosmos,并通过Cosmos生成无限数量的环境,从而支持我们能够创建既扎根于现实、由我们掌控,同时又在系统上可以实现无限的数据。”黄仁勋表示,NVIDIA始终致力于推进先进模型开源,并融合合成数据生成、仿真与训练技术,积极推动AI应用的更广泛落地。
在GTC 2025大会上,NVIDIA发布的两大重磅成果:全球首个开源人形机器人基础模型Isaac GR00T N1,以及与GE医疗联合打造的医疗AI仿真平台,标志着Physical AI的发展新方向——将物理规律深度融入AI训练,利用合成数据弥补人类经验的稀缺性,助力机器人不仅能感知世界,更能理解世界运行机制,推动AI技术向物理世界的纵深发展。
具有推理功能的开放NVIDIA Llama Nemotron模型系列其实也很值得一提。这一推理模型系列是基于Llama模型构建的,能够提供按需AI推理功能。NVIDIA在后训练期间对该推理模型系列进行了增强,以提升多步数学运算、编码、推理和复杂决策能力。
它可以在任何地方运行,包括DGX Spark、DGX Station以及OEM制造的服务器上,甚至可以将其集成到任何Agentic AI框架中。NVIDIA方面希望借此为开发者和企业提供业务就绪型基础,从而构建能够独立工作或以团队形式完成复杂任务的高级AI智能体。
赋予人形机器人通用与推理技能
作为全球首个开源且可定制的基础模型,NVIDIA Isaac GR00T N1支持通用人形机器人实现复杂推理与多样化技能,是NVIDIA一系列可定制模型系列的开篇之作,目前已经面向全球开发者开放。与之同步推出的,还包括全新仿真框架与技术蓝图:用于合成数据生成的Isaac GR00T Blueprint,与Google DeepMind、Disney Research共同开发的开源物理引擎Newton。
全球首个开源且完全可定制的基础模型 NVIDIA Isaac GR00T N1
按照黄仁勋的说法,“机器人是下一个10万亿美元的产业”。预测到2030年年底,全球将面临至少5000万劳动力短缺的问题。借助NVIDIA Isaac GR00T N1以及新的数据生成和机器人学习框架,全球机器人开发者将开启AI时代的全新篇章。
GR00T N1基础模型采用双系统架构,灵感源自人类认知机制:“系统 1”作为快速反应的动作模型,模拟人类本能与直觉;“系统 2”则承担深度决策任务,由视觉语言模型驱动,可对环境和指令进行推理规划,再由“系统 1”将规划转化为精准的机器人动作。其中,“系统 1”基于人类演示数据与Omniverse生成的海量合成数据训练,使其具备强大的适应性。
在实际应用中,GR00T N1展现出卓越的通用任务处理能力,涵盖单手/双手抓取、物体转移、多步骤复杂任务等操作,适用于物品搬运、包装质检等多元场景。开发者还可利用真实或合成数据,针对特定机器人与任务对模型进行后训练优化。
在GTC大会上,1X人形机器人基于GR00T N1后训练策略,成功完成室内清理任务,这一成果正是1X与NVIDIA AI协作的结晶。1X Technologies首席执行官Bernt Børnich强调,GR00T N1在推理与技能上的突破,大幅降低了后训练数据需求,Agility Robotics、波士顿动力、Mentee Robotics 和 NEURA Robotics等头部企业已将其纳入开发体系。
为了让机器人学习如何以更高精度处理复杂任务,NVIDIA 还与Google DeepMind、Disney Research展开合作,共同开发开源物理引擎Newton。该引擎基于NVIDIA Warp框架开发,专为机器人学习优化,兼容MuJoCo等主流仿真框架,并计划整合迪士尼物理引擎技术。Disney Research已率先应用Newton推动娱乐机器人平台发展,GTC亮相的星球大战主题BDX机器人便是其成果之一。
此外,应对机器人后训练发展的数据问题,NVIDIA宣布了用于合成运动生成的 NVIDIA Isaac GR00T Blueprint。它基于GR00T-Teleop 和GR00T-Mimic 完成机器人遥操作运动轨迹的采集和扩增,然后通过基于Omniverse与Cosmos Transfer构建的GR00T-Gen 完成数据集的进一步扩增,可通过少量人工演示快速生成海量合成运动数据。
实测数据显示,NVIDIA在11小时内生成了78万个合成轨迹,相当于6500小时或连续九个月的人类演示数据。再将合成数据与真实数据结合后,GR00T N1的性能提升了40%。为进一步为开发者社区提供有价值的训练数据,NVIDIA还将GR00T N1 数据集作为开源物理AI数据集的一部分,通过Hugging Face平台开放下载。
此外,为进一步降低开发门槛,NVIDIA还宣布推出个人AI超级计算机DGX Spark。该系统支持开发者将GR00T N1能力快速拓展至新场景,无需繁琐的自定义编程,为机器人开发者提供了高效便捷的一站式解决方案。
将物理AI引入自主诊断成像开发
在医疗AI领域,NVIDIA与GE医疗达成重磅合作,聚焦自主成像技术创新,重点发力自主X射线技术与超声应用开发。为加速研发进程,GE医疗引入全新的NVIDIA Isaac for Healthcare医疗设备仿真平台。该平台集成预训练模型,结合基于物理的传感器、解剖结构与环境仿真能力,支持GE医疗在虚拟环境中完成自主成像系统的训练、测试与验证,显著提升研发效率。
当前,医疗服务需求与供给间存在巨大缺口。作为最常用的诊断成像手段,超声与X射线检查仍难以覆盖全球近三分之二的人口。在此背景下,为成像系统赋予机器人能力成为扩大医疗服务可及性的关键突破口。NVIDIA计划通过Isaac for Healthcare平台,协助更多客户搭建仿真环境用例,让机器人系统在高度还原现实场景的虚拟空间中学习技能,突破手术等复杂医疗场景难以复现的训练难题。
NVIDIA Isaac for Healthcare依托NVIDIA DGX、Omniverse和 Holoscan三大机器人计算平台构建,是专为医疗领域设计的物理AI平台。它内置优化后的医疗机器人AI模型,通过强化视觉与语言处理能力,实现医疗场景下的智能感知、决策与行动;同时提供高精度仿真框架,支持开发者构建医疗环境的数字孪生,自由导入定制传感器、器械及解剖结构,有效解决医疗传感器仿真选项匮乏的问题。
此外,借助边缘AI计算平台NVIDIA Holoscan,平台可实现机器人的实时决策,显著缩小虚拟仿真与临床实践间的差距,加速医疗机器人的数字原型设计。
该平台具备多尺度仿真能力,可模拟从微观组织结构到完整医院设施的各类场景。通过反复训练,机器人系统能够掌握手术室应急处理、辅助医生决策及患者护理等复杂技能。NVIDIA Isaac for Healthcare正通过仿真复杂医疗场景、优化手术机器人、内窥镜及心血管介入等应用,推动医疗机器人解决方案的快速落地。
目前,Moon Surgical、Neptune Medical和Xcath等机构已率先应用NVIDIA Isaac for Healthcare平台,实现仿真工具、传感器与机器人系统的无缝集成。Ansys、Franka、ImFusion等生态合作伙伴也已启动平台功能部署,共同推动医疗AI技术的创新发展。
结语
从全栈优化战略应对技术挑战,到开源模型与创新平台推动物理AI在机器人和医疗领域落地,显然,NVIDIA这种“通用+垂直”的并行策略,既保证了技术底座的可扩展性,又能在细分市场快速建立竞争优势,为物理AI技术的发展与应用拓展了广阔空间。
我们有理由相信,随着越来越多开发者和企业基于NVIDIA的技术开展创新实践,物理AI 将深度融入各行各业,在提升生产效率、改善医疗服务、丰富生活体验等方面发挥巨大作用,引领人类社会迈向智能化的新时代。
