蚂蚁集团Ling团队于Arxiv平台上发表一篇技术成果论文,以在有限的资源和预算约束下高效训练LLM,Ling团队通过架构优化、训练策略革新及分布式计算框架升级,实现了在国产低性能GPU设备上的高效训练......

近年来,大型语言模型(LLMs)如OpenAI、Gemini、Claude、Qwen、DeepSeek-AI的快速发展在学术界和工业界引发了关于通用人工智能(AGI)的热烈讨论。尽管密集型模型取得了显著进展,但混合专家(MoE)模型,如DeepSeek系列、Qwen系列和MiniMax-01系列,在某些特定任务上的表现甚至超越了传统的密集型模型。

然而,MoE模型的训练通常依赖于高性能计算资源(例如H100和H800 AI加速器),其高昂的成本限制了在资源受限环境中的广泛应用。

近日,蚂蚁集团Ling团队于Arxiv平台上发表一篇技术成果论文《每一个FLOP都至关重要:无需高级GPU即可扩展3000亿参数混合专家LING大模型》,以在有限的资源和预算约束下高效训练LLM。Ling团队通过架构优化、训练策略革新及分布式计算框架升级,实现了在国产低性能AI加速器上的高效训练。

这一开源模型已发布于https://huggingface.co/inclusionAI。

论文摘要显示,“在这份技术报告中,我们解决了训练大规模混合专家(MoE)模型的挑战,重点关注如何克服此类系统中普遍存在的成本效率低下和资源限制问题。为此,我们提出了两种不同规模的MoE大语言模型(LLM)——Ling-Lite和Ling-Plus(中文名“百灵”,拼音Bailing)。Ling-Lite包含168亿参数(激活参数27.5亿),而Ling-Plus拥有2900亿参数(激活参数288亿)。两个模型均表现出与行业领先基准相媲美的性能。本报告提供了可操作的见解,以提升资源受限环境下AI开发的效率和可及性,推动更具扩展性和可持续性的技术发展。具体而言,为降低MoE模型的训练成本,我们提出了以下创新方法:

  • 模型架构与训练流程优化;
  • 训练异常处理改进;
  • 模型评估效率提升。

此外,通过知识图谱生成的高质量数据,我们的模型在工具使用能力上优于其他模型。实验表明,3000亿参数的MoE LLM可在低性能设备上有效训练,性能与同规模密集模型/MoE模型相当。与高性能设备相比,预训练阶段使用低规格硬件系统可节省约20%的计算成本。”

Ling系列模型在英语和中文的语言理解上达到行业领先水平,在复杂数学问题求解和代码生成任务中表现突出,支持工具使用并具备高安全性设计,适用于金融、医疗等高敏感场景。

文档还包括了一个关于安全性的评估,比较了Ling-Plus模型与其他几个模型的安全性能。结果显示Ling-Plus在拒绝错误输出的同时保持了良好的实用性,得分高于一些竞争对手。

蚂蚁集团此次突破的核心在于通过国产芯片与算法优化的协同创新,不仅实现了与英伟达芯片相当的训练效果,还大幅降低了算力成本。

以Ling-Plus模型为例,若使用高性能硬件(如英伟达H800)训练1万亿token,成本约为635万元;而采用低规格国产芯片系统,成本降至508万元,节省近20%。

消息指出,虽然蚂蚁集团未完全放弃使用英伟达芯片,但新模型已开始转向以中国半导体及部分Advanced Micro Devices(AMD)处理器为主。对此,蚂蚁集团尚未正式回应。

Bloomberg Intelligence分析师表示,蚂蚁集团这项研究突显中国AI技术发展速度之快,也反映国产科技已具备自我供应的潜力,逐步摆脱对美国先进芯片的依赖。

2025年3月,蚂蚁集团首次公开回应投资布局调整,将资金从成熟项目转向大模型、AI算力、具身智能等前沿领域。蚂蚁集团通过减持奥比中光(套现5.56亿元)与永安行(套现2.19亿元)两家上市公司,累计回收资金超7.75亿元,这是基于“AI First”战略的主动调整。

文献链接:https://arxiv.org/pdf/2503.05139

责编:Amy.wu
阅读全文,请先
您可能感兴趣
这个案件不仅是商业机密保护的典型,更是美国企业以国家安全为由阻止中国竞争对手获取核心技术的标志性事件。
研究人员报告称,Apple Watch在心率方面的平均绝对百分比误差(一种用于评估测量精度的常见指标)为4.43%,在步数追踪方面为8.17%。这些误差值处于消费者级健身设备通常认为可接受的范围内。相比之下,能量消耗估计的平均误差达到了27.96%,超过被认为是准确测量所允许误差范围的三倍以上。
苹果在WWDC25上发布的“液态玻璃”设计语言不仅是一次视觉上的革新,更可能成为苹果生态新交互范式的起点。
拆解结果显示,华为MateBook Fold非凡大师的核心运算、通信连接、能源供给等底层硬件层面,实现了前所未有的高比例国产化替代。
高通以每股183便士(约17.5元人民币)的现金报价锁定交易,相较3月31日93.5便士的收盘价溢价96%。Alphawave董事会已一致建议股东投票通过该交易。
作为汽车芯片龙头,恩智浦转型契合车规芯片向高集成、低功耗演进的需求,尤其在智能座舱、自动驾驶领域需12英寸支持先进制程。
混合动力汽车(HEV)曾经被视为电动车和传统燃油车的中间地带,但如今已独当一面,发展成为具有自身市场意义的精密工程系统。为了满足现代 HEV 的需求,工程师正在不断挑战电源架构的极限,以实现更高的电压、更紧密的集成和更智能的连接。
高温环境会严重制约集成电路的性能、可靠性和安全性,亟需通过创新技术手段攻克相关技术难题‌。
​广东芯赛威SFM8801 APOIS芯片实现硬件可重构与算法开源双突破
知存科技联合复旦大学、浙江大学、上海交通大学、南京大学等高校及社区举办的第二届 “知存科技杯高校存内计算创新应用大赛”于近日正式开启。
6 月 10 日消息,赛富乐斯(Saphlux LLC)今日发布 T3 系列 0.13 英寸单片全彩 Micro LED 微显示屏,为新一代增强现实(AR)眼镜带来更丰富的显示内容与更高效的信息提示体
一凡 发自 副驾寺智能车参考 | 公众号 AI4Auto比亚迪的智能辅助驾驶,用户买单吗?超级认可,绝大比例买单。比亚迪刚刚给出了最新销量数据,其中“智驾”车型占比高达79%——门店每开出5辆新车,就
5月28日,北方华创隆重举办“PVD整机1000台交付庆典”。这是继刻蚀设备、立式炉设备之后,公司第三个达成单产品出货量突破1000台的品类里程碑。PVD(物理气相沉积)技术是芯片制造的关键环节,尤其
现货促销让采购/更简单/更高效为了更好地帮助大家采购芯片,实现供需资源的无缝对接。AMEYA360决定开启【现货促销】专栏,通过AMEYA360微信公众号,每天推送原厂现货促销物料,助力广大用户制定更
据媒体报道,首片6寸薄膜铌酸锂光子芯片晶圆顺利下线,我国首条光子芯片中试线在滨湖规模化量产。入选国家工信部“首批重点培育中试平台”名单不到1个月,位于上海交大无锡光子芯片研究院内的国内首条光子芯片中试
在智能化浪潮席卷全球的今天,电机控制技术作为核心驱动力,正不断突破创新边界。近日据悉,峰岹科技(股票代码:688279)即将向市场推出IDE集成开发平台,作为电机控制领域的领军者,致力于打造完善的产品
6月9日,移动芯片巨头高通公司(Qualcomm)正式宣布,将以约24亿美元(约172亿元人民币)现金收购英国伦敦上市的半导体IP供应商Alphawave  IP Group Plc。根据协
据新浪科技消息,小米中国区近日迎来人事调整,小米集团副总裁、中国区总裁、新零售部总经理王晓雁兼任新零售部小米之家总经理。据悉,王晓雁兼任小米之家总经理之后,原小米之家总经理王辉将转任销售管理部总经理,
6月9日,根据 TrendForce 集邦咨询发布的数据,2025 年第一季度全球晶圆代工产业营收环比下滑约 5.4% 至 364.03 亿美元(现汇率约合 2617.09 亿元人民币),与以往数据相