小米推出首个大模型MiMo,赶超OpenAI阿里

WitDisplay 2025-04-30 12:06

今天,小米开源首个为推理(Reasoning)而生的大模型Xiaomi MiMo在数学推理(AIME 24-25)和 代码竞赛(LiveCodeBench v5)公开测评集上,MiMo 仅用 7B 的参数规模,超越了 OpenAI 的闭源推理模型 o1-mini 和阿里 Qwen 更大规模的开源推理模型 QwQ-32B-Preview。

图片

  预训练+后训练,联动提升推理能力
MiMo推理能力的提升,由预训练和后训练阶段中数据和算法等多层面的创新联合驱动,包括:
  • 预训练:核心是让模型见过更多推理模式

    • 数据:着重挖掘富推理语料,并合成约200B tokens推理数据。

    • 训练:进行了三阶段训练,逐步提升训练难度,总训练25T tokens。

图片
  • 后训练:核心是高效稳定的强化学习算法和框架

    • 算法:提出 Test Difficulty Driven Reward 来缓解困难算法问题中的奖励稀疏问题,并引入 Easy Data Re-Sampling 策略,以稳定 RL 训练

    • 框架:设计了Seamless Rollout系统,使得RL训练加速2.29倍,验证加速1.96倍。

图片
  MiMo-7B全系列已开源
MiMo-7B 已开源4个模型至HuggingFace:https://huggingface.co/XiaomiMiMo
图片

MiMo 来自全新成立不久的「小米大模型Core团队」的初步尝试。

此前,小米公司招聘事件吸引了业界的广泛关注。据悉,小米创始人雷军亲自出手,以千万年薪招募到了一位备受瞩目的95后AI天才少女——罗福莉,她正是开源大模型DeepSeek-V2的核心开发者之一。

罗福莉,一个从四川小城走出的普通女孩,凭借自己的努力和天赋,在AI领域大放异彩。她在北京师范大学本科阶段误入计算机专业,但凭借不懈的努力,从成绩垫底逆袭至前列,并成功保研进入北京大学计算语言学研究所。2019年,她在NLP国际顶级会议ACL上发表了8篇论文,其中2篇为第一作者,迅速走红网络,被誉为“95后AI天才小萝莉”。

小米在AI大模型领域的布局虽然相对较晚,但此次雷军的亲自招募无疑彰显了其对这一领域的重视。小米AI实验室早在2016年就组建了AI团队,并在2023年4月设立了专门的大模型团队,由栾剑担任负责人。然而,相较于其他厂商,小米在AI大模型上的发力确实稍显滞后。尽管小米在发布会上曾宣布全面拥抱AI大模型,但其主力突破方向仍是“轻量化”和“本地部署”。

小米作为全球拥有最丰富AI入口和应用场景的公司之一,其AIoT平台已连接的IoT设备数超8.61亿,同比增长23.2%。然而,在多模态交互与跨App联动等方面,小米与竞品相比仍显不足。为了在新一轮的高端智能手机军备竞赛中占据优势,小米必须加注大模型技术的研发。

雷军曾表示,小米将继续加大在AI、物联网(IoT)等前沿技术的投入。近年来,小米在AI领域取得了不少成果,发布了自研芯片澎湃C1、成立了自动驾驶团队和小米机器人实验室,其AI相关团队已超过3000人。近期,小米大模型也已升级至第二代,并在多个应用场景中落地。

(Xiaomi MiMo)

AI交流群
图片



WitDisplay 智慧显示(Wit Display)由资深科技媒体人创立,跟踪全球显示产业链、AIoT产业最新动态.
评论
  • PT100温度传感器是一种基于铂(Pt)电阻特性的温度测量器件,广泛应用于工业、医疗和科研领域。以下是其核心特性与应用解析:‌1. 定义与原理‌‌基本特性‌:PT100在0℃时基准阻值为100Ω,其阻值随温度升高近似线性增长(100℃时约138.5Ω),遵循公式 ‌R=Ro(1+αT)‌(Ro为0℃阻值,α为温度系数)。‌工作原理‌:通过铂电阻的阻值变化反映温度,测温范围覆盖 ‌-200℃至+850℃‌,精度可达A级(±0.15℃)或B级(±0.30℃)。2.&nb
    锦正茂科技 2025-05-15 11:40 83浏览
  •   电磁数据展示系统平台解析   北京华盛恒辉电磁数据展示系统平台是实现电磁数据高效展示、分析与管理的综合性软件体系,以下从核心功能、技术特性、应用场景及发展趋势展开解读:   应用案例   目前,已有多个电磁数据展示系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据展示系统。这些成功案例为电磁数据展示系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与预处理   智能分析处理   集成频谱分析、时频变换等信号处理算法,自动提取时域频域特征;
    华盛恒辉l58ll334744 2025-05-13 10:20 404浏览
  •   电磁数据管理系统深度解析   北京华盛恒辉电磁数据管理系统作为专业的数据处理平台,旨在提升电磁数据的处理效率、安全性与可靠性。以下从功能架构、核心特性、应用场景及技术实现展开分析:   应用案例   目前,已有多个电磁数据管理系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润电磁数据管理系统。这些成功案例为电磁数据管理系统的推广和应用提供了有力支持。   一、核心功能模块   数据采集与接入:实时接收天线、频谱仪等设备数据,兼容多协议接口,确保数据采集的全面性与实时性
    华盛恒辉l58ll334744 2025-05-13 10:59 319浏览
  • 在智能设备与物联网技术深度融合的产业浪潮下,无线遥控技术早已突破电视机、空调与投影仪等传统遥控领域的应用边界,完成了从基础单向指令传输向多维智能交互体系的补充迭代,可精准匹配现代工业领域对遥控距离、遥控精度与环境适应性等能力的核心诉求。其中,无线射频作为一种具备远距离传输、抗干扰能力强与技术成熟度高等优势的无线通信技术,尤其是在Sub-GHz频段下,其低功耗、强穿透与广覆盖的特性进一步凸显,是在各种复杂工业环境中实现高可靠性的无线遥控方案之一。Sub-GHz射频在工业遥控方案中有那些应用优势?众
    华普微HOPERF 2025-05-15 11:19 96浏览
  • PT100温度传感器凭借其高精度(±0.1℃级)和宽温域(-200℃~850℃)特性,广泛应用于以下核心场景:‌一、工业过程控制‌1、‌化工与石油‌l 监测反应釜温度(-200℃~850℃),通过PID算法调控加热/冷却系统,提升化学反应效率与**性。l 原油输送管道中采用浸入式铠装设计(316L不锈钢套管),实现-50℃~300℃范围的黏度与温度联动控制。2、‌电力设备‌l 监测变压器绕组表面温度(≤180℃),结合光纤绝缘层预防热老化故障。l 发电机冷
    锦正茂科技 2025-05-15 13:02 80浏览
  •   舰艇电磁兼容分析与整改系统平台解析   北京华盛恒辉舰艇电磁兼容分析与整改系统平台是保障海军装备作战效能的关键技术,旨在确保舰艇电子设备在复杂电磁环境中协同运行。本文从架构、技术、流程、价值及趋势五个维度展开解析。   应用案例   目前,已有多个舰艇电磁兼容分析与整改系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润舰艇电磁兼容分析与整改系统。这些成功案例为舰艇电磁兼容分析与整改系统的推广和应用提供了有力支持。   一、系统架构:模块化智能体系   电磁环境建模:基
    华盛恒辉l58ll334744 2025-05-14 11:22 121浏览
  •   军事仿真推演系统平台核心解析   北京华盛恒辉军事仿真推演系统平台以计算机仿真技术为基石,在功能、架构、应用及效能上展现显著优势,成为提升军事作战与决策能力的核心工具。   应用案例   目前,已有多个仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润仿真推演系统。这些成功案例为仿真推演系统的推广和应用提供了有力支持。   一、全流程功能体系   精准推演控制:覆盖推演启动至结束全流程。   智能想定管理:集成作战信息配置、兵力部署功能。   数据模型整合
    华盛恒辉l58ll334744 2025-05-14 17:11 119浏览
  • 在全球能源结构转型加速推进与政策驱动的双重作用下,油气输送、智慧水务及化学化工等流体计量场景正面临效率革命与智能化升级的迫切需求。传统机械式流量计虽在工业初期有效支撑了基础计量需求,但其机械磨损、精度衰减与运维困难等固有缺陷已难以适应现代工业对精准化、智能化与可持续发展的多维诉求。在此背景下,超声波流量计则凭借着高精度探测、可实时监测、无侵入式安装、无阻流部件、易于维护与绿色环保等优势实现了突破性发展,成为当代高精度流体计量体系中不可或缺的重要一环。该技术不仅是撬动能源利用效率提升、支撑智慧管网
    华普微HOPERF 2025-05-14 11:49 97浏览
  • 在当下的商业版图中,胖东来宛如一颗璀璨的明星,散发着独特的光芒。它以卓越的服务、优质的商品以及独特的企业文化,赢得了消费者的广泛赞誉和业界的高度关注。然而,近期胖东来与自媒体博主之间的一场激烈对战,却如同一面镜子,映照出了这家企业在光环背后的真实与挣扎,也引发了我们对于商业本质、企业发展以及舆论生态的深入思考。​冲突爆发:舆论场中的硝烟弥漫​2025年4月,抖音玉石博主“柴怼怼”(粉丝约28万)突然发难,发布多条视频直指河南零售巨头胖东来。他言辞犀利,指控胖东来在玉石销售方面存在暴利行为,声称其
    疯人评 2025-05-14 13:49 129浏览
  • 在当下竞争激烈的 AI 赛道,企业高层的变动往往牵一发而动全身,零一万物近来就深陷这样的动荡漩涡。近日,零一万物联合创始人、技术副总裁戴宗宏离职创业的消息不胫而走。这位在大模型基础设施领域造诣颇深的专家,此前在华为云、阿里达摩院积累了深厚经验,在零一万物时更是带领团队短期内完成了千卡 GPU 集群等关键设施搭建,其离去无疑是重大损失。而这并非个例,自 2024 年下半年以来,李先刚、黄文灏、潘欣、曹大鹏等一众联创和早期核心成员纷纷出走。
    用户1742991715177 2025-05-13 21:24 207浏览
  •   军事领域仿真推演系统的战略价值与发展前瞻   北京华盛恒辉仿真推演系统通过技术创新与应用拓展,已成为作战效能提升的核心支撑。以下从战略应用与未来趋势展开解析:   应用案例   目前,已有多个仿真推演系统在实际应用中取得了显著成效。例如,北京华盛恒辉和北京五木恒润仿真推演系统。这些成功案例为仿真推演系统的推广和应用提供了有力支持。   一、核心战略应用   1. 作战理论创新引擎   依托低成本仿真平台,军事人员可高效验证新型作战概念。   2. 装备全周期优化   覆盖武器
    华盛恒辉l58ll334744 2025-05-14 16:41 141浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦