Qwen2.5-Math还增加了对中文的支持,并通过CoT、PoT和TIR的能力来加强其推理能力。其中Qwen2.5-Math-72B的整体性能超越了Qwen2-Math-72B指令微调和著名闭源模型GPT4-o。

9月19日,阿里云CTO周靖人在云栖大会上发布了通义千问新一代开源模型Qwen2.5,并且其旗舰模型Qwen2.5-72B在性能上超越了Llama 405B,成为全球开源大模型的新标杆。

图源:阿里云

Qwen2.5系列模型不仅包括了大语言模型、多模态模型、数学模型和代码模型,还提供了不同尺寸的版本以适应不同的应用需求,总计上架超过100个版本。

在MMLU-redux等十多个基准测评中,Qwen2.5-72B表现超越Llama3.1-405B  图源:阿里云

Qwen2.5系列支持中文、英文、法文、西班牙文、葡萄牙文、德文、意大利文、俄文、日文等超过29种主流语言。与Qwen2类似,Qwen2.5语言模型支持高达128K tokens,并能生成最多8K tokens的内容。

从技术角度来看,与前一版本相比,Qwen2.5的理解能力、逻辑推理、指令遵循和代码能力分别提升了9%、16%、19%和10%,中文能力持续领先业界。

具体来说,Qwen2.5系列模型在中文能力方面领先业界的技术细节主要体现在以下几个方面:

一是多语言支持和上下文长度:Qwen2.5系列模型支持高达128K的上下文长度,能够生成最多8K内容。这种长文本处理能力使得模型在理解和生成中文文本时更加灵活和准确。

二是预训练数据的质量和规模:该系列模型使用了大规模的高质量数学数据进行预训练,并包括由Qwen2-Math生成的合成数据。此外,其预训练数据共3TB,主要涉及公共网络文档、百科全书、书籍、代码等,其中以中文和英文为主,这保证了模型在中文上的表现。

三是指令执行和结构化数据理解:Qwen2.5-LLM在指令执行、长文本处理以及结构化数据理解等方面有显著提升,这些特性对于中文处理尤为重要,因为中文常常需要更复杂的语境理解和语法分析

同时,本次发布的Qwen2.5-Math在更大规模的高质量数学数据上进行了预训练,包括由Qwen2-Math生成的合成数据。在融合了Qwen2-math的技术后,Qwen2.5的数学能力也得到了快速提升。在MATH基准上,Qwen2.5-7B/72B-Instruct的得分从Qwen2-7B/72B-Instruct的52.9/69.0提高到75.5/83.1。

Qwen2.5-Math还增加了对中文的支持,并通过CoT、PoT和TIR的能力来加强其推理能力。其中Qwen2.5-Math-72B的整体性能超越了Qwen2-Math-72B指令微调和著名闭源模型GPT4-o。

此外,Qwen2.5系列模型采用了Apache2.0许可证进行开源,这使得开发者可以自由地使用和修改这些模型。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
目前AI芯片设计人员通常会在系统CPU旁边集成单独的IP模块,以满足AI日益增长的需求。这种方法导致了AI芯片的配置不够理想,因为通常需要依赖三家不同的IP供应商和三套工具链,这不仅使得功率、性能和面积(PPA)指标较差,也增加了适应新算法的难度。
尽管在生态系统建设、软件支持和安全性问题等方面,RISC-V仍需不断努力和完善,但凭借简洁高效、灵活多样的特点,RISC-V目前已经在嵌入式系统、云计算与大数据、人工智能与机器学习、物联网与边缘计算等领域展现出了强大的生命力和广阔的发展前景。
加文・纽森最终否决SB 1047,意味着这个被视为美国乃至全球首个专门针对AI模型安全性和透明度的法律框架并未成为正式法律。不过,归根结底是这项法案确实存在诸多争议的地方。
除了软硬件的开发之外,地瓜机器人也希望通过提供高效、易用的开发工具和平台,聚合优质产业资源,降低机器人开发的门槛,从而推动更多创新应用的出现,最终实现其成为“机器人时代母生态”的愿景。
根据“阿联酋2031”,该愿景旨在将该国的国内生产总值(GDP)从1.49万亿迪拉姆翻一番至3万亿迪拉姆。在这一项塑造未来10年国家未来的国家计划中,在AI技术方面的投资与发展将成为阿联酋经济发展重要的一环。
曾在美国国务院从事科技政策工作的里克·斯威策(Rick Switzer)就指出,“中国可以创新,他们一直在创新,他们并没有靠偷窃来获得创新,他们实际上是通过非常努力的工作才取得现在的成就的。”
所有智能出行系统产品都需要新的计算、通信和连接芯片的支撑,但是随之而来的是这些芯片的系统级故障或意外行为可能引起的危险。
受全球经济衰退影响,高端显示面板需求下滑,导致大尺寸OLED出货量在2023年同比下降了 25.7%。唯一的例外是OLED显示器……
香港应用科技研究院(应科院)将于10月13至16日参与由香港贸易发展局(香港贸发局)主办的「香港秋季电子产品展」,向全球数以万计的专业买家和业界代表,展示一系列崭新智能出行科技。
启发式排程、模拟排程和优化排程都可以帮助您改善工厂 KPI,每种方法都有其优点和缺点。您应该充分了解这些排程方法的适用性和能力,以确保在您的工厂成功实施。
  在静电纺丝时,需要使用交流电源与直流单元结合辅助,采用高电压波形直接写入来实现高分辨率蛇形图案。外加电压是一个重要的参数,只有当电压超过临界值时,液滴才能被拉伸成为纤维。当电压
ADI面向开发者打造全新套件,整合跨设备、跨市场的硬件、软件和服务,CodeFusion Studio™和ADI新推出的开发者门户是该套件中首批亮相的方案。此外还包括ADI Assure™可信边缘安全
  功率放大器是电子设备中常见的重要部件,用于放大电信号的幅度,以便驱动负载如电机或其他设备。然而,在实际使用中,功率放大器常受到各种外部和内部因素的影响,例如过载、过热、短路等问
在深圳市政府指导和深圳市发展改革委支持下,深圳市半导体与集成电路产业联盟携手深圳市重大产业投资集团有限公司共同主办的首届“SEMiBAY湾芯展”——湾区半导体产业生态博览会,将于今年10月16日至18
股市连日大涨之际,中电港股东宣布减持。10月7日晚,中国大陆分销商龙头中电港(001287.SZ)披露减持公告,股东国家集成电路基金计划通过集中竞价交易方式减持不超过1,953,080股,占公司总股本
EVH第七届全球新能源动力总成年会暨千星奖颁奖典礼千星奖评选活动新格局·新突破2024年11月21-22日 | 中国·上海前言:BUSINESS2024年11月21日-22日将在上海举办的EVH202
 智能汽车网络与数据安全新媒体 (谈思汽车讯)2018年7月17日,日本和欧盟在东京签署了《经济伙伴关系协定(EPA)》,双方将取消几乎所有关税,该协定囊括了欧盟28个国家以及全球第三大单一经济体——
来源:猛兽财经   作者:猛兽财经 猛兽财经核心观点: (1)小米集团的股价已经上涨到了2022年以来的最高点。 (
 智能汽车网络与数据安全新媒体 (谈思汽车讯)据汽车制造AP 10月7日消息,德国百年家族企业,汽车座椅、车门和小型电机制造商博泽集团首席执行官Philipp Schramm已于10月2日辞去相关职务
  功率放大器是电子设备中一种关键的元件,其主要作用是将弱信号放大到足够大的幅度,以驱动负载,例如扬声器、电动机或其他高功率设备。下面将详细介绍功率放大器的用途以及它在各个领域中的