首届通义千问AI挑战赛开赛,参赛者可畅玩通义开源模型家族

趣味科技v 2023-12-01 21:03

12月1日,首届“通义千问AI挑战赛”开赛,参赛者可免费畅玩通义开源模型家族,包括刚刚发布的720亿参数模型Qwen-72B。主办方为参赛者提供价值50万元的免费云上算力和丰厚奖金。赛事分为算法和Agent两大赛道,前者聚焦通义千问大模型的微调训练,希望通过高质量的数据探索开源模型的代码能力上限,后者鼓励开发者基于通义千问大模型和魔搭社区的Agent-Builder框架开发新一代AI应用,促进大模型在各行各业的落地应用。即日起开发者可通过天池平台报名参赛。

通义千问720亿参数模型宣布开源,部分性能超越闭源GPT-4

新浪科技讯 12月1日午间消息,阿里云通义千问720亿参数模型Qwen-72B今日宣布开源。该模型基于3T tokens高质量数据训练,在10个权威基准测评中夺得开源模型最优成绩,在部分测评中超越闭源的GPT-3.5和GPT-4。

在英语任务上,Qwen-72B在MMLU基准测试取得开源模型最高分;中文任务上,Qwen-72B在C-Eval、CMMLU、GaokaoBench等基准得分超越GPT-4;数学推理方面,Qwen-72B在GSM8K、MATH测评中断层式领先其他开源模型;代码理解方面,Qwen-72B在HumanEval、MBPP等测评中的表现大幅提升,代码能力有了质的飞跃。

据介绍,Qwen-72B可以处理最多32k的长文本输入,在长文本理解测试集LEval上取得了超越ChatGPT-3.5-16k的效果。研发团队优化了Qwen-72B的指令遵循、工具使用等技能,使之能更好地被下游应用集成。比如,Qwen-72B搭载了强大的系统指令(System Prompt)能力,用户只用一句提示词就可定制AI助手,要求大模型扮演某个角色或者执行特定的回复任务。

随着Qwen-72B的开源,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。至此,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。

业界最强开源模型,填补中国LLM开源领域空白

【在10大权威测评中,通义千问720亿参数模型获得开源模型最优成绩】

【通义千问720亿开源模型部分成绩超越闭源的GPT-3.5和GPT-4】

【用户仅用一句提示词就可创建自己的AI助手】

此前,中国大模型市场还没出现足以对标Llama 2-70B的优质开源模型。Qwen-72B填补了国内空白,以高性能、高可控、高性价比的优势,提供不亚于商业闭源大模型的选择。基于Qwen-72B,大中型企业可开发商业应用,高校、科研院所可开展AI for Science等科研工作。

从1.8B到72B,通义千问率先实现全尺寸开源

如果说Qwen-72B“向上摸高”,抬升了开源大模型的尺寸和性能天花板;发布会上的另一开源模型Qwen-1.8B则“向下探底”,成为尺寸最小的中国开源大模型,推理2K长度文本内容仅需3G显存,可在消费级终端部署。

从18亿、70亿、140亿到720亿参数规模,通义千问成为业界首个“全尺寸开源”的大模型。用户可在魔搭社区直接体验Qwen系列模型效果,也可通过阿里云灵积平台调用模型API,或基于阿里云百炼平台定制大模型应用。阿里云人工智能平台PAI针对通义千问全系列模型进行深度适配,推出了轻量级微调、全参数微调、分布式训练、离线推理验证、在线服务部署等服务。

阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。几款模型先后冲上HuggingFace、Github大模型榜单,得到中小企业和个人开发者的青睐,累计下载量超过150万,催生出150多款新模型、新应用。发布会现场,多位开发者伙伴现身说法,分享了他们用Qwen开发专属模型和特定应用的实践。

阿里云CTO周靖人表示,开源生态对促进中国大模型的技术进步与应用落地至关重要,通义千问将持续投入开源,希望成为“AI时代最开放的大模型”,与伙伴们共同促进大模型生态建设。

通义千问基座模型持续进化,多模态探索业界领先

通义千问在多模态大模型领域的探索也领先业界一步,当天,阿里云首次开源音频理解大模型Qwen-Audio。

Qwen-Audio能够感知和理解人声、自然声、动物声、音乐声等各类语音信号。用户可以输入一段音频,要求模型给出对音频的理解,甚至基于音频进行文学创作、逻辑推理、故事续写等等。音频理解能够赋予大模型接近人类的听觉能力。

通义大模型能“听”也能“看”。通义千问8月开源出视觉理解大模型Qwen-VL,迅速成为国际开源社区最佳实践之一。本次发布会又宣布了Qwen-VL的重大更新,大幅提升通用OCR、视觉推理、中文文本理解基础能力,还能处理各种分辨率和规格的图像,甚至能“看图做题”。不论从权威测评成绩还是真人体验的效果看,Qwen-VL的中文文本理解能力都大幅超越了GPT-4V。

通义千问闭源模型也在持续进化,一个月前发布的通义千问2.0版闭源模型,最近已进阶至2.1版,上下文窗口长度扩展到32k,代码理解生成能力、数学推理能力、中英文百科知识、幻觉诱导抵抗能力分别提升30%、10%、近5%和14%。用户可以在通义千问APP免费体验最新版本的闭源模型。

趣味科技v 资深媒体人彭承文和他的小伙伴们耕耘打理的科技自媒体,传播趣味文章,八卦前卫科技,年度十大媒体人,十佳科技自媒体,美通社媒体传播专家,2018平昌冬奥会火炬手.
评论 (0)
  •  配图来自Canva可画受宏观环境影响,降本增效成为多数企业发展的主旋律。企业大规模缩减开支成为了市场常态,这使得多数SaaS企业TO B端的生意受阻,一些关于SaaS寒冬的传言愈演愈烈,作为SaaS领域最重要的细分赛道之一,CRM SaaS也处于不温不火状态。头部CRM SaaS厂商的运营情况往往综合反映行业的景气程度,是整个行业的晴雨表。在海外,美国客户关系管理软件巨头Salesforce深陷裁员风波。知情人士称,美国客户关系管理软件巨头Salesforce将裁员近700人,约占该
    刘旷 2024-02-23 11:24 78浏览
  • 在科研的世界里,概率论就像一座坚实的桥梁,连接着理论与实践。说到概率论,不得不提门捷列夫纸牌和法拉第抛磁铁这两个有趣的故事。门捷列夫,这位化学界的巨匠,不仅在元素周期表上做出了卓越贡献,还以他的智慧和幽默为概率论教学带来了乐趣。据说,在一次概率论的课堂上,他拿出了一副特制的纸牌,牌面上印有各种化学元素和反应。学生们通过洗牌、抽牌等游戏形式,亲身感受到了概率的奥妙,这不仅使概率论变得生动有趣,还加深了对这一学科的理解。而法拉第,这位电磁学领域的先驱,也曾在科研中巧妙地运用了概率论。他著名的抛磁铁实
    丙丁先生 2024-02-23 05:32 69浏览
  • 披星戴月,跋山涉水,我们的爱车始终与我们“并肩作战”,年底也需要“犒劳”一下,做个“全身SPA”。缺少的油液及时补充,磨损的轮胎、刹车片及时更换,老旧的小零件也要适当换新。“SPA”清单检查刹车系统检查刹车片磨损情况,如果磨损过度,需要更换新的刹车片;检查刹车盘是否磨损、刹车油是否需要更换。检查油液包括机油、刹车油、转向助力油、防冻液等,要检查油液是否充足、是否需要更换或添加。检查机油滤清器查看密封圈是否完好,如果发现密封圈已经损坏或老化,需要更换新的密封圈。检查轮胎检查轮胎气压是否正常、轮胎表
    艾迈斯欧司朗 2024-02-23 18:25 27浏览
  • 非常荣欣参加了这次《物联网鸿蒙系统App开发》试读体验活动,同时非常感谢面包板论坛举办此活动。本书印刷还是非常新颖,具有精美漫画。下图为图书正面。作为新一代物联网操作系统,鸿蒙不仅可以应用在手机上,汽车、家电、手表、眼镜、AR/VR设备等都可以使用鸿蒙系统。物联网将以我们肉眼可见的速度发展,目前国内外掌握鸿蒙开发技术的人员相对较少,我们相信,你的加入会让这个行业生气勃勃,充满无限的想象力。新的物联时代正在到来,鸿蒙系统能催生出更多的应用场景,让我们一起见证鸿蒙的魅力吧。本书在编写过程中,尽可能做
    shenwen2007_656583087 2024-02-22 13:44 170浏览
  • 概述 AP8P059 是一款集成低压 LDO、光 控、充电控制、过充保护、欠压保护、PIR 感应、延时为一体的人体感应太阳能 LED 灯控制芯片,只需要很少的外接元件,适 用于锂电池供电的PIR人体感应LED灯具 的应用。 外置的一级带通增益放大 器便于客户调整感应灵敏度,可与多个品 牌 PIR 传感器匹配,进行信号预处理。 还内置了高精度高PSRR的 LDO,该 LDO 给 PIR 传感器供电,可有 效抑制电源和环境噪声,提高抗干扰能力。 采用了 SOP8 封装。 特点  工作待机电
    Auguss 2024-02-23 15:00 56浏览
  • 在《WiMinet 评说 1.2:多跳无线网络的现状》一文中,我们提到:在室外长距离的无线自组织网络中,由于节点之间的链路损耗较大,其链路预算相对不足,其包误码率PER会相应升高,也就是丢包概率 p 会比较大;而在一个大规模网络中,某些分支节点的通讯链路又会比较深,也就是网络跳数 n 比较大,在这种情况下其通讯成功率Pn自然也就显著下降了,人们的切身感受就是这个链路不太稳定。 此时人们的第一反应自然是上 TCP 算法,在发送节点启用 TCP Client 算法,在接收点启用 TCP Se
    微网高通WiMinet 2024-02-23 15:24 51浏览
  • 双方的合作可助力开发人员在两分钟内将新开发板配置入网 致力于以安全、智能无线连接技术,建立更互联世界的全球领导厂商Silicon Labs(亦称“芯科科技”,NASDAQ:SLAB)日前宣布,公司与开源硬件和软件领域的全球领导者Arduino建立了新的合作伙伴关系,将支持Arduino开发者社区的3,300万用户更好地实现Matter over Thread应用的无缝开发。Arduino的首个Matter软件库是与芯科科技合作开发的,目前可在芯科科技的xG24 Explorer套件和
    电子科技圈 2024-02-23 11:44 70浏览
  • 在一个繁忙的化工厂里,三个控制方法——概率控制、PID控制与前馈控制,各自担当着重要的角色。一天,化工厂接到一个紧急任务,需要生产一种新型的高分子材料。这种材料的生产过程对温度、压力和流量的控制要求极高,稍有差池就会导致产品质量不达标。面对这一挑战,化工厂决定让三种控制方法联手,共同确保生产过程的稳定性和精确性。概率控制首先站了出来。它说:“我先来做个大概的预测,根据历史数据和经验,我们可以估算出生产过程中可能出现的各种情况及其概率。这样,我们就可以提前做好准备,应对可能出现的风险。”PID控制
    丙丁先生 2024-02-23 05:38 72浏览
  • 固态光耦合器是一种光学器件,通常用于隔离和传递电信号或数据信号的装置。在不断发展的电子领域中,一个经常被忽视的关键组件是固态光耦合器。尽管它对于确保电子系统的顺利运行具有重要意义,但许多用户发现自己缺乏对其内部工作原理以及相对于传统同行的优势的详细了解。固态光耦合器基础知识:固态光耦合器,也称为光隔离器,是设计用于使用光波传输电信号的重要组件。与传统设备不同,这些设备利用半导体技术,结合发光二极管(LED)和光电探测器来实现信号隔离。内部组成及工作原理:让我们深入研究这些非凡组件的核心。典型的固
    腾恩科技-彭工 2024-02-23 16:18 61浏览
  • 来源:虹科工业智能互联 虹科技术丨PTP时钟源设备全攻略:从普通时钟到透明时钟的进阶之路原文链接:https://mp.weixin.qq.com/s/ArBtuLpU6mXax4QWmZDKfQ欢迎关注虹科,为您提供最新资讯!#PTP #普通时钟 #透明时钟导读在现代通信技术中,精确时间同步对于保障网络性能至关重要。PTP(Precision Time Protocol)时钟源设备作为实现高精度时间同步的关键组件,其配置和选择对于网络架构师和工程师来说至关重要。本文将探讨普通时钟和透明时钟的特
    虹科电子科技 2024-02-22 16:15 89浏览
  • 在不断发展的技术领域,光耦合器在确保无缝通信和可靠信号传输方面的作用变得越来越关键。本文深入探讨了光耦合器的复杂性,阐明了其重要性,探索了进步,并解决了光耦合器技术人员面临的常见问题。光耦合器基础知识:光耦合器,也称为光隔离器,是电子电路中的重要组件,旨在使用光波传输电信号。核心原理涉及通过光束传输信号,确保输入和输出之间的电气隔离。智能光耦合器的演变:随着智能光耦合器的出现,光耦合器的传统用途得到了扩展。这标志着一个革命性的时代,光耦合器无缝集成到智能系统中,实现互联世界中各种设备之间的通信。
    腾恩科技-彭工 2024-02-23 16:16 54浏览
  •        电子工程是近年来兴起的新兴学科,它的发展对现代社会的科技进步有着重要的推动作用。在学习电子工程的过程中,我不仅获得了扎实的专业知识,还培养了实践能力和解决问题的能力。下面我将分享我在电子工程领域的心得体会。       学习电子工程的过程中,遇到了许多困难和挑战,但我从未放弃。我坚信,只有坚持不懈,才能克服困难并取得成功。通过自主学习和实践,我掌握了许多基础的电子知识和技能。随着时间的推移,我的自信心也
    1316492391 2024-02-22 09:41 106浏览
  • 产品描述AP2915 是一款可以一路灯串切换两路灯串的降压恒流驱动器,高效率、外围简单、内置功率管,适用于5-80V 输入的高精度降压 LED 恒流驱动芯片。内置功率管输出最大功率可达 12W,最大电流 1.2A。AP2915 一路灯亮切换两路灯亮,其中一路灯亮可以全亮,可以半亮。AP2915 工作频率固定在 150KHZ左右,同时内置抖频电路,可以降低对其他设备的 EMI干扰。另外采用平均电流采样模式,可以提高宽输入电压情况下的电流精度。AP2915 带有输出短路保护功能,5V~80V 输入条
    Auguss 2024-02-23 14:14 59浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦