率先全面开放,文心一言为何一骑绝尘?

原创 道总有理 2023-08-31 21:29

连续两天,半夜爆出大消息。先是华为新机深夜上线,让芯片国产替代的步伐更进一步;次日晚,百度文心一言官宣向公众全面开放——两大劲爆消息直接点燃科技圈。

8月31日凌晨,百度官方公众账号即发布推文,称“文心一言向全社会开放”,用户可以在应用商店下载“文心一言APP”或登陆“文心一言官网”体验。包括百度文心一言在内,一共有8个企业/机构的大模型位列第一批名单,可以正式上线面向公众提供服务,值得注意的是,被看作文心一言竞争者的阿里通义千问、360智脑、讯飞星火等,不在首批获批名单中。

随后“文心一言APP”在各大应用商店冲上热榜,在苹果App Store上更是直接登顶免费榜榜首,成为当日热门应用,这无疑让百度再一次占得了先机。

此前,在获得备案审批之前,各家只能小范围内测,用户需要“排队”申请内测资格,由此大大限制了大模型在用户层面的推广,如今大模型备案获批和全面开放,大模型的步伐有望迈入下一阶段。

秉持着技术自主的理念,将资金大规模倾斜到自主技术研发的百度和华为,可以说是殊途同归,而软硬件领域的“双子星”联袂,共同推动技术投入走向“开花结果”。

技术坚守,换来厚积薄发

大模型在国内掀起新一代技术浪潮,迅速席卷了整个互联网,而百度在大模型赛道上的步伐一直领先。2019年第一个发布了文心大模型,2023年,大厂中最早推出大语言模型“文心一言”,如今又率先获批、得到认可,正式向全社会开放。

百度之所以快速踩在了大模型的全球性技术风口上,是建立在百度雄厚的技术基底之上。

早从2010年开始,百度就已经着手布局AI相关技术的研发,近十年来,累计研发投入超过 1400 亿元。其中2022 年研发费用高达 214.16 亿元,占百度核心收入比例达到 22.4%。与全球其他大厂相比,这些投入也是数一数二。

在高研发成本的持续投入下,这些年从最初探索深度学习等基础技术,到推动AI在互联网等场景试点落地,再到如今扎根千行百业、大力推进AI工业化大生产等,百度既完成了在芯片、框架、模型和应用四层构架对应的自研技术积累,具备了做AI基础设施供给者的前提条件,又成功引领了AI技术成果在产业层面的实践,降低了人工智能的开发和应用门槛。


这也使得百度无论在技术专利、技术产品还是技术应用上,都占据了领先地位。以专利来看,根据由国家工业信息安全发展研究中心、工信部电子知识产权中心发布的《中国人工智能专利技术分析报告(2022)》显示,百度AI专利申请量1.68万件,连续五年保持中国第一;专利授权量上,百度仍以5705件专利授权量位列第一。

文心一言大模型,正是百度多年技术积累和产业实践的水到渠成,而基于技术和实践的领先优势,文心一言问世不到半年,在国内外多家调研机构、权威媒体和高校等发布的大模型评测报告中,表现优异。


如IDC最新发布的《AI大模型技术能力评估报告,2023》,报告显示,百度文心大模型3.5拿下12项指标的7个满分,综合评分第一,算法模型第一,行业覆盖第一。其中算法模型是大模型能力最为核心的要素,百度文心大模型在这一维度获得了唯一的满分。

更令外界欣喜的是,从测评来看,百度文心一言大模型能力从5月至今不断提升,正在逐渐赶上国外大模型。

百度「AI大底座」的全栈能力,助力文心一言进化

31日凌晨全面开放后,百度文心一言APP迅速飙升至苹果商店免费榜榜首,成为首个登顶应用商店榜首的中文AI原生应用。

用户的反响,透露出他们对文心一言表现出的强劲进化能力的期待。自今年3月发布至今,文心一言快速成长,熟练掌握的创作体裁超过200个,内容丰富度是发布初期的1.6倍,思维链长度是初期的2.1倍,知识点覆盖达到初期的8.3倍。在一些公开测评中,文心大模型3.5版支持下的文心一言中文能力突出,甚至有超出GPT-4的表现。


这很大程度上得益于百度飞桨,百度拥有自研的深度学习平台飞桨,它有力支撑了大模型的高效训练和推理。通过飞桨端到端自适应混合并行训练技术以及压缩、推理、服务部署的协同优化,文心大模型训练速度达到原来的3倍,推理速度达到原来的30多倍。

飞桨和文心一言,一个是框架平台,一个是大模型,这两者之间正好处在人工智能技术体系里面很重要的两层,它们之间有很强的协同优化潜力,由此飞桨领先的训练技术,能够优化大模型的训练效率。

百度不单单在框架层和模型层拥有关键技术。进入人工智能时代,IT技术的技术栈发生了根本性变化,从过去三层转变为“芯片-框架-模型-应用”四层,百度则是全球为数不多、进行全栈布局的人工智能公司。从高端芯片昆仑芯,到飞桨深度学习框架,再到文心预训练大模型,及搜索、智能云、自动驾驶、小度等应用,各层都有领先业界的关键自研技术。


如框架层上,百度从2016年就开源了飞桨深度学习框架,目前这一框架已经集成了深度学习核心训练和推理框架、基础模型库、端到端开发套件等工具组件,在中国市场份额中排行第一。

全栈布局的优势在于,可以在技术栈的四层架构中,实现端到端优化,大幅提升效率,飞桨和文心一言的优化,就是最典型的例子。另外,芯片、框架、大模型和终端应用场景,也可以形成一个高效的反馈闭环,帮助大模型不断去调优迭代,越做越好。

比如文心一言与搜索、信息流等应用层的协同。百度的搜索服务,每天响应几十亿次真实的用户使用需求,每天进行1万亿次深度语义推理与匹配,能够提供最真实、最及时的反馈,从而倒逼大模型、深度学习框架和芯片的优化。相对地,文心一言应用于搜索,也将带来搜索的变革。

除了全栈自研的「AI 大底座」,百度智能云推出的两大AI工程平台—「AI 中台」和「百度百舸· AI 异构计算平台」,也分别在开发和资源层面进行提效,加速训练过程。这给文心一言的成长提供了最坚实的技术支撑,也成为其追赶国外大模型的底气。

核心能力升级,百度加速大模型落地时代到来

5月底举行的2023万象·百度移动生态大会上,百度搜索宣布“AI伙伴”开始内测。这款全能的“Al伙伴”能够听懂用户的任何问题,并用语音进行互动,还能帮助用户标记答案中的重点,提供权威的来源。在演示中,“Al伙伴”完整地提供了一篇人工智能大会主持词。

百度旗下各类用户侧产品正在利用大模型进行重构,而基于大模型基座和云平台进行开发生态的建设也在同步推进。前不久,百度承办的2023 WAVE SUMMIT上,推出了“超级助理”和“Comate X智能编程助手”。

理解、生成、逻辑和记忆,构成了一个人工智能或者通用人工智能系统最基本的能力,从文心一言在C端及B端应用上的表现来看,这四大核心能力正在快速提升,而背后展示出的则是百度在知识增强、检索增强、对话增强方面的关键技术能力和差异化优势。

庞大的知识图谱和搜索基础上对真实数据和用户需求的理解,是百度多年来构建技术护城河和打造内容生态的基础,因而作为百度自主研制的知识增强大语言模型,文心一言在知识增强和检索增强方面天然具有优势。

据悉,百度文心大模型拥有世界上最大规模知识图谱,包含50亿实体、5500 亿级事实,每天调用量超过400亿次。

在对话增强方面,百度深耕对话技术多年,前不久,王海峰带领团队完成的「知识与深度学习融合的通用对话技术及应用」成果,荣获了「2022 年度吴文俊人工智能科技进步奖特等奖」,这是该奖项设立以来颁发的首个特等奖。对话技术所涉及的记忆机制、上下文理解和对话规划能力,能够帮助文心一言实现更好的对话连贯性、合理性和逻辑性。

百度已经构建了面向中文、服务应用、富含知识的多样化训练数据,并建立起人类反馈、奖励模型和策略优化之间的飞轮机制,随着真实用户的反馈越来越多,文心一言的效果会越来越好,能力也越来越强。

而今,文心一言率先面向用户全面开放,也就说未来能获得更海量的真实世界中的人工反馈,这将进一步改进基础模型,助力文心一言加速迭代、提升能力。而且,对用户层面的放开,会刺激大模型竞争焦点转向应用层,激起应用开发的创造活力,基于文心一言的领先,百度未来或将率先带来杀手级应用,真正引领大模型进入落地时代。

这亦是用户想从这场技术性浪潮看到的,弯道超车,占领新一代技术变革的制高点。

版权声明:道总有理,曾用名歪道道,互联网与科技圈新媒体。谢绝未保留作者相关信息的任何形式的转载与修改。如需商务、内容等相关合作,请联系本人微信号:wddtalk

往期推荐





点击下方关注我,获取更多精彩内容

道总有理 互联网热点与商业趋势观察家,专业有趣有深度。曾用名「歪道道」,现已更名为「道总有理 」。
评论 (0)
  • 2024龙年春节前夕,中国激光雷达产业备受关注。首先是1月31日,美国国防部正式将10多家中国企业列入“中国军方企业名单”,其中就包括中国领先的激光雷达企业禾赛科技。随后禾赛科技在2月7日,官宣将起诉美国国防部。传感器专家网https://www.sensorexpert.com.cn专注于传感器技术领域,致力于对全球前沿市场动态、技术趋势与产品选型进行专业垂直的服务,是国内领先的传感器产品查询与媒体信息服务平台。基于传感器产品与技术,对广大电子制造从业者与传感器制造者提供精准的匹配与对接。在2
    传感器专家网 2024-02-20 21:15 46浏览
  • 电子产品质量的无故障工作时间(MTBF,即Mean Time Between Failures)指标,听起来很专业,其实它就像是我们日常生活中的“持久力”或者“耐力”概念。想象一下,你买了一款新手机,希望它能陪伴你至少几年时间,而不是频繁出现故障。这款手机的MTBF就是指,在平均情况下,你使用这款手机多久后,它才会出现第一次故障。MTBF不仅是一个技术指标,更是对电子产品制造商质量控制的考验。一个高的MTBF值意味着制造商在材料选择、工艺设计以及质量控制方面都做得很好,这样的产品自然更受消费者欢
    丙丁先生 2024-02-21 08:00 77浏览
  • 一、实验目的熟悉定时器的基本结构,学习定时器的功能和控制方法,并实现基于定时器中断方式控制程序。二、实验原理定时器TMS320CC6748有4个定时器/计数器,均可配置为64位计数器、两个独立32位计数器及自动重装32位计数器,可以产生周期中断DMA事件及外部事件。定时器/计数器还可以用于捕获外部输入信号边缘并计数。此外,定时器1还可以用作64位看门狗计数器。本实验使用的是定时器2。定时器的功能(1)定时时钟源一般来源于DSP内部,当然也可以选择来自于外部。(2)计数可以利用它的功能来计算外部脉
    创龙教仪 2024-02-21 14:09 34浏览
  • HDMI是市场上影音产品的主流接口之一,随着电竞市场蓬勃发展,HDMI 2.1规格针对电竞产品新增加了VRR(可变刷新频率)功能,让用户在玩游戏时可以减少画面的撕裂延迟等现象。VRR功能目前已普遍支持PS5、Xbox等游戏机或是Nvidia、AMD等高阶显卡,也成为消费者在考虑购买电竞屏幕时的重要评估指针。电竞屏幕画面延迟风险与解决方案电竞屏幕属于高阶产品,且客群非常重视其效能表现,百佳泰与市场上主流品牌及ODM在屏幕上有着长期的合作,我们在实测中发现导入了VRR功能的屏幕却仍发生画面不顺畅的状
    百佳泰测试实验室 2024-02-21 16:42 60浏览
  • 一百三十多年前,奔驰夫人贝尔塔为了回击社会舆论对奔驰一号的质疑,驾驶着奔驰汽车从曼海姆出发,直驶104公里外的位于普福尔茨海姆的娘家,全程虽开的磕磕绊绊,但却为汽车的宣传起到了极佳的作用。直至今日,汽车领域新技术的应用依旧会伴随着各种质疑,软件定义汽车的新趋势不断发展,对其的质疑,要求行业对汽车软件要更加严格把控,汽车软件测试日益成为汽车电子开发领域不可忽视的一环。面对当前汽车软件测试的高要求,针对汽车软件代码的测试,会成为软件定义汽车时代势必要关注的内容。而VectorCAST作为汽车电子行业
    北汇信息 2024-02-21 13:57 64浏览
  • 很高兴在面包板社区获得清华大学出版社出版的《物联网鸿蒙系统App开发》一书的试读机会!《物联网鸿蒙系统APP开发》首先用一章的篇幅介绍了智能手机操作系统的发展历史、智能手机操作系统的开放与封闭之争及其各自的优势、鸿蒙系统的发展历史、鸿蒙系统在物联网时代的优势、鸿蒙系统的特点和鸿蒙系统的分层架构。接下来就是本书的主题内容:从鸿蒙的开发环境讲起,然后从创建第一个鸿蒙App开始,从用户界面布局开发、常用UI组件开发、鸿蒙页面及数据服务开发等11个角度介绍了鸿蒙系统开发的方方面面。最后一章简单介绍了鸿蒙
    goldjack_680784864 2024-02-20 23:08 64浏览
  • 时值春节临近,2月7日中国及全球领先的车载激光雷达企业——禾赛科技,发布公告,决定对美国国防部进行起诉:全球领先的激光雷达制造商禾赛科技(纳斯达克代码:HSAI)宣布,关于美国国防部于2024年1月31日(美国东部时间)发布更新“中国涉军企业”名单并将禾赛列入该名单,公司认为此决定是错误、不公正且缺乏依据的。为了维护公司声誉,禾赛决定起诉美国国防部,以捍卫公司的正当权益。禾赛始终坚守合规,秉持诚信、合法经营的原则,致力于减少事故、挽救生命,让全球出行更安全。▲来源:禾赛科技官网1月31日,美国国
    传感器专家网 2024-02-20 21:10 47浏览
  • 热斑效应:太阳能电池一般是由多块电池组件串联或并联起来。串联支路中可能由于电池片内部缺陷或者外部遮挡,将被当作负载消耗其他有光照的太阳电池组件所产生的能量。被遮蔽的太阳电池组件此时会严重发热而受损。编辑搜图请点击输入图片描述(最多18字)旁路二极管:是指并联于太阳能电池板正负极两端之间的二极管,能够有效地防止硅电池片因热斑效应而烧毁,是光伏太阳能组件的重要组成部分,旁路二极管的质量直接影响着光伏电站的发电量及使用安全。编辑搜图请点击输入图片描述(最多18字)热性能测试旨在确定二极管的温度特性以及
    普赛斯仪表 2024-02-21 14:20 35浏览
  • 瑞典乌普萨拉,2024年2月20日 – 全球领先的嵌入式系统开发软件解决方案供应商IAR宣布:推出其旗舰产品IAR Embedded Workbench for Arm功能安全版的最新版本9.50.3。此次发布进一步加强了IAR支持开发人员创建安全、可靠和符合标准的嵌入式应用程序的承诺,涵盖了汽车、医疗设备、工业自动化和消费电子等多个行业。该版本中最重要的新功能是经过认证的C-STAT,这是专为安全关键应用程序设计的静态代码分析工具。 IAR Embedded Workbench for
    电子科技圈 2024-02-21 15:39 51浏览
  • 各大Logo更新汇报 | NEW百佳泰可提供超过30种标准认证测试,特为您整理2024年2月各大Logo的最新规格信息。Matter▶3月5日至12日SVE规格验证活动■ 预计地点» 加州旧金山» 中国▶3月18日 – 第21次会员大会» 新加坡PCI Express▶PCI-SIG合规研讨会 #128■ 2024年2月20日至2月23日■ 台北万豪酒店▶PCIe 7.0规范第三版现已开放给会员USB▶USB 供电版本控制■ 符合USB
    百佳泰测试实验室 2024-02-21 16:23 48浏览
  • 据传感器专家网获悉,2月20日国产3D 视觉传感器龙头企业奥比中光发布公告,终止2023年度向特定对象发行A股股票事项,该定增项目涉及超15亿元资金。传感器专家网https://www.sensorexpert.com.cn专注于传感器技术领域,致力于对全球前沿市场动态、技术趋势与产品选型进行专业垂直的服务,是国内领先的传感器产品查询与媒体信息服务平台。基于传感器产品与技术,对广大电子制造从业者与传感器制造者提供精准的匹配与对接。关于终止本次向特定对象发行股票事项的原因,奥比中光在公告中介绍称:
    传感器专家网 2024-02-20 21:24 70浏览
  • 一、实验目的了解AD9833的芯片特性和输出波形的原理,并实现基于AD9833产生正弦波输出。二、实验原理StarterWareStarterWare是一个免费的软件开发包,它包含了示例应用程序。StarterWare提供了一套完整的GPIO寄存器配置接口,简化了开发步骤,程序开发时只需要调用相应接口即可。安装StarterWare 后,可在安装目录下找到 C6748 所有通用库函数和对应的源码(StarterWare的 drivers 目录下,部分位于其他相关目录下),同时可在安装目录docs
    创龙教仪 2024-02-21 14:27 38浏览
  • 质量管理办法一直是各大企业最核心的根本,例如:国际标准ISO 9000:2015中提出的质量管理 (QM)七项原则、知名车厂的8D (福特)、A3 (丰田) Report以及因应工业4.0所延伸出的质量4.0管理办法等。然而,在谈论全面性的质量管理前,无论企业采用何种质量管控办法,产线良率筛检的环节若无法有效把关,则一切都白费了,面对大批量的生产过程中,需要做到更快、更多、更有效的数据管理,仅靠耗时量少的人工抽样检测,是无法满足现今高质量管理需求的。无法有效把关,出现种种潜在风险1.检测量能不足
    百佳泰测试实验室 2024-02-21 15:23 44浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦