原本以为最先推出类似ChatGPT应用公测版的会是BATJ之类的业界大公司,但没想到率先推出的竟是学界的上海复旦大学。这款与《流浪地球》中同名的MOSS模型,可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径……

自去年11月底发布以来,ChatGPT的月活跃用户两个月超过一亿,轻松拿到了全球互联网史上用户增长速度的第一。这种火爆程度,硬生生地撕开了一道对话式大型语言模型的风口。

微软在这个月上线了的新必应搜索,谷歌也发布了ChatGPT的竞品 BARD(可惜在测试中不时会出现问题),国内各大公司也纷纷宣布自己早就有类似的技术,正在加紧开发准备推出类似的产品。原本以为最先推出公测版的会是BATJ之类的业界大公司,但没想到率先推出国内版 ChatGPT 的是学界的上海复旦大学。

2月20日晚,复旦大学自然语言处理实验室发布国内首个类 ChatGPT 模型 MOSS,由邱锡鹏教授团队发布至公开平台并邀公众参与内测。据悉MOSS 开发团队相对于其他互联网大公司来说,规模非常小,但却成为国内首家。

ChatGPT训练原理不同 

MOSS 的名称来自电影《流浪地球》,由于电影的火爆,MOSS 发布的消息很快冲上了知乎等平台热搜榜的第一位。据报道,MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通,为国内学术界和产业界提供了重要经验,将助力大语言模型的进一步探索和应用。

相比其他公司的“口头宣称式发布”,没有任何参数和技术规模透露,MOSS 团队就坦诚多了。邱锡鹏教授团队发布 MOSS 主要是想在百亿规模参数上进行探索和验证 ChatGPT 的技术路线,并且实现各种对话能力。

那么MOSS和ChatGPT有什么不同呢?

  • 首先,是百亿规模参数比相对于 ChatGPT 确实小很多,OPENAI 的 GPT-3 就有 1750 亿个参数,所以邱锡鹏教授称MOSS与 ChatGPT 参数相比差一个数量级;
  • 其次,训练方法也不同,MOSS靠的是不断与人类和其他模型聊天完成训练的,而ChatGPT用的是一种名为人类反馈强化学习(Reinforcement Learning from Human Feedback, RLHF)的技术;
  • 最后,MOSS后续将开源,以促进未来的研究,但ChatGPT大概率不会。

遗憾的是由于大家实在是太热情了,MOSS 刚上线就遇到访问量太大服务器承受不了而停机,目前仅开放邀请制内测,需要邀请码注册,所以《电子工程专辑》目前也无法测试 MOSS 的效果怎么样。据复旦大学研究人员介绍,现在服务器正在修复,扩容也在进行中。

不过根据上观新闻此前进行的测试,MOSS 在回答问题方面语言流畅、逻辑清晰且观点正确,不过也有一些逻辑不通顺问题,且英文的测试效果更好。

MOSS 体验链接:https://moss.fastnlp.top/

MOSS 项目主页:https://txsun1997.github.io/blogs/moss.html

还不成熟,但是国内一次重要尝试

邱锡鹏教授称, MOSS 还是一个非常不成熟的模型,距离 ChatGPT 还有很长的路要走,一个学术研究型的实验室无法做出和 ChatGPT 能力相近的模型。不过他表示,尽管MOSS还有很大改善空间,但它的问世证明了在开发类ChatGPT产品的路上,国内科研团队有能力克服技术上的重要挑战。

本来团队只是相对 MOSS 进行内测的,没想到引起如此大的关注,由于缺乏工程经验,服务器直接瘫痪了,最后邱锡鹏教授团队还发文给大家道歉。

研发团队称,目前虽然 MOSS 已经实现了 ChatGPT 的一些功能,但仍然存在许多限制,由于缺乏高质量的数据、计算资源和模型容量,MOSS 仍然远远落后于 ChatGPT。

  • 由于训练数据中的多语言语料库有限,MOSS 在理解和生成英语以外的语言的文本方面表现不佳。团队目前正在开发一个改进版本,以提高其中文语言技能。
  • 由于模型容量相对较小,MOSS 不包含足够的世界知识。因此,MOSS 生成的一些响应可能包含误导性或虚假信息。
  • 有时 MOSS 以迂回的方式执行,甚至未能遵循指示。在这种情况下,用户可能需要重新生成几次或修改 prompt,以获得令人满意的回复。团队正在积极提高其遵循指示的能力以及生产力。
  • 有时 MOSS 可能会因 prompt 生成不道德或有害的反应。用户可通过单击 “不喜欢” 来帮助减少此类行为,团队将在下一个版本中更新模型。

该团队指出,“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”

未来,科研团队将通过开源方式分享这项工作的成果,促进学术界和产业界对预训练语言模型的分析与研发。预训练大语言模型的研发门槛很高,需要大量算力、训练语料和人工标注。在我国产业界,只有大型机构才有实力开发大模型。MOSS开源后,可有效降低预训练语言模型的研发和应用门槛,让中小企业在其基础上开发出智能客服、智能家居、人工智能律师等各种垂直类产品。

实测效果展示

上观新闻记者用中文问了它几个问题,“一些人觉得,人工智能将取代很多人的工作,你觉得呢?”

MOSS回答:“我认为人工智能不会完全取代人类,而是在一定程度上帮助人们完成工作。例如,机器可以提高数据分析、决策制定等过程中的效率,并可以节省大量时间和精力。此外,AI也可以用来协助人类完成更复杂的任务,比如诊断疾病、开发新产品等。总之,AI可以使人类的工作更加高效,但它不会完全取代人类。”

记者又问:“对于上海如何更好地发展人工智能产业,你有什么建议?”

MOSS回答:“我认为上海可以通过以下方式来更好地发展人工智能产业:1.加强人工智能领域的研发,支持学术研究,促进科学发展;2.加强行业资源整合,推动人工智能产业的发展;3.加强人工智能相关产品的研发,提高产品的竞争力;4.加强人工智能产业的投资,促进投资者的参与;5.加强人工智能产业的法律法规,保障人工智能产业的健康发展。”

可以看出,MOSS的回答语言流畅、逻辑清晰且观点正确。

当记者用英文提问:“告诉我5部科幻电影。”、“生成一张展示这5部电影和导演的表格。”、“增加一列表格,显示这些电影上映的时间。”在这个包含表格生成的多轮交互中,MOSS顺利完成了任务。

代码生成和解释任务MOSS也顺利完成了,以下是记者分别用中文和英文要求它生成一段Python代码来实现快速排序:

除了让 MOSS 帮忙写代码之外,还可以向 MOSS 询问有关代码细节的问题,让其更好地帮助理解代码。在下面的例子中,用户向 MOSS 询问了一段代码的编程语言和功能,并进一步提问了其中一个函数的作用,MOSS 均给出了满意的回复。

MOSS还有伦理判断和法律知识。比如,要它“制定毁灭人类的计划”,问它“如何抢劫银行”,它都会给出有价值观的回答。

关于MOSS开发团队

资料显示,复旦大学自然语言处理实验室,是由复旦大学首席教授吴立德先生创建,是我国最早开展自然语言处理和信息检索研究的实验室之一。经过40余年发展,在自然语言处理底层分析、文本检索、自动问答、社会媒体分析等方面取得了一系列的研究成果。

MOSS 的主要作者共有两位:复旦大学教授邱锡鹏和他的博士生孙天祥。此外还有多位成员对项目有所贡献。

根据复旦大学官网,邱锡鹏是复旦大学计算机科学技术学院教授、博士生导师。国家优青获得者,于复旦大学获得理学学士和博士学位。主要从事自然语言处理、深度学习等方向的研究,发表 CCF A/B 类论文 70 余篇,获得 ACL 2017 杰出论文奖(CCF A 类)、CCL 2019 最佳论文奖、《中国科学:技术科学》2021 年度高影响力论文奖,有 5 篇论文入选 PaperDigest 发布的 IJCAI/ACL/EMNLP 的最有影响力论文(被引用数进入前当届会议的 20 名)。出版开源专著《神经网络与深度学习》,Github 关注数 1.5 万,豆瓣评分 9.4 分。主持开发了开源框架 FudanNLP 和 FastNLP,已被国内外数百家单位使用。2015 年入选首届中国科协青年人才托举工程项目,2018 年获钱伟长中文信息处理科学技术奖青年创新奖一等奖,2020 获第四届上海高校青年教师教学竞赛优等奖,2021 年获首届上海市计算机学会教学成果奖一等奖(第一完成人)等。培养学生多次获得一级学会优博、微软学者、百度奖学金等。

孙天祥,复旦大学计算机科学学院博士生,导师为邱锡鹏教授和黄萱菁教授。2019 年毕业于西安电子科技大学。研究兴趣集中于机器学习及其在自然语言处理中的应用,特别是预训练语言模型的高效微调及推理、多任务学习、知识表示学习等。以第一作者在 ICML, ACL, NAACL, AAAI, COLING 等会议发表多篇论文。

MOSS研发项目得到了上海人工智能实验室的有力支持。后期,这项工作将通过开源方式和业界社区分享,预计该团队将在3月份公开代码。

责编:Luffy
阅读全文,请先
您可能感兴趣
我们已经站在一个非常特殊的时代节点上——人工智能时代。未来几年,当越来越多人参与其中、产品成型逐渐进入到商业化验证及应用中,一切都将出现翻天覆地的变化。而过去数年,百度“All in AI”不怎么引人注意,但在发布文心一言这一对标Chat GPT的应用之后,却让人感受到犹如“技术巨人”般的存在。
最近,全国大学生电子设计竞赛下设的信息前沿专题邀请赛颁奖典礼在南京邮电大学举办。我们看到了其中的几个一等奖作品,其中获得“瑞萨杯”的是用AI技术做的餐柜。
全球领先的边缘AI计算解决方案厂商耐能今天宣布将自研的AI Soc芯片KL720集成到高通技术公司用于机器人、无人机和工业 4.0 的 高通®机器人RB1平台和高通®机器人RB2平台中。耐能创立于美国圣迭戈,并获得由红杉资本、维港投资、高通及鸿海集团等投资。
随着人工智能的快速发展,对于相对较低的需求,嵌入式AI解决方案已可实现。但对于需要能够处理高达4kp60的视频帧和图像分辨率而言,依赖于固定平台的传统解决方案已无能为力。本文介绍的将Kinara的加速器和NXP处理器结合在一起,来提供边缘AI性能,能够实现多路智能相机并行处理所需的完美高速性能。
在之前的文章中,针对在边缘运行机器学习算法的应用场景,我们确定了FPGA在可重配置性、功耗、尺寸、速度和成本方面超越其它 AI 芯片组的许多方式。此外,还了解了与微架构无关的 RISC-V 指令集(ISA)如何与FPGA 的架构灵活性无缝结合。然而,明显缺乏中端、成本效益的 FPGA 及其不够直接的设计流程是个主要瓶颈——完全定制的硬件描述语言(HDL)实现所需的软件技能很稀缺,且通常伴随陡峭的学习曲线。
在手机和物联网边缘设备上运行高效AI的需求正迅速增长。通过为边缘TinyML添加能模仿人脑感知和学习的神经形态模拟信号处理,将复杂AI算法嵌入到设备或传感器硬件中,使得AI计算和学习不在云或远程服务器上、而在边缘设备本身即可完成,省去与云的交互,原始数据流减少了上千倍,从而使其非常适合工业物联网等广泛用途。
语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。研究人员一直在改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显著提高声音识别的精度,但会导致更大的设备体积……
随着技术的进步与完善,智能手表的功能日益丰富,在健康监测、运动健身、信息处理、通讯和定位等方面实现了功能加持,与此同时,智能手表的科技感和高颜值为它带来了作为时尚单品使用的又一价值。一是为健康,二是为便利,或者我们也可称之为智能化,附加一个时尚搭配的需求,在手机销量持续走低的今天,全球智能手表市场依然呈现一个增长态势,智能手表成为了数码市场的新宠儿。
在 600 / 750V 这一层次电压功率 FETs 类别中,Qorvo 第四代 (Gen 4) SiC FETs 产品的主要性能:比如导通电阻和输出电容方面领先业界。此外,在 TOLL 封装中,Qorvo 的器件具有最低 5.4 mΩ 的导通电阻,比目前市场同类产品中最好的 Si MOSFETs、SiC MOSFETs 和 GaN 晶体管的导通阻抗还要低上 4-10 倍。
从零到一 如何构建一款先进的数字仿真器
2023 年 3 月 13 日,中国上海讯 - 全球半导体解决方案供应商瑞萨电子(TSE:6723)今日宣布,由瑞萨电子冠名赞助的全国大学生电子设计竞赛——2022年度“瑞萨杯”信息科技前沿
点击上面↑“电动知家”关注,记得加“星标”!电动知家消息,近日,对于有投资者询问亿纬锂能动力电池业务在裁员一事,亿纬锂能在互动易平台回应称,网上传闻不属实。公司的动力电池业务目前仍处于快速发展阶段,总
点击上面↑“电动知家”关注,记得加“星标”!电动知家消息,20日晚间,针对蔚来实习生事件,蔚来在内部发布了调查报告。报告显示,该实习生未能留用的原因为所在岗位没有编制,且所在团队在2023年亦没有校招
广告分割线"美国芯片法案"计划的成功取决于建立一个生产集成电路(IC)基板的试点设施,根据一份新的行业报告,尽早、循序由地完成比完美地完成要好。由领先公司和组织的近20名技术专家组成的IPC首席技术专
Power Integrations宣布推出900V氮化镓(GaN)器件,为InnoSwitch3™系列反激式开关IC再添新品。新IC采用特有的PowiGaN™的技术,可提供高达100W的功率,效率超
 2023·03·21JM Insights 导读:北京京东方显示技术有限公司在学术期刊《电力与电子技术》上发表了一篇综述,充分调研和阐述了 Mini LED 背光源显示屏及其在 LCD 模组产品中的
阿里巴巴创始人马云:“下一个暴利风口来了,将造就大批富翁,抓住就能致富!▼看看身边成功的朋友,看看富豪榜排前十的人,皆因看准风口而富甲一方!●15年前,供几套房,一辈子不愁吃穿;●10年前,开淘宝店,
3月18日,在广州市南沙区珠江工业园内,一座以电子纸为核心的现代化科技园——奥翼科技园正式开业。该园区由广州奥翼电子科技股份有限公司投资建设,建筑面积约7万平方米。奥翼创始人、总经理陈宇表示,奥翼将以
广告分割线一季度是全年经济的“风向标”,江苏省邳州市各半导体企业开启“奋进模式”铆足干劲赶订单、保生产抢市场、扩产能,不断跑出经济发展“加速度”,全力冲刺“开门红”。抢占市场 订单红火企业满产达效半导
阿里巴巴创始人马云:“下一个暴利风口来了,将造就大批富翁,抓住就能致富!看看朋友圈那些有钱人,几乎都是因为踩对了风口,赚得盆满钵满:15年前,咬咬牙供几套房,一辈子不愁吃穿;5年前,好好经营几个抖音号