在3月15日凌晨1点,OpenAI发布GPT-4最新语言模型,而这距离ChatGPT的上线仅仅过去了4个月时间......

电子工程专辑讯 在3月15日凌晨1点,OpenAI发布GPT-4最新语言模型,而这距离ChatGPT的上线仅仅过去了4个月时间。

GPT-4是通过在微软Azure上训练大量的数据来生成的。微软已经向这家初创公司投资了数十亿美元。GPT-4使用了OpenAI最新一代人工智能架构Pathways研发的5400亿参数大模型——PaLM,可以接受图像和文本输入,输出文本,具备标记因果关系、上下文理解、推理、代码生成等等多项功能,其中常识推理能力更是较之前提升了20%。

来自推特

先简单介绍下GPT的一个发展历程:

  • 2017年6月,Google发布论文《Attention is all you need》,首次提出Transformer模型,成为GPT发展的基础。
  • 2018年6月,OpenAI发布了第一个GPT模型,使用了117M参数和80万词汇量的Transformer模型,在12个自然语言处理任务上取得了优异的结果。
  • 2019年2月,OpenAI发布了GPT-2模型,使用了15亿参数和50万词汇量的Transformer模型,在36个自然语言处理任务上刷新了记录。
  • 2020年5月,OpenAI发布了GPT-3模型,使用了1750亿参数和50万词汇量的Transformer模型,在多个自然语言处理任务上达到了人类水平或超越人类水平。
  • 2021年11月,OpenAI发布了ChatGPTPlus模型,使用了300亿参数和100万词汇量的Transformer模型,在对话生成方面表现出惊人的能力。
  • 2023年3月,OpenAI发布了GPT-4模型,使用了5400亿参数和100万词汇量的PaLM架构,在多种输入输出类型上展现出强大的生成能力。

GPT-4的语言和考试能力

GPT-4是OpenAI扩展深度学习的最新里程碑,它通过模拟律师考试,分数在应试者的前 10% 左右;相比之下,GPT-3.5 的得分在倒数 10% 左右。OpenAI通过使用最新的公开测试(在奥林匹克竞赛和 AP 自由回答问题的情况下)或购买 2022-2023 年版本的模拟考试来继续进行。他们没有针对这些考试进行专门培训,不过该模型在训练期间看到了考试中的少数问题。OpenAI认为结果是具有代表性的。

图1:考试成绩(按GPT-3.5成绩排序)注:估算的百分位数下限(在应试者中)

这是考试结果的输出图,往下再看看GPT-4在不同领域的考试分数。对比GPT-3有显著提升。

图注:GPT-4的考试成绩清单

OpenAI在机器学习模型设计的传统基准上评估了GPT-4。GPT-4的性能超过了现有的大型语言模型,与大多数最先进的(SOTA)模型并驾齐驱,这些模型可能包括针对基准的工艺或额外的训练协议。

在其他语言的能力上,OpenAI使用Azure Translate将MMLU基准——一套涵盖57个主题的14000个多选题--翻译成了各种语言。在测试的26种语言中的24种语言中,GPT-4的表现优于GPT-3.5和其他LLM(Chinchilla,PaLM)的英语表现,包括低资源语言,如拉脱维亚语(Latvian)、威尔士语(Welsh)和斯瓦希里语(Swahili):

从数据来看,GPT-4对于中文等非英语语言也有很大的进步,处理中文的准确度大幅提升。

GPT-4的视觉输入

GPT-4的视觉可以将图像作为输入,并生成标题、分类和分析,还可以利用图像和文本的信息来完成各种任务,例如:从图片中提取信息并回答问题;根据图片生成描述性或创意性的文本;根据文本生成相关的图片;识别图片中的物体、人物、场景等。

在OpenAI的视觉输入案例介绍中是关于“VGA充电器”。

用户:这张图有什么好笑的?一个面板一个面板地描述它。

GPT-4:该图显示了带有三个面板的“Lightning Cable”适配器的包装。

面板 1:带有 VGA 连接器(一种大的蓝色 15 针连接器,通常用于计算机显示器)的智能手机已插入其充电端口。

面板 2:“Lightning Cable”适配器的包装,上面有 VGA 连接器的图片。

面板 3:VGA 连接器特写,末端有一个小型闪电连接器(用于为 iPhone 和其他 Apple 设备充电)。

这张图片中的幽默来自将过时的大型 VGA 连接器插入小型现代智能手机充电端口的荒谬做法。

上图可见,它已经可以看懂梗图、漫画、艺术作品等多种形式的视觉内容,并与之进行交互。

安全问题的改善

GPT-4在敏感问题上的回答也有很大的改善。OpenAI请了50 多位来自 AI 对齐风险、网络安全、生物风险、信任和安全以及国际安全等领域的专家来对模型进行对抗性测试。他们还收集了额外的数据来提高 GPT-4 拒绝有关如何合成危险化学品的请求的能力。

也就是说,GPT-4与 GPT-3.5 相比,显着改善了许多安全特性。他们已将模型响应不允许内容请求的倾向降低了 82%,并且 GPT-4 根据政策响应敏感请求(例如,医疗建议和自我伤害)的频率提高了 29% 。

OpenAI还对GPT-4多方面进行了测试,来证明现在的GPT-4具备更加先进的AI性能,我这里就不一一介绍。OpenAI也对此表示,期望GPT-4能作为一个有价值的工具,为许多应用程序提供动力来改善人们的生活。

不过OpenAI也警告称,GPT-4还不完美,在许多情况下,它的能力不如人类。该公司表示:“GPT-4仍有许多已知的局限性,我们正在努力解决,比如社会偏见、幻觉和对抗性提示。”

额外提一点的是,可能会有人好奇GPT-4怎么访问。根据OpenAI官网介绍,如果要访问 GPT-4 API(它使用与 gpt-3.5-turbo 相同的ChatCompletions API),需要注册他们的候补名单。在OpenAI发布GPT-4后就开始邀请部分开发人员,并逐步扩大规模以平衡容量与需求。不过目前的GPT-4还只能支持纯文本请求,图像输入仍处于有限的 alpha 阶段。按照现在的说法是,开放的GPT-4只支持到6月14日,之后就要开始收费了。

GPT-4里程碑背后的喜和忧

GPT-4的推出也让很多人感觉到担忧,比如有一研究NLP的普通博士就表示,作为一个研究NLP的普通博士生,我对GPT-4有一种复杂的感觉。这当然是令人沮丧的,因为它使我对自己的研究价值产生怀疑。但是,这种兴奋感太过强烈了 ;grinning:

还有网友评论,看来以后只能去做个司机了,因为GPT-4没有手......(但是以后会有自动驾驶......)

还有推特@Pietro Schirano借助GPT-4尝试了在60秒内重建了一个乒乓游戏“pong”,并表示,“GPT-4是一个令人难以置信的变革技术。”Pietro Schirano之前采用GPT 3.5时候必须进行一些调试或者询问错误,这是他第一次一次性完成。

GPT-4的发布还是有很大的意义,它是人工智能领域的一次巨大飞跃,也是技术道德规范的又一重大转变。GPT-4不仅提高了语言理解和生成的能力,还增加了图像处理和多模态融合的能力,为各种智能应用和交互式游戏提供了更强大的技术支持。同时GPT-4也给我们带来了新的挑战和机遇,例如如何保护数据隐私、防止信息造假、促进技术公平等。

责编:Amy.wu
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
由于全球半导体业务出现回调,内存更是处于重灾区,在连续数月下跌之后,今年第一季度韩国两大内存厂商三星和海力士的库存大幅增长,营收或均出现较大亏损,据分析预测,整个2023年的内存营收也将出现较大幅下滑。根据世界半导体贸易统计,2022年全球内存市场价值将下降12.6%,2023年将下降17%,2023年或将出现四年来半导体市场首次下降。
沸沸扬扬的美国罗切斯特大学的物理学家Ranga Dias及其团队在2023年美国物理会议上报告的镥-氮-氢(Lu-N-H)材料“21℃室温超导”论文,在经历了多重复刻,在8天左右被被南京大学物理学系教授闻海虎团队公布推翻。
台积电创始人张忠谋在台湾《天下》杂志举办的访谈中,首次对外明确表态,支持美国减慢中国大陆的芯片产业发展政策......
3月20日,据央视新闻报道,中央纪委国家监委对紫光集团有限公司原董事长赵伟国涉嫌职务犯罪问题进行了立案调查。
尽管日本在重振半导体产业上拥有坚实的基础,但半导体人才正成为日本半导体产业发展的掣肘因素之一。不过,解决半导体人才缺口的长久之道自然是培养本土的技术人才。而日本政府此次的海外人才学习计划也是着眼于长远的发展目标。
从高位需求到快速坠落,这是IC行业多年来前所未见的。根据富昌电子数据,海外 MCU 厂商当前大部分产品货期维稳或缩短,汽车 MCU 货期部份紧缺,价格趋势维稳或上涨。2023年Q1会是MCU衰退的谷底,并在2023年的Q2-Q3回升?
语音是人类交流的重要方式,但说话人的健康状态(例如神经疾病、癌症、外伤等原因导致的声音障碍)和周围环境(噪音干扰、传播介质)往往会影响声音的传输和识别。研究人员一直在改进语音识别和交互技术以应对微弱的声源或嘈杂的环境。多通道声学传感器可以显著提高声音识别的精度,但会导致更大的设备体积……
随着技术的进步与完善,智能手表的功能日益丰富,在健康监测、运动健身、信息处理、通讯和定位等方面实现了功能加持,与此同时,智能手表的科技感和高颜值为它带来了作为时尚单品使用的又一价值。一是为健康,二是为便利,或者我们也可称之为智能化,附加一个时尚搭配的需求,在手机销量持续走低的今天,全球智能手表市场依然呈现一个增长态势,智能手表成为了数码市场的新宠儿。
在 600 / 750V 这一层次电压功率 FETs 类别中,Qorvo 第四代 (Gen 4) SiC FETs 产品的主要性能:比如导通电阻和输出电容方面领先业界。此外,在 TOLL 封装中,Qorvo 的器件具有最低 5.4 mΩ 的导通电阻,比目前市场同类产品中最好的 Si MOSFETs、SiC MOSFETs 和 GaN 晶体管的导通阻抗还要低上 4-10 倍。
从零到一 如何构建一款先进的数字仿真器
点击上面↑“电动知家”关注,记得加“星标”!电动知家消息,3月20日,长安汽车披露了投资者关系活动记录表。内容显示,长安汽车正筹备建设全球区域总部,并推进设立东盟基地,其产品将辐射澳新、南非等市场;同
汽车行业的跳槽热浪过去了一波之后,平静的朋友圈被一个前同事的咨询打破了。这哥们也是资深BMS软件开发工程师了,前两年混迹了一圈各大主机厂,从传统自主品牌跳到合资品牌再跳到头部新势力企业,拿捏得了算法、
前一阵子,DrameExchange公布了去年Q4全球DRAM市场的数据,吓了我一跳,最近NAND市场的数据也出来了。整理完数据我都不知道该如何写报告了。简单一句话概括,整个存储器市场在最近半年里跌没
点击上面↑“电动知家”关注,记得加“星标”!电动知家消息,近日,对于有投资者询问亿纬锂能动力电池业务在裁员一事,亿纬锂能在互动易平台回应称,网上传闻不属实。公司的动力电池业务目前仍处于快速发展阶段,总
点击上面↑“电动知家”关注,记得加“星标”!电动知家消息,美国电动车制造商马伦科技(Mullen Automotive) 今天宣布,它已重新获得前途K50在北美和南美的知识产权和经销权。此后,该公司将
芯片封装目前逐渐向小型化、多引脚、高集成的方向持续发展,异构集成、2.5D、3D、SIP技术让芯片封装结构更加集成且复杂化。作为后摩尔时代芯片性能提升最佳途径,以Flip-chip等为代表的先进封装技
Power Integrations宣布推出900V氮化镓(GaN)器件,为InnoSwitch3™系列反激式开关IC再添新品。新IC采用特有的PowiGaN™的技术,可提供高达100W的功率,效率超
 2023·03·21JM Insights 导读:北京京东方显示技术有限公司在学术期刊《电力与电子技术》上发表了一篇综述,充分调研和阐述了 Mini LED 背光源显示屏及其在 LCD 模组产品中的
(广告分割线)近日,广东省高新技术企业协会正式颁发《2022年度广东省名优高新技术产品证书》。金禄电子科技股份有限公司(以下简称“金禄电子”)申报的3项产品成功获评。金禄电子是专业从事印制电路板(PC
3月18日,在广州市南沙区珠江工业园内,一座以电子纸为核心的现代化科技园——奥翼科技园正式开业。该园区由广州奥翼电子科技股份有限公司投资建设,建筑面积约7万平方米。奥翼创始人、总经理陈宇表示,奥翼将以