过去的一年,大家都感受到了大模型取得了令所有人所称道的成绩,其背后实际上是强大的算力支撑。如果从2012年这一轮深度学习开始实现有效应用算起,它的算法网络结构其实就是持续极高速的增长,大概每六个多月可能就要翻一倍。单一AI算法对于算力的需求就增加了30万倍。

2023年,随着以ChatGPT为代表的AI大模型爆火,算力需求大幅上升,也推升了算力的核心AI芯片的需求。如何在新趋势、新挑战下快速响应需求,推出切实可用的软硬件解决方案,成为了摆在AI芯片企业面前的重要课题。在2023中国临港国际半导体大会上,商汤科技联合创始人、大装置事业群总裁杨帆以“AI大模型技术发展对芯片的关键挑战”为主题,分享了当前AI技术趋势下的新挑战,以及商汤科技在AI大模型方面的布局情况。

汤科技联合创始人大装置事业群总裁

杨帆表示,最近一年,AI大模型实现了快速的增长。可以说,人工智能新范式(AGI)已经到来。今年4月,商汤科技也推出了“商汤日日新SenseNova”大模型,主要包括中文语言大模型应用平台、AI 内容创作社区平台、AI 数字人视频生成平台、场景 3D 内容生成平台、物体 3D 内容生成平台5大应用平台,“我们相信下一代大模型还是会进入到多模态的领域。”

据介绍,商汤科技大模型可以应用于智能客服、营销内容生成(主要包括AI营销素材生成和数字人直播)、选股问答等智能化服务,同时还可以满足“大模型+”多行业应用,比如能源、汽车、医疗、文旅等。

“最近半年,我们可能感受还不强烈,主要在于很多基于大模型的应用还处在试用或者小范围市场化阶段,但到了2024年绝大多数人应该能感受到大模型带来的力量。这些新的技术和应用的出现,会让我们感受到过去AI所提供的内容和服务还是太简单了,同时我们相信未来它可以拥有更大的力量。”杨帆这样看AI大模型未来发展趋势。

“过去的一年,大家都感受到了大模型取得了令所有人所称道的成绩,其背后实际上是强大的算力支撑。如果从2012年这一轮深度学习开始实现有效应用算起,它的算法网络结构其实就是持续极高速的增长,大概每六个多月可能就要翻一倍。单一AI算法对于算力的需求就增加了30万倍。”杨帆表示,“其实数据规模就决定需要一个更复杂的网络,就像人的大脑一样,需要更多的大脑的节点连成一个网络,才能够承载和消化这些数据中隐含的价值、规律和信息。虽然我们并不知道它是怎么去提炼的,但是这个规模关系是明确的。一个更加复杂的网络结构或者大脑结构势必需要更大规模的算力。”

杨帆介绍,随着技术门槛的不断提高,算力成为发展的关键基石。近期热点技术应用如ChatGPT、大模型等技术应用对AI算力及数据的需求逐步上涨。作为一个大型语言模型,ChatGPT使用了大量的训练数据,因此需要高效的存储系统来存储这些数据。此外,训练模型需要大量的计算资源来进行训练,需要高性能的处理器来支持训练。

杨帆指出,过去十年,数据、模型、算力这三大AI要素持续的规模化,推动着整个人工智能的技术进步,但至今我们还没有触及到极限所在。

“可以看到,伴随着数据进一步提升,我们仍然没有触摸到AI的能力极限。我们也不知道,如果能够获得更高一个量级的数据,我们用再大一个量级的算力支撑去训练它的时候会发生什么?这是今天在人工智能领域所面临的挑战。”杨帆表示,如果把人工智能领域未来面临的挑战再映射到集成电路上,我们在芯片算力上将面临更大的挑战。而在国外新的AI禁令下,中国企业在AI大模型发展上正面临更大的挑战,不仅国外AI芯片出口受限,而且国内AI芯片供给不足,特别是要进行更大数量级的AI大模型训练,需要耗费更多的资源。

当然,他也坚信,正是在这样的挑战之下,中国产业链生态将形成更深度的合作,包括芯片制造、软硬件适配等。为此,商汤科技也做了很多工作以及相关布局,比如加大与国内AI芯片厂商合作,成立算力产业生态联盟,推动一些行业标准的建立,同时还在临港建设智能计算中心(目前国内最大单体人工智能计算中心)。

此外,杨帆也希望包括人工智能软件厂商、芯片厂商在内的产业链企业协同配合,共同推进人工智能的发展。

责编:Jimmy.zhang
本文为EET电子工程专辑原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
阅读全文,请先
您可能感兴趣
除了英特尔之外,台积电、三星、SK海力士等头部晶圆厂商均在积极抢购ASML新一代的高数值孔径 High-NA EUV光刻机。据悉,ASML最新的High-NA EUV光刻机设备的价格将在3亿至3.5亿欧元之间,当前热销的EUV光刻机单价则为1.5亿-2亿美元。
一名不愿透露身份的消息人士透露,被裁的员工约有 15 人将被安排从事与中国有关的项目。另一位不具名人士表示,被裁掉的职位目前由合同制软件工程师“顶上”,他们曾参与涉及 Arm 全球业务的项目。
从华为的员工配股,到最近火爆全网的董宇辉成为东方甄选高级合伙人,“股权激励”如今已成为大公司激励员工的常见手段。但这种非常棒的激励方式,在一些行业巨头中反倒成了问题……
Imagination作为手机GPU市场声名显赫的企业,在被凯桥资本收购以后,就进入到了发展的第二篇章。现在的Imagination已经不是过去那个只关注手机GPU的IP供应商了——电子工程专辑和Imagination首席产品官James Chapman聊了聊现在的Imagination...
Intel这次发布酷睿Ultra的阵仗挺大,毕竟这颗处理器汇聚了Intel最先进的N个技术:Intel 4工艺、Foveros 3D封装,还有CPU、核显、AI各类相关技术...来看看在酷睿Ultra的加持下,明年的笔记本会变成什么样。
除了企业层面,在争夺2纳米光刻机上,各国政府层面也在深度介入。除了此次韩国总统出访荷兰以达成深度合作之外,今年6月,日本和荷兰签署了半导体领域合作备忘录。双方欢迎半导体及相关技术领域企业之间的现有合作,并将推动产学研合作。日本和荷兰还将考虑在相关领域建立双边计划。但像韩国总统这样亲自介入2纳米芯片,实属首次。
本文介绍了标准电路保护器件的局限性,以及如何利用电子保险丝改进设计。
TrendForce集邦咨询表示,第三季NAND Flash市场变化主要转折点为三星(Samsung)积极减产的决策。此前买方认为终端需求能见度仍低,担忧市场旺季不旺,因此保持低库存、缓提货的采购策略。
英飞凌正在朝着2030年实现碳中和的目标(范围1和2的碳排放)稳步前进,并且进展顺利。尽管业务增长了约一倍,但公司迄今为止的碳排放量与2019年的基准相比减少了 56.8%。
治精微推出极高静电保护性能的40V多路复用器系列产品ZJG4428/9
点击上方蓝字谈思实验室获取更多汽车网络安全资讯汽车电气架构向中央集中式演进集中式架构成智能驾驶主流,以太网在中心节点占据优势地位。电子电气构架的演进为提升智能驾驶能力提供了坚实的基础。在自动驾驶、智能
天眼查资料显示,12月12日,株洲中车时代电气股份有限公司(以下简称时代电气)公开一项“一种高压SiC电机控制器及包含其的电动汽车”专利,申请公布号CN117220562A,申请日期为2023年8月3
12月19日下午,台积电发布重大消息,现任董事长刘德音将退休,董事会提名其职位由现任副董事长兼总裁魏哲家接任,这标志着台积电台积电持续六年的“双首长制”可能会结束。2018年6月5日,87岁的张忠谋宣
近日,由钛媒体集团主办的2023 T-EDGE全球创新大会暨EDGE AWARDS创新评选在北京隆重举办。会上,钛媒体重磅发布了2023 EDGE AWARDS全球创新评选榜单。百望云凭借对数字化财税
网络是企业背后的基础,这些网络可帮助企业将信息保存在一个集中位置,需要并限制所有其他入站请求的人都可以访问。那么,如何提供持续的一流最终用户体验并维护快速发展的网络呢?只有借助可靠的实时网络监控工具,
                                              编辑:感知芯视界 Link获取最新力传感器深度报告,可在感知芯视界首页对话框回复“28”免费下载。力传感器是
12 月 20 日消息,上市已经有74 年历史的日本科技巨头东芝将于当地时间周三从日本东京证券交易所退市。为了摆脱长期的管理混乱,该公司接受了日本国内投资基金Japan IndustrialPartn
充电泵(无电感)DC/DC转换器在对空间有限制的应用中颇受欢迎,它一定需要低到中负载电流供电。这种转换器采用了小型封装,静态工作电流很低,且需要最少的外部元件。但是,噪音的产生是许多充电泵的一个不太理
达·芬奇,是一位代表了人类创造力巅峰的天才。他被大多数人所熟知的身份是画家,但是从人体解剖到建筑、天文,达·芬奇都有着广泛的成就。在一份《大西洋抄本》的达·芬奇手稿中,这位天才发现桥梁构造,如同织物的