DeepEdge10是国内首创,基于国内自制可控14nm工艺D2D(Die-to-Die)互联 Chiplet先进封装大模型推理芯片,具有SoC主控集成度和C2C(Chip-to-Chip)Mesh扩展架构,内含2大核+8小核的国产RISC-V CPU内核……

边缘计算的市场价值呈现高速发展趋势。IDC预测,到2023年底,全球的边缘计算市场将达到2000亿美金的规模;预计到2026年,边缘计算市场将突破3000亿美金。

边缘计算的场景呈现出算力碎片化、算法长尾化、产品非标化、规模碎片化的特征,传统的算法开发和芯片都难以适应新一代人工智能边缘计算场景的产品化需求。大模型的出现,为行业提供了算法层面的解决之道。但大模型在边缘计算场景要面向实战发挥作用,则需要AI大模型推理芯片的支持。

对于AI芯片而言,大模型带来全新的计算泛式和计算要求。芯片需要具备更大的算力、更大的内存带宽、更大的内存容量,才能支持巨量参数的大模型在边缘端运行。同时,AI边缘推理芯片还承担了“落地应用最后一公里”的职责,这就意味着AI边缘推理芯片不仅要支持大模型等AI计算任务,还需要具备较强的通用算力。

针对上述场景需求,云天励飞打造了新一代边缘AI计算芯片DeepEdge10,并于11月15日在高交会开幕式上重磅发布。云天励飞董事长兼CEO陈宁表示:“从2015年开始,研发到今天的第三代的神经网络处理器,可以全兼容基于Transformer的计算范式。而Transformer是语言、视觉大模型的计算范式,云天励飞2020年开始研究,到2021年就实现了全面兼容。今天发布的DeepEdge10系列芯片,正是基于最新的Transformer计算范式。”

云天励飞董事长兼CEO陈宁博士在高交会开幕式上介绍DeepEdge10芯片

DeepEdge10规格及特性

据介绍,DeepEdge10是国内首创,基于国内自制可控14nm工艺D2D(Die-to-Die)互联 Chiplet先进封装大模型推理芯片,比如通过D2D Chiplet先进封装技术,在一颗封装里面装入更多的DeepEdge10的Die,就能够实现性能的成倍提升。当然,这对于先进封装技术来说,需要保障Die与Die之间能够实现高速互联、大带宽、低功耗、低时延、传输的高可靠性、强大路由、统一内存。

“14nm Chiplet D2D同样可以实现的出色的计算能力,我们基于Chiplet D2D的技术可以实现一次设计流片、多次封装,可推出多颗不同计算规格的AI推理芯片。”陈宁解释道。

DeepEdge10还具有SoC主控集成度和C2C(Chip-to-Chip)Mesh扩展架构,这也意味着,多颗DeepEdge10芯片可以直接通过C2CMesh Torus互联扩展来进一步提升整体的性能,可以实现高达512GB的统一内存、高达192GB的统一内存带宽、实现各计算节点的最短传输延迟、Mesh可重构特性可以支持2×2/3×3/4×4 Mesh。

DeepEdge10内含2大核+8小核的国产RISC-V CPU内核,最高主频1.8GHz;集成了性能可对标Arm Mali-G52的GC8000L GPU,主频800MHz,支持最大8K@30fps的视频编解码能力和最大2亿像素的JPEG编解码能力,并且支持双屏异显(2K@60fps)。

配备云天励飞最新的第四代神经网络处理器(NPU) NNP400T,不仅支持FP16/INT16/INT8等数据格式,还支持多线程、支持Transformer网络结构模型,INT8算力可达12Tops,支持大模型推理部署和算力的灵活扩展。

同时,DeepEdge10还具备硬件级的安全特性,以及完备的高低速外围接口。

DeepEdge10

出货情况

基于一系列创新技术,云天励飞打造了系列化芯片。目前已开发出 Edge10C、Edge10 标准版和 Edge10Max 三款芯片,其中,DeepEdge10C算是精简版,NPU算力为8TOPS。而DeepEdge10Max则是“PRO版”,CPU核心提升到了40核,NPU算力达到了48TOPS。

据陈宁透露,云天励飞下一代的边缘AI推理芯片DeepEdge20将会采用第二代的Chiplet架构,兼容国际标准/国产UCIE标准,内核采用第三代的异构多核架构,并集成自研的第四代的神经网络处理器,届时性能将会比DeepEdge10提升20倍。

目前,云天励飞已向国内头部的AIoT芯片设计厂商、智慧汽车芯片设计厂商、服务机器人厂商、国家重点实验室等提供神经网络处理器的IP授权。出货形态包括芯片、板卡、盒子、加速卡、推理服务器等,可广泛应用于AIoT边缘视频、移动机器人等场景。

在此次发布会上,云天励飞还推出了依托DeepEdge10打造的推理加速卡,包括IPU X2000、IPU X5000和IPU X6000,算力分别为24TOPS、64TOPS和256TOPS。其中,IPU X5000推理卡,已适配并可承载SAM CV大模型、Llama2等百亿级大模型运算。

DeepEdge10 Max

根据云天励飞公布的数据显示,其最强的DeepEdge 10MAX芯片可以支持在端侧运行70亿参数的LLMs大模型,生成速度可达27 Token/s,并且可兼容运行130亿参数的LLMs大模型。而基于DeepEdge10系列芯片的IPU加速卡,通过C2C Mesh互联扩展,算力可达1024TOPS,运行700亿参数的LLMs大模型,生成速度可达42Token/s,并可兼容运行千亿参数的LLMs大模型。

 

云天励飞自2004年成立之初就坚持芯片研发,沉淀“算法芯片化”的核心能力。“算法芯片化”并不是简单的“算法+芯片”,而是云天励飞基于对场景的理解,以及对算法关键计算任务在应用场景中的量化分析,将芯片设计者的理念、思想与算法相融合的AI芯片设计流程,能够让AI芯片在实际应用中发挥更优的效果。

相关阅读:“确认过人脸,是那个拐走孩子的人”

目前公司已完成了3代指令集架构、4代神经网络处理器架构的研发,且已陆续商用。云天励飞还有近30家算法芯片化合作伙伴,这些合作伙伴的需求将会被植入云天励飞的下代芯片当中;在算法应用生态方面,所有使用云天励飞芯片产品的合作伙伴,均可在线下载更新云天励飞的100+种算法。

据介绍,云天励飞已建立起一支核心芯片团队,设计经验平均超过14年。云天励飞的芯片还先后获得工信部、发改委、科技部三大部委人工智能专项,并三度获得“吴文俊人工智能科学技术奖”。

云天励飞副总裁、芯片产品线总经理李爱军在云天励飞AI芯片发布会上详细介绍DeepEdge10情况

云天励飞的自主研发芯片,也是公司自进化城市智能体战略的重要引擎。2020年,云天励飞在高交会上正式发布自进化城市智能体战略。驱动自进化城市智能体发展的核心逻辑,是打造“应用生产数据、数据训练算法、算法定义芯片、芯片规模化赋能应用”的数据飞轮。芯片是决定AI应用广度与深度的关键载体,也是自进化城市智能体建设的重要算力支撑。

展望未来,陈宁认为,三年后,80%以上的企业将运行在大模型之上;五年后,机器人和数字人的数量将超过人类的数量;七年后,也就是到2030年,大模型的智慧程度将超过人脑,那个时候大模型可能将会具备超过1万亿的参数体量,相当于是人脑末梢神经链接的数量,我们正在踏入第四次工业革命的开端。

“在这个过程中,云天励飞也将坚持我们的初心,继续加大自主研发力度,不断的推进人工智能算法的技术、芯片的技术。同时,立足自主可控,以自研‘芯’,为自进化城市智能体发展提供强大引擎。”陈宁说道。

责编:Luffy
阅读全文,请先
您可能感兴趣
尽管黄仁勋重申将重视中国市场,且继续推出特供版AI芯片,但性能无疑会再次“阉割”。据悉,H20等全新特供芯片的研发、设计、生产,将通过后道点断生产工艺,来满足美国新的AI禁令要求。
《报告》显示,2023年上半年,中国人工智能服务器市场规模环比增长54.1%。IDC预计,全球人工智能硬件市场(服务器)规模将从2022年的195亿美元增长到2026年的347亿美元,五年年复合增长率达17.3%;在中国,预计2023年中国人工智能服务器市场规模将达到91亿美元,同比增长82.5%,2027年将达到134 亿美元,五年年复合增长率达21.8%。
对Graphcore而言,时间是非常重要的。2022年5月,Graphcore宣称新一代芯片将在2024年的某个时候上市。届时,Graphcore需要向市场和资本证明自己的发展潜力。这很重要,也很紧迫。
联发科技(MediaTek)近日在加利福尼亚州拉古纳尼盖尔(Laguna Niguel)举行了年度高管峰会。峰会上强调了其以人工智能(AI)为驱动的高端定制 SoC(ASIC)战略;从 Wi-Fi 7 芯片到 5G 和 5G RedCap 瘦调制解调器的全新连接解决方案,凸显了其物联网战略和发展势头。
由于全球生成式AI的井喷式发展,作为AI芯片的主要生产商,英伟达第三财季的营收创造历史记录,同比增长超过一倍,净利润暴涨超12倍。11月22日,英伟达(NVIDIA)公布了截至2023年10月29日的2024财年第三财季的财报:营收创历史纪录达到181.2亿美元,同比增长206%,环比增长34%,净利润92.43亿美元,同比暴涨1259%;毛利率74%,同比提升20.4%;每股摊薄收益为3.71美元,较上年同期的0.27美元增长1274%。
​​​​​​​随着PC市场触底反弹,高通发布全新的骁龙 X Elite SoC,瞄准AI PC市场。全新的骁龙 X Elite 采用台积电 4 纳米工艺节点制造,配备强大的 12 核 Oryon CPU。在Oryon CPU、Adreno GPU和Hexagon NPU之间,骁龙 X Elite可以提供高达75 TOPS的AI计算性能。
据最新HBM市场研究显示,为了更妥善且健全的供应链管理,NVIDIA也规划加入更多的HBM供应商,其中三星(Samsung)的HBM3(24GB)预期于今年12月在NVIDIA完成验证。而HBM3e进度依据时间轴排列如下表所示,美光(Micron)已于今年7月底提供8hi(24GB)NVIDIA样品、SK海力士(SK hynix)已于今年8月中提供8hi(24GB)样品、三星则于今年10月初提供8hi(24GB)样品。
受智能手机产量下滑,以及品牌厂搭载趋势改变的影响,预估2023年智能手机相机模组出货量年减幅度将再扩大至8.9%,约40.65亿颗。而经过一年的库存去化,在2024年智能手机生产量有望恢复的预期下,明年智能手机相机模组市场有望恢复成长,出货量年增率预估3%,约41.71亿颗。
近日,武汉芯源半导体正式发布首款基于Cortex®-M0+内核的CW32A030C8T7车规级MCU,这是武汉芯源半导体首款通过AEC-Q100 (Grade 2)车规标准的主流通用型车规MCU产品。
1200 V分立器件提供出色的性能,有助于加速全球能源转型
杨浦区人大常委会党组书记、主任程绣明到访新思科技,共话以绿色数字经济开创未来之道11月7日,上海市杨浦区人大常委会党组书记、主任程绣明一行到访新思科技,交流企业如何充分利用政府提供的创新沃土,发挥数字
『这个知识不太冷』系列,旨在帮助小伙伴们唤醒知识的记忆,将挑选一部分Qorvo划重点的知识点,结合产业现状解读,以此温故知新、查漏补缺。在过去十年中,移动无线数据快速增长,使得运营商愈加迫切地需要新频
一年一度的白鲸出海全球流量大会GTC重磅来袭!今年GTC出海展区全面升级,规模扩增至15000平方米,覆盖游戏、应用、技术及品牌出海等热门行业,预计将迎来累计超30000名跨境出海相关从业者莅临参观。
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,根据财联社的报道,全美3000多家汽车经销商组成的联盟11月28日向拜登发出一封公开信,呼吁他在电动汽车推广政策上踩刹车。该联盟在信中写道,这
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,科创板上市公司孚能科技(688567)11月29日晚公告,广州工控集团拟将获得公司控制权的方式,由此前的协议转让股份方式,转换为广州工控集团认
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,据魅族科技微博消息,魅族品牌将正式进入汽车市场,第一款魅族汽车MEIZU DreamCar MX,将在2024年一季度启动DreamCar共创
欢迎阅读来自QUIKSOL的现货市场洞察报告,希望这份来自芯片现货市场的实战总结及分析能给您带来些许帮助和价值。如果您有任何疑问或要求,欢迎来电或邮件咨询contact@quiksol.com如有需求
第六届半导体大硅片论坛将于12月7-8日在上海召开,来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇名额已满半导体硅
由亚化咨询主办的第六届半导体大硅片论坛将于12月7-8日在上海召开。来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇