广告

“星星之火,可以燎原”,国内首个二代AI训练芯片刷新多项业界记录

时间:2021-07-08 作者:邵乐峰 阅读:
继成功推出第一代训练芯片“邃思1.0”和“云燧T10/T11”人工智能训练加速卡后,2021年7月,燧原科技全新一代“邃思2.0”和“云燧T20/T21”芯片面世,多项性能指标刷新了中国芯片的记录,也让燧原科技成为了国内首家发布第二代人工智能训练产品组合的公司。
广告

作为一家专注于人工智能领域云端算力的高科技公司,燧原科技自2018年成立以来,已累计获得32亿人民币投资。经过几年的发展,目前,燧原科技员工人数超过五百人,研发人员接近90%,拥有52项专利(包括45项发明专利),还有近30项专利正在申请。

在公司成立18个月后,燧原科技成功推出第一代训练芯片“邃思1.0”和“云燧T10/T11”人工智能训练加速卡。两年后,2021年7月,全新一代“邃思2.0”和“云燧T20/T21”芯片面世,多项性能指标刷新了中国芯片的记录,也让燧原科技成为了国内首家发布第二代人工智能训练产品组合的公司。

中国计算芯片的多项纪录被刷新

新发布的邃思2.0芯片采用2.5D封装,整合了9颗芯片,整体封装尺寸达到了惊人的57.6mm×57.6mm。燧原科技创始人兼COO张亚林在发布会上强调称,这是目前中国最大的计算芯片,即便与竞争对手的旗舰产品相比也毫不逊色。

邃思2.0进行了大规模的架构升级,采用了新一代全自研的GCU-CARA全域计算架构,针对人工智能计算的特性进行深度优化,夯实了支持通用异构计算的基础;支持全面的计算精度,涵盖从FP32、TF32、FP16、BF16到INT8,并成为中国首款支持单精度张量TF32数据精度的人工智能芯片。单精度FP32峰值算力达到40 TFLOPS,单精度张量TF32峰值算力达到160 TFLOPS,以上数据均为国内第一。

张亚林指出,TF32几乎可以应用在大部分AI场景中,包括机器视觉、语音、自然元翻译、强化学习等,都具有应用TF32的潜力。从行业趋势来看,TF32很可能会成为用于训练业务的最重要的数据精度类型之一。

值得关注的是,邃思2.0芯片上共搭载了4颗HBM2E片上存储芯片,高配支持64 GB内存,带宽达1.8 TB/s,这也是中国第一颗支持HBM2E和单芯片64 GB内存的产品。

“燧原的每一代产品必须比前一代在‘平均业务’中将每瓦性能提升三倍以上。“这是张亚林代表燧原科技公布的“燧原产品定理”,基于上述思路,燧原还同时发布了公司训练计算产品和推理计算产品路线图。根据规划,下一代训练芯片将于2023年面世,每瓦性能会比邃思2.0提升两倍。届时还会有推理芯片同步亮相,其性能也将获得大幅提升。

燧原科技第二代通用人工智能训练加速卡“云燧T20”是一个全高全长的PCIE板卡,在FP 32/TF 32下的峰值算力可以达到134.4T(单精度张量)和33.6T(单精度)。在BF16/FP16下的峰值算力则能做到134.4T,INT8的峰值算力更是达到了268.8T,可以与友商旗舰一较高下。云燧T21采用OAM模组模式设计,在多个模式下拥有杰出的表现。

除了硬件性能的提升,为了降低开发门槛,燧原科技还在互联与软件上加大了投入。

GCU-LARE全域互联技术即为代表之一,作为一项专为人工智能训练集群研发的互联技术,GCU-LARE能提供双向300GB/s互联带宽,支持数千张云燧CloudBlazer加速卡互联,实现优异的线性加速比。

与此同时,燧原自主知识产权的计算及编程平台驭算TopsRider也获得了升级。通过软硬件协同架构设计,全新的驭算TopsRider能够充分发挥邃思2.0的性能;基于算子泛化技术及图优化策略,能支持主流深度学习框架下的各类模型训练;再通过利用Horovod分布式训练框架与GCU-LARE互联技术相互配合,为超大规模集群的高效运行提供解决方案。开放升级的编程模型和可扩展的算子接口,为客户模型的优化提供了自定义的开发能力。

基于训练加速卡,燧原还推出了超大规模智算集群,被命名为“云燧智算集群(CloudBlazer Matrix 2.0)”。该智算集群包含了8192张云燧训练卡,可实现最高1.3E的算力,代表着燧原“正使用集群化产品登上中国智能计算和新基建算力舞台”,张亚林说。

星星之火,可以燎原

在工业4.0“智造”时代,人工智能是关键动力。但因为摩尔定律放缓,产业必须加快在异构计算领域的投入,这就意味着以芯片为核心的算力将成为工业4.0兵家必争之地。基于上述考虑,燧原科技推出了异构计算生态——“燎原”计划。

燧原科技CEO赵立东表示,“燎原”计划有三大特征和目标,第一,一定要原始创新,自己从头打造基础;第二,一定要建立标准化生态,第三,以开放的姿态共建生态。三个目标则分别是以人工智能为起点,构建通用异构计算生态,构建标准化的技术体系,以及共建完整生态服务数字中国。而“燎原”计划的内涵也包括繁荣开放的开发者生态、健康互利的产业生态和持续创新的教科研生态。

不仅如此,燧原科技正在与杭州之江实验室、上海交通大学、西安交通大学等一系列产学研伙伴合作,这些合作都依附于燧原科技已有产品进行合作,通过现有的产品不断去打磨生态。

张亚林指出,2020年燧原科技公布第一个客户落地开始,就一直在坚持三条业务线:泛互联网、传统行业和新基建,在这三个业务线上不断发力,构筑整个业务群,同时也得到了非常多的客户反馈,这在反馈侧面印证了客户对燧原科技的重视度,也助力催生了第二代产品。所以,第二代产品是在看到一些客户的需求后推出的。燧原整个公司推出的产品与节奏,第一代和第二代间距是一年半,快于行业内的标杆速度。 

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
邵乐峰
ASPENCORE 中国区首席分析师。
  • 拆解第三代亚马逊Echo Dot,发现音质升级的秘密 第三代Echo Dot在声音效能方面有了很大的改进。这项增强功能反映了多大程度的内部电子升级呢?提升声音效能的背后动机又是什么?让我们来一探究竟吧!
  • 拆解Realme Q2i 5G手机:通过硬件控制成本,实现998的售价 首先,Q2i 的屏幕采用6.5英寸1600x720分辨率的LCD屏,720P分辨率的智能手机已经比较少见了,而且这块屏幕的生产厂商未知。再加上未知厂商电芯+OV主摄都进一步降低了整机成本……
  • 传台积电全面涨价20%即刻生效,其他Foundry或陆续跟进 据台湾经济日报报道,上周台积电通知客户全面涨价20%,而且8月26日之后上线生产都是涨价后的价格,且已下单也在涨价之列。作为全球晶圆代工龙头,台积电涨价带来的影响是全方面的,分析人士表示,包括中芯国际、联电、世界先进、力积电等厂商或跟进涨价,新一轮芯片“涨价潮”将至……
  • 探讨最新处理器技术, 共话MCU生态 2021年8月26日,由ASPENCORE举办的一场“全球MCU生态发展大会”汇聚了微控制器领域的技术和应用专家,共同探讨最新处理器技术、边缘AI、新兴应用和生态发展等热门议题。此次大会的主题为“把握'芯'基建,共绘MCU生态”。
  • Intel GPU的野望:从游戏到数据中心 今年的Intel Architecture Day上,更多有关Intel GPU的产品信息揭开面纱。这次Intel主要谈到了面向游戏玩家的Xe-HPG架构Alchemist GPU;以及面向数据中心的Xe-HPC架构GPU芯片Ponte Vecchio。后者被Intel形容为技术难度“堪比登月”的芯片,这也是我们第一次见到MCM(Multi-chip Module)/chiplet形态的GPU芯片……
  • 中移动发布2021智能硬件质量报告,三大5G商用芯片骁龙/ 中国移动日前在《2021年智能硬件质量报告》中,选取了11个品牌的45款5G手机进行综合能力测评,分别在通信指数、手机游戏、手机摄像头等方面,以及综合性能上给出了排行榜。除了对5G手机整机的评测,中国移动对5G芯片的评测也受到广泛关注,去年上榜的华为麒麟9000因各种原因缺席,擂台上仅剩高通骁龙888、联发科技天玑1200、三星Exynos1080三款主流5G芯片……
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • EMC对策产品: TDK推出用于移动设备 TDK株式会社(TSE:6762)推出用于移动设备的TCM0403M系列小型薄膜共模滤波器
  • 比科奇ORANIC板卡获行业大奖,5G小基 比科奇(Picocom)日前宣布:该公司荣获全球小基站论坛(SCF)一项大奖,其全新的ORANIC板卡赢得了全球小基站论坛(SCF)2021年度“小基站芯片及组件杰出创新金奖”。
  • 基站中的无源交调(PIM)----挑战和解决方案 电子万花筒平台核心服务 中国最活跃的射频微波天线雷达微信技术群电子猎头:帮助电子工程师实现人生价值! 电子元器件:价格比您现有供应商最少降低10%射频微波天线新产品新技术发布平台:
  • 推动本土FPGA生态建设,2021 FPGA生态峰会火热报名中!!! FPGA在我国通信、工业、汽车、物联网以及医疗电子、消费电子领域正发挥越来越大的作用,伴随FPGA的应用深入,FPGA厂商高歌猛进,在2020年均获得了快速发展!继成功举办两届FPGA应用创新论坛之后
  • 【求职必备干货】电子工程师面试笔试题汇总 ▲ 更多精彩内容 请点击上方蓝字关注我们吧!金九银十,又到一年毕业求职季,面对人生的第一份工作,既兴奋又担心。每位学子都希望能进入大厂历练,为自己的职业生涯打下坚实基础。每年这个时
  • 国产替代之痛,这款超高性价比的MCU堪称“翘楚”! MCU涨价缺货是埋在工程师心头的一根刺,从晶圆产能告急再到疫情天灾不断,MCU市场命途多舛。而究其市场国外产品占据超过70%,加之地缘政治摩擦加剧,国产化和国产替代成为当代电子必谈之需。记者获悉,从去
  • 一代国民神车落寞,宝马中国收购华晨中华工厂 点击蓝字关注我们据财经汽车报道,8月31日,华晨集团等12家企业实质合并重整案召开第二次债权人大会,会上共有三项议案,包括财产管理及变价方案、成立债权人委员会两项议案,以及核心议案宝马中国收购华晨中华
  • LED显示屏企业站上“新零售”赛道 2016年阿里云栖大会上,新零售这一概念被提出。何为新零售?简单来说,就是以数据为驱动,通过新科技发展和用户体验的升级,来改造零售业形态,其本质是通过线上销售和线下销售的相互融合,更好地提升顾客的购物
  • 增速最快!中芯国际Q2晶圆代工表现抢眼 快科技消息,8月31日,集邦资讯公布Q2季度全球晶圆代工市场最新排名,总产值达到了244.07亿美元,环比增长6.2%,创下了2019年Q3季度以来连续8个季度增长的新高。在TOP10厂商中,台积电一
  • MOS工作过程 if (!window.__second_open__) { document.getElementById('js_image_desc').inne
  • 为什么DDR电源设计时需要VTT电源 往期精彩1、超全超详细Mos管元件特性及工作原理介绍;2、超详细开关电源芯片内部电路解析;3、70G硬件设计资料汇总分享;【友情推荐】4、分享一份老工程师(某为工作15年)经常使用的pcb企业封装库包
  • 相见恨晚的Altium Designer使用技巧 首先声明下,写这个专题的目的不是为了做教程,所以前提都是建立在大家对于AD比较熟悉的基础上,旨在为大家减少一些画板过程中的繁琐机械的劳动~本文转载自Altium官方公众号。废话不多说,正文开始!场景一
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了