小芯片大算力,看半导体如何赋能HPC

原创 半导体产业纵横 2021-10-23 18:00

“   数字中国的浪潮之中,芯片为桨,HPC为舟。


10月21日,第17届CCF HPC China在珠海横琴召开,会上5位院士和多名各领域的专家分享了HPC在科研领域的重要贡献。其中,陈润生院士在《从大数据、精准医学到核算药物的报告》主题演讲中提到,借助大数据测量,新冠病毒的29903个核酸序列在一周内得以测量;而借助高性能计算,新冠病毒对应的疫苗在几小时之内就被设计了出来。在2008年的SARS病毒中,科学家用4个月确定了病原体和序列;而20世纪的西班牙流感,人们用了13到15年才决定了病原的性质。


随着科学要解决的问题越来越复杂,科研人员要面对的数学问题工作量开始呈指数级增长。但正如陈院士所说,计算机技术的发展,让过去需要几个月甚至几年的问题,变成了几小时可解的问题。而支持对海量数据实现快速计算的,正是高性能算力;在数据时代,算力的重要性就如同第三次工业革命中电力的重要。


负载于计算机上的高性能计算,它的进步离不开硬件的支持。高性能计算通常是大规模的服务器集群计算,对这样大型复杂的系统,芯片在其中扮演者怎样的角色?又是如何助力高性能计算的呢?


芯片让高性能计算更强大


对于从TB级跨越至PB级甚至E级的计算,服务器CPU无疑是其中最核心的部分之一。


先进制程可以提高服务器CPU算力,因此发展高性能计算的重要基石。对于一个高性能计算集群,可能会用到成千上百颗服务器CPU。如果服务器CPU不能提高单位算力,那高性能计算设备的体积将无法想象。


服务器芯片公司为升级HPC的性能,还对HPC相关芯片进行更多探索。高性能计算要处理的数据,不仅仅是数字,其中很大一部分是图像。如果单纯用CPU去处理,无疑会分散CPU的计算能力。与CPU擅长逻辑控制,串行的运算和通用类型数据运算不同,GPU擅长的是大规模并发计算,这也正是密码破解等所需要的。所以GPU除了图像处理,也越来越多的参与到计算当中来。


芯片让高性能计算更灵活


因为不同的学科构建的模型不同、要处理的数据也不同,所以不同领域对高性能计算的需求并不全然相同。例如应用于地理的高性能计算,可能需要大量处理图形数据;而解决生物中Alpha Flod2问题的高性能计算,需要推测一个基因结构,要考虑的因素还包括基因的动态变化,3D模型的方向性等问题。


处理不同学科的工具不同,如果服务器“一刀切”势必会造成有些问题容易解决,有些问题处理起来效率较低。因此如果能根据所建数学模型、数据类型、研究需要去调整服务器,是高效利用服务器算力的方法,于是AI加速卡、DPU也就应运而生。


用于AI的计算,会涉及到机器学习、计算机视觉等领域,例如一些AI加速卡可以为AI计算提供高达1024tops算力。而DPU则是用于专门应用于数据密集场景的一款专用处理器。随着计算量的增加I/O可能会占据整个计算的70~80%,而这极大的降低了性能的提高,但DPU可以将这部分计算分担,最大化地释放CPU压力。


灵活部署,已然成为高性能计算未来发展的必备属性。


芯片让高性能计算更节能


除了服务器基本算力的保证,数据中心的能耗也是一个重要的问题。


当HPC服务器工作时,会耗费大量电力,这成为HPC设备运营的一大成本。64核的算力伴随着280瓦的功耗,当配备成千上万的CPU时,电费是怎样一个数字?这也是许多数据中心无法全功率开放的重要原因,开发出低功耗的处理器已经迫在眉睫。


除了电力问题,能耗还伴随着大量二氧化碳的排放。数据显示HPC的数据中心的PUE在1.9左右,即每用一度电计算,需要花费0.9度电给设备进行散热。减少碳排放,可以从多个环节进行,优化冷却系统是最直接的一种。目前通过液冷系统,可以将PUE降低至1.1甚至更低的水平。同时在循环中的余热,可以成为加热生活基础设施用水的能源,从而进一步提高对能源的利用,最大程度的降低碳排放。上海交通大学的一台计算机设备,通过使用温水冷系统,相对风冷系统节省的碳排放约3900吨;回收的热水,能给调温除湿,热回收的综合减排量达到了950吨。


为服务器服务的冷却系统,随着服务器结构的迭代、CPU能耗的变化,冷却系统也需要通过改变结构,更新算法来达到最好的适配性。而这样一个液冷系统,离不开算法、传感器、散热系统的控制芯片的共同作用。


因此,控制冷却系统的芯片在HPC中也扮演着重要角色。在CPU芯片火力全开时,散热系统芯片在千方百计为其“降火“。


芯片让高性能计算更融合


融合是一个伴随高性能计算的关键词,想要高性能计算真正在各个学科里发挥到极致,除了相应学科的知识,更要有计算机科学的知识。高性能计算还要求更高的片间通讯速度,提高缓存,提高IO,支持更多协议等等,因此对芯片的要求也越来越多。


融合也是解决这一问题的关键词。既然大多数高性能计算需要CPU和GPU共同工作,能否让服务器芯片同时具备CPU和GPU呢?再进一步去想,同一片芯片能否实现X86和Arm的融合?与高性能计算一样,集成电路也是一门多项学科交叉的复合科目。这成为芯片厂商正在探索的方向,而这需要半导体的制程工艺,设计工艺,封测工艺、材料工艺一同进步才能实现。







半导体产业纵横 (微信号: ICViews)半导体产业纵横是神州数码数智创新+平台下的自媒体账号,立足产业视角,提供及时、专业、深度的前沿洞见、技术速递、趋势解析,赋能中国半导体产业,我们一直在路上。
评论 (0)
热门推荐
X
广告
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦