除了成本之外,微软也希望通过自研AI芯片构建自身竞争优势。微软多年的投资显示了芯片在人工智能和云计算领域获取竞争优势的重要性。

在生成式AI的推动下,AI芯片的需求和价格均水涨船高,对一些押注AI应用的科技巨头来说,无疑增加了运营和研发成本。跟随谷歌、亚马逊等巨头,微软也加入了自研AI芯片的阵营。近日,微软在其年度开发者大会Microsoft Ignite上推出了两款自研芯片——Maia 100和Azure Cobalt 100,为大语言模型的训练和推理提供动力。这两款芯片将由台积电代工制造,采用5纳米制程技术。

据悉,Maia 100是微软首款人工智能芯片,主要针对大语言模型训练设计,属于ASIC(应用型专用集成电路)芯片,适用于x86主机,基于台积电5nm节点制造,可以与微软旗下Azure软件栈无缝集成。这款芯片将于明年初开始在Azure数据中心推出,目的是减少微软对英伟达GPU的依赖。

而微软推出的第二款芯片Azure Cobalt 100是基于Arm架构的128核云原生芯片,其针对通用计算任务,能与英特尔处理器和亚马逊云的Graviton系列芯片展开竞争。这款芯片也可以与Azure的生态系统兼容,更大的用处是在微软Cloud上运行通用计算工作负载,降低成本。

这些芯片的主要目的是支持诸如Copilot、Azure OpenAI以及其他服务的运行。Maia 100和CobAlt的推出标志着微软在AI领域的自主研发实力得到了进一步提升。

微软之所以自研AI芯片是因为该公司着眼削减提供AI服务的高额成本问题,毕竟其成本可能是搜寻引擎等传统服务的10倍,包括Alphabet等其他科技巨擘也在开发关键技术芯片来降低成本。

据悉,在开发Athena期间,微软为了满足OpenAI的需求,已经向英伟达订购了至少数十万块GPU。而进入9月,随着ChatGPT热潮趋于平缓,不断有市场消息传出微软开始下调英伟达H100显卡的订单量。在微软10月的财报电话会上,“削减成本”一事也被反复强调。

实际上,2010年微软便希望能自研AI硬件。据The information报道,微软至少从2019年开始,便在研发代号为“Athena(雅典娜)”的新AI芯片组,目的是为ChatGPT等大语言模型的训练及推理提供英伟达芯片之外的替代方案。

当然,除了成本之外,微软也希望通过自研AI芯片构建自身竞争优势。软首席执行官萨蒂亚·纳德拉就在大会上表示:“我们的目标是为你们带来终极效率、性能和规模。”他补充说,Maia首先为微软的人工智能应用提供动力,然后再为合作伙伴和客户提供服务。

微软多年的投资显示了芯片在人工智能和云计算领域获取竞争优势的重要性。这一举措还可以使微软免于过度依赖任何一个供应商,目前全行业对Nvidia人工智能芯片的抢购已经凸显出这种脆弱性。

不过,对于这两款芯片,微软几乎没有透露任何技术细节,无法让人判断这种芯片与传统芯片制造商的竞争力。

责编:Jimmy.zhang
阅读全文,请先
您可能感兴趣
继AMD在Semicon 2023 上宣布的 4 亿美元印度投资后,近日AMD官宣了在印度班加罗尔开设了其最大的全球设计中心,扩大在印度的研究、开发和工程业务。AMD 印度地区负责人 Jaya Jagadish表示:“印度设计中心于 2004 年成立,只有少数员工。如今,AMD 全球员工的 25% 位于印度,他们支持 AMD 在数据中心、游戏等领域的领先产品的开发、PC 和嵌入式客户。这个新设施标志着我们成长历程中的下一个里程碑,我们将成为半导体进步的重要贡献者。”
尽管黄仁勋重申将重视中国市场,且继续推出特供版AI芯片,但性能无疑会再次“阉割”。据悉,H20等全新特供芯片的研发、设计、生产,将通过后道点断生产工艺,来满足美国新的AI禁令要求。
《报告》显示,2023年上半年,中国人工智能服务器市场规模环比增长54.1%。IDC预计,全球人工智能硬件市场(服务器)规模将从2022年的195亿美元增长到2026年的347亿美元,五年年复合增长率达17.3%;在中国,预计2023年中国人工智能服务器市场规模将达到91亿美元,同比增长82.5%,2027年将达到134 亿美元,五年年复合增长率达21.8%。
除了以上三大存储原厂,南亚科、威刚、十铨、宇瞻等都积极投入DDR5相关产品。随着长鑫存储突破LPDDR5之后,国内内存接口芯片龙头企业澜起科技也在行业内率先率先试产DDR5 第二代产品并率先推出DDR5第三代产品。市场研究公司Omdia预计,2023年四季度DDR5销售比例预计将超过20%(基于服务器DRAM),2024年有望进一步上升至51%。
龙架构(LoongArch)从顶层架构,到指令功能等全部自主设计,无需国外授权,得到了上百个与指令系统相关的国际软件开源社区的支持,得到了统信、麒麟、欧拉、龙蜥、鸿蒙等操作系统的支持,得到了WPS、微信、QQ、钉钉、腾讯会议等基础应用的支持,已形成与X86、ARM等并列的基础软件生态。
对Graphcore而言,时间是非常重要的。2022年5月,Graphcore宣称新一代芯片将在2024年的某个时候上市。届时,Graphcore需要向市场和资本证明自己的发展潜力。这很重要,也很紧迫。
据最新HBM市场研究显示,为了更妥善且健全的供应链管理,NVIDIA也规划加入更多的HBM供应商,其中三星(Samsung)的HBM3(24GB)预期于今年12月在NVIDIA完成验证。而HBM3e进度依据时间轴排列如下表所示,美光(Micron)已于今年7月底提供8hi(24GB)NVIDIA样品、SK海力士(SK hynix)已于今年8月中提供8hi(24GB)样品、三星则于今年10月初提供8hi(24GB)样品。
受智能手机产量下滑,以及品牌厂搭载趋势改变的影响,预估2023年智能手机相机模组出货量年减幅度将再扩大至8.9%,约40.65亿颗。而经过一年的库存去化,在2024年智能手机生产量有望恢复的预期下,明年智能手机相机模组市场有望恢复成长,出货量年增率预估3%,约41.71亿颗。
近日,武汉芯源半导体正式发布首款基于Cortex®-M0+内核的CW32A030C8T7车规级MCU,这是武汉芯源半导体首款通过AEC-Q100 (Grade 2)车规标准的主流通用型车规MCU产品。
1200 V分立器件提供出色的性能,有助于加速全球能源转型
杨浦区人大常委会党组书记、主任程绣明到访新思科技,共话以绿色数字经济开创未来之道11月7日,上海市杨浦区人大常委会党组书记、主任程绣明一行到访新思科技,交流企业如何充分利用政府提供的创新沃土,发挥数字
『这个知识不太冷』系列,旨在帮助小伙伴们唤醒知识的记忆,将挑选一部分Qorvo划重点的知识点,结合产业现状解读,以此温故知新、查漏补缺。在过去十年中,移动无线数据快速增长,使得运营商愈加迫切地需要新频
昨日,比亚迪功率器件和传感控制器件研发及产业化项目一期竣工。这是滨海新区2023年重大项目竣工投产仪式上投资总额最大的项目。据了解,位于马山街道的比亚迪项目是省市县长项目、省千项万亿重大项目,项目总投
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,据多家媒体报道,华为拟成立的智能汽车系统及部件公司向投资者出售股权后,估值可高达2500亿元人民币。其中,长安汽车和母公司中国兵器装备集团或分
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,11月30日,宁德时代首席科学家吴凯在2023国际汽车电子与软件大会·滴水湖峰会上透露,目前,宁德时代旗下时代智能开发的滑板底盘已实现技术突破
点击上面“电动知家”↑关注,记得加“星标”!电动知家消息,科创板上市公司孚能科技(688567)11月29日晚公告,广州工控集团拟将获得公司控制权的方式,由此前的协议转让股份方式,转换为广州工控集团认
为什么大陆很多芯片授权分销商都是被动元件起家?韦尔股份是怎么从芯片分销商逆袭成为千亿市值芯片龙头的?为什么说他是芯片分销的集大成者?Smith、Converge、Fusion、Newpower等国际头
Dear customers and vendors, welcome to the Market Insights-Newsletter from Quiksol that delivers tim
当我们谈起日本半导体,会想到什么?上个世纪80年代,日本曾是世界最大的半导体生产国。90年代初,全球前10大半导体公司中,有6家来自日本。如今,日本DRAM“国家队”尔必达已经破产,NEC、东芝、日立
第六届半导体大硅片论坛将于12月7-8日在上海召开,来自新昇、超硅、上海集成电路协会、KLA等公司的专家将带来精彩报告工业参观:半导体大硅片企业上海新昇半导体与上海超硅半导体,目前新昇名额已满半导体硅