广告

安谋中国周易AIPU产品落地,全硬件场景赋能AI创新

时间:2020-08-06 作者:刘于苇 阅读:
经过两年的研发,安谋中国周易AIPU落地全志科技智能语音专用处理器R329,这也是周易平台的落地首秀。 8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景。
广告

2018年6月,Arm把中国业务分拆成了独立公司“安谋(Arm)中国”,这家公司由中资51%控股,把国外的技术创新带入中国,研发更符合中国市场需求的产品。公司成立之初,就确立了3条产品线,分别是:周易AIPU、山海平台安全解决方案、星辰处理器。

2018年11月,在ASPENCORE举办的全球CEO峰会上,安谋中国公布全新人工智能平台“周易”(Zhouyi)。该平台采用完全自主研发的AI处理器AIPU以及SDK,安谋中国还与中国生态合作伙伴共同开发了Tengine人工智能软件框架,适配Arm CPU、Mali GPU和第三方AI处理单元,实现人工智能算力优化。

2020年8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国资深AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景,并谈了安谋中国在人工智能方面的产品和布局。

安谋中国资深AI产品经理杨磊(Alvin Yang)

Arm芯片出货小目标:1万亿颗

传统上大家对Arm的认识,主要是应用在端侧或者物联网设备、手持设备上。虽然一般的终端用户很难接触到Arm公司,但基本上每个人用的设备中都会有Arm,比如95%的手机都会用Arm架构的主处理器或GPU,另外智能电视、机顶盒等设备,底层也大多采用Arm解决方案。

Arm第一个权重产品是处理器解决方案,除了我们熟悉的应用处理器系列,还面向人工智能在处理器的架构上不断演进和升级。杨磊预计,在未来3-5年内可以通过CPU通用算力平台,在人工智能方向上提升10倍的计算能力。

Arm第二个被广泛采用的是GPU产品,据杨磊介绍,Arm GPU的出货量已经达到一年10亿颗。GPU的本职工作虽然是做3D渲染或实现手机游戏的一些功能,但由于它本身计算能力强大,很多应用也会用GPU通用计算能力做深度学习功能。所以Arm在GPU架构上也不断演进,以增强对人工智能场景的运算能力,“我们的GPU架构,从最早只能支持fp32计算,到现在的新架构可以原生支持fp16的计算,从而使GPU在深度学习领域中也能有成倍甚至接近于10倍的性能提升。”杨磊说到。

据杨磊介绍,截止2018年,基于Arm的芯片解决方案累计已经出货1000亿颗,预计会在未来10-20年达到1万亿颗。

大数据背后大市场,需要专用芯片架构

“这是一个十分巨大的量,端侧芯片会产生大量的数据,可以透过5G通信或者IoT把大量数据回传到云端,云端基于丰富的数据,基于现在的大数据、人工智能技术,会产生更加人性化、为大家服务更好的算法或人工智能应用,又重新下载到本地端,更好的服务于我们的生活。”杨磊说到。

由此可见,AIoT未来是一个非常广阔的市场,而且这个市场是正向循环、不断相互促进的。既然看到这个大的市场,那大家都会想要做点什么,这也是Arm在中国成立人工智能产品线,推出深度学习解决方案“周易”的初衷——不仅专注在手机、IoT关键设备等领域,还要在云端、车载等等其他领域有所布局。

周易的定位不像通用处理器或GPU,其IP是专门面向深度学习设计的一套架构和解决方案,同样也是一个IP盒。比如在SoC维度上,周易可用一个完整的异构平台覆盖全部硬件场景,包括已有的CPU、GPU。

杨磊表示,周易AIPU是安谋中国自主研发,是一套国内从头到尾完全自己设计的解决方案。“它跟Arm CPU架构是两套独立的架构,没有任何联系”,其系统底层是面向深度学习重新定义的指令集,在这个指令集基础上又实现了符合这个指令集的周易人工智能处理单元,也就是周易AIPU,它具有高性能、低功耗和安全的特性。

现在人工智能的应用十分丰富,有各种各样的场景,有视觉为主的,也有语音为主的,视觉又有检测、分类等各种算法在里面,不同的解决方案用的算法也不太一样。杨磊发现,有些算法能力强的合作伙伴会做自定义算子,比较私有化,所以安谋中国在设计周易解决方案时,就考虑到了灵活性和通用性。

“我们的架构中分为两类最重要的功能,一部分叫通用算力,灵活可编程,可以支持各种比较冷门的算子以及用户的自定义算子;另外一部分跟AI公司讲的自研AI解决方案一样,我们把它叫做专用算力,它更多采用的是一种加速方式支持大算力、高密度以及高能效的特性。”杨磊解释道,“周易的架构是把这两部分有机融合在一起,构成了人工智能的解决方案。”

本地语音识别方案落地

周易解决方案适合用于语音场景、视觉场景。视觉场景方面,可在安防、智能家居领域做人脸/图像分析、检测,还能用于手机上的抠图、美颜、背景虚化等。

至于语音场景,现在大部分都是本地采集声学信号,自然语言处理(Natural Language Processing ,NLP)或者自然语言理解(Natural Language Understanding,NLU)功能只能通过网络传到云端解析计算,这主要是受限于传统AIoT设备的算力不够。但因为语音交互时,往往需要能够快速响应,还会涉及到一些隐私问题。在有一些场景信号不好,或是没有网络的场景下,只有本地识别才能有好的用户体验。

杨磊表示,周易的计算能力完全可以胜任本地做自动语音识别(Automatic Speech Recognition,ASR)或者自然语言理解,这样能解决一些实时性和隐私性问题,而低功耗特性也可以满足关键词检出(Keyword Spotting ,KWS)功能的要求。

目前学术界对语音的识别、深度学习方面的应用,有很多新尝试。比如用神经网络的方式实现端到端(End to End)的语音识别,而且不仅是实现识别功能,还把语音的去噪、增强等都实现了,从而达到更高的识别精度。

“用周易方案可以很好的实现这些功能,并且是在本地实现。”杨磊说到。

周易专为智能家居打造的Z1-0701与通用DSP在支持AI性能和能效上的对比

这得益于周易本身可灵活可配置的计算能力,从0.1TOPS一直支持到256TOPS。“不过本地语音场景不需要这么高算力,只需要选一个性价比最高的就好。”杨磊建议到,“我们一般建议合作伙伴用最小配置,0.1-0.2TOPS算力水平就可以很好的在本地做语音功能。”

另外周易属于面向深度学习的专用处理器,原生支持常见神经网络的软件框架,也便于用户或者开发者在上面做算法的移植和部署,和通用架构相比,在面积、成本、功耗上都有优势。

2020年4月,全志科技发布了基于周易AIPU的产品智能语音专用处理器R329,这也是安谋中国耗时两年研发周易AIPU的落地首秀。

据杨磊介绍,全志该产品线系列已经在市面上的智能音箱中大量使用,其他一些合作伙伴的产品也马上会面世。未来安谋中国希望籍由周易人工智能平台,赋能各个行业底层应用解决方案。

责编:Luffy Liu

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
刘于苇
电子工程专辑(EETimes China)副主分析师。
  • 波形系统三大关键点解析 优秀的性能可以保证工具的流畅度,而调试的效率也有助于提升工具的用户体验。波形系统只是仿真调试工具中的一个部分,调试工具还有很多很多其他的核心技术,比如代码和电路图调试等。但是观测波形是验证工程师最常用的一种手段,作者希望通过介绍波形系统中的一些基本技术让用户将来选择工具时更加有针对性。同时也希望验证工程师能利用好工具,提升工作效率。
  • 数据中心迈向革命性新架构,CXL迎来高光时刻 从一天内宣布完成对AnalogX和PLDA两家公司的收购,到推出面向数据中心的“CXL内存互联计划”,Rambus日前围绕CXL技术和生态展开的战略布局,令人印象深刻。
  • 氮化镓(GaN)晶体管并联配置在大功率转换器设计中的应用 在充分了解GaN晶体管栅极驱动电路后,可以相对轻松地实现GaN晶体管并联配置应用。其中最大的挑战来自于具体应用的高功率和高开关频率,而这些正是许多工程师采用现有硅器件时所从未经历过的。通过遵循良好PCB布局基本规则,在栅极和开尔文源极路径中使用共模电感,并平衡不同晶体管之间的电流,有助于最大程度地减小电压振荡。
  • EE Times Silicon 100: 2021最值得关注的100家半导体 ASPENCORE旗下EE Times最新发布了2021年Silicon 100,甄选出全球最值得关注的100家电子和半导体初创公司,他们代表着新兴技术的发展趋势和全球半导体行业的未来。在这100家入选的半导体新星中,有12家公司给予详尽的介绍。据《电子工程专辑》分析师团队统计,有24家中国公司或由华人创办的企业入选。 此外,《电子工程专辑》今年3月份发布的“中国IC设计100排行榜”也收录进了2021年版Silicon 100,为全球电子和半导体业界人员提供了一个完整的中国芯片设计产业格局和每个技术类别的Top 10企业。
  • 软硬结合的智能DDR PHY训练技术 DDR接口速率越来越高,每一代产品都在挑战工艺的极限,对DDR PHY的训练要求也越来越严格。本文从新锐IP企业芯耀辉的角度,谈谈DDR PHY训练所面临的挑战,介绍芯耀辉DDR PHY训练的主要过程和优势,解释了芯耀辉如何解决DDR PHY训练中的问题。
  • 系统动力双剑合璧,提升硅前硬件纠错及软件验证速度 为了应对呈指数级上升的系统设计复杂度和上市时间的压力,包括Cadence在内的EDA厂商近期纷纷将重点投向硬件仿真加速与原型验证领域,希望在芯片开发过程中,一方面使用软件工作负载和基准来验证功耗和性能,另一方面,又能在仿真和验证过程中同时兼顾软硬件。
  • 新款iPad Pro 2021成最受欢迎的 由于采用性能相对强大的M1处理器和mini-LED屏幕以及更多的创新,新款iPad Pro 2021已经成为消费者心目中最受欢迎。然而,iPad 2却已经在全球范围内被列入“复古和过时”的名单中。
  • 三星折叠屏手机Galaxy Z Fold 3 目前来看,折叠屏新机作为一种新的生产力工具,逐渐成为高端/平板的一种趋势,有报料称三星的Galaxy Z Fold 3发布时间或为7月,并且会引入新手势操控。

  • ​快人一步,一触即发|芯海科技信号 视频来源:iQOO手机官方微博8月17日晚,iQOO8系列未来电竞旗舰重磅发布,通过屏下双控压感实现更多样的操控体验,双指变四指手速度倍增,在保持机身简洁的同时助你成为自带BUFF的竞技
  • 泰艺电子推出小型化恒温控制晶体振 泰艺电子,频率控制解决方案的领先供货商,推出全新 NN 系列恒温控制晶体振荡器(OCXO),能够满足严格的频率稳定度要求,同时具备优越的相位噪声性能。
  • 答题 | 带均衡的data信号!第一手DDR5仿真资料(下) 上期话题带均衡的data信号!第一手DDR5仿真资料(下)(戳标题,即可查看上期文章回顾)问答关于DDR5的技术,大家还有什么想知道或者有自己想法的,都可以给我们留言哈!感谢各位网友的评论,高速先生也
  • 最强国产自研CPU公司表态:没人可以“卡我们的脖子” 在国内多家研发处理器的公司中,龙芯中科选择的路线有所不同,现在已经全面转向自己的指令集。龙芯高管表示这条路很难走,但好处也是最大的,那就是没人可以“卡我们的脖子。8月26日,在成都举行的2021成都新
  • Versal ACAP系统和解决方案规划方法指南 赛灵思 Versal™ 自适应计算加速平台 (ACAP) 设计方法论是旨在帮助精简 Versal 器件设计进程的一整套最佳实践。鉴于这些设计的规模与复杂性,因此必须通过执行特定步骤与设计任务才能确保设
  • 台积电涨价,iPhone13将提价!  中国半导体论坛 振兴国产半导体产业!    8月27日消息,据报道,苹果计划提高iPhone 13系列的价格,以弥补其主要芯片代工厂台积电涨价所带来的成本上升,从而“减
  • 蹲点拼手速?Python秒杀神器赶紧收下 “朋友最近跟师兄学了个黑科技,每天鼓捣一下,俩月挣了几万块。”他还趁着挖矿热潮,倒卖了一波原价显卡,4张华硕 RTX 3080Ti,挣了8k。这玩意我抢了一个月都没抢到,他居然抢到了4张?“
  • 高速串行简史(四):开挂的自同步方式就是扫地高僧,你怎么看? 周伟 | 文 高速串行信号相对于并行信号最主要的就是通信方式的改进,这种通信方式又叫自同步方式,也即两块芯片之间通信,其中发送芯片产生的数据流同时包括数据和时钟信息,如下图所示。要实现上图所
  • 产业基金寻找项目投资! 需求单位:国内投资机构项目标的:第三代半导体(SiC,GaN)、车用半导体材料,高纯电子化学品、半导体大硅片项目要求:已有实际生产运营业绩和行业客户(或潜在客户)基础如果贵公司有相关的项目、技术投融资
  • 嵌入式单片机产品开发设计框架 你点击蓝字关注,回复“入门资料”获取单片机入门到高级开挂教程文 | 无际(微信:603311638)个人原创 | 第 106 篇全文约2095字,阅读大约需要
  • 专为汽车应用优化的莱迪思Certus-NX FPGA 如今的汽车需要采用半导体芯片的原因有很多,包括消费者对电动车(需要复杂的电子器件来最大程度延长电池寿命)的需求、高级驾驶辅助系统(ADAS)、支持语音控制和手势识别的信息娱乐系统人机交互等。除了用于支
  • 佑明党支部成立,深圳照明显示行业党委直属支部达11家 点击上方蓝字 关注我们2021年8月24日下午,中共深圳市佑明光电有限公司支部委员会成立大会在佑明光电会议室顺利召开。市照明与显示工程行业协会党委书记赵飞同志、办公室主任余俊霞同志、佑明光电董事长吴学
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了