广告

安谋中国周易AIPU产品落地,全硬件场景赋能AI创新

时间:2020-08-06 作者:刘于苇 阅读:
经过两年的研发,安谋中国周易AIPU落地全志科技智能语音专用处理器R329,这也是周易平台的落地首秀。 8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景。
广告

2018年6月,Arm把中国业务分拆成了独立公司“安谋(Arm)中国”,这家公司由中资51%控股,把国外的技术创新带入中国,研发更符合中国市场需求的产品。公司成立之初,就确立了3条产品线,分别是:周易AIPU、山海平台安全解决方案、星辰处理器。vqzEETC-电子工程专辑

2018年11月,在ASPENCORE举办的全球CEO峰会上,安谋中国公布全新人工智能平台“周易”(Zhouyi)。该平台采用完全自主研发的AI处理器AIPU以及SDK,安谋中国还与中国生态合作伙伴共同开发了Tengine人工智能软件框架,适配Arm CPU、Mali GPU和第三方AI处理单元,实现人工智能算力优化。vqzEETC-电子工程专辑

2020年8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国资深AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景,并谈了安谋中国在人工智能方面的产品和布局。vqzEETC-电子工程专辑
vqzEETC-电子工程专辑

安谋中国资深AI产品经理杨磊(Alvin Yang)vqzEETC-电子工程专辑

Arm芯片出货小目标:1万亿颗

传统上大家对Arm的认识,主要是应用在端侧或者物联网设备、手持设备上。虽然一般的终端用户很难接触到Arm公司,但基本上每个人用的设备中都会有Arm,比如95%的手机都会用Arm架构的主处理器或GPU,另外智能电视、机顶盒等设备,底层也大多采用Arm解决方案。vqzEETC-电子工程专辑

Arm第一个权重产品是处理器解决方案,除了我们熟悉的应用处理器系列,还面向人工智能在处理器的架构上不断演进和升级。杨磊预计,在未来3-5年内可以通过CPU通用算力平台,在人工智能方向上提升10倍的计算能力。vqzEETC-电子工程专辑

Arm第二个被广泛采用的是GPU产品,据杨磊介绍,Arm GPU的出货量已经达到一年10亿颗。GPU的本职工作虽然是做3D渲染或实现手机游戏的一些功能,但由于它本身计算能力强大,很多应用也会用GPU通用计算能力做深度学习功能。所以Arm在GPU架构上也不断演进,以增强对人工智能场景的运算能力,“我们的GPU架构,从最早只能支持fp32计算,到现在的新架构可以原生支持fp16的计算,从而使GPU在深度学习领域中也能有成倍甚至接近于10倍的性能提升。”杨磊说到。vqzEETC-电子工程专辑

据杨磊介绍,截止2018年,基于Arm的芯片解决方案累计已经出货1000亿颗,预计会在未来10-20年达到1万亿颗。vqzEETC-电子工程专辑

大数据背后大市场,需要专用芯片架构

“这是一个十分巨大的量,端侧芯片会产生大量的数据,可以透过5G通信或者IoT把大量数据回传到云端,云端基于丰富的数据,基于现在的大数据、人工智能技术,会产生更加人性化、为大家服务更好的算法或人工智能应用,又重新下载到本地端,更好的服务于我们的生活。”杨磊说到。vqzEETC-电子工程专辑

由此可见,AIoT未来是一个非常广阔的市场,而且这个市场是正向循环、不断相互促进的。既然看到这个大的市场,那大家都会想要做点什么,这也是Arm在中国成立人工智能产品线,推出深度学习解决方案“周易”的初衷——不仅专注在手机、IoT关键设备等领域,还要在云端、车载等等其他领域有所布局。vqzEETC-电子工程专辑

周易的定位不像通用处理器或GPU,其IP是专门面向深度学习设计的一套架构和解决方案,同样也是一个IP盒。比如在SoC维度上,周易可用一个完整的异构平台覆盖全部硬件场景,包括已有的CPU、GPU。vqzEETC-电子工程专辑

杨磊表示,周易AIPU是安谋中国自主研发,是一套国内从头到尾完全自己设计的解决方案。“它跟Arm CPU架构是两套独立的架构,没有任何联系”,其系统底层是面向深度学习重新定义的指令集,在这个指令集基础上又实现了符合这个指令集的周易人工智能处理单元,也就是周易AIPU,它具有高性能、低功耗和安全的特性。vqzEETC-电子工程专辑

现在人工智能的应用十分丰富,有各种各样的场景,有视觉为主的,也有语音为主的,视觉又有检测、分类等各种算法在里面,不同的解决方案用的算法也不太一样。杨磊发现,有些算法能力强的合作伙伴会做自定义算子,比较私有化,所以安谋中国在设计周易解决方案时,就考虑到了灵活性和通用性。vqzEETC-电子工程专辑

vqzEETC-电子工程专辑

“我们的架构中分为两类最重要的功能,一部分叫通用算力,灵活可编程,可以支持各种比较冷门的算子以及用户的自定义算子;另外一部分跟AI公司讲的自研AI解决方案一样,我们把它叫做专用算力,它更多采用的是一种加速方式支持大算力、高密度以及高能效的特性。”杨磊解释道,“周易的架构是把这两部分有机融合在一起,构成了人工智能的解决方案。”vqzEETC-电子工程专辑

本地语音识别方案落地

周易解决方案适合用于语音场景、视觉场景。视觉场景方面,可在安防、智能家居领域做人脸/图像分析、检测,还能用于手机上的抠图、美颜、背景虚化等。vqzEETC-电子工程专辑

至于语音场景,现在大部分都是本地采集声学信号,自然语言处理(Natural Language Processing ,NLP)或者自然语言理解(Natural Language Understanding,NLU)功能只能通过网络传到云端解析计算,这主要是受限于传统AIoT设备的算力不够。但因为语音交互时,往往需要能够快速响应,还会涉及到一些隐私问题。在有一些场景信号不好,或是没有网络的场景下,只有本地识别才能有好的用户体验。vqzEETC-电子工程专辑

杨磊表示,周易的计算能力完全可以胜任本地做自动语音识别(Automatic Speech Recognition,ASR)或者自然语言理解,这样能解决一些实时性和隐私性问题,而低功耗特性也可以满足关键词检出(Keyword Spotting ,KWS)功能的要求。vqzEETC-电子工程专辑

目前学术界对语音的识别、深度学习方面的应用,有很多新尝试。比如用神经网络的方式实现端到端(End to End)的语音识别,而且不仅是实现识别功能,还把语音的去噪、增强等都实现了,从而达到更高的识别精度。vqzEETC-电子工程专辑

“用周易方案可以很好的实现这些功能,并且是在本地实现。”杨磊说到。vqzEETC-电子工程专辑

vqzEETC-电子工程专辑

周易专为智能家居打造的Z1-0701与通用DSP在支持AI性能和能效上的对比vqzEETC-电子工程专辑

这得益于周易本身可灵活可配置的计算能力,从0.1TOPS一直支持到256TOPS。“不过本地语音场景不需要这么高算力,只需要选一个性价比最高的就好。”杨磊建议到,“我们一般建议合作伙伴用最小配置,0.1-0.2TOPS算力水平就可以很好的在本地做语音功能。”vqzEETC-电子工程专辑

另外周易属于面向深度学习的专用处理器,原生支持常见神经网络的软件框架,也便于用户或者开发者在上面做算法的移植和部署,和通用架构相比,在面积、成本、功耗上都有优势。vqzEETC-电子工程专辑

vqzEETC-电子工程专辑

2020年4月,全志科技发布了基于周易AIPU的产品智能语音专用处理器R329,这也是安谋中国耗时两年研发周易AIPU的落地首秀。vqzEETC-电子工程专辑

据杨磊介绍,全志该产品线系列已经在市面上的智能音箱中大量使用,其他一些合作伙伴的产品也马上会面世。未来安谋中国希望籍由周易人工智能平台,赋能各个行业底层应用解决方案。vqzEETC-电子工程专辑

责编:Luffy LiuvqzEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
刘于苇
电子工程专辑(EETimes China)副主分析师。
  • 运用可扩展多核处理器满足嵌入式应用日益增长的性能需 下一代嵌入式应用需要对大型CPU集群和专用硬件加速器提供可扩展的支持,以实现所需的性能。大型多核处理器需要新的架构方法来提供更高的性能,并且不会给嵌入式设计者带来其他实现和时序收敛问题。
  • 豪威集团 – 在全球CIS市场上与索尼和三星并驾齐驱的 在全球市场上,豪威集团是与索尼和三星位列同一梯队的CIS厂商。在安防、医疗、笔记本电脑、新兴应用等细分市场,豪威也是长期保持领导地位的CMOS传感器供应商。整合后的豪威集团有什么样的技术和市场策略?其下一个目标是什么呢?
  • 光刻机是开路先锋 在“卡脖子”清单中有两个大类是“硬骨头”,分别是EDA工具与IP以及半导体设备与材料,而其中光刻机是首当其冲的“拦路虎”之一。
  • 国产化的思考 芯片国产化率的概念是中国半导体业的特殊性之一,在全球其它国家与地区似乎并没有类似的提法,而且从芯片国产化的定义,它是用国内的芯片产出与市场需求之比,并非十分完善,因为中国境内许多外资厂商的产出也包含在内……
  • 2020第二季全球前十大IC设计厂商排名出炉,博通近40亿夺 据集邦咨询最新统计,全球前十大IC设计业者2020年第二季营收及排名出炉,高通(Qualcomm)虽持续受惠于5G产品、远距工作与教学需求,然而,因苹果(Apple)新一代iPhone确定延期上市,导致其第二季营收成长动能受限,进而让博通(Broadcom)抢下本季营收排行榜冠军。
  • 如何优化边缘机器学习的功耗和性能 知名市场研究和咨询机构 Tractica近日针对“深度学习芯片组”进行了分析和预测,报告结果显示,机器学习 (ML) 算法正被广泛运用于训练神经网络的企业云系统,而诸如汽车、无人机和移动设备等边缘设备的 AI/ML 芯片组更是以三位数的速度持续增长。AI/ML已然成为这些领域欲发挥价值的关键因素。
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了