广告

安谋中国周易AIPU产品落地,全硬件场景赋能AI创新

时间:2020-08-06 作者:刘于苇 阅读:
经过两年的研发,安谋中国周易AIPU落地全志科技智能语音专用处理器R329,这也是周易平台的落地首秀。 8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景。
广告
ASPENCORE

2018年6月,Arm把中国业务分拆成了独立公司“安谋(Arm)中国”,这家公司由中资51%控股,把国外的技术创新带入中国,研发更符合中国市场需求的产品。公司成立之初,就确立了3条产品线,分别是:周易AIPU、山海平台安全解决方案、星辰处理器。LFFEETC-电子工程专辑

2018年11月,在ASPENCORE举办的全球CEO峰会上,安谋中国公布全新人工智能平台“周易”(Zhouyi)。该平台采用完全自主研发的AI处理器AIPU以及SDK,安谋中国还与中国生态合作伙伴共同开发了Tengine人工智能软件框架,适配Arm CPU、Mali GPU和第三方AI处理单元,实现人工智能算力优化。LFFEETC-电子工程专辑

2020年8月6日,在ASPENCORE集团举办的第二届国际电子产业链资源对接大会上,安谋中国资深AI产品经理杨磊(Alvin Yang)发表《周易AIPU赋能AI多样创新》的演讲,详细介绍了周易AIPU的性能参数,支持的产品类型以及适合的应用场景,并谈了安谋中国在人工智能方面的产品和布局。LFFEETC-电子工程专辑
LFFEETC-电子工程专辑

安谋中国资深AI产品经理杨磊(Alvin Yang)LFFEETC-电子工程专辑

Arm芯片出货小目标:1万亿颗

传统上大家对Arm的认识,主要是应用在端侧或者物联网设备、手持设备上。虽然一般的终端用户很难接触到Arm公司,但基本上每个人用的设备中都会有Arm,比如95%的手机都会用Arm架构的主处理器或GPU,另外智能电视、机顶盒等设备,底层也大多采用Arm解决方案。LFFEETC-电子工程专辑

Arm第一个权重产品是处理器解决方案,除了我们熟悉的应用处理器系列,还面向人工智能在处理器的架构上不断演进和升级。杨磊预计,在未来3-5年内可以通过CPU通用算力平台,在人工智能方向上提升10倍的计算能力。LFFEETC-电子工程专辑

Arm第二个被广泛采用的是GPU产品,据杨磊介绍,Arm GPU的出货量已经达到一年10亿颗。GPU的本职工作虽然是做3D渲染或实现手机游戏的一些功能,但由于它本身计算能力强大,很多应用也会用GPU通用计算能力做深度学习功能。所以Arm在GPU架构上也不断演进,以增强对人工智能场景的运算能力,“我们的GPU架构,从最早只能支持fp32计算,到现在的新架构可以原生支持fp16的计算,从而使GPU在深度学习领域中也能有成倍甚至接近于10倍的性能提升。”杨磊说到。LFFEETC-电子工程专辑

据杨磊介绍,截止2018年,基于Arm的芯片解决方案累计已经出货1000亿颗,预计会在未来10-20年达到1万亿颗。LFFEETC-电子工程专辑

大数据背后大市场,需要专用芯片架构

“这是一个十分巨大的量,端侧芯片会产生大量的数据,可以透过5G通信或者IoT把大量数据回传到云端,云端基于丰富的数据,基于现在的大数据、人工智能技术,会产生更加人性化、为大家服务更好的算法或人工智能应用,又重新下载到本地端,更好的服务于我们的生活。”杨磊说到。LFFEETC-电子工程专辑

由此可见,AIoT未来是一个非常广阔的市场,而且这个市场是正向循环、不断相互促进的。既然看到这个大的市场,那大家都会想要做点什么,这也是Arm在中国成立人工智能产品线,推出深度学习解决方案“周易”的初衷——不仅专注在手机、IoT关键设备等领域,还要在云端、车载等等其他领域有所布局。LFFEETC-电子工程专辑

周易的定位不像通用处理器或GPU,其IP是专门面向深度学习设计的一套架构和解决方案,同样也是一个IP盒。比如在SoC维度上,周易可用一个完整的异构平台覆盖全部硬件场景,包括已有的CPU、GPU。LFFEETC-电子工程专辑

杨磊表示,周易AIPU是安谋中国自主研发,是一套国内从头到尾完全自己设计的解决方案。“它跟Arm CPU架构是两套独立的架构,没有任何联系”,其系统底层是面向深度学习重新定义的指令集,在这个指令集基础上又实现了符合这个指令集的周易人工智能处理单元,也就是周易AIPU,它具有高性能、低功耗和安全的特性。LFFEETC-电子工程专辑

现在人工智能的应用十分丰富,有各种各样的场景,有视觉为主的,也有语音为主的,视觉又有检测、分类等各种算法在里面,不同的解决方案用的算法也不太一样。杨磊发现,有些算法能力强的合作伙伴会做自定义算子,比较私有化,所以安谋中国在设计周易解决方案时,就考虑到了灵活性和通用性。LFFEETC-电子工程专辑

LFFEETC-电子工程专辑

“我们的架构中分为两类最重要的功能,一部分叫通用算力,灵活可编程,可以支持各种比较冷门的算子以及用户的自定义算子;另外一部分跟AI公司讲的自研AI解决方案一样,我们把它叫做专用算力,它更多采用的是一种加速方式支持大算力、高密度以及高能效的特性。”杨磊解释道,“周易的架构是把这两部分有机融合在一起,构成了人工智能的解决方案。”LFFEETC-电子工程专辑

本地语音识别方案落地

周易解决方案适合用于语音场景、视觉场景。视觉场景方面,可在安防、智能家居领域做人脸/图像分析、检测,还能用于手机上的抠图、美颜、背景虚化等。LFFEETC-电子工程专辑

至于语音场景,现在大部分都是本地采集声学信号,自然语言处理(Natural Language Processing ,NLP)或者自然语言理解(Natural Language Understanding,NLU)功能只能通过网络传到云端解析计算,这主要是受限于传统AIoT设备的算力不够。但因为语音交互时,往往需要能够快速响应,还会涉及到一些隐私问题。在有一些场景信号不好,或是没有网络的场景下,只有本地识别才能有好的用户体验。LFFEETC-电子工程专辑

杨磊表示,周易的计算能力完全可以胜任本地做自动语音识别(Automatic Speech Recognition,ASR)或者自然语言理解,这样能解决一些实时性和隐私性问题,而低功耗特性也可以满足关键词检出(Keyword Spotting ,KWS)功能的要求。LFFEETC-电子工程专辑

目前学术界对语音的识别、深度学习方面的应用,有很多新尝试。比如用神经网络的方式实现端到端(End to End)的语音识别,而且不仅是实现识别功能,还把语音的去噪、增强等都实现了,从而达到更高的识别精度。LFFEETC-电子工程专辑

“用周易方案可以很好的实现这些功能,并且是在本地实现。”杨磊说到。LFFEETC-电子工程专辑

LFFEETC-电子工程专辑

周易专为智能家居打造的Z1-0701与通用DSP在支持AI性能和能效上的对比LFFEETC-电子工程专辑

这得益于周易本身可灵活可配置的计算能力,从0.1TOPS一直支持到256TOPS。“不过本地语音场景不需要这么高算力,只需要选一个性价比最高的就好。”杨磊建议到,“我们一般建议合作伙伴用最小配置,0.1-0.2TOPS算力水平就可以很好的在本地做语音功能。”LFFEETC-电子工程专辑

另外周易属于面向深度学习的专用处理器,原生支持常见神经网络的软件框架,也便于用户或者开发者在上面做算法的移植和部署,和通用架构相比,在面积、成本、功耗上都有优势。LFFEETC-电子工程专辑

LFFEETC-电子工程专辑

2020年4月,全志科技发布了基于周易AIPU的产品智能语音专用处理器R329,这也是安谋中国耗时两年研发周易AIPU的落地首秀。LFFEETC-电子工程专辑

据杨磊介绍,全志该产品线系列已经在市面上的智能音箱中大量使用,其他一些合作伙伴的产品也马上会面世。未来安谋中国希望籍由周易人工智能平台,赋能各个行业底层应用解决方案。LFFEETC-电子工程专辑

责编:Luffy LiuLFFEETC-电子工程专辑

ASPENCORE
本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
刘于苇
电子工程专辑(EETimes China)副主分析师。
  • 2020第二季全球前十大IC设计厂商排名出炉,博通近40亿夺 据集邦咨询最新统计,全球前十大IC设计业者2020年第二季营收及排名出炉,高通(Qualcomm)虽持续受惠于5G产品、远距工作与教学需求,然而,因苹果(Apple)新一代iPhone确定延期上市,导致其第二季营收成长动能受限,进而让博通(Broadcom)抢下本季营收排行榜冠军。
  • 如何优化边缘机器学习的功耗和性能 知名市场研究和咨询机构 Tractica近日针对“深度学习芯片组”进行了分析和预测,报告结果显示,机器学习 (ML) 算法正被广泛运用于训练神经网络的企业云系统,而诸如汽车、无人机和移动设备等边缘设备的 AI/ML 芯片组更是以三位数的速度持续增长(图 1)。AI/ML已然成为这些领域欲发挥价值的关键因素。
  • 详解FPGA如何实现FP16格式点积级联运算 通过使用Achronix Speedster7t FPGA中的机器学习加速器MLP72,开发人员可以轻松选择浮点/定点格式和多种位宽,或快速应用块浮点,并通过内部级联可以达到理想性能。
  • 二代IPU:怎样做一颗秒杀超算的芯片? 近期Graphcore又发布了二代IPU芯片Colossus MK2 IPU (GC200)(以下简称MK2),以及包含四颗MK2芯片系统方案的IPU-Machine: M2000 (IPU-M2000)(以下简称M2000)。扩展至1024个IPU-POD,即512个机架,至多64000个MK2芯片集群之后,其16bit FP算力能够达到16 ExaFLOPs.
  • 中美科技冷战对半导体设备产业的影响 无论是针对美方新祭出的出口管制禁令或是振兴美国本土半导体产业的措施,美国半导体设备业者都不愿意表达意见,毕竟他们已经习惯有八成业务来自于海外市场...
  • 美国面临芯片制造危机,而EDA产业茁壮成长 EDA产业的季成长率以及移动平均值呈现稳定上升态势;2020年第一季该产业营收较前一年度同期增加3.5%,达到26.9亿美元规模...
广告
热门推荐
广告
广告
广告
EE直播间
在线研讨会
广告
广告
面包芯语
广告
向右滑动:上一篇 向左滑动:下一篇 我知道了