向右滑动:上一篇 向左滑动:下一篇 我知道了
广告

选AI芯片也有诀窍?别看算力,看“疗效”

时间:2019-05-16 作者:刘于苇 阅读:
怎样选择一款好的终端AI芯片?是谁的算力强谁就牛吗?非也……算力的提升可以简单通过MAC数的堆积和工艺的提升来达到,然而付出的代价则是芯片面积和功耗的提升,以及成本的增加。而一颗成功的终端AI芯片,应该具有以下特征……

近年随着人工智能AI)技术的兴起,各路势力开始纷纷布局相关产品及应用,AI芯片产业也从野蛮生长,进入大浪淘沙阶段。产品落地、商业应用等实际成果成为衡量企业竞争力的标尺,新产品发布、合作签约、样板案例成为业界关注的焦点。zGLEETC-电子工程专辑

怎样选择一款好的终端AI芯片?是谁的算力强谁就牛吗?zGLEETC-电子工程专辑

“算力的提升可以简单通过MAC数的堆积和工艺的提升来达到,然而付出的代价则是芯片面积和功耗的提升,以及成本的增加。” 在5月15日耐能(Kneron)的夏季媒体沟通会上,耐能创始人兼CEO刘峻诚博士向大家普及了一些终端AI芯片选择的小知识,“一颗成功的终端AI芯片应该具有足够的算力,最有竞争力的成本,最高的兼容性以及最低的功耗。换句话说,就是用刚刚好的算力,满足相应的需求,并且成本低到能够迅速普及。”zGLEETC-电子工程专辑
20190515-kneron-1.jpgzGLEETC-电子工程专辑
刘峻诚发布耐能KL520智能物联网专用AI SoCzGLEETC-电子工程专辑

本次沟通会耐能宣布从提供IP转向量产芯片,并正式发布其首款智能物联网专用AI SoC——KL520。耐能一直以实现终端AI网络(Edge AI Net)为其愿景,相较于传统云端AI的终端“采集数据——100%上传服务器处理——反馈回终端”的复杂流程,终端AI具有保护用户的隐私/机密,实时反馈,降低网络带宽压力,总成本低等优势——“能解决的当场就给办了”。zGLEETC-电子工程专辑
耐能KL520智能物联网专用AI SoC机器开发板.jpgzGLEETC-电子工程专辑
耐能KL520智能物联网专用AI SoC及其开发板zGLEETC-电子工程专辑

来到发布会现场的还有美国高通公司风险投资总监毛嵩、大唐半导体研发部技术总监母大学、奥比中光高级战略BD总监彭勋禄、蓦然认知创始人兼CEO戴帅湘。几位也从投资人、方案商、终端应用等产业链不同位置的角度,介绍了他们选择AI芯片的标准,以及与耐能的合作进展。zGLEETC-电子工程专辑

做芯片如搭乐高,“我们是世界一流的”

其实早在CES 2019期间,耐能就宣布将于第二季度推出首款面向智能物联网市场的AI SoC。4个月后的,这款AI芯片终于亮相。zGLEETC-电子工程专辑

刘峻诚表示,KL520支持的ONNX、Tensorflow、Keras、Caffe框架,几乎覆盖了95%以上的AI软件开发者需求。采用Vgg16、Resnet、GoogleNet、YOLO等主流的CNN模型,压缩精度损失<0.5%,目前主要应用在人脸识别、物品识别、身体与手势识别、3D传感上。zGLEETC-电子工程专辑

20190516-kneron-1.pngzGLEETC-电子工程专辑
zGLEETC-电子工程专辑
而相比传统的微处理器和DSP方式实现AI,KL520采用的ASIC NPU方式更加有效和灵活,能效比提升达100x。zGLEETC-电子工程专辑

“和传统ASIC最大的不同,就是我们的NPU是可重构的,就像是乐高积木。”刘峻诚这样形容KL520的特性,“一些体量比较小的客户可能有自己的需求,比如你要它做语音识别的用途,就把语音的积木搭上去,要做人脸识别,就把人脸识别的积木搭上去。所有积木都可以打散后重新按需求搭建,当然如果大客户不想二次开发,我们也可以全部做好,然后像交钥匙(Turn-key)一样批量出货。”zGLEETC-电子工程专辑

随后,刘峻诚放出了耐能KL520智能物联网专用AI SoC的架构图与详细参数。zGLEETC-电子工程专辑
耐能KL520架构图.jpgzGLEETC-电子工程专辑
耐能KL520架构图zGLEETC-电子工程专辑
 zGLEETC-电子工程专辑

产品型号zGLEETC-电子工程专辑

KL520zGLEETC-电子工程专辑

神经网络处理器zGLEETC-电子工程专辑

最高频率300MhzzGLEETC-电子工程专辑

8-bit模式峰值速率:345 GOPS, 576MAC/cyclezGLEETC-电子工程专辑

中央处理器zGLEETC-电子工程专辑

ARM Cortex-M4@200MHz做系统控制zGLEETC-电子工程专辑

ARM Cortex-M4@250MHzAI协处理器zGLEETC-电子工程专辑

SDRAMzGLEETC-电子工程专辑

系统级封装, 32MB64MB, 16-bit LPDDR2-1066zGLEETC-电子工程专辑

外部闪存 zGLEETC-电子工程专辑

高达64MB SPI NOR flashzGLEETC-电子工程专辑

支持操作系统zGLEETC-电子工程专辑

CMSIS RTXzGLEETC-电子工程专辑

功耗zGLEETC-电子工程专辑

典型功耗500毫瓦zGLEETC-电子工程专辑

1.1V 核心电压zGLEETC-电子工程专辑

3.3, 1.8V 输入输出电压zGLEETC-电子工程专辑

制程工艺zGLEETC-电子工程专辑

40纳米低功耗zGLEETC-电子工程专辑

视频输入接口zGLEETC-电子工程专辑

2-Lane MIPI-CSI-2 RXzGLEETC-电子工程专辑

DVPzGLEETC-电子工程专辑

视频输出接口zGLEETC-电子工程专辑

2-Lane MIPI-CSI-2 TXzGLEETC-电子工程专辑

MIPI-DSI TX zGLEETC-电子工程专辑

DVPzGLEETC-电子工程专辑

LCMzGLEETC-电子工程专辑

音频接口zGLEETC-电子工程专辑

I2S 接口连接外部音频解码器zGLEETC-电子工程专辑

外围接口zGLEETC-电子工程专辑

I2C zGLEETC-电子工程专辑

SPIzGLEETC-电子工程专辑

UART zGLEETC-电子工程专辑

USB 2.0 host/device 接口zGLEETC-电子工程专辑

PWMzGLEETC-电子工程专辑

GPIOzGLEETC-电子工程专辑

SDIOzGLEETC-电子工程专辑

现场几位还同时对这款芯片的一个主要特性点赞,就是低功耗和小体积,算力345GOPS (300MHz) ,平均功耗500mW。但从算力来看其实不高,但能效比相对友商产品提升了3-4倍。这得益于KL520极高的MAC利用率, ResNet50 73%,GoogLeNet 74%,比竞品分别高出3.15倍和1.71倍,这对于当今AI应用能效比普遍偏高的病症,“疗效”是非常好滴。zGLEETC-电子工程专辑

刘峻诚表示,“我们找了市面上所能买到的AI芯片进行对比,目前(MAC利用率)还没有能达到25%以上的,我们应该是目前世界上一流的。zGLEETC-电子工程专辑

20190516-kneron-2.pngzGLEETC-电子工程专辑
此外,KL520可以作为协处理器,分担主芯片的AI算力,无需更换主芯片从而保留软硬件资产。针对智能门锁等轻量级应用,更是可以凭借内置Cortex-M4 CPU,还可直接替代主控芯片。至于为什么选择M4的核,刘峻诚笑道:“我们也是被客户逼的,因为一颗SoC中的CPU其实是最吃成本的,客户要求总价更低,所以不能选太好的CPU。于是我们把NPU做到了超强,强到用什么CPU已经不重要了。”zGLEETC-电子工程专辑

智能门锁最爱什么样的芯片?

随着消费习惯逐渐养成,以及渗透率的不断提高,智能门锁行业将进入快速发展期。大唐半导体研发部技术总监母大学表示,大唐一直希望打造安全、低功耗的3D人脸识别智能门锁解决方案,不过智能门锁产业存在日益凸显的安全问题,以及面临“智能门锁+AI”“智能门锁+安全”等趋势,所以他们非常期待这样一颗能解决安全、能耗问题的AI芯片出现。zGLEETC-电子工程专辑
20190515-kneron-2.jpgzGLEETC-电子工程专辑
智能门锁市场增长迅速zGLEETC-电子工程专辑

母大学指出,耐能3D方案在其AI芯片支持下,不仅利用了人脸识别、人脸比对、活体检测等红外人脸信息,而且通过红外相机和彩色相机得到的特征点视差计算出人脸的3D信息,然后将得到人脸3D信息和人脸2D红外图像信息、RGB图像信息通过耐能融合算法与原始数据进行匹配,结果都和录入数据匹配才算认证成功,安全性得到极大的提升,误识率仅为数十万分之一。同时,对包括室内室外的光线环境均能很好适应,也能有效地防止多种材质的相片、显示屏甚至人脸模型的攻击。zGLEETC-电子工程专辑

20190516-kneron-4.jpgzGLEETC-电子工程专辑

2D人脸识别方案能够轻易被照片骗过,所以需要用户做转头、张嘴、眨眼等动作,而3D方案则不存在被平面照片欺骗的风险。zGLEETC-电子工程专辑

解决3D传感行业痛点

奥比中光高级战略BD总监彭勋禄介绍道,3D成像三大技术是结构光、ToF和双目测距,三种技术各有特点。我们现在看到的绝大部分图像,视频都是通过2D摄像头平面成像,无法识别物理世界中的三维信息(如:尺寸,体积,距离等几何数据)。2D图像人脸识别存在体验性、可靠性、局限性和安全性等问题,而3D摄像头立体成像,能够识别视野内空间每个点位的三维座标信息,从而使得计算机得到空间的3D数据并能够复原完整的三维图像。zGLEETC-电子工程专辑
20190516-kneron-3.pngzGLEETC-电子工程专辑

不过3D传感行业有一些“祖传”的痛点,包括3D摄像头模组成本高,芯片成本高,硬件功耗高等“三高”问题。即便是国际上少数几个掌握3D传感绝大部分核技术、我国唯一能同苹果、微软、英特尔等国际巨头抗衡的奥比中光,也面临着这些问题。zGLEETC-电子工程专辑

对此刘峻诚表示:“如果传统3D传感模组的芯片,从GPU/DSP切换到耐能的KL520,可以实现芯片成本的降低;而采用耐能轻量级3D传感方案,将ToF/结构光/双目的方式变为普通RGB和普通NIR,则可从模组级别上做到成本的降低。这种属于从源头上就把成本给降下来了。”zGLEETC-电子工程专辑

产品路线图公布

此次媒体沟通会也揭开了耐能的AI芯片产品路线图。刘峻诚透露,2019年第四季度,耐能将发布更高规格的第二款AI SoC——KL720。而2020年,“3代”的KL330、KL530和KL730系列也将相继推出,其中KL530将采用28nm工艺、KL730的工艺则为16nm。zGLEETC-电子工程专辑
耐能AI芯片产品路线图.jpgzGLEETC-电子工程专辑
耐能AI芯片产品路线图zGLEETC-电子工程专辑

从一家做算法的IP公司,跨足到芯片行业,其实是很有挑战的。AI有三样东西最关键,算力(硬件芯片)、算法和数据,相对于算法来说,芯片的门槛更高。我们曾经看过无数的好技术,因为没有落地场景,或是场景被其他技术抢占先机,就此消亡。这次耐能带着AI落地和芯片赚钱的决心切入市场,他们未来的表现如何,让我们拭目以待。zGLEETC-电子工程专辑

相关阅读:

能落地才是好AI!轻量级人工智能登场zGLEETC-电子工程专辑

对话耐能刘峻诚:全球化AI芯片公司在中国的成长与未来zGLEETC-电子工程专辑
zGLEETC-电子工程专辑

利用本性、借力培育打造令人惊叹的AI SoC zGLEETC-电子工程专辑

 zGLEETC-电子工程专辑

本文为EET电子工程专辑 原创文章,禁止转载。请尊重知识产权,违者本司保留追究责任的权利。
刘于苇
电子工程专辑(EETimes China)副主分析师。
您可能感兴趣的文章
相关推荐
    广告
    近期热点
    广告
    广告
    广告
    可能感兴趣的话题
    广告