美光高性能内存与存储,推动AI丰富残障人士生活体验

原创 美光科技 2023-12-06 12:08

关注美光 获取动态



美光云计算高级业务发展经理 Eric Booth 90 岁的祖母患有严重的听力障碍,即使佩戴助听器也很难听清别人在说什么。Eric 注意到,她需要凑近讲话者,识别他们的唇语,努力理解他们的话语。而当多人进行交谈时,她常常会感到迷茫。

Eric 萌生了一个想法:

为何不用祖母的智能手机帮她来“倾听”呢?


他打开手机的记事簿功能,按下麦克风按钮,向她展示了手机如何将他的话转录成屏幕上的文字。


他表示:“我的祖母非常兴奋,笑得合不拢嘴,她现在可以参与到从前无法进行的对话中。”这也让我们看到了该技术如何切实改善了言语、语言和听力障碍者的生活质量。”


将语音转化成文本的技术看似简单,却很容易被忽视。事实上,它的演变过程十分复杂,历经几十年的发展才达到现有水平。



快速发展的技术

距第一台语音识别 (SR) 设备 Audrey 的问世已经过了很久。1962 年,贝尔实验室推出了 Audrey,当时这台约 2 米高的计算机只能识别个位数字,且无法输出文字。它会根据说出的数字闪烁相应次数的灯光,例如听到“9”时闪烁九次。


甚至几年前,SR 技术还不方便用户使用:它难以准确识别声音,无法过滤即使最轻微的环境声,转录速度也很慢。彼时,SR 技术想真正融入日常生活,还有很长的路要走。


如今,人工智能、虚拟助理技术、5G 蜂窝技术与内存、存储和计算机处理技术的进步使 SR 成为可能,帮助我们实现许多从前做不到的事情:比如用陌生的语言进行交流,即时转录长录音,只通过语音就能订购我们想要的任何东西并享受送货上门。


生成式 AI 正进一步提升该技术。语音识别将音频转化为文字,而生成式 AI 则对文字进行处理,让用户真正理解其含义。SR 技术不再仅聚焦于识别说了什么?而是专注于理解这些话是什么意思?是在提问吗?如果是,答案是什么?


这种类型的机器学习能根据用户提示或对话创建文本、视频、图像、计算机代码和其他内容。以语音识别为基础的生成式 AI 将学习提升到了全新水平,赋能 SR 技术以进一步帮助言语和听力障碍人士。


尽管灵活的语音识别可能会接收到不符合常规语音模式的语言,但生成式 AI 和自然语言处理 (NLP) 能理解并将其转化为相关建议。这一过程使全面且高度个性化的语言治疗方案成为可能。


Eric 的女儿曾接受语言治疗,他深知其所需的时间和精力。这一经历促使他攻读位于爱达荷州的博伊西州立大学的博士课程,以研究利用技术帮助语言障碍患儿的方法。


Eric 表示:“在语言治疗中,过去我们认为治疗师会给患者提供阅读内容并利用工具对他们的发音和吐字进行评分。但借助生成式 AI,我们能用工具来管理整个过程。生成式 AI 擅长识别各种语言模式,因此能更好地判断出患者是否经常发错 O 音。”



不久前,语音识别还需依赖大型内存服务器,并将收集到的全部数据上传云端。而如今,语音识别功能已内置在手机中,具有更快的计算速度和更大的内存,过去需要数据中心处理的流程现在能够直接在手机上进行。


AI 模型训练不仅能生成更复杂的模型,还可以将这些模型简化,从而在手机或个人电脑等终端设备上运行。很快,生成式 AI 程序就会出现在您的手机或其他终端设备上。随着大语言模型的快速发展,他们难以在云环境之外进行训练。然而,一旦模型通过训练并进行简化后,就能转移到终端设备上。


过去几年,大语言模型取得了巨大进步。Eric 表示:“大语言模型拥有数万亿个参数,是实现生成式 AI 聊天机器人和高级搜索功能的关键。几年前,万亿级的参数量难以想象,我们根本无法处理,而如今,这一数字已是基准线。当然,模型越大,就越智能,这正是拉动计算和内存需求的因素。


NLP 和生成式 AI 需要大量大语言模型训练,其所使用的参数越多,所需的内存容量就越大(见下图)。

为了处理这些不断扩大的模型,迁移学习越来越流行。该思路是在一个特定的环境中使用大量数据训练模型,然后对该模型的参数进行微调以适应另一个具有较小数据集的环境。假设大的数据集是成人语音,小的数据集是儿童语音,迁移学习可以提供一个精准匹配两个数据集的模型。而如果您想训练的模型是以成人语音为主,同时包括少量的儿童语音,那么准确性就会降低。在一种环境中进行大数据集训练,然后将数据微调并转移到另一个具有较少数据的环境中,这一组合非常有效。Eric 在他的论文《评估和改进儿童定向自动语音识别》中阐释了关于这方面的进展。


预训练神经网络遵循了同样的思路,在一个任务或数据集上训练模型,然后将这些参数转移到另一个任务或数据集上进行不同的模型训练。以 ChatGPT 为例,(ChatGPT™ 中的“P”代表预训练),它通过大量互联网对话数据进行了预训练,因此能够回答常规问题,并能根据提供给它的额外语境来更好地适应当前对话。这为该模型发展提供了有利条件,避免了从零开始,因为您只需少量数据就能创建强大的模型。


如今,许多 AI 研究人员都专注于生成式 AI。这不仅源于 ChatGPT 所带动的热潮,还因为生成式 AI 在医疗保健和其他行业具有潜在的深远影响。



根据美国言语语言听力协会 (American Speech-Language-Hearing Association) 的数据,美国有超过 100 万儿童在学校接受专业的言语和语言障碍帮助。Eric 表示,总体而言,8% 的儿童存在语言发育迟缓或障碍问题。


“您当前无法在市场上接触到儿童言语治疗技术。因为该技术尚未实现,但它尤为重要,尤其对低收入家庭的患儿而言。”Eric 表示,对儿童进行治疗评估至少需要两小时,但美国政府可能只会承担 30 分钟的费用。


“电脑可以承担很多工作,为治疗师腾出时间来做更长远的规划和更有针对性的治疗。”


学习障碍资源基金会 (Learning Disabilities Resources Foundation) 认为,患有学习障碍(如阅读障碍)的儿童也可受益于语音转录文字技术。正如巧妙地利用语音转录文字技术帮助 Eric 的祖母参与到交谈中,这项关键 AI 技术还有大量尚待开发和探索的应用空间。



式 AI SR 

如今,美光正在开发密度更高、速度更快的内存和存储,助力手机取代云端直接进行语言处理,以节省数据传输时间。


为了提升终端设备的性能,美光低功耗 LPDDR5X 内存具有双倍数据传输速率,可实现功耗与性能的平衡和流畅的用户体验LPDDR5X  移动内存采用了业界先进技术,峰值速度可达 8.533 GB/秒,较上一代产品提高 33%。LPDDR5X 的高速与高带宽对于实现高性能终端生成式 AI 至关重要。


借助生成式 AI,SR 技术的处理速度和准确度逐渐接近人脑,但距离真正实现目标还存在较大困难,尤其是在处理儿童语言和发音问题,以及帮助听力或语言障碍者。Eric 正在进行的研究能够切实改善生成式 AI 技术,丰富全人类生活体验。


生成式 AI 通过深度学习正在将语音转化为更加自然的文字。过去,AI 模型擅长挖掘大量数据、识别模式、诊断并确定原因;如今,生成式 AI 能够“读取”文字,并通过数据推断人类交流的语境。本质上,生成式 AI 是在“训练”自己。为了做到这一点,AI 需要能同时访问并获取大量数据,并从海量内存中提取数据以做出适当的响应。美光正在积极推动这些技术进步。


美光高密度 DDR5 DRAM 模块和 TB 级 SSD 存储可提供超高速度与超高带宽,满足在数据中心训练生成式 AI 模型的需求。最新发布的第二代 HBM3 (HBM3E) 进一步提升了性能,容量扩大超过 50% ,带宽超过 1.2 TB/秒,可将百万亿级参数的 AI 模型训练时间缩短 30% 以上。随着这些技术的速度和准确度不断提高,未来,更多的语言障碍人士将能进行正常的沟通,发出自己的声音。


Eric 预测:“在不久的将来,我们将看到生成式 AI 和 SR 技术在性能上取得飞跃式发展。我很高兴能看到这项技术不断丰富全人类生活体验。”


中奖名单

恭喜以下粉丝在 11 月 29 日推文

美光助力生成式 AI 高速发展,开启时代新篇章

中获得


「 罗技 M221 鼠标 一个 」

蔚蓝天


「 米家保温杯 一个 

可心麻麻


「 罗马仕移动电源 一个 」

Old boy


「 京东 E 卡 50 元 一张 」

拈花菩提


「 京东 E 卡 10 元 一张 」

槿语℡👣;Judy;小月



请以上中奖的几位粉丝,于 12 月 13 日前私信本公众号后台,将您的联系人、地址、电话提供至后台,逾时未兑换或逾时未回复将被视为自动放弃奖品。


点击阅读原文 ,了解美光如何助力生成式 AI 高速发展


END



· 加入美光科技VIP俱乐部 ·

与美光科技共同遨游创新内存与存储世界

技术资源下载、签到积分兑好礼等多重会员福利等你解锁


/ 往期推荐 /

点分享
点收藏
点点赞
点在看

美光科技 关注美光科技,我们将向您及时推送公司最新产品信息和行业洞见,使您第一时间了解公司最新解决方案资讯。
评论 (0)
  • 前不久,一个朋友聊天中提及家里的猫毛和灰尘太多,双11入手了一台松下扫地机器人,没选我所推荐的戴森、科沃斯、石头和小米。扫地机器人真的好用么?有哪些芯片方案?从行业数据来看,扫地机器人渗透率在美国约为15%,在日本和欧洲约为10%左右,而在我国沿海地区渗透率仅为4%-5%,内陆仅为0.5%。尽管渗透率低,但2020年中国扫地机器人销量达600万台,销售额94.1亿元。由此可见,扫地机器人的市场前景是非常广阔的。《2021年扫地机器人市场发展白皮书》显示,2021年上半年,国内扫地机器人的零售量为
    拍明芯城 2024-02-29 10:51 78浏览
  • 在人手一机、智能装置满屋的时代,充电线成为必备的日常用品,而几经规格革命的充电线,目前也已渐走向统一Type-C规格的趋势,USB充电线变身一般通路上最热销的产品,在百家争鸣的红海市场中,若要保有竞争力,产品自然需要不断创新与优化,但是在效能之外,也要确保产品的耐用性及安全性,才能让消费者买的放心、用的安心。USB充电线应用安全风险与解决方案睡前充电早已是现代人的例行公事,您是否也有过类似的经验?充电线在长时间使用的过程中,受到弯曲或是扭转的力量影响,导致芯线断裂或破损,因而出现信号质量变差,甚
    百佳泰测试实验室 2024-02-29 14:01 99浏览
  • 常见充电桩有直流充电桩、交流充电桩、交直流充电桩等。涉及到的芯片或零组件包括充电模块、显示模块、线缆、主控板及元器件、接触器、断路器、继电器、外壳、插头插座等。1、充电桩成本构成:充电模块(30kW单个约2000元)、充电枪线(5米约5000元)、主控板(约1500元)、显示模块+通讯模块+壳体+线束+继电器(整体300元/kW,售价400元/kW);2、800V高压充电桩相对于400V升级:单800V升压内部结构不升级;高功率高电流要做分体机,耐高压高电流线束继电器、软件系统升级,若用液冷成本
    拍明芯城 2024-02-29 10:54 76浏览
  • 第一次接触到电纸书,是十几年前路必康的君正Demo,同期诞生的掌阅如今都上市了,岁月如梭!介于智能手机和平板电脑之间的电纸书,定位是类纸护眼阅读,让读书人携万卷难再破万卷。如今电纸书除了是闲置交易平台的热品经久不衰,也与Pad一起被打上了“泡面盖”的标签。而一本集齐万卷Datasheet的电纸书,定能对电子工程师有所帮助。今天我们的主题就是“电纸书的芯片方案及核心器件”。图1、Kindle Voyage(图源:iFixit)品牌型号描述飞思卡尔(Freescale)MCIMX6L8DVN10AB
    拍明芯城 2024-02-29 10:40 49浏览
  • 2024年初被“尔滨”和各地文旅刷屏大家是不是也坐不住了?祖国山河广袤辽阔却也气候多变从炎热沙漠到寒冷极地从湿润雨林到干燥草原看欧司朗车灯如何征服前路01驰骋雪域冰封极寒,如何“手拿把掐”?欧司朗车灯给出“稳定答案”“极寒酷暑”严峻考验恶劣环境稳定发挥零下40℃低温运行毫无压力让“冰雪嬉戏”变得“触手可及”尽情享受冰雪的魅力02恣意山河山河壮阔,怎能被黑暗淹没?欧司朗车灯划破夜的寂寥实验室震动测试挑战轻松通过耐用值UP UP!再颠簸路况亦能探索自由与浪漫天地山河尽情释放激情03点亮时间探寻古迹遗
    艾迈斯欧司朗 2024-02-29 17:20 78浏览
  • 电池监测和矿石能耗监测在实现上的异同点主要表现在以下几个方面:相同点:数据采集:两者都需要对目标对象(电池或矿石能耗设备)进行数据采集,包括电压、电流、温度、功率等关键参数。数据处理与分析:采集到的数据需要经过处理和分析,以提取有用的信息,如电池的健康状态、剩余电量或矿石能耗设备的能效、运行状态等。预警与控制功能:两者都可以设定一定的阈值,当监测到的数据超过或低于这些阈值时,系统会发出预警,并采取相应的控制措施,以防止设备损坏或能耗过高。不同点:监测对象:电池监测主要针对的是电池组或单个电池的性
    丙丁先生 2024-02-29 12:08 80浏览
  • 随着科技的不断发展,各种高频/高速的电子产品亦不断推陈出新,而高频传输线的延迟问题,便已成为现代通信和电子领域中极为重要的挑战。当高频率数据的传输需求不断增长,延迟首当其冲是个显著的障碍,直接影响通信速度、数据的准确性和整体性能,这些延迟所带来的深远影响这意味着在未来,若要使设备在通信和数据传输中实现优异表现,必须将延迟问题彻底解决,而这将是一个相当艰巨的课题。信号延迟示意图及可能产生的问题传输延迟导致的潜在风险传输延迟可能带来一系列的潜在风险,从个人生活到商业和社会体系的运作都可能受到影响,当
    百佳泰测试实验室 2024-02-29 14:44 105浏览
  • 对于数据的存储落盘来说,占据绝大部分存储空间的数据来自于相机传感器,特别是当前的数采需求可能需要6-8个800M像素的相机采集,进行RAW数据落盘。举个例子在以非RAW格式,比如YUV422 8bits,在3840×2160(800M)分辨率下以30fps进行拍摄:3840 × 2160 × 16 / 8 ×30 / 1024^2 = 475MB/s,近500MB/s的带宽需求,在搭载多个800M相机以及其他传感器的情况下,一辆数采车可以轻易达到5TB/小时的落盘需
    康谋 2024-02-29 14:49 67浏览
  • 「啪」!一碰就「来电」?说起静电,想必大家并不陌生,静电是我们日常生活中常见的一种现象,通常是由于物体之间的摩擦而产生的。例如,当我们脱下带有合成纤维的衣物时,布料与皮肤之间的摩擦可能会导致电荷的累积。同样地,当走在干燥的地毯上时,鞋底与地面的摩擦也可能引起静电的产生。须特别注意的是,当身体带有静电电荷时,一旦触摸电子产品即有可能会导致电荷的传递,进而可能对设备造成损害。电子产品通常包含敏感的电子组件,这些组件对静电非常敏感。即使静电放电可能以微弱到肉眼不可见的形式存在,但却足以引起电子组件的故
    百佳泰测试实验室 2024-02-29 15:14 94浏览
  • 上个月底,也就是10月29日,脸书(Facebook)创始人扎克伯格宣布了“Facebook, Inc.”改名为“Meta Platforms, Inc.”,掀开了All in Metaverse(元宇宙)的大幕,从社交平台转向一个专注于虚拟现实的新兴计算平台。恰逢其时,10月28日下午电子圈创始人江帮主邀请豪微研究院院长孔华威和亿境EmdoorVR创始人石庆做了元宇宙主题的线上分享会,对我很有启发。我找到了一张可以概括元宇宙六大支撑技术的图(图源:中译出版社《元宇宙通行证》):交互技术方面,恰
    拍明芯城 2024-02-29 10:45 88浏览
  • 近日,OpenAI发布的基于Transformer架构的文生视频Sora,可谓是在AI圈掀起新的热潮。该模型具有强大的视频生成能力,可产生高达一分钟的高清视频,并且用户可以自由指定视频时间长度、分辨率和宽高比。据OpenAI的观点,Sora的诞生可能预示着物理世界通用模拟器的重大突破。360集团创始人兼董事长周鸿祎在2024年亚布力中国企业家论坛第二十四届年会上分享了其对Sora模型的观察。“Sora的推出预示AI视频生成能力的突破,不仅推动了AI的发展,而且为企业的未来指明新的发展方向。通用人
    高性能服务器 2024-02-29 11:54 78浏览
  • 爱车知多少?你是不是也有过这样的经历:晚上驾车,对面来车的“远光灯”让你瞬间“失明”?急转弯时,车灯突然不亮了,吓出一身冷汗!车灯,看似车上很小的一部分,但却是一辆车的“眼睛”,对于行车安全至关重要。对于爱车的“双眼”你了解多少呢?车灯是否需要更换,如何判断车灯状况,如何挑选合适的车灯……今天,就让我们一起探索这双大眼睛的秘密!一关注车灯,守护行车安车灯,作为车辆的“双眼”,不仅担负着照亮前行道路的职责,还承载着与周围其他车辆和行人进行信息交流的重要功能。如果在夜间驾驶时,车灯亮度过暗或突然发生
    艾迈斯欧司朗 2024-02-29 17:00 78浏览
我要评论
0
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦