新型人工智能存储研究报告(2025)

智能计算芯世界 2025-05-12 07:48
图片
本文所有资料都已上传至智能计算芯知识”星球。如《60+份AI Agent技术报告合集》”,“《清华大学:DeepSeek报告13部曲合集》”,“浙江大学:DeepSeek技术20篇(合集)”,“300+份DeepSeek技术报告合集”,“《100+份AI芯片技术修炼合集》”,“800+份重磅ChatGPT专业报告”,“《12+份Manus技术报告合集》,加入星球获取严选精华技术报告。

本文来自“新型人工智能存储研究报告(2025)”。新型AI 存储是指专为人工智能应用和服务设计的数据存储系统,具备超高性能、超大容量、极致安全、数据编织等特征,可以有效支撑海量数据的分析和学习,是AI 基础架构不可或缺的组成部分,作为大模型的数据载体,新型 AI 存储与大模型数据归集、预处理、训练、推理等全生命周期流程紧密相关,且逐步成为 AI 数据全生命周期服务与管理平台的重要组成部分。

当今在不同行业和组织内部具备形成多元化数据集的条件下,新型 AI 存储正在成为数据资源的统一管理平台,并以此为基础构成跨域跨部门的 AI 数据湖,为数据赋能提供关键的技术支撑。

1、人工智能存储是发力大模型的基础

大模型正在从基础大模型向行业大模型演进。大模型的应用场景日渐丰富,正在加速向各个行业渗透。大模型很大程度上打破了AI 场景化和行业化的瓶颈,为上层应用提供更多通用性的基础能力,同时企业不再需要按场景从零开始开发和训练独立的基础模型,仅需在较成熟的基础大模型上融入企业生产业务沉淀而来的私域数据,即可进一步实现大模型的专业训练,满足特定领域对准确度和安全性等方面的诉求。根据 IDC 的分析及预测,未来 95%的大中型企业将基于专属数据自建行业大模型,例如银行的风控数据、车企自动驾驶数据、医疗 PACS 数据等。

数据决定人工智能高度。大模型三要素是数据、算力和算法。随着 AI 技术快速成熟,各企业所使用的算力已逐渐趋同;各企业采用的算法也同样逐渐收敛,大多依托 Transformer 模型基础架构和以 PytorchTensorFlow 等为代表的开发框架;因此真正体现大模型差异性的要素是数据。根据公开数据显示,Meta 开发的LLaMA3 拥有 700 亿参数和 15TB 训练数据,而 OpenAI 的 GPT-3.5拥有 1750 亿参数和 570GB 训练数据,尽管 LLaMA3 在参数规模上还不到GPT-3.5的一半,但其表现能力在大部分基准上均超过后者。

AI 存储逐步成为大模型的关键基础设施。AI 存储是大模型数据收集、预处理、训练、推理的关键一环,决定了能保存利用的数据容量、训练及推理的数据存取效率、基础设施可用度以及数据安全。

一是 AI 存储与大模型数据处理效率紧密相关,AI 存储直接影响数据访问速度,从而影响大模型训练和推理速度。

二是 AI 存储是模型规模和数据量激增时平衡成本的重要因素。模型参数增大会伴随训练数据集规模的指数级增长,从而大幅增加数据储存成本。

三是大模型行业落地需要依托 AI 存储来加速数据在各环节的自动流转,保护数据安全,并形成统一的数据管理。面对大模型带来的大量数据处理和工程化工作,也需要结合 AI 存储中的相关技术一并解决。

2、新型人工智能存储关键技术

新型人工智能存储(面向 AI 的存储系统)具备极致性能、数据安全、大模型数据范式、高扩展性、数据编织和绿色节能 大关键特征,极致的性能密度可以加速数据供给,缩短训练数据的归集与预处理、CheckPoint 数据的保存以及断点续训等造成的算力等待,提升 AI 全流程效率;支持向量、张量、KV Cache 等大模型数据范式,能显著加速数据的融合检索,更好的支持推理应用;AI 存储 99.9999%的可靠性提升 AI 基础设施的持续服务时间,防勒索和存储加密进一步保障数据安全;跨域跨集群的 AI 数据湖支撑异构计算,近存计算的扩展;数据编织提供全局数据可视、可管,实现数据流动效率的倍数提升,并通过数据版本管理和数据血缘管理,保证数据质量不被破坏;绿色的 AI 存储,可降低每 TB 数据的能耗和占用空间。

构建先进的 AI 存储,要从存储介质、系统、架构、数据编织、数据范式和数据安全等多方面发力,协同提升大模型数据存储能力。

长记忆存储通过多级 KV Cache 助力大模型推理成本降低,用户体验增强。长记忆存储是专业记录大模型思考结果的存储,作为内存的扩展,以分级的方式实现月级、年级、乃至“终身”的记忆能力,让大模型推理具备慢思考能力,一方面,大模型推理过程中需处理长序列以获取准确的上下文信息、生成高质量输出,模型的计算成本和内存需求通常随序列长度的增加而显著增加,通过 KVCache 缓存机制,可以有效降低模型长序列推理的内存占用和计算开销,实现有限硬件条件下的高效推理。另一方面,基于高性能长记忆存储技术构建的多级 KV Cache 缓存机制,可以保证 KV Cache 具备随时在线和全局池化共享能力,配合以查代算算法,实现从持久化的KV Cache“长记忆”中调取前期已执行过的计算结果,减少推理过程中的重复计算。

近数据向量知识库提高大模型检索效率,减少输出幻觉。近数据向量知识库基于快速知识生成、大库容高召回率与多模融合检索关键能力,可实现百亿知识库秒级检索。通过分布式合并建图技术,实现近数建库,根据企业实践,知识生成从月级降至天级,建库时长缩短5 倍,实现知识实时更新。同时利用存储侧容灾备份特性组合,可提供数据库高可用保障,消除单点故障引发重新建库的巨大开销。

大模型时代,AI 存储架构从传统的层次化、主从服务器架构,向全对等、全直通的超节点架构转变。超节点存储能够构建全对等、全直通的架构,实现“DC as a Computer”。存储与计算之间高并行数据直通,通过开放的协议标准,既支持 Scale-up 扩展容量,也支持Scale-out 扩展性能的超节点架构。一方面在宏观上存算分离,计算、存储资源独立部署,通过高通量数据总线互联,统一内存语义访问数据,实现计算、存储资源解耦灵活调,资源利用率最大化。目前,模型训练仍然需要通过 CPU 去访问内存,但由于 CPU 的发展逐步放缓,导致内存的带宽和容量成为瓶颈。以 CXLCompute Express Link)为代表的高速互联总线,将系统中的计算、存储、内存等资源彻底解构,各自形成统一的共享资源池,让 GPU 可以直接通过 CXL 总线以更快的速度访问内存与存储,从而极大提升大模型的数据加载及流转效率,实现以数据为中心的超节点架构。

篇幅有限,完整内容请参考“新型人工智能存储研究报告(2025)”。

来源:中国信息通信研究院、中国人工智能产业发展联盟

下载链接:

重磅合集
1、《70+篇半导体行业“研究框架”合集》
2、《56+份智能网卡和DPU合集
3、《14份半导体“AI的iPhone时刻”系列合集》
4、《21份走进“芯”时代系列深度报告合集》
5、800+份重磅ChatGPT专业报告
6、《92份GPU技术及白皮书汇总》
7、《11+份AI的裂变时刻系列报告》

8、《3+份技术系列基础知识详解(星球版)》

《100+份AI芯片技术修炼合集》

《300+份DeepSeek技术报告合集》

《42篇半导体行业深度报告&图谱(合集)

亚太芯谷科技研究院:2024年AI大算力芯片技术发展与产业趋势

SSD闪存技术基础知识全解(知识星球版)
服务器基础知识全解(知识星球版)
存储系统基础知识全解(知识星球版)
2025新技术前瞻专题系列合集
GPU原理详解:Tensor Core原理
GPU原理详解:Tensor Core架构演进
GPU原理详解:Tensor Core深度剖析
GPU原理详解:分布式训练与NVLink发展
GPU原理详解:NVSwitch基础和原理
国外AI芯片:谷歌TPU 芯片发展
国外AI芯片:谷歌TPU1详细解读
国外AI芯片:谷歌TPU2推理到训练

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。


图片

免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索AI_Architect”或“扫码关注公众号实时掌握深度技术分享,点击阅读原文获取更多原创技术干货


图片
图片

智能计算芯世界 聚焦人工智能、芯片设计、异构计算、高性能计算等领域专业知识分享.
评论
  • 在竞争白热化的智能汽车赛道,深蓝汽车近期因一系列“迷之操作”,被舆论的熊熊烈火炙烤得焦头烂额。事情起因是,大量深蓝汽车老车主公开吐槽称,深蓝汽车在没经过车主同意的情况下在车机大屏幕投放广告。为此,深蓝汽车及其CEO邓承浩发文道歉,并表示:内部已进行了流程优化,未来将不再通过车机通道给用户推送权益提醒。不过,道歉后深蓝汽车对用户隐私条例进行了更新,主要新增了用户数据采集,如果用户不同意更新,则只能以游客身份访问App。所以又有网友辣评,“这是要强行让大家同意看广告?”对此,深蓝汽车法务部发文回应:
    用户1742991715177 2025-06-17 18:21 1564浏览
  • 当数千伏工业电机快速启停时、当高速充电桩断电恢复时、当光伏逆变器遭遇雷击时,高压侧电路可能会因电感电流突变或浪涌耦合,产生幅值达母线电压数倍的电压尖峰。而在缺乏有效电气隔离措施或在寄生电容耦合作用的情况下,这些电压尖峰会迅速传导至低压侧电路,瞬间击穿MCU、传感器等敏感元器件,严重时还会威胁到操作人员的生命安全。因此,在现代电力电子系统的高低压电路之间引入隔离芯片,建立安全可靠的电气隔离屏障,已成多项安全标准与通用规范中的明确要求与刚性规定。其不仅能防止高压浪涌、短路漏电等不良现象损坏敏感元器件
    华普微HOPERF 2025-06-18 15:52 4076浏览
  • 概述相关API函数举例:定时发送一个事件总结概述ESP32有一组外设--定时器组。它可以选择不同的时钟源和分配系数。该定时器应用灵活,超时报警可以自动更新计数值。相关API函数1.定时器配置结构体typedefstruct { gptimer_clock_source_tclk_src; /* 定时器时钟源,在clk_tree_defs.h中有个枚举soc_periph_gptimer_clk_src_t */ gptimer_count_direction_tdirection;
    二月半 2025-06-17 16:39 15434浏览
  • 概述在工业自动化领域,PLC(可编程逻辑控制器)是生产过程的核心,其性能直接影响系统的稳定性和效率。然而,在多主站应用场景下,传统PLC往往面临诸多挑战,如协议兼容性不足、扩展性受限以及高昂的License费用,这些都增加了系统部署的复杂性和成本。宏集Berghof PLC基于CODESYS平台,凭借其强大的多主站支持能力和灵活的License选项,为工业控制提供了高效、灵活且经济的解决方案,助力企业优化自动化系统架构。传统PLC多主站应用的挑战在许多自动化应用中,设备需要同时支持多个通信主站,
    宏集科技 2025-06-19 10:58 3768浏览
  • 随着智慧居家中与智能家电快速发展,各类产品纷纷透过无线技术和行动软件(APP)实现更智能的服务,让原本单一功能的产品,逐步进化变身为多功能且提供人性化功能的智能家电。本篇的主角-智慧居家门铃(Doorbell),正是其中具代表的应用之一。智能门铃整合了传统门铃与对讲机功能,再加上摄影机的功能,进而成为新世代的智能产品!用户可以透过镜头,立即看到来访者并进行对话。更进阶的应用则是结合高分辨率的摄影机、无线连线与APP整合,让用户不再经由传统有线线路,即可远程实时了解门外的一切状况。实测案例本次案例
    百佳泰测试实验室 2025-06-19 13:42 4118浏览
  • 在户外作业和复杂环境监测场景中,目标追踪需求、环境干扰因素和多变光线条件不断增加,传统光学观测设备面对画面模糊、响应延迟、信息缺失等问题时常难以应对。此时,显示技术的升级成为突破口——它不再只是单纯的“图像载体”,而逐步演变为“决策中枢”,成为设备智能化的核心支撑。其中,Fast LCD 通过其高速响应、高清显示、低功耗和优秀的环境适应性,成为瞄准镜、热成像等设备理想的显示方案,极大地提升设备性能和用户体验。上海冠显光电推出的Fast LCD 1.25" HDMI单目驱动方案,小巧紧凑,采用HD
    冠显光电MicroOLED代理视涯 2025-06-17 14:51 957浏览
  • 作为自然界最敏锐的“通用语言”之一,从破土而出的植物新芽到钢铁熔炉中的炽热火焰,温度一直都在无声地影响着万物运行的节奏,它不仅是农业播种与收获、牧业养殖与繁育、工业材料加工与产品制造等领域的关键生产因素之一,更是所有地球生物赖以生存的重要气候参数。因此,如何更好地“读懂”温度已成为各行各业实现提质增效的重要突破点之一,而数字温度传感器就是人类通过发展物联网技术让温度实现快速“说话”的重要途径。数字温度传感器是一种能直接输出数字信号的传感器,具有微型化、易集成、低功耗与高精度等优势,已被广泛应用于
    华普微HOPERF 2025-06-19 09:39 4638浏览
  • 中国汽车市场以年均超 3000 万辆的销量规模(占全球 1/3以上),正推动安全标准从被动防护向主动预防转型。2024 年 7 月实施的 C-NCAP ( China New Car Assessment Program)修订版首次将驾驶员监控系统(DMS)、道路特征识别(RFR)纳入评分体系,其中 DMS 占主动安全分值 40%(总分 2 分),检测准确率需≥90%。这一变革不仅响应工信部 GB/T 41796-2022 等三项国家标准要求,更标志着中国
    康谋 2025-06-18 10:25 2100浏览
  • Micro-OLED显示技术具有高刷新率、高亮度低功耗、小体积等特点,是微显示领域的优选方案。针对Micro-OLED CVBS显示驱动需求,上海冠显(TDO)设计的驱动方案,实现CVBS信号到Micro-OLED显示屏的稳定转换和显示控制,将满足行业对高质量、高性能显示解决方案的迫切需求,为XR、军工、工业及医疗等应用领域提供更优质的视觉体验。方案架构 显示屏驱动板TV103F1CSFS01 是TDO自主开发的单目硅基 OLED 显示屏驱动板,以 SH1.0连接器为 CVB
    冠显光电MicroOLED代理视涯 2025-06-18 16:32 4024浏览
  • 文/Leon编辑/cc孙聪颖6月9日,美团在北京美团总部恒电大厦举行股东周年大会,美团创始人、CEO王兴携一众高管出席。在回答股东问题的环节,王兴谈及与京东、淘宝闪购的竞争时表示:“第一,我们非常欢迎更多参与者入场的;第二,再次重申美团是坚决反对内卷的;第三,我们对长期是很有信心的。”然而,据自媒体《划重点》公开报道称,有参会股东透露,疑似提前安排好的问题和管理层全程读稿式的回答令部分现场股东感到不满。在会议结束后,现场股东将负责市场和投资的副总裁徐思嘉围了起来,在小会议室继续沟通了半个小时。不
    华尔街科技眼 2025-06-17 19:11 1774浏览
  • 医疗数字化的昨天       今天,当我手拿着鼠标在电脑屏幕前面熟练的操作着中望3D软件制作3维立体模型的设计时,平面设计、3维规划、尺寸测量、漏洞修补、色彩渲染、浮点计算、仿真。。。这一系列的工程作图强大而复杂功能被安装在服务器的工程软件轻易的实现了。而对比在多年前我趴在制图桌子上,靠工程尺、圆规、计算器的辅助,做比这简单相似的工程制图工作不知道要方便、准确和快捷了多少。这就是数字化发展带来的显而易见的成果。      &n
    广州铁金刚 2025-06-17 09:46 22867浏览
  •  RoCE v2原语在RoCE v2协议中,应用程序并不直接与网卡接口相关联,开发者使用RDMA原语进行应用程序的开发。RDMA原语分为单边(one-side)语义和双边(two-side)语义,其中,WRITE、READ、ATOMIC为单边语义,SEND、RECEIVE为双边语义,且双边语义往往成对出现。单边语义指:当本地主机调用单边语义进行操作时,远程主机的CPU完全不会感知这一过程,只有本机的CPU参与数据处理和数据传输流程[42]。READ、WRITE、ATOMIC操作为单边语
    zzbwx_326664406 2025-06-17 08:23 677浏览
  •   再次拆开来,干脆放上电池看看,呵呵,转呀!  嘀嗒嘀嗒声好听,小齿轮转啊转尊,挺有活力啊!  莫非是活动关节受阻?  仔细,用放大镜观察,真是的!轴承与转杆接触位有污垢。  拆解下来,用酒精仔细清洗干净,看看纸上是刷子擦下来的污迹。  顺便把PCB、其他可能的零部件,也用酒精擦一擦  清洗清洁后的的各个零部件。  再看看电极接触点,有磨损,露出了底下的铜金属。  想想,用焊锡填补吧!  金属表面不太接受,总算有了一点焊锡,试试看吧!  再组装回去,装上电池,不转动!  再拆开来,到底是那个零
    自做自受 2025-06-21 12:19 2320浏览
  • 在RoCE v2协议中,RoCE v2队列是数据传输的最底层控制机制,其由工作队列(WQ)和完成队列(CQ)共同组成。其中工作队列采用双向通道设计,包含用于存储即将发送数据的发送队列(SQ)和用于存储已接收到的数据的接收队列(RQ),二者共同组成了端到端的数据传输管道(Pipeline)每一个SQ与RQ绑定起来称为队列对(QP),每个队列对中包含有若干个工作队列元素(WQE)和一些其他元素如本地接收队列指针、本地发送队列指针、远程接收队列指针、远程发送队列指针等。同样的,每一个CQ中也存在着若干
    zzbwx_326664406 2025-06-18 11:49 2412浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦