精准匹配智算供需:智算IP广域网发展步入快车道

原创 网优雇佣军 2025-01-14 20:02

随着AI技术和应用迅猛发展,行业正面临日趋加剧的智算供需对接挑战。一方面,国内已建设很多智算资源池,尤其运营商已在全国范围内落地多级算力资源池,迫切需要充分发挥这些智算资源的作用;另一方面,行业对人工智能技术的投入持续增加,产生了海量样本数据上传和日益复杂的模型训练需求。


如何精准对接智算资源供给与行业需求?智算广域网成为业界关注的焦点,其不仅是智算中心与各行各业之间智算数据传输的桥梁,更是实现“网效”与“算效”双提升的关键基础设施。


正是在这样的背景下,中国信息通信研究院于12月23日在京举办了以“打造超弹性无损智算IP广域网,加速迈向智能时代”为主题的“智算IP广域网产业交流会”。会上,行业专家们围绕技术创新、应用实践和产业标准等方面进行了深入探讨,并联合发布了“智算广域网发展倡议”和首批创新成果,充分展示智算IP广域网实用性与广阔的应用前景。



智算场景需求旺盛,

对广域网提出全新挑战



技术的发展离不开需求的驱动。对于智算广域网的创新发展,在会上,中国工程院邬贺铨院士和中国通信标准化协会闻库理事长均建议行业从场景需求和痛点入手,深入探索与创新技术路径和业务模式。


当前智算业务具体有哪些场景需求和痛点?“海量样本入算、存算分离拉远训练、跨数据中心协同训练和业务推理等典型业务需求给传统网络带来了全新的挑战,为提升网效与算效,行业需要通过广域超宽、网络高吞吐、RDMA长距无损、任务式服务和差异化体验保障等关键技术创新推动智算广域网快速发展。”中国信息通信研究院技术与标准研究所互联网中心高巍主任对智算广域网典型业务需求和挑战进行了深入分析。


海量样本入算,指企业需要将海量样本数据实时上传到智算中心。传统广域网主要针对数据量较小的“蚂蚁流”设计负载均衡,而样本入算以GB级的“大象流”为主,流数少但单流数据量大,且具有强突发性,若仍采用传统网络的负载均衡方案,容易引发链路拥塞和负载不均而造成整网吞吐严重下降。同时,样本上传通常需要短时高带宽支持,若企业采用传统固定带宽连接方式,会面临“低带宽等不起、高带宽用不起”的问题。因此,海量样本入算场景要求智算广域网具备弹性高带宽和更有效的均衡调度能力。


存算分离拉远训练,指行业对敏感数据的安全性要求较高,需通过RDMA协议直接将样本数据送到智算服务器的内存中进行训练,使样本数据不落盘存储于第三方算力资源中。然而,RDMA技术对丢包极为敏感,千分之一的丢包会导致计算效率下降50%以上。因此,智算广域网需部署RDMA无损传输技术,以确保样本数据远距离高吞吐无损传输,算效不下降。


跨数据中心协同训练,指利用网络实现多智算中心协同计算,以提升整体算力效率,满足更大规模的算力需求。单体智算中心因受制于机房空间、电力资源等限制,越来越难满足呈指数级增长的算力需求,因此跨数据中心协同训练成为了新趋势。但该场景面临RDMA长距离传输对丢包十分敏感、网络传输时延增加等挑战,要求网络具备广域无损调度、精准拥塞控制等能力,以确保跨智算中心算效不下降。


业务推理场景是利用数据和模型为特定业务需求提供智能分析和决策支持的实际应用场景。推理业务需要网络来实现数据的高效传输和模型结果的实时交付,从而支持智能应用的快速响应。这要求网络具备高带宽、差异化时延保障、高等级的安全隔离等能力,以及具备边缘节点东西向连接能力。



精准匹配供需,

运营商加速智算广域网创新实践



需求的满足离不开技术的创新与突破。当前,中国移动、中国电信和中国联通三大运营商正加快完善算力布局,建起了覆盖全国的多层级算力中心。为了将这些算力资源充分转化为各行业可用的智算服务,精准匹配算力供给与行业需求,三大运营商已聚焦场景需求和痛点,积极推动智算IP广域网技术创新与试点,并已取得初步成果。


面对上海全市300多家企业、40多所高校和研究所以及11个信息化园区的用算诉求,上海电信已试点建设一张端到端400GE IP弹性无损智算广域试验网络,为企业提供海量样本高效入算、存算分离拉远训练等智算服务。


上海电信副总工程师张坚平表示,该网络通过网络高吞吐使能“算得多”,RDMA广域无损保障“算得快”,任务式弹性服务做到“用得起”,全面匹配智算时代下新供需关系带来的网络诉求。其中,400GE弹性算网通过端到端部署400GE大带宽接口技术,将网络传输能力提升至4倍,并通过在企业侧部署智算CPE,可构建100Mbps到100Gbps的IP弹性专线,满足企业通过一条专线同时访问多种异构算力资源池的需求;长距RDMA无损传输技术使网络吞吐率逼近400GE线路带宽,支持广域超百公里RDMA远距离、高吞吐无损传输,算效不下降;结合网络控制器智能调度和秒级调优技术,可实现算力业务传输质量实时可视,保障智算业务传输时延,有效满足推理业务流量毫秒级传输。


浙江联通建设发展部总经理汤滢琪分享到,在中国联通服装制造军团“衣瞳行业模型”训练场景中,面对很多服装厂家有明确的数据敏感性要求,希望数据不出园区,浙江联通通过IP广域无损方案,实现了杭州存、金华训的“数据不落盘”拉远训练。该方案在业界首次实现30TB样本数据跨200公里存算分离拉远训练,计算拉远效率大于97%,充分验证了存算分离拉远训练技术的可行性。


存算分离拉远训练不仅能确保数据外部“不落盘”,还能大幅提升算力资源利用率。重庆移动计划部副总经理刘轻舟在会上介绍,在重庆,某车企的全球数据中心设在重庆,并在多个城市部署智算中心,这种跨区域的布局面临两大痛点和需求:一是传统“先传后训”模式导致算力资源利用率低下,约30%的时间处于闲置状态;二是敏感数据传输涉及安全性需求。为此,重庆移动联合华为创新提出“存算拉远”解决方案,利用广域RDMA无损网络技术将敏感数据直接传输到算力卡内存,以“边传边训”的方式不仅确保了数据训练后即清理,而且极大降低了算卡闲置率和训练耗时,将传输效率提升超过90%,从而有效解决了大模型训练中的算效与安全性问题,为智算IP广域网赋能智能网联汽车产业升级树立了标杆。


此外,在算间协同场景,面对单体智算中心难以满足超过10万卡的建设需求,北京电信正在探索通过智算广域网整合京津冀三地算力中心资源,创新多算力中心协同的多点共算模式,以支持超大模型训练。北京电信云网发展部规划总监姚凌分享到,北京电信通过配置新一代智算路由器,采用新型流级拥塞控制技术,实现了网络拥塞或故障快速精准识别,确保了拥塞不扩散到全网;并通过采用路由器广域无损调度和负载均衡技术,保障了业务吞吐率达到95%以上,实现了跨100公里长距离算效仅下降1%。这些实践成果为实现京津冀算力资源一体化协同提供了可能性。



产业协作,

智算广域网发展步入快车道



有明确的需求牵引,也有技术创新支撑,更有显著的实践效果,无疑彰显了智算IP广域网的可行性与广阔前景。然而,要跟上AI应用飞速发展的步伐,加速智算IP广域网规模化落地,前方仍面临不少挑战,这迫切需要产业界凝聚共识、携手合作,持续推动技术创新和标准制定,并积极探索新模式、新场景。


为此,在会上,中国信通院、中国通信标准化协会、中国电信、中国移动、中国联通和华为联合发起了“凝心聚力,携手并进,共同绘制智算IP广域网产业宏伟蓝图”的倡议,旨在聚力产业各方资源,更好推进智算IP广域网技术创新和产业发展。


近年来,随着算力需求呈指数级增长,如何通过算网协同保障智算高效供给,最大化发挥算力价值,已成为全社会关注的重点。国家相关部门从顶层设计角度已紧密发布一系列政策。2023年10月,工信部等六个部门联合发布《算力基础设施高质量发展行动计划》,提出通过优化算力高效运载质量、强化算力接入网络能力、提升枢纽网络传输效率、探索算力协调调度机制四个方面提升算力高效运载能力。12月,国家发展改革委、国家数据局等部门联合印发《关于深入实施“东数西算”工程 加快构建全国一体化算力网的实施意见》,明确提出算力网是支撑数字经济高质量发展的关键基础设施,可通过网络连接多源异构、海量泛在算力,实现资源高效调度、设施绿色低碳、算力灵活供给、服务智能随需。


在政策和市场双向驱动下,运营商正加速布局一体化算力网。比如,中国联通推出了全新的算力智联网AINet,依托“网络+平台”两大基础底座,实现高通量、高性能、高智能的“三高”核心能力,提供高效入算、灵活联算、数据快递、数据高铁、算网一体等领先的算网产品与服务,为各行各业智能升级和智算业务发展铺平广阔道路。中国移动已形成“四纵一横”一体化发展的算力网络架构,系统性构建了“九州”算力互联网,围绕多元承载、敏捷感知、超宽联接、稳定可靠、AI智能、弹性服务这八大核心能力打造“MATRIXES”技术体系。


智算广域网作为支撑智算数据高效流通和智算资源高效调度的新型网络底座,是算网一体化布局的关键一环。从顶层设计领航,到运营商整体布局,都将为智算IP广域网的快速高质量发展再添动力。因此,从本次大会可以看出,在政策引导、市场需求、技术创新、产业协作等多重因素的推动下,智算IP广域网创新发展正步入快车道。


网优雇佣军投稿邮箱:wywd11@126.com
长按二维码关注
 通信路上,一起走!

网优雇佣军 通信、科技、未来!通信路上,一起走!
评论
  • 前言基于 ESP32 设计开发的智能流动环境检测车,旨在克服传统固定监测方式的不足。该车能够在不同环境场景下灵活移动,深入到各个角落进行环境数据采集,大大拓展了环境监测的范围和灵活性。通过集成多种先进的传感器,如 BMP280 用于精确采集温湿度和气压数据,ESP32cam 摄像头能够捕捉直观的图像信息,再结合网络 API 获取的天气预报信息,实现了多源数据的综合采集与分析,为全面、准确地了解环境状况提供了丰富的数据支持。展示整车展示APP展示云端展示功能1.除草(12v割草机)2.环境检测3.
    小恶魔owo 2025-02-13 11:43 256浏览
  • ​随着GNSS技术的不断进步,各类设备广泛采用该技术实现高精度定位,并推动了其在众多领域的广泛应用。对于关键行业如汽车制造和基础设施,设备的可用性和可靠性被视为基本准则,GNSS作为提供“绝对位置”信息的关键传感器,其稳定性和可靠性尤为关键。为此,中国已为汽车行业制定了详细的GNSS定位规范和行业标准。GNSS模拟器解决方案支持:BD 420005—2015 《北斗/全球卫星导航系统(GNSS)导航单元性能要求及测试方法》BD 420023—2019 《北斗/全球卫星导航系统(GNSS) RTK
    德思特测试测量 2025-02-13 15:35 135浏览
  • 文:杜杰编辑:孙聪颖如果说2024年是手机的AI元年,三星应该是第一个站出来表示同意的,毕竟在ChatGPT热热闹闹的同时,三星S24是第一批“吃螃蟹”的。在经过了一年的AI试水之后,今年开年三星就率先在海外发布了进一步重构AI的S25,而今天该系列的国行版正式发布,大家最感兴趣的就是这部搭载原生AI的S25在国内的表现到底如何。无感的AI与去年S24小打小闹不同,今年S25在AI方面堪称是全面化、本地化,而从软硬件整合方面来看,显然AI已经成为S25的灵魂。经过这两年各路AI应用的训练,大家或
    华尔街科技眼 2025-02-13 19:30 127浏览
  • 前言最近正好想要做一个定位器,正好可以用嘉立创的STM32F407的板子,还要淘晶驰的串口屏配合NEO-6M做一个GPS实时定位感觉设计到的知识点还是挺全面的,包括串口通信,还要定时器硬件NEO-6M采用串口通信,默认9600(可以通过软件改115200)搭配有源天线,在室外定位很好用淘晶驰很火的串口屏,通过自带的软件可以随便画界面,还是很方便的可通过 USART HMI 软件进行全界面可视化编辑、支持 “C 语言代码” 和 “0 代码” 双模式编程,广泛应用于工业控制、智能家居等领域的智能串口
    小恶魔owo 2025-02-13 23:05 97浏览
  • 文/Leon编辑/cc孙聪颖‍DeepSeek的持续火爆,正在向各个领域蔓延,包括智能终端、汽车智驾、制造业、金融和教育等。其中,DeepSeek在手机领域的应用最为引人关注。《华尔街科技眼》了解到,国产品牌努比亚则将深度整合DeepSeek,采用了系统级内嵌方式,用户在手机亮屏时可以直接与集成DeepSeek大模型的智能体对话,无需跳转应用。此前,华为小艺助手也接入了DeepSeek,但更接近于插件的方式,而非系统级的调用。DeepSeek大模型的优势在于用较低的训练成本实现高性能推理,并且开
    华尔街科技眼 2025-02-12 17:12 213浏览
  • 在上一期的内容中,我们精心为大家整理了一份关于晶台光耦在各类通信(驱动)电路中应用的选型指南。考虑到不同通信速率下的应用需求存在显著差异,如何准确选择适合的芯片并在同时合理控制成本,成为了设计过程中至关重要的一环。因此,从本期开始,我们将通过一系列详尽的应用实例及其原理示意图,为设计者们提供切实可行且具有高度参考价值的解决方案。晶台光耦的性能优势晶台光耦作为一种高性能的电子组件,在单片机(MCU)与可编程逻辑控制器(PLC)的通信电路中应用广泛。其晶体管输出型光耦系列,能满足多种中高速通信需求,
    晶台光耦 2025-02-13 10:34 143浏览
  • 今日,长虹官宣旗下AI TV正式接入DeepSeek,并支持在“深度思考(满血R1)”和“快速响应”两个版本间自由切换,这意味着行业首个能深度思考的AI TV智能体已全面上线。据长虹相关负责人表示,目前,长虹电视用户终端的升级工作已全部结束,所有搭载了沧海智能体的长虹AI TV均已正式接入DeepSeek。通过深度融合DeepSeek的模型能力,持续升级用户的智能交互体验,真正做到让用户一次购买,就能享受产品的持续进化,让电视始终处于不断发展、永无最终形态的进化进程中。据了解,用户无需复杂的操作
    华尔街科技眼 2025-02-13 12:00 181浏览
  • 一、前言随着自动驾驶技术的快速发展,庞大的测试数据和复杂的场景需求为性能与安全评估带来了巨大挑战。如何高效管理海量数据、挖掘关键场景,并满足以Euro NCAP(European New Car Assessment Programme,欧洲新车安全评鉴协会)为代表的严格评估标准,已成为行业亟待解决的核心问题。这不仅关乎技术研发的效率与精度,更是智能驾驶车辆进入市场、提升竞争力的关键前提。本文我们将围绕如何应对海量数据所带来的挑战进行探讨,分享提高场景测试与性能安全评估的见解。二、 场
    康谋 2025-02-13 10:44 124浏览
  • 案例概况ABB能源自动化公司通过宏集Cogent DataHub软件将电厂设施的数据实时传输到公司办公室,实现了OPC隧道/镜像解决方案,在电厂和公司网络之间建立了一个安全、可靠的连接,确保数据传输的高度安全,减少入侵风险。(一)应用背景1.确保电厂与公司办公室之间的安全数据传输ABB能源自动化公司为发电厂提供软件和控制系统,确保发电厂设备在最佳速度和效率下运行。在近期的项目中,ABB发现若能直接在公司办公室监控电厂的运行情况,将大大提高工作效率。于是ABB项目工程师Michele开始寻找一种可
    宏集科技 2025-02-13 16:38 115浏览
  • 我跟EET的相识,起源于一次国际电子工程会议,当时我是为了去听国际行业趋势和新技术产品,以公司海外英文名报名参加的,在非常不经意间,我在会场的群里发表了少许观点,没想到当场就有很多人加我微信,微信加得手软,有位VIP席位上的美国有排名的科学家(她当时在上海中科院任职)约了与我共进午餐,隔年这位美国科学家还带来了国际合作,我们公司与亚洲最大的技术顾问公司签了战略合作及一些实际合作项目。所以,我挺早就在EET面包板上了,只不过那些年我所在的公司的国际业务繁忙,还要忙着参加美国分公司的筹备,于是下班后
    牛言喵语 2025-02-14 02:15 79浏览
  • 文心一言免费对于创业来说是一个很大的机遇,加油!虽然是一个很大的挑战,但是好处还是很大的。文心一言的免费开放为创业者提供了一个低成本甚至零成本使用先进人工智能技术的机会。在以往,创业者若想在项目中融入AI技术,往往需要支付高昂的研发或授权费用。而现在,他们可以直接利用文心一言的强大功能,如语言理解、生成能力、深度搜索等,来构建自己的产品或服务,从而显著降低创业成本。文心一言的全面免费开放为创业者提供了广阔的创新空间。创业者可以基于文心一言开发出各种创新的应用和服务,满足市场的多样化需求。例如,利
    curton 2025-02-14 13:37 50浏览
  • 文心一言准备免费,说实话,这个是好事情,但是他也会产生非常大的影响,总体来说,对技术的发展还是起到积极的作用。文心新苑为什么要免费呢?无非就是市场的原因,绝对不是文心一言不想利用这个AI赚钱。我分析下原因:1、市场竞争:在人工智能技术高速发展的背景下,各类AI产品层出不穷,市场竞争日益激烈。尤其是DEEPSEEK的出现,真是的非常重大的一个事件,作为同类产品,文心一言非常无奈的被迫的选择全面免费策略,旨在迅速提高用户量,争夺市场份额。通过免费使用,文心一言能够吸引更多用户,形成网络效应,进而提升
    curton 2025-02-14 10:30 54浏览
  • 在电路板Layout设计时,有时候会遇到高速差分信号对间或者对内需要交叉走线的情况,这不仅会导致Layout困难,而且交叉走线导致的via增加和绕线也会影响高速信号的信号质量。鉴于这个问题,一些高速差分信号在标准中就定义了其可以对内或者对间交叉连接,而不影响数据对接。现根据标准定义,将各个高速差分信号是否支持对间或对内翻转列出来,供设计参考。注:1. 列出的高速差分信号不全,后续陆续补充;2. 具体使用时,还需要咨询芯片供应商是否支持。USB2.0不支持对间和对内翻转USB3.0支持对内极性翻转
    durid 2025-02-14 08:23 79浏览
我要评论
0
点击右上角,分享到朋友圈 我知道啦
请使用浏览器分享功能 我知道啦