社区首页
博客
论坛
下载
文库
评测
芯语
研讨会
商城
EE直播间
芯视频
E聘
更多
社区
论坛
博客
下载
评测中心
面包芯语
问答
E币商城
社区活动
资讯
电子工程专辑
国际电子商情
电子技术设计
CEO专栏
eeTV
EE|Times全球联播
资源
EE直播间
在线研讨会
视频
白皮书
小测验
供应商资源
ASPENCORE Studio
活动
2025 中国国际低空经济产业创新发展大会
2025 第六届国际 AIoT 生态发展大会
2025 全球 MCU 生态发展大会
2025 第六届中国国际汽车电子高峰论坛
IIC Shenzhen 2025
2025国际电子商情分销与供应链行业年会
IIC Shanghai 2025
更多活动预告
杂志与服务
免费订阅杂志
电子工程专辑电子杂志
电子技术设计电子杂志
国际电子商情电子杂志
帖子
帖子
博文
电子工程专辑
电子技术设计
国际电子商情
资料
白皮书
研讨会
芯语
文库
×
提示!
您尚未开通专栏,立即申请专栏入驻
帖子
博文
用户
芯语
首页
专栏作家
CEO专栏
论坛
博客
E币商城
资讯
电子工程专辑
国际电子商情
电子技术设计
CUDA
LM Studio 借助 NVIDIA GeForce RTX GPU 和 CUDA 12.8 加速 LLM 性能
随着 AI 使用场景不断扩展(从文档摘要到定制化软件代理),开发者和技术爱好者正在寻求以更 快、更灵活的方式来运行大语言模型(LLM)。在配备 NVIDIA GeForce RTX GPU 的 PC 上本地运行模型,可实现高性能推理、增强型数据隐私保护,以及对 AI 部署与集成的完全控制。LM Studio 等工具(可免费试用)使这一切成为可能,为用户提供了在自有硬件上探索和构建 LLM 的便捷途
英伟达NVIDIA中国
2025-06-04
160浏览
深度丨CUDA作为英伟达底层算法平台的核心意义
·聚焦:人工智能、芯片等行业欢迎各位客官关注、转发前言:CUDA最初是为科学计算领域设计的,英伟达致力于在消费级游戏显卡之外拓展新的市场机遇。借助CUDA的发展,英伟达成功地在数据中心等高性能计算领域找到了第二个增长点。作者 | 方文三图片来源 | 网 络 让英伟达确立主导地位的并非芯片本身GPU与CPU在设计上存在本质差异。CPU作为处理复杂任务的全能型处理器,一次仅能处理有限数量的任务;而G
AI芯天下
2025-05-07
252浏览
平替CUDA!摩尔线程发布MUSA4、配套性能分析工具
摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。借助MUSA SDK,开发者能够轻松地利
硬件世界
2025-04-20
429浏览
平替CUDA!摩尔线程MUSA越来越强大了
在发布重量级的MUSA SDK 4.0.1开发包之后,摩尔线程又同步带来了配套性能分析工具Moore Perf System的最新版本v1.3.0。Moore Perf System是摩尔线程SDK中的基础组件,用于辅助开发者进行开发调试,可以方便、快速、准确地定位到系统级别的性能瓶颈,进而进行针对性分析和优化,使程序性能满足需求。如果需要进一步分析计算类应用程序,请使用Moore Perf Co
文Q聊硬件
2025-04-20
163浏览
全球AI系统计算平台对比:CUDA、CANN、Neuware和ROCm
本文来自“国内外AI芯片平台分析:独立自主的AI系统级计算平台是国产AI芯片构建生态壁垒的关键”,影响AI芯片计算能力的因素除了硬件层面的芯片制程、内存、带宽等,还包括调用各硬件资源的系统级软件计算平台。AI芯片厂商开发的系统计算平台不仅仅有效提升各家AI芯片产品的算力利用率,还为各类AI应用开发提供了丰富的函数库,提供开发者简便易用的开发环境。本文所有资料都已上传至“智能计算芯知识”星球。如“《
智能计算芯世界
2025-04-15
2093浏览
取代CUDA!摩尔线程重磅发布MUSA4:支持国产x86
摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。借助MUSA SDK,开发者能够轻松地利
硬件世界
2025-04-13
1175浏览
取代CUDA!摩尔线程MUSA重磅升级:支持国产x86
摩尔线程MUSA SDK是一套完整的GPU并行计算开发环境,专为利用摩尔线程GPU加速程序而设计,也是NVIDIA CUDA开发环境的国产替代之一。MUSA SDK包含运行时、C/C++编译器、GPU加速计算库、迁移和优化工具等组成的MUSAToolkits工具包,以及计算库、神经网络加速库、通信库等一系列开发工具,开发者可以一站式安装MUSA应用开发环境。借助MUSA SDK,开发者能够轻松地利
文Q聊硬件
2025-04-13
789浏览
14.88亿元!国产GPU连续拿下AI大单还要啥CUDA
DeepSeek的火爆,给整个AI行业带来了一股新风,大模型开源,算力需求低,从打破了NVIDIA CUDA长期以来的生态垄断,大大推动了国产GPU AI芯片、系统的发展,比如沐曦就连续拿下了两份采购大单,总额达14.88亿元。2月7日,超讯通信发布公告称,与中特新联科技签订《采购合同》《采购订单》,含税总金额约8.5亿元。2月25日,超讯通信再次发布公告称,与深圳星航智算科技签订《智算集成服务采
硬件世界
2025-02-26
408浏览
14.88亿元!国产GPU连续拿下AI大单还要啥CUDA
DeepSeek的火爆,给整个AI行业带来了一股新风,大模型开源,算力需求低,从打破了NVIDIA CUDA长期以来的生态垄断,大大推动了国产GPU AI芯片、系统的发展,比如沐曦就连续拿下了两份采购大单,总额达14.88亿元。2月7日,超讯通信发布公告称,与中特新联科技签订《采购合同》《采购订单》,含税总金额约8.5亿元。2月25日,超讯通信再次发布公告称,与深圳星航智算科技签订《智算集成服务采
文Q聊硬件
2025-02-26
415浏览
绕开CUDA!DeepSeek准备适配国产GPU
DeepSeek在研发大模型时绕过了英伟达的护城河CUDA,这让美国不少巨头们感到了很大的威胁,而现在这件事才刚刚开始。DeepSeek真的绕过了CUDA,那这件事意味着什么?对此,北京航空航天大学黄雷副教授接受采访时表示,绕过CUDA,可以直接根据GPU的驱动函数做一些新的开发,从而实现更加细粒度的操作。譬如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX(Parallel Th
文Q聊硬件
2025-02-02
2578浏览
DeepSeek团队神操作:用“汇编”取代CUDA让性能狂飙!
在人工智能领域,DeepSeek 引发了巨大轰动。它借助由 2048 块英伟达 H800 GPU 组成的集群,仅用约两个月时间就完成了拥有 6710 亿参数的混合专家(MoE)语言模型训练,效率比 Meta 等人工智能行业领军企业高出 10 倍。据 @Jukanlosreve 援引韩国未来资产证券(Mirae Asset Securities Korea)的分析,这一突破得益于大量细粒度的优化措施
EETOP
2025-01-29
1388浏览
为什么英伟达如此强大?这就是CUDA的魔力
在高性能计算、游戏和人工智能处理方面,英伟达无疑是领先的竞争者,远远超过了AMD和英特尔,夺得了性能桂冠。那么,是什么使英伟达的芯片与其他厂商的芯片不同,其他厂商至今未能复制其成功呢?这个成功的关键在于并行处理——通过同时执行多个数据处理操作来提高计算速度的过程。与按顺序处理任务的多个内核的CPU(中央处理单元)不同,GPU(图形处理单元)可以利用数千个核心同时处理多个任务。这种架构优势为处理当今
EETOP
2024-11-09
466浏览
AMD将推出统一GPU架构,挑战英伟达CUDA“护城河”!
在德国柏林举行的IFA 2024上,AMD计算和图形业务集团高级副总裁兼总经理Jack Huynh宣布,公司将把以消费者为中心的RDNA和以数据中心为中心CDNA架构统一为UDNA架构,这将为公司更有效地应对英伟达根深蒂固CUDA生态系统奠定基础。当AMD在2019年放弃其GCN微架构时,该公司决定将其新的图形微架构分为两种不同的设计,其中RDNA旨在为消费市场的游戏图形产品提供支持,而CDNA架
飙叔科技洞察
2024-09-10
763浏览
PyTorch官宣:告别CUDA,GPU推理迎来Triton加速新时代
点击上方↑↑↑“OpenCV学堂”关注我来源:公众号 新智元 授权【导读】用英伟达的GPU,但可以不用CUDA?PyTorch官宣,借助OpenAI开发的Triton语言编写内核来加速LLM推理,可以实现和CUDA类似甚至更佳的性能。试问,有多少机器学习小白曾被深度学习框架和CUDA的兼容问题所困扰?又有多少开发者曾因为频频闪烁的警报「CUDA版本必须与安装的PyTorch匹配!!!」而企图炸键盘
OpenCV学堂
2024-09-09
832浏览
NVIDIA招聘|欢迎加入NIM和CUDA团队,与我们共同打造AI未来的基础
01企业想要部署生成式 AI 模型,可以使用 NVIDIA 的哪一个推理微服务?点击空白处查看答案NIM02NVIDIA 在 2006 年推出的向业界开放 GPU 能力的服务是什么?点击空白处查看答案CUDA上面两个问题的答案是否与您心中所想一致呢?现在多个 CUDA 和 NIM 团队的岗位在等待您的投递!热招岗位(上海)JR1985241 Senior CUDA Test Development
英伟达NVIDIA中国
2024-08-20
615浏览
NVIDIA封杀转译兼容CUDA:AMD被迫删除代码
NVIDIA CUDA生态建设得非常繁荣,也成为其极具竞争力的护城河,自然不会允许别人随便染指,今年3月发布的CUDA 11.6版本就明确规定,不允许在非NVIDIA平台上逆向工程、反编译或反汇编CUDA SDK生成的任何结果。首当其冲被影响的就是ZLUDA项目,出自大神级开发者Andrzej Janik,只需用ZLUDA库替代CUDA即可,不需要任何转译,也不需要调整代码。ZLUDA最初通过In
硬件世界
2024-08-09
629浏览
摆脱英伟达CUDA,各家厂商积极寻求解套方法
面对当前人工智能市场的快速发展,包括AMD、英特尔等企业对此也正在积极寻求对人工智能软件公司收购、投资和合作,以进一步能与能与英伟达(NVIDIA)的CUDA竞争。英伟达全球数据中心AI芯片市占率超过90%,AI热潮使英伟达H100 AI芯片尽管价格不菲,仍供不应求。接下来 Blackwell 核心架构 GB200 GPU 仍会延续趋势。CUDA 运算架构软件被认为是英伟达拿下主导地位的主要贡献者
EETOP
2024-07-25
740浏览
打破垄断!CUDA软件可以在AMD显卡上无缝运行
英国新创公司Spectral Compute近日推出了名为“SCALE”的GPGPU编程工具包,成功实现了NVIDIA CUDA软件在AMD GPU上的无缝运行,有望打破NVIDIA在GPU计算领域的垄断地位。CUDA是NVIDIA 2007年推出的并行计算平台和编程模型,广泛应用于高性能计算和深度学习等领域。由于其与NVIDIA GPU硬件的深度绑定,CUDA生态的丰富性使得其他厂商难以竞争。S
硬件世界
2024-07-19
1702浏览
英伟达危险!CUDA护城河或被打破!
英国初创公司Spectral Compute推出了一款名为“SCALE”的GPGPU工具链,使英伟达(NVIDIA)的CUDA可以无缝运行在AMD的GPU上。据wccftech报道,英伟达的CUDA现在可以直接在AMD等非英伟达的GPU上运行,无需代码移植,这要归功于SCALE。看起来业界已经能够打破英伟达的软件栈主导地位,他们现在正在寻找通过各种手段移除其“排他性”地位的方法。之前我们看到ZLU
EETOP
2024-07-18
610浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-06-03
628浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-05-17
644浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-05-16
498浏览
字节美国专家CUDA内核编程训练营
试听群:感兴趣可以加文末试听群,免费试听第一节课。课程报名咨询请联系客服小月(WX:linuxer2016)训练营主题: CUDA内核编程训练营时长: 12 小时训练营描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍
Linux阅码场
2024-05-15
593浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-04-22
682浏览
CUDA编程训练营
培训主题: CUDA编程培训时长: 12 小时课程描述本课程是为对cuda编程感兴趣的软件工程师设计的。本课程第一部分主要介绍CUDA编程相关的知识。首先本课程将简单介绍GPU编程的基础概念,包括GPU硬件,GPU编程模型(SIMT),以及简单的CUDA程序实例。本课程将进一步介绍GPU程序运行时,包括CUDA初始化,CUDA程序中不同内存的使用,CUDA程序同步机制,多GPU间的通信和进程间的通
Linux阅码场
2024-04-16
681浏览
正在努力加载更多...
广告
今日
新闻
1
英飞凌“在中国、为中国”战略剖析:入华30年,中国市场对英飞凌意味着什么?
2
传苹果2026年推出折叠屏iPhone,屏幕由三星显示供应
3
超低成本的PWM控制开关电压调节器设计
4
Lattice SensAI:引领从“云端集权”到“边缘自治”的智能革命
5
芯片圈的“Labubu”:DDR4报价飙升53%,“有钱没货”
6
SpaceX星舰S36火箭静态点火测试爆炸,马斯克称“比烟花寂寞”
7
国防科技大学成功研发蚊子大小仿生机器人
8
国家统计局:5月份,规模以上高技术制造业增加值同比增长8.6%
热门
文章排行
1
VS Code 封杀 Cursor?微软禁止其使用官方 C/C++/C# 扩展
C语言与CPP编程
2567
2
深度解析2025年最热门的AI应用和发展趋势
SSDFans
940
3
董明珠卸任,格力芯片公司换帅
未来产链
838
4
分享一个超级精简好用的画图工具DrawIO
嵌入式Lee
781
5
曝某车企IPO疑告吹,员工内购股票暴雷,称“贷款上班”!
谈思汽车
759
6
华为、中芯国际进台湾实体名单,外交部回应!
中国半导体论坛
725
7
曝上海一芯片团队突然裁员:当天走人,赔偿N+3!
未来产链
603
8
2025年全球AI产业发展全景
智能计算芯世界
568
9
彭博社:台当局将华为、中芯国际列入黑名单!
EETOP
543
10
RTX 5090首次跌破2万元!中国玩家悲催
硬件世界
502
11
第三款国产DDR5内存诞生!32GB 6000CL36只要559元
硬件世界
482
12
Zen6未发Zen7消息已流出:32核64线程、超大V-Cache缓存!
硬件世界
448
13
外交部回应华为中芯国际进台湾实体名单
科创板日报
408
14
大模型推理PD分离技术:核心原理、技术优势、挑战与未来展望
智能计算芯世界
407
15
大唐移动起诉小米!
EETOP
398
16
填补空白!国内首条碳基集成电路生产线正式投运
DT半导体材料
395
17
突发!台当局将华为、中芯国际列入黑名单
半导体前沿
387
18
钴出口禁令再延2个月,锂电产业链震荡!
锂电联盟会长
386
19
离职员工发万字长文谈阿里,深藏功与名
李肖遥
385
20
玩转YOLOv8~YOLO11全系模型从训练到推理就靠它了
OpenCV学堂
381
21
价格倒挂!DDR4内存现货价一天大涨近8%:比DDR5还贵
硬件世界
371
22
重磅!哪吒汽车宣布复工、更换CEO
智能汽车电子与软件
369
23
小米16全球首发!高通骁龙8 Elite 2跑分曝光:多核成绩突破1.1万
快科技
358
24
5月人形机器人领域融资超10亿!
移动机器人产业联盟
353
25
突发!美光官方确认DDR4将停产,市场面临大缺货
芯通社
338
26
从罗马仕召回近50万台充电宝聊聊硬件电路设计容易被忽视的重中之重:可靠性设计
硬件那点事儿
332
27
2025年第一季度,中国大陆PC出货量逆势增长12%,联想夺冠PC市场,华为稳居平板第一
Canalys
328
28
2025具身智能行业深度:技术路线、市场机遇、产业链及相关公司深度梳理
智能汽车设计
327
29
第一批升级iOS 26的用户遇到Bug:手机黑屏且无法充电
快科技
324
30
硬件与软件的"甩锅"之争:当新程序遇上老硬件
PCB和原理图设计与共享
312
广告
最新
评论
更多>>
学习了...
12qwwe
评论文章
2025-06-13
气密性检测:推动新能源汽车升级的隐形力量|贤日测控专访
虽然AI有很多积极的应用场景,但也存在很多被滥用的可能
Rain管理
评论文章
2025-06-04
“AI教父”辛顿最新专访:没有什么人类的能力是AI不能复制的
资料
文库
帖子
博文
1
300个超多动图、小视频,帮你理清电子电路基础知识!(1)
2
300个超多动图、小视频,帮你理清电子电路基础知识!(2)
3
硬件设计指南:从器件认知到手机基带设计
4
超圖解 ESP32 深度實作
5
电子电路分析与设计:模拟电子技术(第三版) (Donald A. Neamen)
6
电子电路分析与设计:半导体器件及其基本应用(第三版) (Donald A. Neamen)
7
新型开关电源典型电路设计与应用(第2版).pdf (赵同贺)
8
Altium Designer 22(中文版)电子设计速成实战宝典
9
STM32CubeMX用户手册
10
干货经典!反激开关电源变换器设计笔记.pdf
1
立创商城中找到的元件封装,怎么把3D模型关联上这个封装...
2
【资料下载-第一季】开关电源、KiCad电路、电阻、LLC...
3
光耦817引脚图及参数详解:电子设计中的“隔离神器”
4
什么时候社区商城上个机械键盘
5
请教关于本站点eet-china.com与手机端 芯视频 APP的关系。
6
E币兑换迟迟未兑现
7
晶振起振靠的是什么呢
8
「你的愿望清单,我们来买单!」社区E币兑换计划启动——留言想要的礼品,下一个惊喜就是它!
1
智能门铃影像设计难题揭密:夜间辨识、影像优化
2
应用案例 | 多协议·高兼容·低成本——PLC多主站解决方案全解
3
让温度“说话”,数字温度传感器如何智能感知温度?
4
Python 图像处理实战:打造批量加水印工具(支持透明度与位置控制)
5
冠显Micro-OLED CVBS显示驱动方案
6
从工业到光储充,数字隔离器如何升级替换光耦隔离器?
7
RDMA简介5之RoCE v2队列
8
康谋分享| 揭秘C-NCAP :合成数据如何助力攻克全球安全合规难关?
1
电机控制采用有感和无感两种检测方式
2
4~20mA恒流源电路分析及仿真
3
微电子之芯片微纳制造技术
4
入门到精通—电阻颜色代码快速计算值
5
芯片-封装电源完整性协调设计
6
28例电气自动控制电路图,超实用电路图集合!
7
把电源设计好,硬件成功一半
8
STM32的I2C从机接收
9
如何快速评估一款MCU是否能跑系统RTOS?
10
电工常用电流的计算公式,一张图就搞定,超便捷!
在线研讨会
Mercury基于展频技术的医疗时钟EMI抑制方案
AI 巨型芯片,性能越强,测试越难,如何破局?
利用先进精密仪器仪表解决方案,优化研发并加快产品上市
ST 在大功率热管理系统中的电机控制系统方案(AI 数据中心/暖通空调/电池储能系统/变频制冷)
EE直播间
常用电测仪表的校准展示
直播时间:06月20日 10:00
Keysight World Tech Day 线上直播-AI 驱动的超高速传输测试分论坛
直播时间:06月26日 13:30
材料介电常数的精确表征和测试
直播时间:07月03日 10:00
E聘热招职位
本网页已闲置超过10分钟,按键盘任意键或点击空白处,即可回到网页
X
最新资讯
英飞凌“在中国、为中国”战略剖析:入华30年,中国市场对英飞凌意味着什么?
传苹果2026年推出折叠屏iPhone,屏幕由三星显示供应
超低成本的PWM控制开关电压调节器设计
Lattice SensAI:引领从“云端集权”到“边缘自治”的智能革命
芯片圈的“Labubu”:DDR4报价飙升53%,“有钱没货”