
摩尔线程发布了 Torch-MUSA v2.0.0 版本,这是面向 PyTorch 深度学习框架的 MUSA 扩展库的重要升级。新版本基于 MUSA Compute Capability 3.1 计算架构,支持原生 FP8 数据类型和 PyTorch 2.5.0,并通过多项性能优化,进一步提升了 AI 模型和大规模数据处理的支持能力。
作为本次升级的核心亮点,Torch-MUSA v2.0.0 在国产 GPU 上实现了对 FP8 数据类型的完整支持。FP8 是当前 AI 计算的一种前沿低精度格式,在支持原生 FP8 的 GPU 上,大语言模型(LLM)训练采用 FP8 混合精度可大幅提高 GPU 算力,显著降低显存占用。
摩尔线程基于新一代 MUSA Compute Capability 3.1 计算架构的全功能 GPU 原生支持 FP8 计算,这为 Torch-MUSA v2.0.0 实现 FP8 矩阵乘法和分布式通信优化提供了基础。依托这一底层架构优势,Torch-MUSA v2.0.0 能够充分发挥 FP8 的计算效能,提升大语言模型训练和推理的效率。
此外,Torch-MUSA v2.0.0 在 MUSA 计算平台引入多项创新功能,进一步提升深度学习任务的执行效率。新增虚拟内存管理支持、新增 MUSA Graph 支持以及 torch.compile 增加 Triton 后端支持等,使开发者能够在基于 MUSA Compute Capability 3.1 计算架构的全功能 GPU 上,无缝运行新版本的 PyTorch。
值得一提的是,Torch-MUSA v2.0.0 还完全开源,开发者可通过访问 GitHub 获取源代码。这表明摩尔线程对开放和合作的态度,鼓励开发者社区共同推动 GPU 计算技术的发展。
支持原生 FP8 和 PyTorch 2.5.0,摩尔线程开源发布 Torch-MUSA v2.0.0
IT之家
"技嘉首发AMD线程撕裂者工作站,支持CXL内存扩展"
在2025年台北国际电脑展上,技嘉展示了一套引人注目的AI系统。该系统采用了AMD锐龙Threadripper PRO 7965WX处理器和技嘉TRX50 AI TOP主板,并配备了一张PCIe形式的技嘉AI TOP CXL R5X4内存扩...
IT之家|2025-05-28 08:36
国产显卡大突破!摩尔线程新驱动让《生化危机4》性能暴增2倍
摩尔线程近日发布了全新显卡驱动程序v300.110版本,为游戏玩家和专业用户带来了显著的性能提升。新驱动在3DMark基准测试工具Steel Nomad中表现出色,测试成绩较之前提升了35%,充分释放了MTT S80显卡的潜力。在游戏优化方...
IT之家|2025-05-25 21:10
"海光重磅发布C86-5G服务器芯片:128核512线程支持DDR5内存"
IT之家 5 月 11 日消息,国产 X86 处理器厂商中科海光现已正式披露了其最新旗舰级服务器处理器 C86-5G 的产品路线图。据介绍,相应处理器配备 128 个物理核心,并支持同步多线程(SMT)技术,与常见的双向 SMT 不同,C8...
IT之家|2025-05-13 20:20
腾讯混元视频生成工具 HunyuanCustom 宣布开源,融合文本、图像、音频、视频等多模态输入生视频的能力
IT之家 5 月 9 日消息,腾讯混元宣布今天正式推出并开源全新的多模态定制化视频生成工具 Hunyuan Custom。该模型基于混元视频生成大模型(Hunyuan Video)打造,主体一致性效果超过现有的开源方案。据介绍,Hunyua...
IT之家|2025-05-12 10:36
李想回应开源理想星环OS:就是为了感谢DeepSeek
快科技5月7日消息,理想汽车今日晚间举办理想AI Talk,李想在直播中称,很敬佩梁文锋,DeepSeek的出现对他们加速做VLA(视觉语言行动模型)是巨大的帮助。理想原本计划于2025年9月完成的VLA语言模型部分,因直接采用DeepSe...
快科技|2025-05-10 10:15
DeepSeek致谢腾讯技术团队,DeepEP开源通信框架性能显著提升
IT之家5月7日消息,腾讯技术团队针对DeepSeek开源的DeepEP通信框架进行深度优化,使其在多种网络环境下均实现显著性能提升。经测试,优化后的通信框架性能在 RoCE网络环境提升100%,IB 网络环境提升 30%,为企业开展AI大...
IT之家|2025-05-10 07:35
英伟达 Parakeet TDT 0.6B 成开源 ASR 新王:1秒转录60分钟音频
IT之家 5 月 7 日消息,科技媒体 marktechpost 昨日(5 月 6 日)发布博文,报道称英伟达最新推出 Parakeet TDT 0.6B,是一款先进的自动语音识别(ASR)模型,已在 Hugging Face 平台上完全开...
IT之家|2025-05-08 22:30
千问3登顶全球权威开源模型榜
5月6日消息,国际权威大模型测评榜LiveBench公布了最新一期排名,阿里巴巴开源的新一代通义千问模型Qwen3(简称千问3)斩获全球开源模型冠军,并在指令遵循(Instruction Following)这一关键能力上超越o3 High...
雷峰网|2025-05-07 17:40
PHP 开源项目 ADOdb 曝 CVSS 满分 SQL 注入漏洞,官方督促用户升级至 5.22.9 版本解决
IT之家 5 月 5 日消息,PHP 开源项目 ADOdb 于上周发布了 v5.22.9 版本,该版本主要修复一项 CVSS 风险评分高达 10 分(满分)的严重安全漏洞 CVE-2025-46337,官方透露该漏洞“可能影响全球 280...
IT之家|2025-05-06 18:25
本信息来自互联网,不代表导读网立场,如若转载,请注明出处:http://www.frfey.com/news/57548/