摩尔线程发布 Torch-MUSA v2.7.0


摩尔线程发布 torch-musa v2.7.0

近日,摩尔线程正式推出 PyTorch 深度学习框架的 MUSA 扩展库新版本——Torch-MUSA v2.7.0。此次更新在功能整合、性能调优以及硬件适配方面实现了多项重要进展。

自v2.5.0版本起,Torch-MUSA 的版本号已与 PyTorch 主版本保持一致,方便开发者更直观地进行版本匹配与管理。本次v2.7.0版本进一步集成了muSolver与muFFT等高性能计算库,显著提升了复杂算法任务的运行效率;同时新增对统一内存设备(Unified Memory)的UMM支持,有效改善了内存资源的利用效率。

此外,新版继续保持与最新MUSA SDK的兼容性,支持使用MUSA SDK 4.2.0至4.3.0及更高版本完成编译构建。截至目前,Torch-MUSA 已实现对超过1050个专属算子的支持,在系统整体性能和稳定性方面也得到持续增强。

v2.7.0 版本核心更新亮点

新增功能

  • 动态双精度转换(Dynamic Double Cast)

通过设置环境变量 export TORCH_USE_MUSA_DOUBLE_CAST=1,用户可启用 Float64 类型算子的动态降级机制,torch_musa 将自动采用 float32 进行实际计算,提升运算速度。

  • 分布式检查点(Distributed Checkpoint)

支持多 rank 并行加载与保存模型状态,大幅缩短检查点操作耗时。当前已实现分布式检查点的异步保存能力,进一步提升训练流程效率。

功能升级

独响 独响

一个轻笔记+角色扮演的app

独响 249 查看详情 独响
  • 新增 Poisson、binomial、_standard_gamma、_sample_dirichlet、vdot、upsample(1d/2d/3d/with aa)、flash_attention、transformer_encoder_layer 等多个常用算子,MUSA专属支持算子数量突破1050个
  • 基于PyTorch底层架构升级,强化 torch.compile 与 AOTInductor 功能支持;
  • 默认开启 TF32 计算模式,加快浮点密集型运算;
  • 升级性能分析工具 Kineto 至 2.7.0 版本,提升其运行稳定性;
  • 持续优化 FSDP2 流水线并行策略,进一步减少显存占用。

v2.5.0 版本关键更新回顾

新增特性

  • 集成 muFFT 与 muSolver 加速库,显著扩展科学计算与工程*场景下的应用能力;
  • 在面向边缘计算的 SoC 平台上引入统一内存管理支持,基于 Arm 架构的 UMA(统一内存寻址)设计,实现 CPU 与 GPU 共享物理内存空间,带来以下优势:
    • 避免 GPU 端重复分配内存;
    • 减少主机与设备间的冗余数据拷贝;
    • GPU 可直接访问由 CPU 内存分配器提供的地址空间。

算子拓展与性能改进

  • 新增 ilshift、irshift、replication_pad1d_bwd、angle、ctcLossTensor、ctcLossTensorBwd、logit、amin/amax/prod.dim_int、glu_bwd 等多个算子支持;
  • 初步支持基础 Sparse(CSR) 相关操作;
  • 扩展量化算子覆盖范围;
  • 修复 torch.norm 存在的输出形状错误问题;
  • 支持 reduce_sum 接收 uint8 输入并输出 int64 结果;
  • C++ 扩展中新增 tensor.is_musa() 方法;
  • 修正空输入情况下 argmax/argmin 的异常行为;
  • 对 var/std、pad、convolution3d、layer_norm 等关键操作进行性能优化。

系统能力增强

  • 开放 torch.musa.mccl.version() 接口,便于查看通信库版本信息;
  • 支持 getCurrentMUSABlasHandle 与 getCurrentMUSABlasLtHandle 调用;
  • 优化 FSDP2 流水线并行机制,降低训练过程中的内存开销。

未来,Torch-MUSA 将持续跟进 PyTorch 官方版本演进节奏,计划下个版本将支持 PyTorch 2.9.0,并持续推进性能调优与功能完善,致力于打造更加成熟、高效的基于 MUSA 架构的国产全功能GPU深度学习生态体系。

源码地址:点击下载

以上就是摩尔线程发布 Torch-MUSA v2.7.0的详细内容,更多请关注其它相关文章!


# 相关文章  # 脐橙推广营销计划书  # 贵州省全网营销推广  # 百业网网站推广  # 延庆区品质网站建设配置  # 试管婴儿网站建设  # 云浮seo公司到9火星  # 宁波seo推广渠道排名  # 抖音seo浙江运营  # seo周报报范文  # 沙河网站推广方案  # 点击下载  # 解决问题  # 更高  # 中文网  # git  # 浮点  # 成长之路  # 开源  # 边缘  # 多个  # red  # 摩尔线程  # pytorch  # 边缘计算  # 深度学习  # 环境变量  # c++  # 工具 


相关栏目: 【 Google疑问12 】 【 Facebook疑问10 】 【 优化推广96088 】 【 技术知识133117 】 【 IDC资讯59369 】 【 网络运营7196 】 【 IT资讯61894


相关推荐: 生成式人工智能来了,如何保护未成年人? | 社会科学报  美军AI无人机“误杀”操作员,人工智能要在军事领域毁灭人类?  IBM将模拟计算用于人工智能,重塑AI计算  “长沙造”无人机,领先的不止植保  500元一张的AI艺术二维码制作,详细教程来了!  普渡机器人与变形金刚品牌合作,特别活动爆火,商品售罄!  2025 WAIC|美团无人机发布第四代新机型  微软向美国政府提供GPT的大模型,安全性如何保证?  微软为 AI 初学者推出免费网课:为期 12 周,共 24 节课  日媒关注中国推进鸟类识别 AI 普及,除监测保护外还可预防传染性疾病  Adobe旗下Illustrator引入生成式AI工具Firefly  Gartner预测:到2025年,全球对话式人工智能支出预计将达到1860亿美元  论文插图也能自动生成了,用到了扩散模型,还被ICLR接收  云鲸发布全新的扫拖机器人J4系列  中国最强AI研究院的大模型为何迟到了  成功孵化首个大型模型解决方案的重庆人工智能创新中心  应用生成式人工智能技术改善农业产业  从医疗康复外骨骼到通用人形机器人,傅利叶智能推动核心技术升级  掌阅科技对话式AI应用“阅爱聊”开启内测  “世界上最像人的机器人”接入 Stable Diffusion ,现场完成作画  泗洪:畅通城市“血管” ,管下机器人来帮忙  让AI助手带您轻松愉快地享受写作之旅  湖北科技职业学院举行工业机器人及智能制造技术专精特新产业学院建设启动仪式  70年前他本想逃避考试,却影响了整个互联网  百度举办AIGC创作沙龙,现场传授AI绘画“咒语”技巧  视觉中国宣布推出AI灵感绘图、画面扩展功能  第四范式“式说”大模型入选《2025年通用人工智能创新应用案例集》  遵义市首次引入手术机器人,成功实施全膝关节置换术  小米创始人雷军将揭示小米AI在年度演讲中的最新进展  售价14.99万起!小米汽车部分信息疑遭AI曝光,内部人士回应:网传图片明显经过处理,不可轻信  人工智能和神经网络有什么联系与区别?  绿联发布笑脸屏幕显示充电状态的30W/65W Q湃机器人充电器  OPPO三方联合发布AI可持续发展白皮书,坚持发展健康AI生态  一文看懂基础模型的定义和工作原理  此「错」并非真的错:从四篇经典论文入手,理解Transformer架构图「错」在何处  统信深度deepin成立 AI SIG 社区,共同提升 Linux 下 AI 体验  ​日媒:AI高效解析纳斯卡地画  Valve Index VR 头显销量下滑,上市四年的长青树渐失光彩  美图秀秀发布7款AI产品:支持用户创作、商业创作  金山办公宣布与英伟达团队合作,加速WPS AI服务  AMD在AI方面奋起直追,与英伟达的差距缩小了吗?  人工智能如何用于家庭安全  彬州市第三届青少年机器人创新大赛成功举办  Nature发AIGC禁令!投稿中视觉内容使用AI的概不接收  你们的开机第一屏画面要变了!安卓机器人首次3D化  十个AI算法常用库J*a版  首届亚太网络法实务大会召开 九位大咖探讨元宇宙与人工智能发展  为什么很多人对纽约《人工智能招聘法》感到生气?  CharacterAI - 也许会成为会话人工智能的未来  移远通信率先完成多场5G NTN技术外场验证,为卫星物联网应用落地提速 

 2025-11-28

了解您产品搜索量及市场趋势,制定营销计划

同行竞争及网站分析保障您的广告效果

点击免费数据支持

提交您的需求,1小时内享受我们的专业解答。

运城市盐湖区信雨科技有限公司


运城市盐湖区信雨科技有限公司

运城市盐湖区信雨科技有限公司是一家深耕海外推广领域十年的专业服务商,作为谷歌推广与Facebook广告全球合作伙伴,聚焦外贸企业出海痛点,以数字化营销为核心,提供一站式海外营销解决方案。公司凭借十年行业沉淀与平台官方资源加持,打破传统外贸获客壁垒,助力企业高效开拓全球市场,成为中小企业出海的可靠合作伙伴。

 8156699

 13765294890

 8156699@qq.com

Notice

We and selected third parties use cookies or similar technologies for technical purposes and, with your consent, for other purposes as specified in the cookie policy.
You can consent to the use of such technologies by closing this notice, by interacting with any link or button outside of this notice or by continuing to browse otherwise.