刚完硬件刚软件 AMD确认AI软件3倍性能提升
2025-08-10 10:32:56
快科技8月9日消息,在AI市场上NVIDIA占据了95%的份额,这不仅是他们的AI显卡硬件性能强大,还得益于CUDA的软件生态更完善,毕竟16年来积累了400多万开发者,这是NVIDIA最大的护城河。
AMD在AI市场上想抢占更多份额,除了明年推出性能40PFlops(4亿亿次每秒)的MI400加速卡之外,还要在软件生态上取得突破,这方面就得靠AMD的ROCm软件了,而且还是开源开放的生态。

今年6月份AMD官宣了最新的ROCm 7软件,专为性能、兼容性和灵活性而设计,在推理和训练方面提供了重大增强,支持许多开箱即用的最新AI模型,并将AMD开放生态系统从云扩展到边缘。
在日前的财报会议上,CEO苏姿丰也提到了ROCm 7的诸多优点,强调在这一财季中AMD取得了重大进展,提高了ROCm7的性能、易用性并扩大了其采用范围。
苏姿丰表示,我们发布了 ROCm7,对整个软件栈的每一层都进行了重大升级,与上一代相比,推理和训练性能提升了3倍以上,并增加了对大规模训练、分布式推理和低精度数据类型的支持。

为了加强与开发者的合作,AMD推出了 ROCm夜间构建版本,并扩大了即时计算基础设施的访问范围,包括推出了AMD首个开发者云,该云提供预配置的容器,可即时访问 AMD GPU。
在此前的发布会上,AMD还提供了ROCm7的实测结果,在Llama 3.1 70B模型上性能提升 3.2倍,Qwen2-72B上性能提升3.4倍,而DeepSeek R1性能提升3.8倍。
在训练任务上,Llama 2 70B、Llama 3.1 8B、Qwen 1.5 7B模型上平均性能提升3倍。
今年内ROCm7还会不断提升生态支持,加入对锐龙平台笔记本/工作站的支持,完整支持Linux系统,还会正式加入对Windows系统的支持,可以说之前备受开发者吐槽的问题正在逐步解决。
相关阅读
-
佳能 EOS R6 V 定档 5 月 13 日发布:支持 7K 视频与自动散热深度解读 2026-05-08 10:35:15
-
百度网盘时光轴在哪里?百度网盘时光轴打开方法资讯百科 2026-05-08 10:35:05
-
190 元榴莲遭仅退款?商家驱车 1600 公里翻垃圾桶取证,结局大快人心金融科技前沿 2026-05-08 10:34:41
-
索尼 A7R6 定档 5 月 13 日发布:佳能 A1M2 最强杀手来袭深度解读 2026-05-08 10:29:47
-
加密货币的价值从何而来?深度解析其核心来源与投资逻辑区块链快讯 2026-05-08 10:29:45
-
汽车零重力座椅保险引热议:碰撞风险堪比 5 楼坠落、误夹儿童隐患解析金融科技前沿 2026-05-08 10:28:33
-
见者好运!印尼天空惊现绝美彩虹云,持续半小时奇观深度解读 2026-05-08 10:24:42
-
胖东来回应被质疑套取国补:发长文否认,强调产品均明码标价金融科技前沿 2026-05-08 10:23:02
-
AgentLISA (LISA) 币深度解析:项目概述、代币经济模型与路线图全攻略区块链快讯 2026-05-08 10:23:01
-
概率思维是什么?加密交易必备的概率思维实战指南区块链快讯 2026-05-08 10:20:39