AMD 發(fā)布下一代開源軟件棧技術(shù) ROCm 7
IT 世家 6 月 13 今天凌晨的日消息 AMD Advancing AI 2025 活動(dòng)中,AMD 正式推出其下一代開源軟件棧技術(shù) ROCm 7,進(jìn)一步加速 AI 生產(chǎn)力與開發(fā)者。

隨著 ROCm 7 的發(fā)布,AMD 終于從其 ROCm 6 在過去的幾年里,軟件棧向前邁進(jìn)。 —— 特別是在 AI 自從計(jì)算出現(xiàn)以來(lái) —— 經(jīng)過多次更新。下面是 AMD 在 ROCm 7 重點(diǎn)關(guān)注的一些功能:
最新算法和模型
用于拓展 AI 的高級(jí)功能
MI350 系列支持
集群管理
企業(yè)級(jí)功能

通過 ROCm,AMD 這意味著它在軟件堆棧中越來(lái)越注重推理能力的提高。ROCm 7 堆棧將包括加強(qiáng)框架。,如 vLLM v1、llm-d、SGLang,并且專注于提供多種提升。即將到來(lái) ROCm 7 包括新核心和算法 GEMM 自動(dòng)調(diào)優(yōu)、MoE、Attention 和基于 Python 內(nèi)核編寫。
AMD 已宣布對(duì)其 MI350 系列提供 FP6 和 FP4 支持,ROCm 7 還包括對(duì)這些高級(jí)數(shù)據(jù)類型的全面支持,例如 FP8、FP6、FP4 混合精度。
IT 從新聞發(fā)布會(huì)上了解到,在性能方面,AMD 表示 ROCm 7 把推理作為重點(diǎn),為 AI 高達(dá)帶來(lái)了工作負(fù)荷 3.5 性能提升倍。
具體而言,相比之下 ROCm 6,ROCm 7 的 Llama 3.1 70B 提高了 3.2 Qwen2-72B 提高了 3.4 倍,DeepSeek R1 提高了 3.8 倍。

本文僅代表作者觀點(diǎn),版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請(qǐng)?jiān)谖闹凶⒚鱽?lái)源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請(qǐng)及時(shí)與我們聯(lián)系進(jìn)行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com