AMD 為 MI350 系列加入了一張新的 PCIe 卡,這次明顯是瞄準那些想提升 AI performance、但又不想拆掉現有伺服器架構重來的資料中心。
全新的 AMD Instinct MI350P 是一款為標準 PCIe 插槽打造的 enterprise AI accelerator。這點很重要,因為不是每家公司都想——或負擔得起——直接跳去全客製 AI server platform。對 Malaysia 和 SEA 的 cloud providers、本地資料中心營運商、大學、銀行、telcos,以及 AI startups 來說,這種卡可能是更實際的升級路線。
MI350P 不需要什麼超 exotic 的 cooling setup,而是設計給現有 air-cooled rack servers 使用。它是一張 10.5-inch dual-slot card,採用 fanless design,靠伺服器 chassis 內部 airflow 散熱。AMD 標示它大約是 600W power envelope,不過如果伺服器 power 或 thermal limit 比較緊,也可以配置到 450W。
規格方面,MI350P 基本上就是 AMD 更高階 MI350X 和 MI355X 的小弟。它採用 AMD 的 CDNA4 architecture,並使用 TSMC 的 3nm and 6nm FinFET processes 製造。這張卡有 8,192 cores、128 compute units、512 Matrix Cores、最高 clock 2.2GHz,以及 128MB of last-level cache。
對 AI workloads 來說,最大的 headline 是 memory。AMD 給 MI350P 配上 144GB of HBM3E,頻寬達 4TB/s。這正是 large language models、retrieval-augmented generation,以及 inference workloads 會很在意的規格,因為 memory capacity 和 bandwidth 有時跟 raw compute 一樣重要。
AMD 表示單一系統最多可以一起使用 eight MI350P cards,讓資料中心能根據 workload size 擴充。這張卡也支援 MXFP6 and MXFP4 這類 lower-precision formats,對加速 LLM-related tasks 很有用。AMD 宣稱 MI350P 可達估計 2,299 TFLOPs,並在 MXFP4 下最高可達 4,600 peak TFLOPs。
這裡最明顯的對手就是 Nvidia 的 H200 NVL,目前是最強的 PCIe AI accelerator options 之一。根據公開數據,AMD MI350P 在多個領域有更強的 theoretical compute:相比 Nvidia 的卡,約 20% better FP64、43% better FP16,以及 39% better FP8。
這對 AMD 來說是很大的 flex,尤其是 Nvidia 目前還沒有宣布其最新配備 HBM 的 B200 Blackwell GPU 會有 PCIe 版本。所以目前 AMD 可以主打一個很 sharp 的定位:一款更新的 AI accelerator,而且能放進傳統 PCIe form factor。
對 Malaysian readers 來說,這不是那種你會買來裝進 gaming PC 或 home AI hobby build 的 GPU。這是 enterprise hardware——想的是 serious server racks,不是 Shopee cart。但它對本地依然重要,因為 AI infrastructure 在 SEA 正變得越來越關鍵。更多 regional AI capacity,可能代表更好的 local cloud services、更快的 enterprise AI deployments,以及 Nvidia-only stacks 之外更多選項。
不過,最大的問題不只是 performance,而是 software。Nvidia 仍然憑著 CUDA 擁有巨大優勢,很多 developers 和公司早就依賴它。AMD 一直在改善 ROCm software ecosystem,但客戶是否有信心把 workloads 搬過去,才會決定 adoption。
即便如此,MI350P 看起來是一步聰明棋。它讓 AMD 擁有一張真正有份量的 PCIe AI card,給那些想要更多 compute、但不想走 full custom platform 的公司。如果 ROCm 持續進步,這很可能會成為 SEA data centres 想 diversify AI hardware 時的現實選項。
Source: Tom's Hardware