AMD MI350P Bawa Kuasa AI Besar ke Server PCIe Standard

AMD telah menambah kad PCIe baharu ke dalam keluarga MI350, dan kali ini memang jelas ditujukan kepada pusat data yang mahukan prestasi AI lebih tinggi tanpa perlu rombak setup server sedia ada.

AMD Instinct MI350P baharu ini ialah accelerator AI enterprise yang dibina untuk slot PCIe standard. Ini penting sebab bukan semua syarikat mahu — atau mampu — terus lompat ke platform server AI custom sepenuhnya. Untuk cloud provider, operator pusat data tempatan, universiti, bank, telco, dan startup AI di Malaysia serta SEA, kad macam ini boleh jadi laluan upgrade yang lebih praktikal.

Daripada memerlukan setup cooling pelik-pelik, MI350P direka untuk server rack air-cooled sedia ada. Ia ialah kad dual-slot 10.5 inci dengan reka bentuk fanless, bergantung pada airflow chassis dalam server. AMD meletakkannya sekitar power envelope 600W, walaupun ia juga boleh dikonfigurasi turun ke 450W untuk server dengan had kuasa atau thermal yang lebih ketat.

Dari segi spec, MI350P ini boleh dikatakan adik kepada MI350X dan MI355X AMD yang lebih high-end. Ia menggunakan arkitektur CDNA4 AMD dan dibina menggunakan proses 3nm dan 6nm FinFET TSMC. Kad ini memuatkan 8,192 cores, 128 compute units, 512 Matrix Cores, max clock 2.2GHz, dan 128MB last-level cache.

Headline paling besar untuk workload AI ialah memory. AMD memberikan MI350P 144GB HBM3E dengan bandwidth 4TB/s. Ini memang spec yang penting untuk large language models, retrieval-augmented generation, dan workload inference, di mana kapasiti memory dan bandwidth boleh jadi sama penting dengan raw compute.

AMD mengatakan sehingga lapan kad MI350P boleh digunakan bersama dalam satu sistem, membolehkan pusat data scale mengikut saiz workload. Kad ini juga menyokong format lower-precision seperti MXFP6 dan MXFP4, yang berguna untuk mempercepatkan tugasan berkaitan LLM. AMD mendakwa MI350P boleh mencapai anggaran 2,299 TFLOPs dan sehingga 4,600 peak TFLOPs dengan MXFP4.

Rival paling jelas di sini ialah H200 NVL Nvidia, yang kini antara pilihan accelerator AI PCIe paling kuat. Berdasarkan angka yang dikongsikan, AMD MI350P mempunyai theoretical compute yang lebih kuat dalam beberapa bahagian: sekitar 20% lebih baik FP64, 43% lebih baik FP16, dan 39% lebih baik FP8 berbanding kad Nvidia.

Ini memang big flex daripada AMD, terutama sekali sebab Nvidia belum mengumumkan versi PCIe untuk GPU B200 Blackwell terbaru mereka yang lengkap dengan HBM. Jadi buat masa sekarang, AMD boleh claim posisi yang sangat tajam: accelerator AI baharu yang muat dalam form factor PCIe tradisional.

Untuk pembaca Malaysia, ini bukan GPU yang anda beli untuk gaming PC atau home AI hobby build. Ini hardware enterprise — fikir server rack serius, bukan cart Shopee. Tapi ia tetap penting secara tempatan sebab infrastruktur AI makin menjadi benda besar di seluruh SEA. Lebih banyak kapasiti AI serantau boleh bermaksud cloud service tempatan yang lebih baik, deployment AI enterprise yang lebih pantas, dan mungkin lebih banyak pilihan selain stack Nvidia sahaja.

Namun, persoalan besar bukan prestasi semata-mata. Ia juga software. Nvidia masih ada kelebihan besar kerana CUDA, yang sudah digunakan ramai developer dan syarikat. AMD pula semakin memperbaiki ekosistem software ROCm mereka, tetapi adoption akan bergantung pada sama ada pelanggan yakin untuk memindahkan workload mereka ke sana.

Walaupun begitu, MI350P nampak seperti langkah yang bijak. Ia memberikan AMD kad AI PCIe yang serius untuk syarikat yang mahukan lebih compute tanpa perlu pergi ke platform full custom. Kalau ROCm terus improve, ini boleh jadi pilihan yang sangat real untuk pusat data SEA yang mahu diversify hardware AI mereka.

Sumber: Tom's Hardware

AMD MI350P Bawa Kuasa AI Besar ke Server PCIe Standard

Tag