AMD telah melancarkan GPU PCIe Instinct MI350P baharu, dan walaupun ini bukan jenis graphics card yang kau sumbat masuk dalam gaming rig, ia masih benda besar untuk scene tech yang lebih luas — termasuk Malaysia dan SEA.
Pitch dia simple: syarikat mahu jalankan lebih banyak AI workload, tapi bukan semua orang mahu terus bakar duit pada cloud services. Cloud AI memang convenient, betul, tapi ia juga datang dengan dua sakit kepala yang sangat real: data privacy dan bil yang susah dijangka. Untuk bisnes yang handle data pelanggan, dokumen dalaman, rekod kewangan, atau aset media sensitif, kekalkan AI workload secara on-premises boleh jadi play yang lebih selamat.
Masalahnya? Setup AI accelerator high-end tradisional boleh perlukan perubahan besar pada data centre, terutama dari segi power delivery, cooling, dan reka bentuk rack. Itu memang tak murah, dan untuk banyak enterprise Malaysia, universiti, telco, serta team tech serantau, bina semula infrastruktur sepenuhnya ialah komitmen yang besar gila.
Di sinilah AMD mahu kad PCIe Instinct MI350P masuk.
Direka untuk masuk ke server sedia ada
AMD kata kad PCIe Instinct MI350P ialah GPU dual-slot, drop-in yang dibuat untuk server air-cooled standard. Dalam bahasa mudah: ia direka untuk masuk ke environment server enterprise tanpa memaksa syarikat reka semula seluruh data centre untuk platform accelerator yang lebih pelik atau khusus.
Ini penting sebab banyak organisasi di Malaysia dan SEA masih berada pada peringkat awal-ke-pertengahan dalam adoption AI. Mereka mungkin mahu jalankan AI inference secara lokal — benda seperti internal assistant, pemprosesan dokumen, model customer support, content moderation, translation, atau analytics — tapi mereka tak semestinya mahu commit kepada bil cloud monster atau overhaul hardware sepenuhnya.
Untuk game studio, syarikat media, platform esports, dan team creator-commerce, hardware AI on-prem macam ini juga boleh jadi relevan nanti. Bayangkan workflow aset yang lebih laju, automated video tagging, localisation, recommendation system, dan internal tools yang tak perlu hantar semuanya keluar kepada third-party cloud provider. Bukan semua team perlukan hardware tahap ini hari ini, tapi arah dia memang jelas.
Nombor AI besar dalam kad PCIe
Dari segi performance, AMD memang push angka yang serius. Kad PCIe Instinct MI350P menyokong format lower-precision MXFP6 dan MXFP4, yang ditujukan untuk deliver throughput tinggi bagi AI workload. Kad ini juga menyokong sparsity acceleration merentas kebanyakan precision 8-bit dan 16-bit mainstream.
AMD menganggarkan performance pada 2,299 TFLOPS, dengan sehingga 4,600 peak TFLOPS pada MXFP4. Menurut syarikat itu, ini menjadikannya pilihan performance tertinggi yang tersedia sekarang dalam kad PCIe enterprise.
Memory juga satu lagi bahagian besar dalam pakej ini. Kad PCIe MI350P disenaraikan dengan anggaran 144 GB memory HBM3E, berjalan sehingga bandwidth 4 TB/s. Untuk AI inference, terutamanya dengan model lebih besar atau enterprise workload yang lebih berat, kapasiti memory dan bandwidth ini boleh jadi sama penting dengan raw compute.
Open ecosystem ialah angle paling mesra SEA
AMD juga mengetengahkan open ecosystem serta pilihan development stack kos rendah atau tanpa kos. Bunyi macam marketing enterprise standard, tapi sebenarnya ini penting di rantau ini.
Untuk team SEA, kawalan kos memang segalanya. Hardware sudah pun mahal bila kau ambil kira exchange rate, harga import, deployment, dan support. Kalau software stack boleh kurangkan operating cost dan elakkan syarikat terkunci terlalu ketat dalam satu ecosystem, itu beri team IT lebih fleksibiliti.
Sudah tentu, ini masih hardware AI enterprise, bukan consumer tech. Jangan harap kad ini muncul dalam build Low Yat atau listing gaming PC Shopee. Tapi untuk bisnes Malaysia yang cuba bawa AI lebih dekat kepada infrastruktur sendiri, pelancaran PCIe MI350P AMD beri mereka satu lagi jalan: performance accelerator yang serius tanpa semestinya bina semula seluruh server room.
Dan jujur, itu bahagian yang menarik. AI sedang bergerak daripada hype deck kepada keputusan infrastruktur sebenar. Pemenang bukan sekadar siapa ada nombor benchmark paling besar, tapi siapa yang buat deployment kurang sakit untuk syarikat sebenar dengan bajet sebenar.
Sumber: TechPowerUp