Generasi AI GPU NVIDIA yang akan datang bukan sekadar pasal chip lebih laju. Battle sebenar mungkin pada power delivery — dan nombornya memang mula nampak gila.
Menurut angka yang diketengahkan daripada Morgan Stanley Research, generasi Feynman AI rack masa depan NVIDIA boleh membawa lebih US$191,000 dalam kandungan power semiconductor untuk setiap rack. Untuk pembaca Malaysia, itu lebih kurang sekitar RM900,000 sebelum cukai, shipping, integrasi dan turun naik kadar tukaran — hanya untuk bahagian semiconductor berkaitan kuasa, bukan full rack.
Inilah bahagian yang patut buat operator datacentre terus alert. Berbanding Blackwell, angka Feynman dianggarkan sekitar 17 kali lebih tinggi.
Dari Blackwell Ke Feynman: Power Jadi Bahagian Mahal
Baseline Blackwell B200 semasa dianggarkan sekitar US$11,234 dalam kandungan power semiconductor. GB200 tambah lebih kurang US$4,000 lagi, manakala GB300 push lagi sekitar US$3,500. Sepanjang generasi Blackwell, anggaran itu naik kepada US$17,761.
Lepas itu, scaling mula jadi jauh lebih ganas.
Rubin, yang dijangka hadir selepas Blackwell, dianggarkan melepasi US$33,000 dalam kos power semiconductor. Rubin Ultra naik lagi tinggi, dengan anggaran dilaporkan sekitar US$95,000. Feynman, yang dirancang untuk 2028 selepas Rubin, kemudian menggandakan angka Rubin Ultra itu kepada lebih US$191,000.
Dalam bahasa mudah: AI racks NVIDIA makin kurang macam ‘GPU boxes’ biasa dan makin jadi projek kejuruteraan kuasa penuh. Chip masih bintang utama, memanglah, tapi memberi elektrik kepada chip-chip itu dengan selamat dan efisien sedang menjadi cost centre yang sangat besar.
Komponen Apa Yang Push Kos Ini?
Bahagian paling besar dilaporkan datang daripada power conversion system dan second-stage voltage regulation modules. PCS menyumbang sekitar 27%, manakala komponen berkaitan VRM mengambil sekitar 26%.
Power supply units pula membentuk lagi 19%. Lateral VRMs berada sekitar 15%, manakala intermediate bus converters, battery backup, komponen UPS dan komponen sokongan lain mengambil bahagian lebih kecil. Switches, NICs dan eFuses juga termasuk dalam campuran ini.
Basically, setiap langkah untuk mengalirkan kuasa daripada fasiliti ke ratusan GPU yang lapar tenaga makin lama makin rumit.
Kenapa NVIDIA Bergerak Ke 800V DC
NVIDIA sudah pun menggariskan peralihan ke arah arkitektur 800V DC untuk datacentre AI masa depan. Ini akan bergerak melangkaui sistem lama gaya 48V atau 54V, yang semakin awkward untuk AI racks skala megawatt.
Sebabnya fizik. Voltan lebih tinggi bermaksud arus lebih rendah untuk tahap kuasa yang sama, yang boleh mengurangkan ketebalan kabel, keperluan copper dan kehilangan tenaga. Bahan sumber Wccftech menyatakan bahawa rack 1MW menggunakan 54V DC boleh memerlukan sehingga 200kg copper busbar. Scale benda itu ke datacentre 1GW, dan keperluan copper jadi memang ridiculous.
800V DC juga membantu mengurangkan penukaran kuasa berulang, yang boleh membazir tenaga dan memperkenalkan lebih banyak titik kegagalan. Arkitektur ini bergantung pada power electronics canggih seperti komponen gallium nitride dan silicon carbide, kedua-duanya penting untuk high-voltage switching yang efisien.
NVIDIA Kyber racks, yang dijangka pada 2027, dirancang untuk memperkenalkan 800V DC dengan Rubin Ultra GPUs. Setup ini digambarkan sebagai reka bentuk rack 600kW yang padat dan liquid-cooled dengan 576 chip Rubin Ultra.
Kenapa Malaysia Dan SEA Patut Ambil Peduli
Ini memang kedengaran macam benda hyperscaler, tapi ia penting untuk pasaran tempatan juga. Malaysia sudah pun menarik pelaburan datacentre yang serius, terutamanya sekitar Johor dan lokasi strategik lain di rantau ini. Jika infrastruktur AI terus bergerak ke arah rack kelas megawatt, ketersediaan kuasa, cooling, perancangan grid dan bekalan komponen akan jadi lebih penting.
Untuk gamers dan PC builders, ini bukan bermaksud kad GeForce anda yang seterusnya tiba-tiba akan berharga RM900k, relax bro. Tapi ia menunjukkan ke mana fokus engineering paling high-end NVIDIA sedang pergi: AI factories, bukan sekadar gaming GPUs.
Untuk SEA, soalan lebih besar ialah sama ada datacentre serantau boleh menyokong power density sebegini tanpa kos tenaga dan had infrastruktur menjadi bottleneck sebenar. AI lebih laju perlukan sistem kuasa lebih kuat — dan bahagian itu makin cepat jadi mahal.
Sumber: Wccftech Gaming