AI Hypercomputer Google Dibina untuk Gelombang AI Agents Seterusnya

Google sedang all-in untuk era yang dipanggil agentic AI, dan kali ini bukan sekadar cakap tentang chatbot yang lebih pandai. Di Cloud Next 26, syarikat itu mengumumkan AI Hypercomputer, platform infrastruktur Google Cloud baharu yang direka untuk menggabungkan TPU custom, CPU Axion, GPU NVIDIA, networking, storage dan software machine learning ke dalam satu sistem AI gergasi.

Untuk pembaca Malaysia dan SEA, ini jenis tech backend yang pada awalnya nampak jauh, tapi sebenarnya boleh membentuk app, game, creator tools dan servis AI yang kita guna setiap hari. Training dan inference AI yang lebih laju biasanya bermaksud rollout feature lebih cepat, scaling cloud platform yang lebih murah, dan tool AI yang lebih ambitious untuk developer yang bina game, esports analytics, virtual assistant atau content pipeline.

Apa yang Google sebenarnya umumkan

AI Hypercomputer ialah pitch Google untuk infrastruktur AI berskala besar yang melangkaui idea “supercomputer” tradisional. Daripada bergantung pada satu jenis cip sahaja, Google menggabungkan beberapa pilihan compute ke dalam satu platform:

Google TPU generasi ke-8
Google Axion Arm-based Cloud CPUs
NVIDIA Vera Rubin NVL72 GPUs
Networking fokus AI
Storage berkelajuan tinggi
Software terbuka dan framework ML

Hardware utama di sini ialah keluarga TPUv8 baharu Google, yang dibahagikan kepada dua cip: TPU 8t untuk training dan TPU 8i untuk inference.

TPU 8t dibuat untuk training model gergasi

TPU 8t dibina untuk training model AI frontier berskala besar. Google kata satu superpod TPU 8t boleh scale sehingga 9,600 cip dengan 2PB shared high-bandwidth memory. Syarikat itu mendakwa 121 exaflops FP4 compute untuk setiap pod, sekitar 2.84x lebih tinggi berbanding generasi Ironwood sebelum ini.

Google juga menolak beberapa penambahbaikan di sini, termasuk bandwidth interchip dua kali ganda berbanding generasi sebelum ini, akses storage 10x lebih laju, dan TPUDirect untuk menghantar data terus ke dalam TPU. Platform ini juga menggunakan Virgo Network, JAX dan software Pathways milik Google, dengan Google mengatakan ia boleh menyokong scaling hampir linear sehingga satu juta cip dalam satu logical cluster.

TPU 8t juga memperkenalkan sokongan FP4 native, yang membantu mengurangkan tekanan memory bandwidth dengan menggunakan bit yang lebih sedikit untuk setiap parameter sambil masih cuba mengekalkan accuracy model besar pada tahap yang boleh digunakan.

TPU 8i fokus pada inference

TPU 8i pula disasarkan untuk inference, iaitu bahagian di mana model AI yang sudah dilatih benar-benar memberi respons kepada pengguna. Ini penting sebab inference ialah tempat kos dunia sebenar boleh meletup apabila berjuta-juta orang mula menggunakan sesuatu produk AI.

Google kata TPU 8i hadir dengan 288GB HBM memory dan 384MB on-chip SRAM, peningkatan kapasiti 3x berbanding generasi sebelum ini. Cip ini menawarkan 331.8 exaflops FP8 compute untuk setiap pod, yang menurut Google adalah 6.74x lebih tinggi berbanding Ironwood.

Untuk model Mixture of Experts moden, Google menggandakan ICI bandwidth kepada 19.2Tb/s. Architecture Boardfly baharunya mengurangkan maximum network diameter lebih daripada 50%, manakala Collectives Acceleration Engine boleh mengurangkan on-chip latency sehingga 5x.

NVIDIA Rubin juga sebahagian daripada pelan

Google bukan bergantung pada silicon sendiri sahaja. Syarikat itu berkata GPU NVIDIA kekal sebagai bahagian teras dalam lineup AI accelerator mereka, dan Google Cloud akan menjadi antara yang pertama menawarkan sistem NVIDIA Vera Rubin NVL72. Sistem ini akan duduk bersama instance sedia ada berasaskan Hopper dan Blackwell.

Kombinasi ini menarik sebab pelanggan cloud tidak akan dipaksa masuk ke satu laluan hardware sahaja. Untuk studio, startup AI, team enterprise dan kumpulan research di SEA, fleksibiliti memang penting. Sesetengah workload mungkin lebih sesuai dengan Google TPU, manakala yang lain mungkin masih prefer ekosistem NVIDIA yang kuat dengan CUDA.

Kenapa ini penting untuk SEA

Tidak, gaming PC anda di Malaysia bukan tiba-tiba akan ada TPU 8t di dalamnya. Tapi infrastruktur cloud AI mempengaruhi tool di sekeliling gaming dan entertainment: NPC game yang lebih pintar, localisation lebih laju, automated video editing, AI moderation, analisis data esports, aset AI-generated dan enterprise copilot.

Google juga kata pelanggan yang menggunakan infrastruktur ini termasuk US DOE, Boston Dynamics, Citadel Securities, Thinking Machine Labs dan Axia Energy. Itu menunjukkan sasarannya ialah kerja AI berskala besar yang serius, bukan gimmick consumer.

Kesimpulan besar: Google mahu cloud mereka menjadi salah satu rumah utama untuk agentic AI, menggunakan TPU dan CPU sendiri sambil tetap membawa masuk NVIDIA Rubin untuk pelanggan yang perlukan ekosistem itu. Untuk Malaysia dan SEA, impaknya kemungkinan besar akan sampai melalui app dan servis yang dibina di atasnya, bukan melalui hardware itu sendiri.

Source: Wccftech Gaming