OpenAI secara rasmi telah melancarkan ChatGPT Images 2.0, model penjanaan imej terbarunya, dan upgrade besar kali ini bukan sekadar AI art yang nampak lebih cantik. Syarikat itu kata versi baharu ini jauh lebih bagus dalam mengikuti arahan terperinci, mengendalikan banyak teks dalam satu imej, dan memastikan objek berada di tempat yang betul antara satu sama lain.
Benda tu memang dah kedengaran berguna, tapi bahagian yang mungkin paling menarik perhatian di Malaysia dan scene kreatif SEA yang lebih luas ialah ini: OpenAI kata model ini telah membuat peningkatan besar untuk teks bukan Latin, khususnya Japanese, Korean, Chinese, Hindi dan Bengali. Kalau dakwaan ini memang terbukti dalam penggunaan dunia sebenar, ini boleh jadi upgrade yang agak penting untuk creator serantau, team indie game, fan artist dan marketer yang perlukan visual yang tak terus hancur bila minta teks bahasa Asia.
Menurut OpenAI, Images 2.0 juga merupakan model imej pertamanya dengan keupayaan reasoning. Syarikat itu kata ini membolehkan sistem melakukan perkara seperti search web dan mengesahkan output, dengan matlamat menjadikan hasil lebih boleh dipercayai apabila ketepatan, konsistensi dan visual cohesion itu penting.
Untuk kerja berkaitan anime, manga dan game, benda ni memang besar. Salah satu frustration paling besar dengan tool imej AI selama ini ialah ia boleh nampak cantik pada pandangan pertama, tapi terus fumble detail bila kau perlukan teks yang boleh dibaca, watak yang konsisten, atau layout yang sebenarnya masuk akal. OpenAI kata model baharu ini juga lebih bagus dalam menghasilkan semula pelbagai visual language dengan lebih setia, yang diposisikan sebagai berguna untuk game prototyping dan storyboarding.
Ada juga beberapa upgrade praktikal. Images 2.0 kini menyokong aspect ratio selebar 3:1 dan setinggi 1:3, boleh menjana sehingga resolusi 2K, dan boleh menghasilkan sehingga lapan output serentak. Ini memberi pengguna lebih fleksibiliti untuk banner, vertical social post, panel gaya manga dan format lain yang tak sesuai dengan workflow imej square biasa.
Dalam preview awal Engadget, model ini diuji dengan tiga prompt: seekor kucing tortoiseshell yang dirender dalam gaya pixel art game Pokemon generasi ketiga, permintaan untuk menukar imej itu menjadi transparent PNG, dan manga empat halaman tentang kucing itu menikmati hari cerah di tepi sungai bandar. Preview itu kata hasil gaya Pokemon tersebut surprisingly solid, terutama sebab pixel art biasanya merupakan weak spot untuk model AI.
Ujian transparent PNG pula agak kurang stabil. Ia mengambil masa lebih lama, dan output sedikit berbeza daripada imej asal, yang bermaksud ia sedikit lari daripada prompt. Namun begitu, ia dilaporkan berjaya menghasilkan imej transparent yang betul, sesuatu yang model imej lain tidak semestinya mampu handle dengan baik.
Untuk pembaca di Malaysia dan SEA, angle bukan Latin ini mungkin headline sebenar. Banyak kerja kreatif serantau berada merentas pelbagai bahasa dan budaya visual pada masa yang sama, terutama bila kau berurusan dengan fandom anime, promo art bahasa Chinese, trend design berinspirasikan Korea atau game asset yang disasarkan kepada audiens campuran. Kalau Images 2.0 betul-betul boleh mengekalkan teks lebih bersih dan rujukan style lebih tepat, ia boleh menjimatkan banyak masa cleanup.
Model baharu ini tersedia mulai hari ini untuk semua pengguna ChatGPT, termasuk tier Free dan Go. Pelanggan Plus dan Pro mendapat akses kepada output yang lebih advanced. OpenAI juga sedang melancarkannya melalui API dan app coding Codex, yang baru-baru ini sahaja mendapat penjanaan imej terbina dalam. Pelancaran ini juga hadir hanya beberapa hari selepas Anthropic masuk ke ruang visual design dengan design assistant mereka sendiri, jadi race imej AI memang makin panas.
Source: Engadget