Google Gemini Intelligence 想替你處理 Android App 任務
Google 正把 Android 更深入推進 AI agent 時代,而這次已經不只是問 chatbot 問題那麼簡單了。
在 Android Show: I/O Edition 上,Google 發表了 Gemini Intelligence,這是一套全新系統,目標是幫 Android 裝置跨 app 完成任務,減少使用者手動點來點去。你可以把它想成一個 AI helper,能在你的手機 app 之間移動,理解需要完成什麼,然後執行多步驟操作。
Google 表示,他們花了五個月調整這個 agent,讓它能在一些最常用的手機 app 之間運作。概念很簡單:與其你自己打開一個 app、複製資料、跳去另一個 app、搜尋、加入商品、再手動確認,Gemini Intelligence 可以幫你處理其中一部分流程。
Google 給的一個例子其實蠻實用。如果學生在 Gmail 收到課程 syllabus,Gemini 可以讀取內容,辨識這堂課需要的書本,然後把那些書放進 shopping cart。這種無聊 admin task 大多數人都不愛做,所以你會明白為什麼 Google 想讓 AI 接手這些 grind。
當這套系統能使用你螢幕上的內容或圖片時,就變得更有意思。Google 描述了一個旅遊情境:有人在酒店看到一張 brochure,然後叫 Gemini 在 Expedia 上找類似的 tour。對 SEA 旅客來說,如果功能真的穩,這類 feature 會很有用,尤其是在規劃日本、韓國、泰國,甚至本地 cuti-cuti Malaysia 小旅行的時候。
對馬來西亞 Android 使用者來說,最大的問題不是這聽起來酷不酷,而是它到底夠不夠可靠,可以每天使用。我們的手機已經處理從 Grab 叫車、Touch ’n Go eWallet,到 Shopee cart、banking app、airline check-in 和 food delivery 的所有東西。如果 Gemini Intelligence 能減少那些重複的小步驟,而且不搞亂事情,那真的很有用。但如果它點錯東西、選錯 item,或者誤解 context,confirm memang 很快就會讓人失去信任。
Google 顯然知道,讓一個 AI agent 控制你的手機聽起來有點 sus。公司表示,Gemini Intelligence 只會在使用者指示後才開始任務。如果任務涉及購買東西,使用者仍然必須批准 purchase。使用者也可以透過 Android 一貫的 permissions menu 管理 data access,而 progress bar 也讓他們能在 Gemini 工作時停止它。
這個控制層很重要。在馬來西亞和 SEA,mobile wallet、banking app 和 shopping platform 都被高度使用,沒有人想要 AI 隨便替你做出涉及真金白銀的決定。即使購買仍需要 confirmation,使用者在信任 Gemini 處理敏感 workflow 之前,還是會想清楚看到它到底在做什麼。
Google 計劃先把 Gemini Intelligence 推出到近期發布的 Pixel 和 Samsung Galaxy 手機上。從全球角度來看這合理,不過 Pixel 在馬來西亞的供應一直沒有 Samsung 那麼 mainstream。對本地使用者來說,Samsung Galaxy 手機更可能是第一批真正體驗到這功能的裝置。
更大的挑戰,是證明這不只是 flashy demo。大多數手機 app 本來就已經設計得容易使用,而人們只要熟悉流程,也可以很快叫車、買東西或管理 booking。Gemini Intelligence 必須比自己操作更快、更安全、更穩定。否則,它就會變成另一個大家試一次,然後忘在 settings menu 裡的 AI feature。
不過,如果 Google 真的把這件事做好,Android 可能會從一台你逐個 app 控制的手機,變成更接近真正 digital assistant 的東西。不是只回答問題,而是真的替你完成那些無聊部分。這件事很大 — 但前提是這個 agent 必須先贏得信任。
來源:Engadget


