踏入 12 月有大量 AI 產品更新,繼 AWS 和 OpenAI 之後,Google 突然發表 Gemini 2.0 Flash。根據官方的資料,新模型是 1.5 Flash 的升級版本,整體表現卻比 1.5 Pro 版本更強勁,而且回應速度倍增。Google 還公布新項目 Project Mariner,跟上微軟、OpenAI 趨勢將 AI 從只有對答的「口腔期」走向行動代理。
根據 Google 的命名系統,Flash 模型屬輕量版,Pro 為專業版。不過官方公布的數據,Gemini 2.0 Flash 的整體評分均完勝 1.5 Pro,只有處理長文字和翻譯語音不敵。
![](https://storage.googleapis.com/gweb-uniblog-publish-prod/original_images/gemini_benchmarks_narrow_light2x.gif)
Google 目前先以實驗模型方式在 Google AI Studio 和 Vertex AI 提供 Gemini 2.0 Flash 有限度預覽,明年才陸續推出不同版本模型。
在今年 I/O 大會發表的 Project Astra,新版本將會用上 Gemini 2.0,唯仍然只限開放給小數可信的開發人員試用。Project Astra 為 AI 助理,運用模型的多重模態能力,能理解現實環境情況,包括文字、語音、動態影像等。加入 Gemini 2.0 的 Project Astra 有幾項升級能力:
- 對話:同時支援多種語言,甚至混合語言對話、理解口音和不常用的詞彙;
- 新工具:可以使用搜尋、Lens、地圖等,理解周遭環境;
- 記憶力:將 Project Astra 記憶時間加長至 10 分鐘,記住內容提供個人化功能;
- 時延:新模型近乎實時理解語音,Project Astra 能做到接近人類的對話反應。
Project Mariner 開啟 Google的 AI 代理
Google 又發表新項目 Project Mariner,展示 Gemini 2.0 當 AI 代理的能力。Project Mariner 是瀏覽器上的 AI 代理,能理解用戶正在瀏覽網站的內容,包括文字、程式碼、圖像、表格等元件。
根據示範,在試算表內有幾間公司名字,在側欄叫出 Project Mariner,吩咐從網站找出這些公司的電郵聯絡方法。然後 AI 代理自動執行一連串動作,如開啟 Google 搜尋、找出資訊、點擊進入官網瀏覽,隨即得出結果向用戶匯報。用戶都能監察整個過程。
Project Mariner 在評估 AI 在現實世界網頁工作的基準測試 WebVoyager 獲得 83.5%。Google 稱是領先業界的成果,只是執行速度較慢和偶爾不準確,不過技術改進會解決。目前 Project Mariner 以 Chrome 擴充功能方式,有限度向可信測試人員提供。
另外 Google 還公布幾個 AI 代理試驗項目,包括程式碼代理 Jules、打機代理 Genie 2,展示 Gemini 2.0 在可行性。