(圖/翻攝 Google 部落格)
Google 全新 AI 模型 Gemini 3 於今日正式登場!這款被強調為全球最優秀的多模態模型,不僅支援最佳的代理式 AI 功能與 Vibe Coding 能力,互動介面也更加視覺化,即日起開放 Gemini 3 Pro 使用。
Google 表示,Gemini 3 能用更少的指令提供最充足的答覆,具備先進的推理能力以識別細微差異,可以深層地理解用戶的意圖,回覆既聰明又簡潔,而且不會有陳腔濫調與過多恭維,此稍微暗諷了 ChatGPT。
請繼續往下閱讀...
此外,Gemini 3 能無縫同步處理文字、圖片、影片與程式碼等不同元素。例如想學習新主題時,只要提供 Gemini 3 一系列論文或教學影片,就能由它製作可互動的學習卡、視覺化程式碼,協助用戶深入掌握主題;甚至 AI 現在還能分析人類運動畫面,找出技巧上的改進空間並擬定訓練計劃。現在 Google 搜尋的 AI 模式也能受惠於 Gemini 3,提供沉浸式的視覺化版面以及互動式工具。
在具體效能方面,Gemini 3 Pro 在 LMArena 測試中取得 1501 分,超越原本位居第一的 Gemini 2.5 Pro(1451 分)。它具備博士級的推理能力,在未使用額外工具的情況下,於 Humanity's Last Exam 取得 37% 的成績,在 GPQA Diamond 則有 91.9% 的表現。同時,Gemini 3 推出了 Deep Think(深度思考)模式,能進一步解答複雜問題。開啟此模式後,Humanity's Last Exam 的成績提升至 41%,GPQA Diamond 則來到 93.8%。
於 Vibe coding 和代理編碼模型領域,Gemini 3 在 WebDev Arena 排行榜以 1487 ELO 分數奪冠,且評估編碼代理能力的 SWE-bench Verified 測試裡,Gemini 3 也用 76.2% 大幅超越 2.5 Pro。
它在 WebDev Arena 排行榜上以 1487 ELO 的驚人高分奪冠。在測試模型透過終端機操作電腦能力的 Terminal-Bench 2.0 中,它獲得了 54.2% 的分數;在衡量編碼代理能力的 SWE-bench Verified 中,它更以 76.2% 大幅超越 2.5 Pro。
此外,Google 更推出了 Google Antigravity 代理式 AI 開發平台,允許開發者運用 Gemini 3 將現有工具轉化為更主動的夥伴,不再僅是被動接受指令,而是能與使用者協作進行軟體設計與測試。
即日起,一般大眾能在 Gemini App 裡啟用 Gemini 3 模型,美國訂閱用戶則可在 Google 搜尋的 AI 模式中使用。
標題:Google 最新 Gemini 3 模型正式推出!即日起開放使用
地址:https://www.twetclubs.com/post/124142.html