(圖/路透社)
現在人碰到問題,第一直覺反應就是問 AI!但是到底哪一個 AI 工具才最準確?或許每個人都有不一樣的感受,對此英國消費者組織就聯合專家,針對六組常見的 AI 工具進行實測,結果 Gemini、ChatGPT 都無法獲得最高分。
《Which?》針對 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜尋的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六個工具進行測試,每個 AI 會被詢問包含個人理財、法律、健康與飲食、消費者權益及旅遊等不同面向、共 40 個問題,再由專家確認準確度、清晰度、實用性、倫理責任等指標,進而給出整體評分,結果如下(分數越高越好):
請繼續往下閱讀...
1.Perplexity:71%
2.Gemini AIO:70%
3.Gemini 69%
4.Copilot:68%
5.ChatGPT:64%
6.Meta AI:55%
調查發現,AI 給予的答案存在許多隱憂,例如許多來源引用 Reddit 論壇或未知網站,並非來自權威內容,甚至有的 AI 會提供錯誤的理財、醫療資訊。當旅遊碰到意外時,它甚至可能誤導取消機票可以全額退費,或是對於票務規則本身就有錯誤理解,在法律上的專業度也明顯不足,沒有提醒消費者應該徵詢專業的法律建議。
《Which?》科技專家 Andrew Laughlin 指出:「我們的研究發現,AI 有太多令人不安且不準確的誤導性陳述,尤其是在碰到財務、法律諮詢等重要議題時。」他警告用戶,使用 AI 務必明確定義問題,並且仍要檢查資訊來源,對於醫療、財務等複雜議題,一定要尋求專業諮詢後,再做出重大決定。
標題:專家實測 6 大 AI 工具可靠度排行榜!ChatGPT、Gemini 都被它擊敗
地址:https://www.twetclubs.com/post/125405.html