OpenAI推出全新gpt-oss開源語言模型。(圖/路透社)
自2019年的GPT-2以來,OpenAI時隔6年再推出新的開放權重模型,包括兩款全新語言模型gpt-oss-120b與gpt-oss-20b,回應「讓人工智慧成果造福全人類」的初衷。
所謂「開放權重」,意味模型的訓練權重參數對外公開,可供任何人使用,讓使用者得以省去自行訓練模型所需的大量資料與運算成本,快速獲得模型能力。不過gpt-oss並未公開其訓練資料與訓練程式碼。
請繼續往下閱讀...
根據OpenAI說法,gpt-oss整體訓練成本低於50萬美元(約新台幣1,600萬元),希望透過這兩款模型降低進入門檻,讓更多開發者能參與前沿AI應用開發。外界普遍認爲,OpenAI此舉是為了跟DeepSeek、阿裏巴巴等中國公司競爭。
兩款模型分別對應不同使用需求,規模較大的gpt-oss-120b,擁有1,170億個參數,只需要一張NVIDIA顯示卡即可執行;較輕量的gpt-oss-20b,可在一般配備16GB記憶體的筆電上運作。
在多項常見基準測試中,gpt-oss-120b與o4-mini表現相當,gpt-oss-20b則接近o3-mini,甚至在健康、數學等專業領域測試中,超越了多款商用模型。不過值得注意的是,gpt-oss-120b和gpt-oss-20b在答題時出現「幻覺」的比例較高。
標題:OpenAI又有大動作!全新開源gpt-oss模型來了、效能直逼o4-mini
地址:https://www.twetclubs.com/post/112529.html