Markets.com Logo

OpenAI 發布開源 AI 模型 GPT-oss:邁向透明化與競爭的一步

5 min read

OpenAI 攜 GPT-oss 發布重返開源懷抱

OpenAI 週二宣布發布兩款開源 AI 模型,這是一個令人驚訝的舉動,使該公司重返其早期根源。 這兩款新模型 GPT-oss-120b 和 GPT-oss-20b 旨在通過 Hugging Face 平台免費提供,並且據稱在開放基準評估中實現了最先進的性能。

此公告代表 OpenAI 的重大轉變,近年來,OpenAI 逐漸遠離開源,轉而專注於封閉的商業模型。 GPT-oss 的發布旨在為開發人員和研究人員提供強大的開源替代方案,同時促進 AI 領域的透明度和協作。

GPT-oss 模型的規格和功能

GPT-oss-120b 模型的特點是容量大,因為它可以在單個 Nvidia GPU 上運行。 較小的 GPT-oss-20b 模型可以在具有 16 GB RAM 的消費級筆記型電腦上運行。 需求的這種多樣性允許廣泛的用戶訪問和使用這些模型。

根據 OpenAI 的說法,GPT-oss 模型可用於將複雜的指令發送到雲端 AI 模型以供執行。 在 GPT-oss 無法處理某些任務(例如圖像處理)的情況下,開發人員可以將其連接到 OpenAI 更強大的封閉源模型。

OpenAI 為什麼要重返開源?

此公告發布之際,OpenAI 正面臨來自中國 AI 實驗室(如 DeepSeek、阿里巴巴的通義(Qwen)和 Moonshot AI)日益激烈的競爭,這些實驗室發布了多個世界領先的開源模型。 此外,OpenAI 正面臨來自美國政府的壓力,要求增加開源共享,以促進反映美國價值的 AI 技術。

通過發布 GPT-oss,OpenAI 旨在獲得開發人員社區和政策制定者的支持。 OpenAI 首席執行官 Sam Altman 表示,OpenAI 的使命是確保通用人工智能 (AGI) 造福全人類,並且他們很高興看到基於美國和民主基礎的開源 AI 技術的發展。

模型性能與限制

GPT-oss 模型在性能測試中取得了可喜的成果,在編程比賽中優於其他開源模型,例如 DeepSeek R1。 但是,在某些任務中,它們仍然落後於 OpenAI 的封閉源模型,例如 o3 和 o4-mini。

一個需要考慮的重要方面是,GPT-oss 模型比最新的 OpenAI 模型具有更高的“幻覺”率。 這表明開源模型可能更容易產生不準確或不正確的信息。

培訓與許可

GPT-oss 模型是使用與 OpenAI 封閉源模型中使用的過程類似的過程進行訓練的。 這些模型基於“專家混合”(MoE)架構,該架構通過在任何給定時間僅激活一部分參數來提高運行效率。 GPT-oss-120b 和 GPT-oss-20b 是在 Apache 2.0 許可下發布的,這是一種寬鬆的開源許可,允許公司在商業應用程序中使用這些模型,而無需獲得許可或支付費用。

總之,OpenAI 發布 GPT-oss 代表了朝著提高 AI 領域透明度和協作邁出的重要一步。 雖然存在一些限制,但這些開源模型為開發人員和研究人員提供了強大的工具來探索和開發新的 AI 技術。了解封閉和開源開發之間的細微差別可以讓研究人員更好地利用 AI 模型。評估每個決策的風險和回報非常重要。


風險警告:本文僅代表作者個人觀點並僅供參考。本內容不構成投資建議或財務指導,也不代表 Markets.com 平台的立場。在進行股票、指數、外匯及商品的交易或價格預測時,請務必留意:差價合約(CFD)交易具有高度風險,可能導致資本虧損。過去的表現並不代表任何未來結果。此資訊此資訊僅供參考之用,並不構成也不應構成投資建議。所有英國散戶投資人皆被限制進行加密貨幣差價合約(CFD)與點差交易。

相關文章