OpenAI 推出 o3 與 o4-mini:最聰明的 ChatGPT 模型登場,「圖像推理」成新突破

OpenAI 宣布推出兩款 ChatGPT 新模型:o3 和 o4-mini,OpenAI 表示這兩者不僅是目前最聰明、最有能力的模型,還加入了前所未有的功能:能真正「思考」圖像,不只看圖,更能將圖像納入推理過程中。
這兩款模型已開放給 ChatGPT Plus、Pro 與 Team 方案用戶,並將在一週內提供給 ChatGPT Enterprise 和 Edu 用戶。同時,開發者現在也可透過 Chat Completions API 和 Responses API 使用這兩款新模型。
Table of Contents
Toggleo3:全能型選手,推理與視覺理解全面升級
OpenAI 表示,o3 模型在多個領域表現出色,特別是在程式編寫、數學運算、科學推理與視覺理解等任務上設定了新的標準。這款模型也支援多種內建工具的整合使用,包括:
廣告 - 內文未完請往下捲動
-
網路搜尋
-
Python 運算工具
-
圖像分析與產生
-
檔案解析功能
這代表用戶現在不僅能問問題,還能讓 AI 實際動手幫忙分析數據、看圖解釋、甚至自動生成圖片或程式碼。
o4-mini:高效率推理機器,適合大量查詢需求
與 o3 相比,o4-mini 更專注於成本與速度的優化。雖然模型較小,但它的推理能力仍然非常出色,特別適合需要高頻率、高吞吐量的應用場景。
OpenAI 表示,如果你需要一天問上百個問題,o4-mini 絕對是你的最佳選擇。而且因為效能出色、運算成本低,用戶可以享有更高的使用額度。
思考圖像的新能力:從看圖到「用圖思考」
兩款模型最大的亮點之一,是首次具備了「圖像推理」(Thinking with images)的能力。
傳統的 AI 模型只能看到圖片,現在的 o3 與 o4-mini 則可以將圖片納入整個推理過程。這意味著,如果你傳了一張圖片給模型,它不只是告訴你圖片裡是什麼,而是會把那張圖片視為一個推理線索,與文字資料一起分析、整合,進行更深入的回答。
這項突破對教育、醫療、設計與工程等領域來說,都是一大福音。
新版模型已上線,ChatGPT 用戶可立即體驗
從即日起,ChatGPT Plus、Pro、Team 的用戶會在模型選擇器中看到:
-
o3
-
o4-mini
-
o4-mini-high
它們將取代舊有的 o1、o3-mini 以及 o3-mini-high。Pro 用戶雖然目前還可以選擇 o1-pro 模型,但 OpenAI 表示,將在接下來幾週推出 o3-pro,屆時會提供完整的工具支援功能。
開發者工具同步升級,Responses API 增強推理能力
除了 ChatGPT 用戶之外,開發者現在也能使用 o3 與 o4-mini,透過 Chat Completions API 與新升級的 Responses API。
Responses API 新增多項功能,包括:
-
推理摘要(reasoning summaries)
-
支援保留推理過程的 token(提高性能)
-
即將支援內建工具如網路搜尋、檔案搜尋與程式碼解譯器
這使得開發者可以打造更智慧、更具推理能力的應用程式。
隨著 o3 和 o4-mini 的推出,OpenAI 再次提升了 AI 模型的天花板。不僅推理能力全面升級,還加入了真正懂「看圖思考」的能力。無論你是開發者、商業用戶還是好奇心旺盛的日常用戶,這兩款模型都提供了更多選擇與可能。
風險提示
加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。
o3o4-miniOpenAIThinking with images衍伸閱讀
- OpenAI 搶開社群平台?對上馬斯克 xAI,社群數據成AI模型黃金燃料
- OpenAI 400 億鎂募資案拍板!估值飆升 3,000 億鎂,軟銀與微軟領投
標題:
地址:https://www.pressbased.com/post/12471.html