政策相關

OpenAI 推出 o3 與 o4-mini:最聰明的 ChatGPT 模型登場,「圖像推理」成新突破

By admin 2025-04-17 03:05
OpenAI 推出 o3 與 o4-mini:最聰明的 ChatGPT 模型登場,「圖像推理」成新突破

OpenAI 宣布推出兩款 ChatGPT 新模型:o3o4-mini,OpenAI 表示這兩者不僅是目前最聰明、最有能力的模型,還加入了前所未有的功能:能真正「思考」圖像,不只看圖,更能將圖像納入推理過程中。

這兩款模型已開放給 ChatGPT Plus、Pro 與 Team 方案用戶,並將在一週內提供給 ChatGPT Enterprise 和 Edu 用戶。同時,開發者現在也可透過 Chat Completions API 和 Responses API 使用這兩款新模型。

Table of Contents

Toggle

o3:全能型選手,推理與視覺理解全面升級

OpenAI 表示,o3 模型在多個領域表現出色,特別是在程式編寫、數學運算、科學推理與視覺理解等任務上設定了新的標準。這款模型也支援多種內建工具的整合使用,包括:

廣告 - 內文未完請往下捲動
  • 網路搜尋

  • Python 運算工具

  • 圖像分析與產生

  • 檔案解析功能

這代表用戶現在不僅能問問題,還能讓 AI 實際動手幫忙分析數據、看圖解釋、甚至自動生成圖片或程式碼。

o4-mini:高效率推理機器,適合大量查詢需求

與 o3 相比,o4-mini 更專注於成本與速度的優化。雖然模型較小,但它的推理能力仍然非常出色,特別適合需要高頻率、高吞吐量的應用場景。

OpenAI 表示,如果你需要一天問上百個問題,o4-mini 絕對是你的最佳選擇。而且因為效能出色、運算成本低,用戶可以享有更高的使用額度。

思考圖像的新能力:從看圖到「用圖思考」

兩款模型最大的亮點之一,是首次具備了「圖像推理」(Thinking with images)的能力。

傳統的 AI 模型只能看到圖片,現在的 o3 與 o4-mini 則可以將圖片納入整個推理過程。這意味著,如果你傳了一張圖片給模型,它不只是告訴你圖片裡是什麼,而是會把那張圖片視為一個推理線索,與文字資料一起分析、整合,進行更深入的回答。

這項突破對教育、醫療、設計與工程等領域來說,都是一大福音。

要求 GPT 推理圖片中倒置的筆記中寫什麼
可要求 ChatGPT 對於照片中的港口船隻進行辨識,並推理出相關資訊

新版模型已上線,ChatGPT 用戶可立即體驗

從即日起,ChatGPT Plus、Pro、Team 的用戶會在模型選擇器中看到:

  • o3

  • o4-mini

  • o4-mini-high

它們將取代舊有的 o1、o3-mini 以及 o3-mini-high。Pro 用戶雖然目前還可以選擇 o1-pro 模型,但 OpenAI 表示,將在接下來幾週推出 o3-pro,屆時會提供完整的工具支援功能。

開發者工具同步升級,Responses API 增強推理能力

除了 ChatGPT 用戶之外,開發者現在也能使用 o3 與 o4-mini,透過 Chat Completions API 與新升級的 Responses API。

Responses API 新增多項功能,包括:

  • 推理摘要(reasoning summaries)

  • 支援保留推理過程的 token(提高性能)

  • 即將支援內建工具如網路搜尋、檔案搜尋與程式碼解譯器

這使得開發者可以打造更智慧、更具推理能力的應用程式。

隨著 o3 和 o4-mini 的推出,OpenAI 再次提升了 AI 模型的天花板。不僅推理能力全面升級,還加入了真正懂「看圖思考」的能力。無論你是開發者、商業用戶還是好奇心旺盛的日常用戶,這兩款模型都提供了更多選擇與可能。

 

風險提示

加密貨幣投資具有高度風險,其價格可能波動劇烈,您可能損失全部本金。請謹慎評估風險。

o3o4-miniOpenAIThinking with images

衍伸閱讀

  • OpenAI 搶開社群平台?對上馬斯克 xAI,社群數據成AI模型黃金燃料
  • OpenAI 400 億鎂募資案拍板!估值飆升 3,000 億鎂,軟銀與微軟領投

標題:

地址:https://www.pressbased.com/post/12471.html