GPT-4o

**GPT-4o**
開發者	OpenAI
首次發布	2024年5月13日，2個月前
取代	GPT-4 Turbo
類型	多模態（英語：Multimodal learning）; 大型語言模型; 基於轉換器的生成式預訓練模型; 基礎模型;
許可協定	專有軟體
網站	openai.com/index/hello-gpt-4o

GPT-4o（英語：Generative Pre-trained Transformer 4 Omni）是由OpenAI訓練的多語言、多模態（多種類型資料，例如文字、圖像、音訊等）GPT大型語言模型。GPT-4o於2024年5月13日發布。 ^[1] 該模型比其前身GPT-4快兩倍，而價格僅為其50%。該模型由米拉·穆拉蒂在OpenAI直播演示中宣布。 ^[1] OpenAI聲稱該模型將對所有使用者免費，並為付費ChatGPT Plus使用者提供高達5倍的訊息上限。^[2]

背景

GPT-4o最初在LMSYS上以3個不同模型的形式暗中發布。這3個模型分別稱為gpt2-chatbot、im-a-good-gpt2-chatbot和im-also-a-good-gpt2-chatbot。2024年5月7日，薩姆·奧爾特曼透露OpenAI發布了這些神秘的新模型。^[3]

功能

GPT-4o在語音、多語言和視覺基準測試中取得了最先進的成果，在音訊語音辨識和翻譯領域創下了新紀錄。^[4] GPT-4o 在 MMLU 基準測試中的得分為 88.7，而GPT-4 的得分為86.5。^[4] ^[5]

根據該公司的演示，GPT-4o將有效地將ChatGPT轉變為可以進行即時語音對話的數位個人助理。它還能夠使用文字和「視覺」進行互動，這意味著它可以檢視使用者上傳的螢幕截圖、相片、文件或圖表，並就它們進行對話。OpenAI演示了與ChatGPT的語音對話，以獲得解決數學問題的即時說明、講述睡前故事並獲得編碼建議。^[6] 免費ChatGPT使用者將可以與新的GPT-4o模型進行有限次數的互動，然後該工具會自動恢復依賴更小的GPT-4o mini模型；付費使用者將可以使用最新GPT-4o訪問更多數量的訊息。^[6]

該模型支援超過50種語言，覆蓋超過97%的口語語言。它目前是LMSYS Elo Arena基準測試中的領先模型。^[7]

GPT-4o mini

OpenAI於2024年7月18日發布了GPT-4o mini，比起GPT-4o更小，而且價格更便宜。^[8]

根據OpenAI的說法，其低成本預計對那些希望將其整合到服務中的公司、初創企業和開發者特別有用，因為他們通常會進行大量的API呼叫。其API的費用為每百萬輸入標記15美分，每百萬輸出標記60美分，相比之下，GPT-4o分別為5美元和15美元。它的效能也比GPT-3.5更好，而且比後者便宜60%。

參見

參考資料

^ ^1.0 ^1.1 Wiggers, Kyle. OpenAI debuts GPT-4o 'omni' model now powering ChatGPT. TechCrunch. 2024-05-13 [2024-05-13]. （原始內容存檔於2024-05-22）（美國英語）.
^ Mauran, Cecily. OpenAI announces GPT-4o, a multimodal voice assistant that's free for all ChatGPT users. Mashable. 2024-05-13 [2024-05-13] （英語）.
^ Sam Altman "https://twitter.com/sama/status/1787222050589028528" Twitter, X. Retrieved 14 May 2024.
^ ^4.0 ^4.1 Hello GPT-4o. OpenAI. [2024-05-13]. （原始內容存檔於2024-05-14）.
^ OpenAI教谷歌做语音助手！新模型GPT-4o科幻级语音交互，零延迟满情绪，AI进入HER时代, 郭晓静、郝博阳腾讯科技 2024-05-13 18:15.
^ ^6.0 ^6.1 OpenAI unveils newest AI model, GPT-4o. 2024-05-13 [2024-05-13] （英語）.
^ Fedus, William. GPT-4o is our new state-of-the-art frontier model..
^ OpenAI. GPT-4o mini: advancing cost-efficient intelligence. [2024-07-21].

外部連結

[:0-1] 1.0 ^1.1 Wiggers, Kyle. OpenAI debuts GPT-4o 'omni' model now powering ChatGPT. TechCrunch. 2024-05-13 [2024-05-13]. （原始內容存檔於2024-05-22）（美國英語）.

[2] Mauran, Cecily. OpenAI announces GPT-4o, a multimodal voice assistant that's free for all ChatGPT users. Mashable. 2024-05-13 [2024-05-13] （英語）.

[3] Sam Altman "https://twitter.com/sama/status/1787222050589028528" Twitter, X. Retrieved 14 May 2024.

[:1-4] 4.0 ^4.1 Hello GPT-4o. OpenAI. [2024-05-13]. （原始內容存檔於2024-05-14）.

[5] OpenAI教谷歌做语音助手！新模型GPT-4o科幻级语音交互，零延迟满情绪，AI进入HER时代, 郭晓静、郝博阳腾讯科技 2024-05-13 18:15.

[:2-6] 6.0 ^6.1 OpenAI unveils newest AI model, GPT-4o. 2024-05-13 [2024-05-13] （英語）.

[7] Fedus, William. GPT-4o is our new state-of-the-art frontier model..

[8] OpenAI. GPT-4o mini: advancing cost-efficient intelligence. [2024-07-21].

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]