頂[0] 分享評論[0] 編輯

GPT·5

GPT-5是AI初創(chuàng)公司OpenAI開發(fā)的一款大型語言模型，作為GPT-4的迭代產(chǎn)品，它在多個領(lǐng)域展現(xiàn)出了卓越的性能，標(biāo)志著AI進(jìn)化進(jìn)入了一個新的戰(zhàn)略階段。

基本信息編輯本段

類別	詳情
開發(fā)公司	OpenAI
代號	Orion
產(chǎn)品類型	大型語言模型、“用于使用語言模型的可下載計算機軟件”
模型系列	GPT-5系列，包含GPT-5、GPT-5mini、GPT-5nano以及GPT-5 - Codex四款模型
上下文長度	均為400K
最大輸出	128K tokens
發(fā)布時間	當(dāng)?shù)貢r間2025年8月7日（北京時間8月8日凌晨1時）

模型介紹編輯本段

GPT-5是OpenAI首次將o系列模型的推理能力與GPT系列模型的快速響應(yīng)能力相結(jié)合的產(chǎn)物。它是一個集成模型（integrated model），融合了大語言模型GPT系列和推理模型o系列，并非單一的語言或者推理模型，而是具備調(diào)度子模型的能力。首次使用了內(nèi)嵌式三位一體集成架構(gòu)，系統(tǒng)由三部分組成：

GPT-5 - main模型：處理常規(guī)問題。

GPT-5 - thinking深度思考模型：解決復(fù)雜任務(wù)。

實時決策的路由機制：根據(jù)對話類型、復(fù)雜程度、工具需求以及用戶的明確意圖，快速決定使用哪個模型，自主決定是否進(jìn)入深度思考模式，自動匹配最適合的模型。此外，還有額度使用完后啟動的mini版本。

其用途廣泛，涵蓋了可下載與語言模型相關(guān)的計算機程序和軟件，能生成人類語音和文本，處理、生成、理解和分析自然語言。其他功能還包括基于機器學(xué)習(xí)的語言和語音處理、文本/語音的翻譯、共享用于機器學(xué)習(xí)和預(yù)測分析的數(shù)據(jù)集、將音頻數(shù)據(jù)文件轉(zhuǎn)換為文本等。OpenAI還打算提供軟件即服務(wù)（SaaS）功能，并開發(fā)和實現(xiàn)人工神經(jīng)網(wǎng)絡(luò)。

發(fā)展歷程編輯本段

早期階段

2023月18日，OpenAI向商標(biāo)局（USPTO）提交了“GPT - 5”商標(biāo)申請，在申請中將其描述為“用于使用語言模型的可下載計算機軟件”，并概述了其用途，與上述模型介紹中的功能相符。

2024年1月，OpenAI首席執(zhí)行官山姆·奧特曼（Sam Altman）接受媒體采訪時表示，推出可能被稱為GPT - 5的新模型是他的首要任務(wù)，并稱GPT - 5“將能夠比現(xiàn)有模型做更多的事情”。

測試階段

2023年9月，OpenAI官宣招募一批紅隊測試人員（Red Teaming Network），邀請不同領(lǐng)域?qū)＜以u估模型。紅隊測試是一種安全測試方法，目的是通過模擬真實世界中的攻擊，來評估和提升系統(tǒng)或網(wǎng)絡(luò)的安全性。

2024年4月，有網(wǎng)友透露GPT - 5正在進(jìn)行紅隊測試，隨后HACKIT AI社區(qū)創(chuàng)始人、網(wǎng)絡(luò)安全架構(gòu)師Yuval曬出OpenAI發(fā)給自己的紅隊邀請郵件。

截至2024年12月，OpenAI已經(jīng)完成了至少兩次大型訓(xùn)練運行，目的是通過對大量數(shù)據(jù)的訓(xùn)練來改進(jìn)模型。最初訓(xùn)練運行比預(yù)期慢，了解該項目的人士指出，Orion目前充其量只比OpenAI的公開模型要好一些，距離“重大飛躍”還很遙遠(yuǎn)，且該模型為期六個月的訓(xùn)練僅在計算成本方面就花費了約5億美元。同時，相關(guān)媒體報道稱GPT - 5的研發(fā)進(jìn)程落后于預(yù)期，因其研發(fā)測試成本巨大，產(chǎn)品效果不理想，預(yù)計不會在2024年發(fā)布。

2025年2月13日，OpenAI首席執(zhí)行官薩姆·奧爾特曼宣布，OpenAI將在未來幾個月內(nèi)推出名為GPT - 5的模型，并公布了GPT - 5模型的發(fā)展路線圖。該模型將整合OpenAI的大量技術(shù)，包括o3，并應(yīng)用于聊天機器人ChatGPT以及API平臺，不再計劃將o3作為獨立模型發(fā)布。免費版ChatGPT能在標(biāo)準(zhǔn)智能設(shè)置下無限制地使用GPT - 5進(jìn)行對話。

2025年3月，薩姆·奧爾特曼稱，DeepSeek的迅速崛起給OpenAI帶來了深刻的教訓(xùn)。當(dāng)OpenAI隱藏“思維鏈”（Chain of Thought）功能時，給了競爭對手可乘之機，DeepSeek憑借這一功能實現(xiàn)了病毒式傳播，這讓OpenAI意識到免費層策略的重要性，并促使其重新審視自身的產(chǎn)品布局。

GPT·5" href="uploads/202511/1763002295nCtFKpv3.jpg" target="_blank"> GPT·5

GPT·5

2025年4月，薩姆·奧爾特曼對外透露了公司發(fā)布計劃的重大轉(zhuǎn)變，宣布在備受期待的GPT - 5發(fā)布之前將推出兩個中級大模型。

2025年5月，GPT - 4.1核心研究員Michelle Pokrass透露，構(gòu)建GPT - 5的挑戰(zhàn)在于在推理和聊天之間找到適當(dāng)?shù)钠胶狻?/p>

2025年6月，在墨西哥舉辦的AI Summit峰會上，兩名OpenAI公司代表透露，公司正在開發(fā)下一代基礎(chǔ)模型GPT - 5，并計劃通過該模型與競爭對手展開更激烈角逐，明確表示GPT - 5即將面世，且性能將遠(yuǎn)超GPT - 4等現(xiàn)有模型。

2025年7月，IT之家消息稱，GPT - 5有望在未來幾天或幾周內(nèi)正式亮相。有跡象表明，OpenAI正在測試一個代號為gpt - 5 - reasoning - alpha - 2025 - 07 - 13的新模型，該模型已于7月13日定稿，當(dāng)前正處于最終測試階段。同月，薩姆·奧爾特曼在社交平臺上確認(rèn)，OpenAI準(zhǔn)備在8月初正式推出GPT - 并透露新版本將包括mini和nano等多個規(guī)模不同的型號，并通過API向外部開發(fā)者和企業(yè)開放使用。GPT - 5被設(shè)計為一個高度集成的技術(shù)系統(tǒng)，旨在融合o系列與GPT系列模型的功能，打造一個能夠調(diào)用全部工具并勝任多樣化任務(wù)的統(tǒng)一平臺，這一版本被視為推動語言模型與高級推理能力深度融合的關(guān)鍵進(jìn)展。

正式發(fā)布

當(dāng)?shù)貢r間2025年8月7日（北京時間8月8日凌晨1時），OpenAI舉行時長超1小時的線上發(fā)布會，正式推出GPT - 5人工智能模型。GPT - 5面向所有免費用戶及眾多付費ChatGPT訂閱用戶開放，付費用戶擁有更高的使用限額，付費用戶（Plus、Pro、Team）可獲得更高使用額度或無限使用。微軟同步宣布將該模型整合至Copilot、Microsoft 365 Copilot、Azure AI Foundry和GitHub Copilot等平臺，標(biāo)志著GPT - 5全面登陸微軟生態(tài)系統(tǒng)。當(dāng)?shù)貢r間9月15日，OpenAI發(fā)布了GPT - 5 - Codex模型，這是一個專門為Agent編程優(yōu)化的模型，同步在Codex CLI、IDE擴展、網(wǎng)頁端、移動端以及GitHub代碼審查中可用。

功能特點編輯本段

性能卓越

截至2025年8月8日，在大模型競技場LMArena上，剛剛上線的GPT - 5憑借著極強的性能在所有細(xì)分類目中都位列第一。

編碼能力突出

GPT - 5是OpenAI迄今為止最強大的編碼模型，在復(fù)雜的前端生成和大型代碼庫調(diào)試方面表現(xiàn)突出，能夠僅憑一個提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站、應(yīng)用程序App和游戲。早期測試者注意到其在間距、排版和留白等設(shè)計選擇方面的改進(jìn)。在從GitHub獲取現(xiàn)實世界編碼任務(wù)的基準(zhǔn)測試SWE - bench Verified中，GPT - 5思考后首次嘗試的準(zhǔn)確率達(dá)74.9%，高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。例如，OpenAI的研究者演示要求GPT - 5創(chuàng)建一款網(wǎng)頁App，幫助說英語的用戶學(xué)習(xí)法語，且該App必須有一個引人入勝的主題，包含抽認(rèn)卡、測驗、經(jīng)典的貪吃蛇游戲，以及追蹤每日學(xué)習(xí)進(jìn)度的方法。研究者將相同的提示詞提交到兩個GPT - 5窗口中，幾分鐘后生成了兩個不同的App，雖然OpenAI的負(fù)責(zé)人稱這些App“存在一些缺陷”，但用戶可以根據(jù)個人喜好再調(diào)整AI生成的軟件，如更改背景或添加更多標(biāo)簽頁。

幻覺大幅降低

GPT - 5的“幻覺”問題大幅改善，在HealthBench Hard Hallucinations測試中錯誤信息率僅為1.6%，遠(yuǎn)低于GPT - 4o的15.8%。OpenAI為GPT - 5引入了新的安全訓(xùn)練模式“安全補全”，旨在讓模型在安全范圍內(nèi)提供最有幫助的答案。與GPT - 4o相比，GPT - 5的事實錯誤率降低了45%；在深度思考模式下，事實錯誤率更是比o3大幅下降80%，變得更加準(zhǔn)確可靠。在開放性事實準(zhǔn)確性基準(zhǔn)LongFact和FActScore測試中，GPT - 5的幻覺率比o3減少大約六倍，長篇內(nèi)容生成的準(zhǔn)確性顯著提升。

創(chuàng)意寫作出色

GPT - 5能夠處理結(jié)構(gòu)復(fù)雜的寫作任務(wù)，如無韻律的抑揚格五音步詩或自然流動的自由詩，猶如詩人。OpenAI的ChatGPT業(yè)務(wù)副總Nick Turley表示，GPT - 5在創(chuàng)意任務(wù)上表現(xiàn)出“更好的品味”，響應(yīng)更自然。

健康咨詢實用

GPT - 5能更積極地標(biāo)記潛在健康問題，幫助用戶解析醫(yī)療結(jié)果，但OpenAI強調(diào)，ChatGPT不能替代醫(yī)療專業(yè)人員。在名為HealthBench Hard Hallucinations的測試中，具備思考能力的GPT - 5出現(xiàn)幻覺的錯誤信息率僅為1.6%，遠(yuǎn)低于GPT - 4o和o3模型，后兩者的錯誤信息率分別為15.8%和12.9%。

記憶功能增強

ChatGPT的記憶（Memory）功能現(xiàn)在支持Pro、Plus以及Teams訂閱用戶連接ChatGPT至谷歌賬號，訪問日歷內(nèi)容。這意味著ChatGPT可以聯(lián)動Gmail和Google Calendar，從而讓GPT - 5根據(jù)用戶日常行程，獲取更多情境能力。ChatGPT甚至可以提醒用戶回復(fù)其收到的電子郵件，閱讀但尚未回復(fù)的電子郵件。這一功能將首先向Pro用戶推出，后續(xù)擴展到Plus和Teams訂閱用戶。

安全補全機制

GPT - 5引入了一種新的安全訓(xùn)練形式，名為安全補全（safe completions），它教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。有時，這可能意味著部分回答用戶的問題，或者只提供高水平的回答。如果需要拒絕，經(jīng)過訓(xùn)練的GPT - 5會以透明的方式告知用戶拒絕的原因，并提供安全的替代方案。在受控的實驗和OpenAI的生產(chǎn)模型中，OpenAI都發(fā)現(xiàn)這種安全補全的方法更加細(xì)致入微，能夠更好地引導(dǎo)雙重用途問題，增強對模糊意圖的魯棒性，并減少不必要的過度拒絕。

預(yù)設(shè)性格功能

OpenAI為所有ChatGPT用戶推出四種預(yù)設(shè)性格的全新研究預(yù)覽版。初始的四種性格選項——憤世嫉俗者（Cynic）、機器人（Robot）、傾聽者（Listener）和書呆子（Nerd）都是可選的，用戶可在設(shè)置中隨時調(diào)整，用以匹配ChatGPT和用戶的溝通風(fēng)格。上述四種性格最初適用于文本聊天，之后將擴展到語音聊天，讓用戶無需編寫自定義提示詞即可設(shè)置ChatGPT的交互方式，無論是簡潔專業(yè)的、周到支持的，還是略帶諷刺的。

社會評價編輯本段

薩姆·奧爾特曼在發(fā)布會上稱，如果說GPT - 4是一個大學(xué)生，那么GPT - 5就是“真正的專家”。

GPT·5

基本信息編輯本段

模型介紹編輯本段

發(fā)展歷程編輯本段

早期階段

測試階段

正式發(fā)布

功能特點編輯本段

性能卓越

編碼能力突出

幻覺大幅降低

創(chuàng)意寫作出色

健康咨詢實用

記憶功能增強

安全補全機制

預(yù)設(shè)性格功能

社會評價編輯本段

相關(guān)事件編輯本段

撤銷權(quán)限風(fēng)波

發(fā)布會現(xiàn)場BUG事件

連破“百年懸案”

附件列表

標(biāo)簽

同義詞

GPT·5

基本信息 編輯本段

模型介紹 編輯本段

發(fā)展歷程 編輯本段

早期階段

測試階段

正式發(fā)布

功能特點 編輯本段

性能卓越

編碼能力突出

幻覺大幅降低

創(chuàng)意寫作出色

健康咨詢實用

記憶功能增強

安全補全機制

預(yù)設(shè)性格功能

社會評價 編輯本段

相關(guān)事件 編輯本段

撤銷權(quán)限風(fēng)波

發(fā)布會現(xiàn)場BUG事件

連破“百年懸案”

附件列表

標(biāo)簽

同義詞

基本信息編輯本段

模型介紹編輯本段

發(fā)展歷程編輯本段

功能特點編輯本段

社會評價編輯本段

相關(guān)事件編輯本段