天天干人人-欧美福利视频一区二区-日韩精品欧美激情-国产伦理吴梦梦伦理-欧美日韩亚洲二区-99热成人-在线免费av网址-欧美体内谢she精2性欧美-国产7777777-午夜伦理一区二区-色拍拍视频-成人免费毛片网站-一本色道久久综合亚洲二区三区-你懂的国产视频-男人天堂va-国产精品自产拍在线观看55亚洲-国产91热爆ts人妖在线

知名百科  > 所屬分類  >  科技百科   

GPT·5

GPT-5是AI初創(chuàng)公司OpenAI開發(fā)的一款大型語言模型,作為GPT-4的迭代產(chǎn)品,它在多個領(lǐng)域展現(xiàn)出了卓越的性能,標(biāo)志著AI進(jìn)化進(jìn)入了一個新的戰(zhàn)略階段。

目錄

基本信息 編輯本段

類別詳情
開發(fā)公司OpenAI
代號Orion
產(chǎn)品類型大型語言模型、“用于使用語言模型的可下載計算機軟件
模型系列GPT-5系列,包含GPT-5、GPT-5mini、GPT-5nano以及GPT-5 - Codex四款模型
上下文長度均為400K
最大輸出128K tokens
發(fā)布時間當(dāng)?shù)貢r間2025年8月7日(北京時間8月8日凌晨1時)

模型介紹 編輯本段

GPT-5是OpenAI首次將o系列模型的推理能力與GPT系列模型的快速響應(yīng)能力相結(jié)合的產(chǎn)物。它是一個集成模型(integrated model),融合了大語言模型GPT系列和推理模型o系列,并非單一的語言或者推理模型,而是具備調(diào)度子模型的能力。首次使用了內(nèi)嵌式三位一體集成架構(gòu),系統(tǒng)由三部分組成:

GPT-5 - main模型:處理常規(guī)問題。

GPT-5 - thinking深度思考模型:解決復(fù)雜任務(wù)。

實時決策的路由機制:根據(jù)對話類型、復(fù)雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個模型,自主決定是否進(jìn)入深度思考模式,自動匹配最適合的模型。此外,還有額度使用完后啟動的mini版本。

其用途廣泛,涵蓋了可下載與語言模型相關(guān)的計算機程序和軟件,能生成人類語音和文本,處理、生成、理解和分析自然語言。其他功能還包括基于機器學(xué)習(xí)的語言和語音處理、文本/語音的翻譯、共享用于機器學(xué)習(xí)和預(yù)測分析的數(shù)據(jù)集、將音頻數(shù)據(jù)文件轉(zhuǎn)換為文本等。OpenAI還打算提供軟件即服務(wù)(SaaS)功能,并開發(fā)和實現(xiàn)人工神經(jīng)網(wǎng)絡(luò)。

發(fā)展歷程 編輯本段

早期階段

2023月18日,OpenAI向商標(biāo)局(USPTO)提交了“GPT - 5”商標(biāo)申請,在申請中將其描述為“用于使用語言模型的可下載計算機軟件”,并概述了其用途,與上述模型介紹中的功能相符。

2024年1月,OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)接受媒體采訪時表示,推出可能被稱為GPT - 5的新模型是他的首要任務(wù),并稱GPT - 5“將能夠比現(xiàn)有模型做更多的事情”。

測試階段

2023年9月,OpenAI官宣招募一批紅隊測試人員(Red Teaming Network),邀請不同領(lǐng)域?qū)<以u估模型。紅隊測試是一種安全測試方法,目的是通過模擬真實世界中的攻擊,來評估和提升系統(tǒng)或網(wǎng)絡(luò)的安全性。

2024年4月,有網(wǎng)友透露GPT - 5正在進(jìn)行紅隊測試,隨后HACKIT AI社區(qū)創(chuàng)始人、網(wǎng)絡(luò)安全架構(gòu)師Yuval曬出OpenAI發(fā)給自己的紅隊邀請郵件。

截至2024年12月,OpenAI已經(jīng)完成了至少兩次大型訓(xùn)練運行,目的是通過對大量數(shù)據(jù)的訓(xùn)練來改進(jìn)模型。最初訓(xùn)練運行比預(yù)期慢,了解該項目的人士指出,Orion目前充其量只比OpenAI的公開模型要好一些,距離“重大飛躍”還很遙遠(yuǎn),且該模型為期六個月的訓(xùn)練僅在計算成本方面就花費了約5億美元。同時,相關(guān)媒體報道稱GPT - 5的研發(fā)進(jìn)程落后于預(yù)期,因其研發(fā)測試成本巨大,產(chǎn)品效果不理想,預(yù)計不會在2024年發(fā)布。

2025年2月13日,OpenAI首席執(zhí)行官薩姆·奧爾特曼宣布,OpenAI將在未來幾個月內(nèi)推出名為GPT - 5的模型,并公布了GPT - 5模型的發(fā)展路線圖。該模型將整合OpenAI的大量技術(shù),包括o3,并應(yīng)用于聊天機器人ChatGPT以及API平臺,不再計劃將o3作為獨立模型發(fā)布。免費版ChatGPT能在標(biāo)準(zhǔn)智能設(shè)置下無限制地使用GPT - 5進(jìn)行對話。

2025年3月,薩姆·奧爾特曼稱,DeepSeek的迅速崛起給OpenAI帶來了深刻的教訓(xùn)。當(dāng)OpenAI隱藏“思維鏈”(Chain of Thought)功能時,給了競爭對手可乘之機,DeepSeek憑借這一功能實現(xiàn)了病毒式傳播,這讓OpenAI意識到免費層策略的重要性,并促使其重新審視自身的產(chǎn)品布局。

GPT·5" href="uploads/202511/1763002295nCtFKpv3.jpg" target="_blank">GPT·5GPT·5

2025年4月,薩姆·奧爾特曼對外透露了公司發(fā)布計劃的重大轉(zhuǎn)變,宣布在備受期待的GPT - 5發(fā)布之前將推出兩個中級大模型。

2025年5月,GPT - 4.1核心研究員Michelle Pokrass透露,構(gòu)建GPT - 5的挑戰(zhàn)在于在推理和聊天之間找到適當(dāng)?shù)钠胶狻?/p>

2025年6月,在墨西哥舉辦的AI Summit峰會上,兩名OpenAI公司代表透露,公司正在開發(fā)下一代基礎(chǔ)模型GPT - 5,并計劃通過該模型與競爭對手展開更激烈角逐,明確表示GPT - 5即將面世,且性能將遠(yuǎn)超GPT - 4等現(xiàn)有模型。

2025年7月,IT之家消息稱,GPT - 5有望在未來幾天或幾周內(nèi)正式亮相。有跡象表明,OpenAI正在測試一個代號為gpt - 5 - reasoning - alpha - 2025 - 07 - 13的新模型,該模型已于7月13日定稿,當(dāng)前正處于最終測試階段。同月,薩姆·奧爾特曼在社交平臺上確認(rèn),OpenAI準(zhǔn)備在8月初正式推出GPT - 并透露新版本將包括mini和nano等多個規(guī)模不同的型號,并通過API向外部開發(fā)者和企業(yè)開放使用。GPT - 5被設(shè)計為一個高度集成的技術(shù)系統(tǒng),旨在融合o系列與GPT系列模型的功能,打造一個能夠調(diào)用全部工具并勝任多樣化任務(wù)的統(tǒng)一平臺,這一版本被視為推動語言模型與高級推理能力深度融合的關(guān)鍵進(jìn)展。

正式發(fā)布

當(dāng)?shù)貢r間2025年8月7日(北京時間8月8日凌晨1時),OpenAI舉行時長超1小時的線上發(fā)布會,正式推出GPT - 5人工智能模型。GPT - 5面向所有免費用戶及眾多付費ChatGPT訂閱用戶開放,付費用戶擁有更高的使用限額,付費用戶(Plus、Pro、Team)可獲得更高使用額度或無限使用。微軟同步宣布將該模型整合至Copilot、Microsoft 365 Copilot、Azure AI Foundry和GitHub Copilot等平臺,標(biāo)志著GPT - 5全面登陸微軟生態(tài)系統(tǒng)。當(dāng)?shù)貢r間9月15日,OpenAI發(fā)布了GPT - 5 - Codex模型,這是一個專門為Agent編程優(yōu)化的模型,同步在Codex CLI、IDE擴展、網(wǎng)頁端、移動端以及GitHub代碼審查中可用。

功能特點 編輯本段

性能卓越

截至2025年8月8日,在大模型競技場LMArena上,剛剛上線的GPT - 5憑借著極強的性能在所有細(xì)分類目中都位列第一。

編碼能力突出

GPT - 5是OpenAI迄今為止最強大的編碼模型,在復(fù)雜的前端生成和大型代碼庫調(diào)試方面表現(xiàn)突出,能夠僅憑一個提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站應(yīng)用程序App和游戲。早期測試者注意到其在間距、排版和留白等設(shè)計選擇方面的改進(jìn)。在從GitHub獲取現(xiàn)實世界編碼任務(wù)的基準(zhǔn)測試SWE - bench Verified中,GPT - 5思考后首次嘗試的準(zhǔn)確率達(dá)74.9%,高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。例如,OpenAI的研究者演示要求GPT - 5創(chuàng)建一款網(wǎng)頁App,幫助說英語的用戶學(xué)習(xí)法語,且該App必須有一個引人入勝的主題,包含抽認(rèn)卡、測驗、經(jīng)典的貪吃蛇游戲,以及追蹤每日學(xué)習(xí)進(jìn)度的方法。研究者將相同的提示詞提交到兩個GPT - 5窗口中,幾分鐘后生成了兩個不同的App,雖然OpenAI的負(fù)責(zé)人稱這些App“存在一些缺陷”,但用戶可以根據(jù)個人喜好再調(diào)整AI生成的軟件,如更改背景或添加更多標(biāo)簽頁。

幻覺大幅降低

GPT - 5的“幻覺”問題大幅改善,在HealthBench Hard Hallucinations測試中錯誤信息率僅為1.6%,遠(yuǎn)低于GPT - 4o的15.8%。OpenAI為GPT - 5引入了新的安全訓(xùn)練模式“安全補全”,旨在讓模型在安全范圍內(nèi)提供最有幫助的答案。與GPT - 4o相比,GPT - 5的事實錯誤率降低了45%;在深度思考模式下,事實錯誤率更是比o3大幅下降80%,變得更加準(zhǔn)確可靠。在開放性事實準(zhǔn)確性基準(zhǔn)LongFact和FActScore測試中,GPT - 5的幻覺率比o3減少大約六倍,長篇內(nèi)容生成的準(zhǔn)確性顯著提升。

創(chuàng)意寫作出色

GPT - 5能夠處理結(jié)構(gòu)復(fù)雜的寫作任務(wù),如無韻律的抑揚格五音步詩或自然流動的自由詩,猶如詩人。OpenAI的ChatGPT業(yè)務(wù)副總Nick Turley表示,GPT - 5在創(chuàng)意任務(wù)上表現(xiàn)出“更好的品味”,響應(yīng)更自然。

健康咨詢實用

GPT - 5能更積極地標(biāo)記潛在健康問題,幫助用戶解析醫(yī)療結(jié)果,但OpenAI強調(diào),ChatGPT不能替代醫(yī)療專業(yè)人員。在名為HealthBench Hard Hallucinations的測試中,具備思考能力的GPT - 5出現(xiàn)幻覺的錯誤信息率僅為1.6%,遠(yuǎn)低于GPT - 4o和o3模型,后兩者的錯誤信息率分別為15.8%和12.9%。

記憶功能增強

ChatGPT的記憶(Memory)功能現(xiàn)在支持Pro、Plus以及Teams訂閱用戶連接ChatGPT至谷歌賬號,訪問日歷內(nèi)容。這意味著ChatGPT可以聯(lián)動Gmail和Google Calendar,從而讓GPT - 5根據(jù)用戶日常行程,獲取更多情境能力。ChatGPT甚至可以提醒用戶回復(fù)其收到的電子郵件,閱讀但尚未回復(fù)的電子郵件。這一功能將首先向Pro用戶推出,后續(xù)擴展到Plus和Teams訂閱用戶。

安全補全機制

GPT - 5引入了一種新的安全訓(xùn)練形式,名為安全補全(safe completions),它教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。有時,這可能意味著部分回答用戶的問題,或者只提供高水平的回答。如果需要拒絕,經(jīng)過訓(xùn)練的GPT - 5會以透明的方式告知用戶拒絕的原因,并提供安全的替代方案。在受控的實驗和OpenAI的生產(chǎn)模型中,OpenAI都發(fā)現(xiàn)這種安全補全的方法更加細(xì)致入微,能夠更好地引導(dǎo)雙重用途問題,增強對模糊意圖的魯棒性,并減少不必要的過度拒絕。

預(yù)設(shè)性格功能

OpenAI為所有ChatGPT用戶推出四種預(yù)設(shè)性格的全新研究預(yù)覽版。初始的四種性格選項——憤世嫉俗者(Cynic)、機器人(Robot)、傾聽者(Listener)和書呆子(Nerd)都是可選的,用戶可在設(shè)置中隨時調(diào)整,用以匹配ChatGPT和用戶的溝通風(fēng)格。上述四種性格最初適用于文本聊天,之后將擴展到語音聊天,讓用戶無需編寫自定義提示詞即可設(shè)置ChatGPT的交互方式,無論是簡潔專業(yè)的、周到支持的,還是略帶諷刺的。

社會評價 編輯本段

薩姆·奧爾特曼在發(fā)布會上稱,如果說GPT - 4是一個大學(xué)生,那么GPT - 5就是“真正的專家”。

相關(guān)事件 編輯本段

撤銷權(quán)限風(fēng)波

2025年8月1日,《連線》發(fā)布博文稱在OpenAI發(fā)布GPT - 5模型之際,Anthropic公司稱OpenAI違反了服務(wù)條款,撤銷了OpenAI對其模型的API訪問權(quán)限。根據(jù)Anthropic的商業(yè)服務(wù)條款,客戶禁止使用該服務(wù)“構(gòu)建競爭性產(chǎn)品或服務(wù),包括訓(xùn)練競爭性AI模型”或“逆向工程或復(fù)制”服務(wù)。此次撤銷OpenAI對Claude的訪問權(quán)限,正值其準(zhǔn)備發(fā)布新AI模型GPT - 5,有消息稱該模型在編程方面表現(xiàn)更佳。

發(fā)布會現(xiàn)場BUG事件

在GPT - 5的發(fā)布會上,直播中展示的性能圖表存在數(shù)據(jù)與圖表顯示不匹配的情況,例如在編程基準(zhǔn)測試(swe - bench)的圖表中,GPT - 5的準(zhǔn)確率標(biāo)注為52.8%,但對應(yīng)的柱狀圖高度卻超過了標(biāo)注為69.1%的舊模型O3的柱狀圖,引發(fā)了網(wǎng)友的廣泛質(zhì)疑。關(guān)于減少幻覺方面的demo,也被人挑出了毛病,奧爾特曼也承認(rèn)了錯誤。同時,馬斯克轉(zhuǎn)發(fā)了GPT - 5在ARC - AGI - 2上沒有打敗Grok 4的消息。

連破“百年懸案”

2025年10月,兩位研究人員僅用一個周末,便借助GPT - 5解決了10個「百年懸案」級的埃爾德什難題。正如數(shù)學(xué)家陶哲軒所言,AI最有成效的應(yīng)用是處理查文獻(xiàn)等耗時環(huán)節(jié),將研究者解放出來專注于思考。這標(biāo)志著一種科研范式的到來,AI正成為重塑基礎(chǔ)科學(xué)、加速人類接近真理的工具。

附件列表


0

詞條內(nèi)容僅供參考,如果您需要解決具體問題
(尤其在法律、醫(yī)學(xué)等領(lǐng)域),建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。

如果您認(rèn)為本詞條還有待完善,請 編輯

上一篇 情緒消費    下一篇 向光出發(fā) | 《我心光明》新書分享會在京舉行

標(biāo)簽

同義詞

暫無同義詞
郧西县| 临泉县| 客服| 舟山市| 祁东县| 洛阳市| 伊吾县| 赫章县| 祁阳县| 黄陵县| 锡林郭勒盟| 沙田区| 闸北区| 新乡市| 蓬安县| 和平县| 阿拉善盟| 博客| 平定县| 宁国市| 监利县| 方城县| 水城县| 汉阴县| 怀柔区| 汉沽区| 原阳县| 蓬莱市| 南乐县| 铜鼓县| 滨州市| 洛宁县| 日照市| 上饶县| 无为县| 长海县| 乌审旗| 靖州| 贡觉县| 黄平县| 隆安县|