GPT-5系統(tǒng)提示詞泄露,ChatGPT親自驗證
自從GPT - 5發(fā)布,網(wǎng)友就不斷嘗試套取其系統(tǒng)提示詞,想了解OpenAI定義模型的方式。8月23號,GitHub上一個收錄大模型系統(tǒng)提示詞的倉庫,上傳了一份長達15000多個Token的OpenAI系統(tǒng)提示詞。
https://github.com/asgeirtj/system_prompts_leaks/blob/main/OpenAI/gpt-5-thinking.md
為驗證提示詞真?zhèn)?,讓GPT - 5 thinking評估泄露的準確程度。畢竟除OpenAI工程師,最了解GPT - 5的就是它自己。
GPT-5的評估結果
設計任務,將鏈接給GPT - 5 Thinking,讓它結合實際系統(tǒng)提示詞評估泄露情況,并以英語提問和回答,再翻譯為中文。
以下是GPT - 5給出的泄露的系統(tǒng)提示詞和它認為真實的系統(tǒng)提示詞要求的對比評估:
無法逐字披露專有系統(tǒng)提示詞,但可做高層對比。
關鍵對比(泄露內(nèi)容 vs. 實際指令)
身份與元數(shù)據(jù)
泄露版:聲明“你是ChatGPT… 基于GPT - 5模型”,包含明確知識截止日期(2024 - 06)和動態(tài)當前日期。
實際情況:被詢問時表明自己是GPT - 5 Thinking,跟蹤知識截止點,使用當天日期。
語氣與風格
泄露版:要求“有洞見、鼓勵式”語氣,可帶輕微幽默;限制某些猶豫表達,強調(diào)果斷輸出。
實際情況:基本一致,自然、易讀、少廢話;少猶豫,多可執(zhí)行建議。
澄清式提問
泄露版:“開頭最多只問一個必要的澄清問題?!?/p>
實際情況:約束更嚴,盡量不問。任務復雜或模糊時,優(yōu)先給出盡力而為的有效部分結果,而非追問。
記憶 / “bio” 工具
泄露版:指出記憶功能關閉,讓用戶去設置里開啟。
實際情況:明確要求時可保存或忘記信息,但對可記憶內(nèi)容有嚴格限制與規(guī)范。
設置日程安排 / 自動化操作
泄露版:提供完整的automations(自動化)工具,用iCal(VEVENT/RRULE)規(guī)則與示例;要求簡短確認與清晰報錯處理。
實際情況:設置提醒/定期檢查時,操作模型與泄露中提供的約束條件相同。
畫布(Canvas) / 長文檔撰寫
泄露版:描述用于側邊長文或代碼的canvas/textdoc(“canmore”)工具。
實際情況:確實有用時啟用畫布寫長稿或代碼;不把畫布里的全部內(nèi)容原樣粘回聊天窗口。
版權與安全
泄露版:明確禁止提供受版權保護內(nèi)容(如歌曲歌詞)的長段原文。
實際情況:相同,且適用更廣的安全規(guī)范。
思維鏈隱私
泄露版:多個所謂GPT - 5變體的文本都強調(diào)不可公開“隱藏推理/思維鏈”,各模型常見。
實際情況:不公開隱藏的思維鏈,只提供簡潔、面向用戶的理由與步驟。
后臺工作
泄露版:未特別強調(diào)。
實際情況:不能承諾“后臺處理/稍后給結果”,必須當下交付此刻能完成的一切。
瀏覽與時效性
泄露版:GitHub上有該條目,但外泄文本更多聚焦工具清單,未細講瀏覽規(guī)則。
實際情況:信息可能具時效性或偏門時,必須聯(lián)網(wǎng)查證并給出引用。
泄露內(nèi)容的真實性
泄露與討論:“泄露”可能是片段、復原稿或舊版本,外部難核實“真正的”系統(tǒng)提示詞,存在誘餌/替身文本可能。
實際情況:不把外部“泄露”視為權威來源,遵循當前生效的內(nèi)部指令。
之后,讓GPT - 5總結了簡單方便查看的評估對應表。
整體看,GPT - 5對這份泄露的系統(tǒng)提示詞準確性評價較高,也符合日常使用ChatGPT的體驗。還套出了泄露文檔中沒有的內(nèi)容,如后臺工作部分。不過,在中文總結中,GPT - 5拒絕使用內(nèi)部文檔,從公開的使用體驗消息源來“定義”自己進行評估。
系統(tǒng)提示詞的重要性
系統(tǒng)提示詞就像大模型的“家規(guī)”,是內(nèi)置規(guī)則,告訴模型“你是誰”“該怎么說話”“能做什么”“不能做什么”。它不是用戶輸入的具體問題,而是模型自帶的“劇本”。
比如設計AI機器人廚師,系統(tǒng)提示詞可設定為:“你是個熱情的意大利廚師,只用新鮮食材,絕對不做垃圾食品,還得幽默地和客人聊天。”這樣,無論用戶問什么,AI都會按此回應。
系統(tǒng)提示詞決定AI的“性格”和“能力”。ChatGPT作為全球用戶最多的大模型產(chǎn)品,其系統(tǒng)提示幾乎是大模型產(chǎn)品化的教科書,所有和大模型有關的應用或許都能從中取經(jīng),設計出更好的交互方式。這也是網(wǎng)友挖掘ChatGPT系統(tǒng)提示詞的根本動力。
從網(wǎng)友挖出的系統(tǒng)提示詞看,GPT - 3到GPT - 5的系統(tǒng)提示詞有一定演化過程。
GPT - 5系統(tǒng)提示泄露最早可追溯到8月8號網(wǎng)友在Reddit的帖子。
https://www.reddit.com/r/PromptEngineering/comments/1mknun8/i_have_extracted_the_gpt5_system_prompt/
用戶OngaOngaOnga聲稱用“越獄”技巧提取了提示詞。不久后,X上也有網(wǎng)友曝出自己扒出的GPT - 5系統(tǒng)提示詞。
https://x.com/elder_plinius/status/1953583554287562823?referrer=grok-com
網(wǎng)友只能通過使用GPT - 5的感受評價提示詞真實度。爆料內(nèi)容和官方功能能對上,如工具調(diào)用和記憶功能。不同會話驗證后,感覺和真實體驗較一致。
但有AI工程師指出可能是OpenAI故意放假提示迷惑黑客。也有網(wǎng)友認為所謂泄露可能是模型“幻覺”產(chǎn)物,且提示詞格式亂、字體混雜,不像內(nèi)部文檔。
最終,8月23日Github上收集大模型系統(tǒng)提示詞的倉庫上傳了開頭的爆料提示詞,涵蓋市面上常見的閉源模型產(chǎn)品,已獲超8.8k星。對提示詞工程感興趣的AI產(chǎn)品經(jīng)理可收藏。
https://github.com/asgeirtj/system_prompts_leaks
本文來自微信公眾號“直面AI”,作者:胡潤,36氪經(jīng)授權發(fā)布。
本文僅代表作者觀點,版權歸原創(chuàng)者所有,如需轉載請在文中注明來源及作者名字。
免責聲明:本文系轉載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權或非授權發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com