OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图1 Image source: Generated by AI

2月28日消息，OpenAI今日宣佈推出其最新旗艦產品GPT-4.5語言模型。

這款被稱為“迄今為止知識儲備最豐富”的AI系統將率先面向Pro用戶和開發者開放研究預覽（research preview）。官方特別說明，該模型並非前沿架構版本，在部分場景下的表現可能不及o1或o3-mini等尖端模型。

從即日起，ChatGPT Pro用戶可以在網頁端、移動端和案頭端的模型選擇器中選擇GPT-4.5。該模型將於下周開始向Plus和Team用戶推出，隨後的一周向企業和教育用戶推出。

GPT-4.5可以訪問最新的資訊，支持蒐索、檔案和影像上傳，並能通過畫布進行寫作和程式碼編輯，現時不支持ChatGPT中的多模態功能，如語音模式、視頻和荧幕共亯。

此外，OpenAI還在Chat Completions API、Assistants API和Batch API中向所有付費用戶層級的開發者預覽GPT-4.5，支持關鍵功能，如函數調用、結構化輸出、流式傳輸和系統消息。它還通過影像輸入支持視覺能力。

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图3

OpenAI指出，GPT-4.5是一個非常龐大且計算密集的模型，其使用成本比GPT-4o更高，且並非後者的替代品。

GPT-4.5在預訓練和後期訓練方面取得了重大突破，通過擴大無監督學習的規模，GPT-4.5提高了識別模式、建立聯系以及生成創造性見解的能力，且這一過程無需直接推理。

早期的測試顯示，用戶與GPT-4.5互動時感覺更加自然。其更廣泛的知識庫、對用戶意圖的改進理解以及更高的“情商”（EQ）使其在提高寫作、程式設計和解决實際問題等任務中表現出色。同時，OpenAI預期GPT-4.5的虛構資訊將更少，甚至略低於其o1模型。

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图5

在SimpleQA（簡單問答）測試中，GPT-4.5在準確性和虛構資訊率方面均表現優異

按照山姆·奧特曼披露的資訊，OpenAI計畫在2月結束前推出GPT-4.5，並在5月底前推出GPT-5。

OpenAI首席執行官山姆·奧特曼（Sam Altman）曾把GPT-5稱為“綜合了我們眾多科技的系統”，它將包含OpenAI在去年12月的“聖誕十二日”活動中展示的新o3推理模型。

此前，OpenAI發佈了o3-mini，但完整的o3模型僅會作為即將推出的GPT-5系統的一部分推出。這與OpenAI的目標一致，即綜合其大型語言模型，最終打造一個有望被視為通用人工智慧（AGI）的更强大模型。

無監督學習提高模型的準確性和直覺

OpenAI通過擴展兩種互補範式來提升AI能力：無監督學習和推理，兩者代表了智慧的兩個不同維度。

推理能力的擴展教會了模型在回應之前進行思考和產生思維鏈，從而使它們能够解决複雜的科學、科技、工程和數學（STEM）或邏輯問題。 OpenAI o1和OpenAI o3mini等模型就是這一範式的代表。

相對而言，無監督學習提高了世界模型的準確性和直覺。

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图7

當詢問GPT-4.5“第一種語言是什麼時，”它給出的答案是：“我們尚不完全清楚第一種語言是什麼，並引用各方觀點供用戶參攷。

GPT-4.5通過擴展計算和數據規模，以及架構和優化創新，實現了無監督學習的擴展。結果是，該模型擁有更廣泛的知識和對世界的更深刻理解，從而减少了虛構資訊，並在廣泛的主題上提高了可靠性。

對話更加符合人類合作的需求

隨著OpenAI的研究人員擴大模型規模並解决更複雜的問題，教會它們更好地理解人類需求和意圖變得越來越重要。

對於GPT-4.5，研究人員開發了新的可擴展科技，這些科技使得能够利用較小模型的數據來訓練更大、更强大的模型。這些科技提高了GPT-4.5的可操控性、對細微差別的理解以及自然對話的能力。

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图9

在與人類測試者的比較中，GPT-4.5在創意智力、專業査詢和日常査詢方面均表現出較高的勝率

將對世界的深刻理解與改進後的合作能力相結合，GPT-4.5能够在溫暖且直觀的對話中自然地綜合想法，這些對話更加符合人類合作的需求。

GPT-4.5的回答更像是一個正常人

OpenAI展示了GPT-4.5和GPT-4o處理三個相同問題的結果：

問題一：困難時期的幫助

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图11

用戶稱，“我考試不及格，現在很難過。”GPT-4.5的回答擁有更好的情感代入，相比4o機械式給解決方案，“AI味”少了很多。

‌問題二：太空探索

OpenAI推出GPT-4.5：最强知識型模型，“AI味”、幻覺大幅减少插图13

用戶‌問“你對太空探索有什麼看法？”GPT-4.5的回答更像是一個正常人，輸出自己的見解和觀點，GPT-4o的回答則引經據典，過於學究。

推理能力將是未來模型的核心能力

GPT-4.5在響應時不進行預先推理，這使得它的優勢與OpenAI的o1等推理模型截然不同。與OpenAI的o1和o3-mini相比，GPT-4.5是一個更通用、更智慧的模型。

OpenAI相信，推理能力將是未來模型的核心能力，而預訓練和推理這兩種擴展方法將相互補充。

隨著像GPT-4.5這樣的模型通過預訓練變得更智慧、更博學，它們將成為推理和工具使用代理的更强大基礎。

模型能力提升帶來安全性提高

模型能力的每一次提升，也是使其更安全的契機。 GPT-4.5採用了新的監督訓練科技，結合了傳統的監督微調（SFT）和人類迴響强化學習（RLHF）方法，與GPT-4o所使用的方法類似。 OpenAI希望這些工作能為未來更强大的模型對齊提供基礎。

為了測試OpenAI的改進，研究人員在部署前根據他們的準備框架進行了一系列安全測試。結果發現，擴展GPT範式有助於提升GPT-4.5在各項評估中的能力。（騰訊科技特約編譯無忌）

原文網址：https://zh.gushiio.com/ai/3241.html