OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图1Image source: Generated by AI

2月28日消息,OpenAI今日宣佈推出其最新旗艦產品GPT-4.5語言模型。

這款被稱為“迄今為止知識儲備最豐富”的AI系統將率先面向Pro用戶和開發者開放研究預覽(research preview)。 官方特別說明,該模型並非前沿架構版本,在部分場景下的表現可能不及o1或o3-mini等尖端模型。

從即日起,ChatGPT Pro用戶可以在網頁端、移動端和案頭端的模型選擇器中選擇GPT-4.5。 該模型將於下周開始向Plus和Team用戶推出,隨後的一周向企業和教育用戶推出。

GPT-4.5可以訪問最新的資訊,支持蒐索、檔案和影像上傳,並能通過畫布進行寫作和程式碼編輯,現時不支持ChatGPT中的多模態功能,如語音模式、視頻和荧幕共亯。

此外,OpenAI還在Chat Completions API、Assistants API和Batch API中向所有付費用戶層級的開發者預覽GPT-4.5,支持關鍵功能,如函數調用、結構化輸出、流式傳輸和系統消息。 它還通過影像輸入支持視覺能力。

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图3

OpenAI指出,GPT-4.5是一個非常龐大且計算密集的模型,其使用成本比GPT-4o更高,且並非後者的替代品。

GPT-4.5在預訓練和後期訓練方面取得了重大突破,通過擴大無監督學習的規模,GPT-4.5提高了識別模式、建立聯系以及生成創造性見解的能力,且這一過程無需直接推理。

早期的測試顯示,用戶與GPT-4.5互動時感覺更加自然。 其更廣泛的知識庫、對用戶意圖的改進理解以及更高的“情商”(EQ)使其在提高寫作、程式設計和解决實際問題等任務中表現出色。 同時,OpenAI預期GPT-4.5的虛構資訊將更少,甚至略低於其o1模型。

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图5

在SimpleQA(簡單問答)測試中,GPT-4.5在準確性和虛構資訊率方面均表現優異

按照山姆·奧特曼披露的資訊,OpenAI計畫在2月結束前推出GPT-4.5,並在5月底前推出GPT-5。

OpenAI首席執行官山姆·奧特曼(Sam Altman)曾把GPT-5稱為“綜合了我們眾多科技的系統”,它將包含OpenAI在去年12月的“聖誕十二日”活動中展示的新o3推理模型。

此前,OpenAI發佈了o3-mini,但完整的o3模型僅會作為即將推出的GPT-5系統的一部分推出。 這與OpenAI的目標一致,即綜合其大型語言模型,最終打造一個有望被視為通用人工智慧(AGI)的更强大模型。

無監督學習提高模型的準確性和直覺

OpenAI通過擴展兩種互補範式來提升AI能力:無監督學習和推理,兩者代表了智慧的兩個不同維度。

推理能力的擴展教會了模型在回應之前進行思考和產生思維鏈,從而使它們能够解决複雜的科學、科技、工程和數學(STEM)或邏輯問題。 OpenAI o1和OpenAI o3mini等模型就是這一範式的代表。

相對而言,無監督學習提高了世界模型的準確性和直覺。

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图7

當詢問GPT-4.5“第一種語言是什麼時,”它給出的答案是:“我們尚不完全清楚第一種語言是什麼,並引用各方觀點供用戶參攷。

GPT-4.5通過擴展計算和數據規模,以及架構和優化創新,實現了無監督學習的擴展。 結果是,該模型擁有更廣泛的知識和對世界的更深刻理解,從而减少了虛構資訊,並在廣泛的主題上提高了可靠性。

對話更加符合人類合作的需求

隨著OpenAI的研究人員擴大模型規模並解决更複雜的問題,教會它們更好地理解人類需求和意圖變得越來越重要。

對於GPT-4.5,研究人員開發了新的可擴展科技,這些科技使得能够利用較小模型的數據來訓練更大、更强大的模型。 這些科技提高了GPT-4.5的可操控性、對細微差別的理解以及自然對話的能力。

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图9

在與人類測試者的比較中,GPT-4.5在創意智力、專業査詢和日常査詢方面均表現出較高的勝率

將對世界的深刻理解與改進後的合作能力相結合,GPT-4.5能够在溫暖且直觀的對話中自然地綜合想法,這些對話更加符合人類合作的需求。

GPT-4.5的回答更像是一個正常人

OpenAI展示了GPT-4.5和GPT-4o處理三個相同問題的結果:

問題一:困難時期的幫助

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图11

用戶稱,“我考試不及格,現在很難過。”GPT-4.5的回答擁有更好的情感代入,相比4o機械式給解決方案,“AI味”少了很多。

‌問題二:太空探索

OpenAI推出GPT-4.5:最强知識型模型,“AI味”、幻覺大幅减少插图13

用戶‌問“你對太空探索有什麼看法?”GPT-4.5的回答更像是一個正常人,輸出自己的見解和觀點,GPT-4o的回答則引經據典,過於學究。

推理能力將是未來模型的核心能力

GPT-4.5在響應時不進行預先推理,這使得它的優勢與OpenAI的o1等推理模型截然不同。 與OpenAI的o1和o3-mini相比,GPT-4.5是一個更通用、更智慧的模型。

OpenAI相信,推理能力將是未來模型的核心能力,而預訓練和推理這兩種擴展方法將相互補充。

隨著像GPT-4.5這樣的模型通過預訓練變得更智慧、更博學,它們將成為推理和工具使用代理的更强大基礎。

模型能力提升帶來安全性提高

模型能力的每一次提升,也是使其更安全的契機。 GPT-4.5採用了新的監督訓練科技,結合了傳統的監督微調(SFT)和人類迴響强化學習(RLHF)方法,與GPT-4o所使用的方法類似。 OpenAI希望這些工作能為未來更强大的模型對齊提供基礎。

為了測試OpenAI的改進,研究人員在部署前根據他們的準備框架進行了一系列安全測試。 結果發現,擴展GPT範式有助於提升GPT-4.5在各項評估中的能力。 (騰訊科技特約編譯無忌)

原文網址:https://zh.gushiio.com/ai/3241.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *