殺瘋了！ 6年來最强模型GPT-4.5登場：更貴、更高情商、更少幻覺

殺瘋了！ 6年來最强模型GPT-4.5登場：更貴、更高情商、更少幻覺插图1

（圖片來源：GuShiio.com股市智慧AGI編輯林志佳拍攝）

今晨4點，GPT-4.5突然上線。

2月27日消息，GuShiio.com股市智慧AGI獲悉，
美國OpenAI公司今天推出GPT-4.5模型（代號Orion），這是該公司有史以來算力和數據規模最大、最佳的AI基座模型，
本周將面向每月200美元的ChatGPT Pro用戶開放，下周向ChatGPT Plus開放。

GPT-4.5從一開始就不是一個推理模型。 OpenAI表示，GPT-4.5在擴展預訓練和後訓練方面向前邁出了一步，通過擴展無監督學習，GPT-4.5提高了識別模式、建立聯系和產生創造性見解的能力，而無需推理，此外，GPT-4.5計算效率比GPT-4提升了10倍以上，而價格層面，GPT-4.5 API每100萬token輸入75美元，輸出價格為150美元，這比GPT-4o的2.5美元暴漲30倍，更是競爭對手Claude 3.7 Sonnet的25倍。

儘管OpenAI CEO奧爾特曼（Sam Altman）沒現身在發佈會現場，但他發推文表示，& ldquo; GPT‑4.5讓他第一次感覺像在與一個有思想的人在交談，可以從模型那裡得到真正好的建議。不過壞消息是，這是一個龐大而昂貴的模型，真的很想同時推出Plus和pro版本，但是我們GPU計算卡已經不够了。下周我們將添加數萬張GPU卡。& rdquo;

&ldquo；（我）在醫院照顧我的孩子。團隊已經成功了！& rdquo; 奧爾特曼稱。

6年來最强模型發佈：更貴、更高情商、更少幻覺

據悉，
從GPT-1到即將發佈的GPT-4.5，經歷了6年之久。

2018年，
6月OpenAI發佈GPT-1，這是OpenAI第一個基於Transformer架構大規模預訓練的語言模型； 2019年，OpenAI發佈GPT-2，模型規模擴大10倍，擁有1.5億個參數，在生成文字方面展現出强大能力，但因潜在濫用風險，OpenAI以內測形式使用。

2020年，
5月OpenAI推出GPT-3，擁有1750億個參數，在自然語言處理任務上表現驚人，能完成生成文字、回答問題、翻譯等多種任務，而到了2022年，GPT-3.5發佈，OpenAI利用人工標注數據和强化學習提升了模型性能，
同年11月30日，基於GPT-3.5的AI聊天機器人產品ChatGPT發佈，風靡全球。

2023年3月14日，
OpenAI發佈GPT-4，語言理解能力更强大，能處理影像內容，對月訂閱費20美元的Plus用戶開放使用，隨後11月，OpenAI在首届開發者大會上宣佈GPT-4陞級為GPT-4 Turbo。

到了2024年，
5月OpenAI推出可免費使用的多模態模型GPT-4o，7月18日推出GPT-4o mini； 9月12日，OpenAI正式對外發佈o1模型的預覽版，同時發佈了o1-mini。此外，12月5日，OpenAI發佈正式版OpenAI o1模型，隨後還公佈o3-mini系列，效能和性價比都超越o1模型。

然而，在開源AI模型DeepSeek V3/R1，以及馬斯克的競購動作影響下，今年2月13日，一切都變了，OpenAI終於不再&ldquo；擠牙膏&rdquo；，整個產品線全面加速，最快今年發佈GPT-5模型。

奧爾特曼在推文中承認，OpenAI已經意識到自家的模型和產品供應已經變得非常複雜，需要簡化產品供應。& ldquo; 我們和您一樣討厭模型選擇，並希望回到魔法般的統一智慧。我們的首要目標是通過創建可以使用我們所有工具、知道何時需要長時間思考、並且通常可用於非常廣泛的任務的系統來統一o系列模型和GPT系列模型。& rdquo; 奧爾特曼表示。

奧爾特曼表示，OpenAI將很快（幾周/月內）發佈代號為&ldquo； Orion” （獵戶座）的GPT-4.5，也是最後一個非思維鏈模型，並且會綜合GPT和o系列，即將（數月內）推出具備多項新功能的GPT-5。

奧爾特曼強調，此前公佈的推理模型o3將不會以獨立模型形式發佈。最重要的是，免費版ChatGPT能在標準智慧設定下無限制地使用GPT-5基礎班進行對話，不過會有防止濫用，而Plus/Pro付費用戶將以更高的智慧水准使用GPT-5。
顯然，GPT-5也將成為該公司第一個世界模型。

如今，OpenAI首先發佈GPT-4.5&mdash；& mdash; 這是該公司6年來規模最大、價格最貴、更高情商、更少幻覺的模型。

OpenAI表示，GPT-4.5在預訓練和後訓練的擴展上取得進展，通過擴展無監督學習提升了模式識別等能力。

殺瘋了！ 6年來最强模型GPT-4.5登場：更貴、更高情商、更少幻覺插图5

能力提升方面，
早期測試顯示，GPT-4.5互動更自然，它知識基礎更廣，能更好理解用戶意圖，& ldquo; 情商&rdquo；更高，可减少幻覺，在寫作、程式設計和解决實際問題等任務中表現出色。 SimpleQA（評估模型的事實性回答能力）數据集測試中，
GPT-4.5準確率達62.5%，高於GPT-4o、o3 mini系列等；幻覺率低至37.1%，遠遠優於GPT-4o等。

同時，
GPT-4.5擁有無監督學習擴展，通過擴展計算、數據及架構和優化創新，提升了世界模型的準確性和直覺，擁有更廣泛知識和對世界更深入理解，並且用小模型數據訓練大模型，提升了GPT-4.5的可控性、對細微差別的理解及自然對話能力，而且訓練採用新的監督科技，結合傳統方法，在部署前進行安全測試，相關評估結果將發佈在系統當中。

在與人類測試者的對比評估中，GPT-4.5在創意智慧、專業査詢和日常査詢方面相比4o有更高勝率，表現出更强的審美直覺和創造力，在日常査詢當中能够達到57%，專業査詢達63.2%。此外，雖然GPT-4.5沒有深度思考，但未來推理將成模型核心能力，所以GPT-4.5採用預訓練和推理兩種擴展方法相互補充。

使用管道層面，
ChatGPT Pro用戶即日起可在模型選擇器中選用，下周起向Plus和Team用戶推出，再下周面向Enterprise和Edu用戶，該版本支持蒐索獲取最新資訊、檔案和影像上傳及使用畫布處理寫作和程式碼，但暫不支持語音、視頻和荧幕共亯等多模態功能；而API層面，在Chat Completions API、Assistants API和Batch API中向所有付費開發者預覽，支持函數調用等關鍵功能及影像輸入視覺功能，適用於寫作輔助等應用場景。但因模型大且計算密集，成本較高，官方正評估是否長期在API中提供。

Box AI CEO Aaron Levie表示，其將於今天晚些時候在Box AI Studio中向客戶推出GPT-4.5版本。通過早期測試看，與GPT-4o相比，GPT-4.5正確選取的欄位準確率提高了19個百分點，凸顯了其處理細微契约數據的能力有所提高，看到GPT-4.5在處理複雜企業數據方面取得了強勁成果，這將在企業中解鎖更多用例。

Cognition聯合創始人兼CEO Scott Wu分享了使用GPT-4.5的體驗，表示非常棒。在他們的智慧體編碼基準測試中，GPT-4.5相較於o1和4o實現大幅改進。同時發現一個有趣的數據點：雖然GPT-4.5和Claude 3.7 Sonnet在整體基準測試中得分相似，但他們發現GPT-4.5在涉及架構和跨系統互動的任務上峰值更大，而Claude 3.7 Sonnet在原始編碼和程式碼編輯上峰值更大。

OpenAI表示，GPT-4.5處於無監督學習前沿，還無法完全替代GPT-4o。