殺瘋了! 6年來最强模型GPT-4.5登場:更貴、更高情商、更少幻覺

殺瘋了! 6年來最强模型GPT-4.5登場:更貴、更高情商、更少幻覺插图1

(圖片來源:GuShiio.com股市智慧AGI編輯林志佳拍攝)

今晨4點,GPT-4.5突然上線。

2月27日消息,GuShiio.com股市智慧AGI獲悉,
美國OpenAI公司今天推出GPT-4.5模型(代號Orion),這是該公司有史以來算力和數據規模最大、最佳的AI基座模型,
本周將面向每月200美元的ChatGPT Pro用戶開放,下周向ChatGPT Plus開放。

GPT-4.5從一開始就不是一個推理模型。 OpenAI表示,GPT-4.5在擴展預訓練和後訓練方面向前邁出了一步,通過擴展無監督學習,GPT-4.5提高了識別模式、建立聯系和產生創造性見解的能力,而無需推理,此外,GPT-4.5計算效率比GPT-4提升了10倍以上,而價格層面,GPT-4.5 API每100萬token輸入75美元,輸出價格為150美元,這比GPT-4o的2.5美元暴漲30倍,更是競爭對手Claude 3.7 Sonnet的25倍。

儘管OpenAI CEO奧爾特曼(Sam Altman)沒現身在發佈會現場,但他發推文表示,& ldquo; GPT‑4.5讓他第一次感覺像在與一個有思想的人在交談,可以從模型那裡得到真正好的建議。 不過壞消息是,這是一個龐大而昂貴的模型,真的很想同時推出Plus和pro版本,但是我們GPU計算卡已經不够了。 下周我們將添加數萬張GPU卡。& rdquo;

“ (我)在醫院照顧我的孩子。 團隊已經成功了!& rdquo; 奧爾特曼稱。

6年來最强模型發佈:更貴、更高情商、更少幻覺

據悉,
從GPT-1到即將發佈的GPT-4.5,經歷了6年之久。

2018年,
6月OpenAI發佈GPT-1,這是OpenAI第一個基於Transformer架構大規模預訓練的語言模型; 2019年,OpenAI發佈GPT-2,模型規模擴大10倍,擁有1.5億個參數,在生成文字方面展現出强大能力,但因潜在濫用風險,OpenAI以內測形式使用。

2020年,
5月OpenAI推出GPT-3,擁有1750億個參數,在自然語言處理任務上表現驚人,能完成生成文字、回答問題、翻譯等多種任務,而到了2022年,GPT-3.5發佈,OpenAI利用人工標注數據和强化學習提升了模型性能,
同年11月30日,基於GPT-3.5的AI聊天機器人產品ChatGPT發佈,風靡全球。

2023年3月14日,
OpenAI發佈GPT-4,語言理解能力更强大,能處理影像內容,對月訂閱費20美元的Plus用戶開放使用,隨後11月,OpenAI在首届開發者大會上宣佈GPT-4陞級為GPT-4 Turbo。

到了2024年,
5月OpenAI推出可免費使用的多模態模型GPT-4o,7月18日推出GPT-4o mini; 9月12日,OpenAI正式對外發佈o1模型的預覽版,同時發佈了o1-mini。 此外,12月5日,OpenAI發佈正式版OpenAI o1模型,隨後還公佈o3-mini系列,效能和性價比都超越o1模型。

然而,在開源AI模型DeepSeek V3/R1,以及馬斯克的競購動作影響下,今年2月13日,一切都變了,OpenAI終於不再“ 擠牙膏”, 整個產品線全面加速,最快今年發佈GPT-5模型。

奧爾特曼在推文中承認,OpenAI已經意識到自家的模型和產品供應已經變得非常複雜,需要簡化產品供應。& ldquo; 我們和您一樣討厭模型選擇,並希望回到魔法般的統一智慧。 我們的首要目標是通過創建可以使用我們所有工具、知道何時需要長時間思考、並且通常可用於非常廣泛的任務的系統來統一o系列模型和GPT系列模型。& rdquo; 奧爾特曼表示。

奧爾特曼表示,OpenAI將很快(幾周/月內)發佈代號為“ Orion” (獵戶座)的GPT-4.5,也是最後一個非思維鏈模型,並且會綜合GPT和o系列,即將(數月內)推出具備多項新功能的GPT-5。

奧爾特曼強調,此前公佈的推理模型o3將不會以獨立模型形式發佈。 最重要的是,免費版ChatGPT能在標準智慧設定下無限制地使用GPT-5基礎班進行對話,不過會有防止濫用,而Plus/Pro付費用戶將以更高的智慧水准使用GPT-5。
顯然,GPT-5也將成為該公司第一個世界模型。

如今,OpenAI首先發佈GPT-4.5—& mdash; 這是該公司6年來規模最大、價格最貴、更高情商、更少幻覺的模型。

OpenAI表示,GPT-4.5在預訓練和後訓練的擴展上取得進展,通過擴展無監督學習提升了模式識別等能力。

殺瘋了! 6年來最强模型GPT-4.5登場:更貴、更高情商、更少幻覺插图5

能力提升方面,
早期測試顯示,GPT-4.5互動更自然,它知識基礎更廣,能更好理解用戶意圖,& ldquo; 情商” 更高,可减少幻覺,在寫作、程式設計和解决實際問題等任務中表現出色。 SimpleQA(評估模型的事實性回答能力)數据集測試中,
GPT-4.5準確率達62.5%,高於GPT-4o、o3 mini系列等; 幻覺率低至37.1%,遠遠優於GPT-4o等。

同時,
GPT-4.5擁有無監督學習擴展,通過擴展計算、數據及架構和優化創新,提升了世界模型的準確性和直覺,擁有更廣泛知識和對世界更深入理解,並且用小模型數據訓練大模型,提升了GPT-4.5的可控性、對細微差別的理解及自然對話能力,而且訓練採用新的監督科技,結合傳統方法,在部署前進行安全測試,相關評估結果將發佈在系統當中。

在與人類測試者的對比評估中,GPT-4.5在創意智慧、專業査詢和日常査詢方面相比4o有更高勝率,表現出更强的審美直覺和創造力,在日常査詢當中能够達到57%,專業査詢達63.2%。 此外,雖然GPT-4.5沒有深度思考,但未來推理將成模型核心能力,所以GPT-4.5採用預訓練和推理兩種擴展方法相互補充。

使用管道層面,
ChatGPT Pro用戶即日起可在模型選擇器中選用,下周起向Plus和Team用戶推出,再下周面向Enterprise和Edu用戶,該版本支持蒐索獲取最新資訊、檔案和影像上傳及使用畫布處理寫作和程式碼,但暫不支持語音、視頻和荧幕共亯等多模態功能; 而API層面,在Chat Completions API、Assistants API和Batch API中向所有付費開發者預覽,支持函數調用等關鍵功能及影像輸入視覺功能,適用於寫作輔助等應用場景。 但因模型大且計算密集,成本較高,官方正評估是否長期在API中提供。

Box AI CEO Aaron Levie表示,其將於今天晚些時候在Box AI Studio中向客戶推出GPT-4.5版本。 通過早期測試看,與GPT-4o相比,GPT-4.5正確選取的欄位準確率提高了19個百分點,凸顯了其處理細微契约數據的能力有所提高,看到GPT-4.5在處理複雜企業數據方面取得了強勁成果,這將在企業中解鎖更多用例。

Cognition聯合創始人兼CEO Scott Wu分享了使用GPT-4.5的體驗,表示非常棒。 在他們的智慧體編碼基準測試中,GPT-4.5相較於o1和4o實現大幅改進。 同時發現一個有趣的數據點:雖然GPT-4.5和Claude 3.7 Sonnet在整體基準測試中得分相似,但他們發現GPT-4.5在涉及架構和跨系統互動的任務上峰值更大,而Claude 3.7 Sonnet在原始編碼和程式碼編輯上峰值更大。

OpenAI表示,GPT-4.5處於無監督學習前沿,還無法完全替代GPT-4o。

OpenAI將與kimi、DeepSeek同時“ 撞車”

事實上,
2022年11月30日之前,OpenAI的網站流量幾乎為零。 但隨後的兩個月裏,OpenAI受到了超過1億訪問者的衝擊,所有人爭相體驗ChatGPT,自那以後,所有人的生活都不一樣了,尤其是公司CEO奧爾特曼,成為了一名AI科技“ 佈道師” 和行業指引者。

如今,OpenAI估值超過1570億美元(約合人民幣1.1萬億元)

近期奧爾特曼公開表示,OpenAI正考慮基於使用量進行定價。 至於何時能够實現AGI,他稱當一個AI系統能够完成一個非常熟練的人在重要工作中所能做的事情時,就可以稱之為AGI。

有趣的是,今天淩晨,月之暗面kimi再一次“ 撞車”, 悄悄公佈最新Kimi-K1.6-IOI-high模型,其在LiveCodeBench基準測試榜單上排名第一,超越了GPT和Claude系列模型。

同時,DeepSeek開源周持續引發關注,包括已發佈專為英偉達Hopper GPU打造的MLA解碼內核FlashMLA、EP通信庫DeepEP、FP8 GEMM(通用矩陣乘法)計算庫DeepGEMM等。 預計今天上午9點左右,DeepSeek還會在X平臺上發佈全新開源科技。

據公開資訊,2024年全年,OpenAI銷售收入大約37億美元,同比增長1700%以上,而預計到2025年,OpenAI年化收入將增長至116億美元,其中,75%收入來自用戶ChatGPT Plus服務訂閱。 內部預估,2029全年OpenAI營收將達到1000億美元,相當於現時雀巢的年銷售額。

 

原文網址:https://zh.gushiio.com/ai/3231.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *