openai自曝gpt-4.5馬上發布、gpt-5免費無限用,推理模型o3-mini或成為絕唱
(圖片來源:unsplash)
2月13日消息,gushiio.com股市智能agi獲悉,openai執行長奧爾特曼(sam altman)今晨公布關於gpt-4.5和gpt-5的路線圖消息。
奧爾特曼表示,openai將很快(幾周/月內)發布代號為“orion”(獵戶座)的 gpt-4.5,也是最後一個非思維鏈模型,並且會整合gpt和o系列,即將(數月內)推出具備多項新功能的gpt-5。
奧爾特曼強調,此前公布的推理模型o3將不會以獨立模型形式發布。最重要的是,免費版chatgpt能在標準智能設置下無限制地使用gpt-5基礎班進行對話,不過會有防止濫用,而plus/pro付費用戶將以更高的智能水平使用gpt-5。
而這也意味著,gpt 4o、openai o3-mini或成為“絕唱”,gpt-5也將成為該公司第一個世界模型。
同時,openai發布一個全新的模型規範(model spec),更新後的模型規範特別強調知識自由,即 ai 應該允許人們自由探索、討論和創作,而不受不必要的限制;此外,openai還宣布深度搜索(deep research)權限下放,每月20美金的plus用戶每月十次,免費用戶每月兩次使用deep research,以及o1和o3-mini現支持chatgpt文件和圖像上傳,plus用戶的 o3-mini-high限額每天最多可達到50次。
消息一出,全網刷屏。有意思的是,網友問:“但問題擺在這兒,它能超過中國的deepseek不”,也有網友稱,,這不就是降級,orion 現已降級至 4.5,也沒有o3,“它甚至很難在幾個月內擊敗 deepseek。& rdquo;
對於openai路線圖轉變,2月13日上午,一位 ai 領域技術專家對gushiio.com股市智能agi表示,“(openai)模型智力、能力提高不了了,用‘大雜燴’系統提供解決方案”。在他看來,其實openai一直沒訓練出gpt-5,但現在是被deepseek刺激到,提前把新模型拿出來,但模型發展已經處於停滯,技術進步可能不是特別大。
很顯然,deepseek引發的熱潮以及馬斯克的最新動態,似乎促使openai在技術發展方向上有所轉變。
openai不再“擠牙膏”,gpt-5或將在今年推出
萬萬想不到,短短216個單詞的推文,奧爾特曼竟然讓全網刷屏看到gpt-5消息。
“we want ai to“ just work” for you; we realize how complicated our model and product offerings have gotten.& rdquo;
在推文中,奧爾特曼首先承認,openai 已經意識到自家的模型和產品供應已經變得非常複雜,需要簡化產品供應。
對此,openai公布一系列措施,包括在幾周/月內發布gpt-4.5、統一o系列模型和gpt系列模型,然後以gpt-5為始發布新系列模型們,以及直接給用戶一個規模最大、最先進的模型技術系統。
“我們和您一樣討厭模型選擇,並希望回到魔法般的統一智能。我們的首要目標是通過創建可以使用我們所有工具、知道何時需要長時間思考、並且通常可用於非常廣泛的任務的系統來統一 o 系列模型和 gpt 系列模型。& rdquo;奧爾特曼表示。
事實上,從gpt-1到即將發布的gpt-4.5,經歷了6年之久。
- 2018年:6月,openai發布gpt-1,這是openai第一個大規模預訓練的語言模型,基於transformer架構,通過無監督學習從網際網路文本數據中預訓練,不過泛化能力相對有限,主要是一個語言理解工具。
- 2019年:openai發布gpt-2,模型規模擴大10倍,擁有 1.5 億個參數,在生成文本方面展現出強大能力,但因潛在濫用風險,openai以內測形式使用。
- 2020年:5月,openai推出gpt-3,擁有1750億個參數,在自然語言處理任務上表現驚人,能完成生成文本、回答問題、翻譯等多種任務,openai 沒有公開發布模型本身,僅通過 api 向部分用戶提供訪問權限。
- 2022年:gpt-3.5發布,openai 利用人工標註數據和強化學習提升了模型性能;同年11月30日,基於gpt-3.5的 ai 聊天機器人產品chatgpt發布,風靡全球。
- 2023年:3月14日,openai發布gpt-4,語言理解能力更強大,能處理圖像內容,對月訂閱費20美金的plus用戶開放使用。11月7日,openai在首屆開發者大會上宣布gpt-4升級為gpt-4 turbo。
- 2024年:5月,openai 推出可免費使用的 gpt-4o,支持文本、視覺、音頻多模態;7月18日,openai推出gpt-4o mini;9 月 12 日,openai 正式對外發布 o1 模型的預覽版,同時發布了o1-mini。12月5日,openai發布了正式版openai o1模型,隨後在今年還公布了o3-mini系列,性能和性價比都超越o1模型。
如今,在開源ai模型deepseek v3/r1,以及馬斯克的競購動作影響下,一夜之間,openai終於不再“擠牙膏”,全面加速,最快今年發布gpt-5模型。
奧爾特曼表示,chatgpt免費版將在標準智能設置下獲得對gpt-5的無限制聊天訪問;每月20美金的plus訂閱付費用戶將能夠以更高的智能水平運行gpt-5;每月200美金的pro訂閱者將能夠以更高的智能水平運行gpt-5。這些模型將融合語音、畫布、搜索、深度研究等。
而目前,chatgpt plus訂閱界面如同一張技術菜單:主打通用場景的gpt-4o標註著“適合大多數問題”,需手動開啟的“定時任務版”允許延遲響應;專注於數學與邏輯的o1和o3-mini分別強調“高級推理”與“編碼能力”;gpt-4仍以“經典模型”名義保留。
根據此前報導,gpt-4.5(獵戶座)是超越gpt-4的下一代大模型,核心優勢在於處理文本、圖像和視頻等多模態數據的能力,目標是實現指數級的改進、達到比gpt-4強100倍的能力,將成為大模型在語言處理和多模態功能上實現巨大飛躍的重要里程碑。
openai高管shaun ralston在x平台上發文表示,按照計劃目標,獵戶座的算力將達到gpt-4的100倍,其推出將標誌著ai能力的新時代。
不過需要指出的是,數月前就有報導指出,草莓(o系列)和獵戶座(gpt-4.5)代表了openai對人工智慧未來的願景。草莓將重新定義推理能力,而獵戶座則承諾前所未有的性能改進——二者將共同作為下一代旗艦模型gpt-5的構建塊。因此,很難說奧爾特曼是提前就有規劃,現在外部環境複雜下拿出思考已久的路線圖。
對此,openai員工ian silber感慨:“很高興能夠大大簡化我們的產品,讓更多人都能用上ai、多用ai。& rdquo;
google ai studio高級產品經理logan kilpatrick表示,“這一直是我們對gemini的計劃,確保推理能力是基本模型的一部分,而不是支線任務。(這也是為什麼我們發布了2.0 flash thinking)”。
斯坦福nlp團隊則轉發了相關推文,並配文字稱,“最後承認openai、anthropic等在2023年戰略()簡單地擴大模型大小、數據、計算和花費的資金將使我們達到 agi/asi)不再有效。& rdquo;
openai更新模型規範但不開源,谷歌、字節則持續加速模型疊代
與此同時,openai官方發布了一條題為“分享最新的模型規範”的文章,談及openai塑造所需模型行為的方法,核心是在推進 ai 發展與確保安全之間尋求平衡。
首先在模型規範更新層面,openai強化對可定製性、透明度和知識自由的承諾,基於去年 5 月的基礎,結合應用經驗進行更新。通過明確命令鏈和附加原則平衡創建實用安全模型、防止嚴重傷害、維護運營許可等有時衝突的目標。
其中,在命令鏈層,將明確模型處理平台、開發者和用戶指令的順序優先級,用戶和開發者可在平台規則內自定義模型行為;同時,模型需平衡避免引導用戶與探索各主題,了解用戶目標並適時提供批評性反饋;定能力基本標準,涵蓋事實準確性、創造力和程式化使用;說明模型平衡用戶自主權與預防傷害或濫用的方式,新版本全面涵蓋拒絕請求原因;提供格式和交付的默認指導,確保清晰可用。
最重要的是,openai明確鼓勵思想自由,只要不造成重大傷害,模型應能探討各類話題,避免宣傳特定議程。而通過收集對模型規範更新,初步結果表明,與去年5月的最佳系統相比,到今天,openai模型對模型規範的依從性有了顯著提高,openai認為這主要歸因於一致性增強,但仍有改進空間。
對於開源規範層面,openai將新版本模型規範基於creative commons cc0 許可發布到公共領域,開發人員和研究人員可自由使用、改編和構建。同時開源評估提示,計劃未來發布更多規範評估和協調的代碼、工件及工具,在 github 存儲庫定期發布新規範版本。
這意味著,openai希望讓更多人使用開源的openai技術。
早前deepseek發布以後,奧爾特曼承認,openai過去在開源方面一直站在“歷史錯誤的一邊”,需要想出一個不同的開源策略。
2025年1月31日,openai宣布,免費向用戶開放推理模型o3-mini,但其核心技術還是封閉的,仍然強調開源“不是我們當前的最高優先事項”。這表明,openai短期內不會在開源方面有實質性的轉變。
下一步,openai計劃持續擴大挑戰範圍,納入實際使用中發現的案例。同時,隨著 ai 系統進步,持續疊代原則,邀請社區反饋並公開進展。不再為每次更新發布博客文章。目標是在研究和創新指導下,安全啟用新用例,不斷學習改進,鼓勵公眾參與 ai 技術發展當中。
不過與此同時,谷歌、字節等多個 ai 科技龍頭正在加速閉源模型疊代速度。
面對deepseek所掀起的低價高效風潮,2月初,谷歌正式推出了旗艦ai 模型gemini 2.0 pro experimental,並同時發布gemini 2.0 flash thinking 模型,被視為谷歌在ai 領域積極應對競爭,鞏固其市場地位的重要舉措。
最新gemini 2.0 pro 甚至可以調用谷歌搜索等工具,並代表用戶執行代碼。同時,gemini 2.0 pro 的上下文窗口達到了200萬tokens,這意味著它可以一次處理約150萬個英文詞彙,此容量足以讓它在單個提示中讀取《哈利波特》系列的所有七本書,並且還剩下約40萬個單詞的空間。
2月5日,谷歌ceo桑達爾·皮查伊(sundar pichai)在業績電話會議上讚揚deepseek,認為降低ai成本將對科技巨擘及整體ai需求產生積極影響。皮查伊稱,隨著ai推理成本持續下降,更多的ai應用將變得可行,認為谷歌的gemini 2.0 flash模型及2.0 flash thinking模型在效率上可與deepseek r1模型媲美。
而2月12日,字節跳動旗下“豆包大模型”foundation團隊公布,其提出一種全新的稀疏模型架構“ultramem”,該架構在保證模型效果的前提下,推理速度較傳統的moe(專家混合模型)架構提升2到6倍,推理成本最高可降低83%。這項創新成果已被機器學習和ai領域的頂級會議iclr 2025接收,為解決大模型推理效率和擴展能力問題提供了全新思路。
更早之前,豆包大模型團隊與北京交通大學、中國科學技術大學聯合提出視頻生成實驗模型“videoworld”,能達到了專業 5 段 9×9 圍棋水平,並能夠在多種環境中,執行機器人任務,目前,該項目代碼與模型已開源。
gpt-5的消息也正值openai的關鍵時刻。本周,馬斯克牽頭的財團出價974億美金尋求控制openai,交易達成後馬斯克會將openai與旗下的xai合併,但這一收購請求被奧爾特曼秒拒,稱“openai是非賣品,馬斯克的收購提議更多是他為減緩競爭對手步伐的策略性舉動。我並不認為馬斯克的收購提議值得特別認真對待。& rdquo;
根據規劃,openai近期還將完成總額400億美金的融資計劃,投後估值高達3000億美金。同時,openai還將完全重組為一家營利性企業,有望加快公司商業化進程。
原文網址:https://zh.gushiio.com/ai/1397.html