鯨觀察|deepseek競爭壓力下,openai 公開了o3思維鏈,變open了?
openai正在嘗試開放性的動作。deepseek開源之後,很多基礎大模型都要面對“如何保持自己競爭力”這一提問,更多公司的價值和估值也會受到挑戰。
圖片來自視覺中國
藍鯨新聞2月7日訊(記者 武靜靜)當地時間2月6日,openai 公開最新模型 o3-mini 系列模型的思維鏈(以下簡稱cot)。
openai公開了o3-mini思維鏈,但不是原始版本
思維鏈簡單來說就是模型在解決問題時的中間推理步驟,類似人類在思考問題時拆解問題、逐步推理的過程。用戶也可以在用大模型時直觀地看到機器是如何動態思考並給出答覆的。
目前,國內市場,用戶在使用deepseek深度思考r1模型以及kimi的k1.5長思考模型時已經可以直觀的看到大模型的動態思考推理過程。
比如,輸入“算八字”的指令,deepseek r1的思維鏈和給出的答覆是這樣的。
輸入“聖杯一的含義”,kimi顯示的推理過程是這樣的:
openai研究員noam brown在社交平台提到,“see cot live”通常是大模型的“aha moment”(頓悟時刻)。不過他提到:雖然已經非常接近,但這並不是原始的思維鏈。
為什麼不公開原始的思維鏈?奧特曼解釋稱,團隊正努力整理原始的cot提升可讀性,並在必要時提供翻譯,儘量保持原始內容的忠實度。
openai首席產品官kevin weil發文稱:“我們知道用戶想要看到這些,openai會找到一個合適的平衡點。& rdquo;
由於deepseek在全球範圍內的技術進展和開放性舉措正在獲得大量關注,因此,有人紛紛將deepseek r1模型和openai的新動作進行比較。有用戶在奧特曼的帖子下發表評論稱:“可讀性是否是不公開原始思維鏈的唯一理由?還是存在其他原因?deepseek cot之所以如此有趣的原因之一是因為它是原始的、未經過濾的。& rdquo;
有用戶認為openai此舉是看到deepseek的產品效果和開源舉措後,一次打破過往嚴防死守的“封閉”路線的跟進動作。也有用戶對openai現在才開放思維鍊表達不滿,並稱“deepseek免費執行此操作。& rdquo;
deepseek開源後,基礎大模型面臨的新難題
可以理解的是,此前openai一直未公開思維鏈,一個重要原因在於“保密性”,以此保障自己的技術領先地位。一位開發者告訴藍鯨新聞:“一方面,思維鏈可能包含模型的內部工作原理,競爭對手可以利用這些信息來改進自己的模型。另一方面,思維鏈中包含敏感的數據或信息。如果模型在訓練過程中接觸了某些機密數據,這些數據可能在思維鏈中有所體現。公開這些信息可能會導致數據泄露,影響公司的利益。& rdquo;
“不公開原始思維鏈可能是出於用戶體驗、隱私保護、輸出質量、技術成本和商業機密等多方面的考慮。這樣既能提供有用的思考過程,又不會帶來負面影響。& rdquo;前述開發者表示。
但是,思維鏈的開放也會給用戶帶來顯而易見的價值,一位海外開發者認為,r1最酷的事情之一是暴露模型提示詞彙如何影響cot,使得不良響應更容易解決。推理過程公開可以讓開發者更容易看到哪個環節出現錯誤,這樣用戶就可以消除歧義並引導ai回答得更準確。
開放和開源也是deepseek當下在全球產生這麼大影響的原因之一。正如deepseek創始人梁文峰此前在接受《暗涌》採訪時提到,在顛覆性的技術面前,閉源形成的護城河是短暫的。他當時說道:“開源,發論文,其實並沒有失去什麼。對於技術人員來說,被follow是很有成就感的事。其實,開源更像一種文化行為,而非商業行為。& rdquo;
meta首席ai科學家楊立昆(yann lecun)公開談到,“正確的解讀是:‘開源模型正在超越專有模型’,deepseek提出了新想法,並在其他人的工作基礎上進行了構建。由於他們的工作是公開且開源的,因此每個人都可以從中受益,這就是開放研究和開源的力量。& rdquo;
近日,openai ceo sam altman罕見地發表了檢討,稱在開源方面他們“一直站在歷史的錯誤一邊”,也在內部承認了開源問題上的保守策略是一個戰略失誤。
如何把握開放的尺度?這是openai當前面臨的一道關鍵選擇題。
openai當下“公開思維鏈”這個表面看上去的小動作,背後也印證了公司正在嘗試更多開放性的舉措。
openai之外,在deepseek開源之後,對於全球的大模型公司都產生了重大影響,很多基礎大模型都要面對“如何保持自己競爭力”這一提問,更多公司的價值和估值也會受到挑戰。
原文網址:https://zh.gushiio.com/gushi/319.html