DeepSeek頭號黑粉這下爽到了
文|字母榜,作者|畢安娣,編輯|趙晋傑
還真讓DeepSeek頭號黑粉美到了。
北京时間2月25日,Anthropic傳來兩個好消息。
第一個好消息是,Anthropic發佈首個“ 混合模型” Claude 3.7 Sonnet。 在騰訊、阿裡、xAI等紛紛跟上DeepSeek的脚步,推出推理模型的時候,Anthropic說“ 我都要”, 將及時應答和深度思考結合,拋弃了多模型堆砌的做法。
第二個好消息是,在Claude 3.7 Sonnet發佈的幾乎同時,《華爾街日報》稱Anthropic接近完成35億美元的新一輪融資,估值可能達到615億美元,是此前180億美元估值的3倍有餘。
Anthropic有很多頭銜。 這家公司是OpenAI“ 叛軍” 代表,是矽谷藝員人工智慧初創公司。 同時,在近一個月,該公司還成為了“ DeepSeek頭號黑粉”, 不僅質疑V3的600萬美元訓練成本,還由聯合創始人之一親自上陣撰寫檄文,呼籲加强美國的晶片出口管制。
如今新模型發佈,再加上融資即將超額完成的消息,Anthropic暫時頂住了DeepSeek帶來的壓力。
這不僅是屬於Anthropic的好消息,實際上,在華爾街和福斯都因DeepSeek質疑矽谷的高支出AI戰畧時,Anthropic的表現證明著神話還未破滅。 對OpenAI等也在融資的企業來說,也無疑是一個積極的訊號。
01
DeepSeek R1推理模型的推動下,OpenAI火速上線o3 mini,馬斯克的xAI也在上周發佈Grok 3時帶上了Grok Reasoning。
而Anthropic此時選擇:來個混合大招。
此前一直傳聞Claude 4即將發佈,但Anthropic這次實際上發佈的是Claude 3.7 Sonnet。
Anthropic稱,Claude 3.7 Sonnet是市面上首款“ 混合模型”, 並將立即投入使用。
此“ 混合”, 指的是
業界首個在單一架構上綜合實时應答(Fast Thinking)和深度思考(Slow Thinking)的模型。
相比而言,不管是DeepSeek的R1模型,還是OpenAI的o3-mini,都是嚴格的推理模型。
在使用R1和o3-mini時,思考過程是強制的,用戶只能等待,由此拖慢獲取答案的時長。 但有的問題實際上並不需要長時間地思考,這時候需要用戶來判斷並切換到及時應答的模型。
但在Claude 3.7 Sonnet這種混合模型中,用戶不必切換即可獲取實时應答或者深度思考。
“ 這個模型融合了所有功能—& mdash; 我們的目標是擁有一個統一的AI,能適用於各種場景。 這樣對我們的客戶而言會更簡單一些。& rdquo; Anthropic聯合創始人兼首席科學家賈雷德·; 卡普蘭(Jared Kaplan)表示。
卡普蘭將其比作人類大腦的運行管道:有的問題需要深度思考,有的問題需要快速作答。
Claude 3.7 Sonnet將這兩種能力綜合在同一個模型中,而不是完全分開。
除此之外,用戶可以利用“ 草稿” 功能,在問題比較複雜時,指導模型進行更準確的思考; API用戶還可以精細控制Claude 3.7 Sonnet的思考時長,甚至控制思考的預算,如告訴Claude在回答時最多思考多少個tokens。
在模型表現上,相較於上一代Claude 3.5 Sonnet:& ldquo; Claude 3.7 Sonnet在遵循指令、一般推理、多模態能力和自主編碼方面表現出色,擴展思維在數學和科學方面提供了顯著提升。& rdquo; 值得一提的是,其數學、編碼能力提高10%。 其中編碼能力尤為突出,在多個測試中有所展現。
根據SWE Bench測試數據,Claude 3.7的程式碼能力大幅超越DeepSeek R1、OpenAI的o1、o3模型。 專注AI程式設計的Cursor已經宣佈集成Claude 3.7 Sonnet。
Claude 3.7 Sonnet已經全面上線,支持免費版、專業版、團隊版和企業版,此外可以在Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI上使用。 不過免費用戶現時無法使用擴展思考模式。
在定價方面,Claude Sonnet 3.7的價格為:輸入3美元/百萬tokens,輸出15美元/百萬tokens。 這與前代模型保持一致,並顯著高於競爭對手的純推理模型,如OpenAI o3 mini(輸入1.1美元/百萬tokens,輸出4.4美元/百萬tokens)和DeepSeek R1(輸入0.55美元/百萬tokens,輸出2.19美元/百萬tokens)。
在此基礎之上,Anthropic也同步發佈了專注於程式碼的Agent Claude Code,可以直接在終端運行,幫開發者完成程式設計任務。
從蒐索、閱讀程式碼、編輯檔案、編寫程式碼、運行測試,一直到將程式碼提交到GitHub。 不過,現時Claude Code僅作為有限的研究預覽版提供。
02
在發佈大模型的同時,Anthropic正在進行的融資也傳來好消息:
《華爾街日報》報導:& ldquo; Claude背後的公司克服了因中國DeepSeek的成功引發的投資者擔憂,估值達到615億美元。& rdquo;
據稱,Anthropic即將完成一輪35億美元的融資,估值將達到615億美元。 最新一輪融資的投資者包括創投公司Lightspeed Venture Partners、General Catalyst和Bessemer Venture Partners。 總部位於阿布達比的投資公司MGX也在洽談參與事宜。
這個數位雖然離OpenAI的1570億美元估值還有距離,但是超過了xAI去年底的400億美元估值。 xAI也正在尋求融資,預計估值750億美元。
要知道,這次融資之前Anthropic的估值還只有180億美元。
知情人士向《華爾街日報》透露,Anthropic最初計畫籌集20億美元,但在和投資者談判期間成功提高了這一數額。
Anthropic迎頭趕上,甚至拿出“ 要超越你們所有人” 的架勢,這並不令人意外。 可以說,今天的兩個好消息,都在夯實Anthropic被貼在身上的標籤。
Anthropic自2021年成立之初,就因其由OpenAI前員工創辦,而喜提“ OpenAI叛軍” 的稱號。
之前Anthropic已經多次搶先OpenAI一步。 如去年的“ 代理(Agent)” 功能,OpenAI在Anthropic之後跟進。
這次發佈混合模型,高舉“ 反多模型堆砌方案” 的大旗,也不禁讓人想到了OpenAI CEO山姆·; 奧特曼(Sam Altman)前不久發佈的GPT 5計畫。 彼時奧特曼就表示,意識到模型和產品功能太複雜,未來將統一。 不承想又被Anthropic搶先一步了。
Anthropic的聯合創始人卡普蘭和邁克·; 克裏格(Mike Krieger)都表示,預計競爭對手很快也會轉向這種混合模型的方向。
另一方面,在
DeepSeek R1橫空出世之後,Anthropic儼然化身“ DeepSeek頭號黑粉”。
對DeepSeek的態度,矽谷大佬們大多是贊許中帶著苦澀,但言語上還算客氣。
如馬斯克在Grok 3發佈前,一邊贊許DeepSeek R1很强,給中國工程師點贊,但也表示DeepSeek帶來的不算AI領域的一次突破,並順勢誇讚了自家的模型。
奧特曼一邊大贊DeepSeek“ 無疑是令人印象深刻的模型”, 一邊暗戳戳地表示DeepSeek用OpenAI專有模型訓練自己的模型,可能違反了其服務條款。 後來又“ 大方” 表示“ 沒有起訴DeepSeek的計畫”。
而Anthropic就很不会了,不僅壓根不相信DeepSeek V3的訓練成本僅有600萬美元,甚至創始人之一的達裏奧·; 阿莫迪(Dario Amodei)還發佈了檄文《關於DeepSeek和出口控制》。
文章的覈心思想就是,由於DeepSeek V3不可能只花了600萬美元成本,而咱們又聽說他們走私了晶片,囙此咱們得好好管制一下晶片出口。 之前只管H100和H800這些高端晶片顯然是不够的,咱得把H20也管起來。
Anthropic當然不願意認,雖叫“ OpenAI叛軍”, 但背靠巨頭燒錢這方面,二者如出一轍。 OpenAI前有微軟後有軟銀,而Anthropic則抱上了穀歌和亞馬遜的大腿。
尤其是亞馬遜,2023年就向Anthropic投資了40億美元,2024年又承諾投資40億美元。
而DeepSeek的大火又恰逢Anthropic進行新一輪融資之時,著急上火也是情理之中的(雖然手段有點讓人不齒)。 左手檄文打壓DeepSeek,右手發佈及時應答+深度思考的混合模型,總算穩住了局面,如果不出意外,這一輪Anthropic將超額完成融資目標。
03
Anthropic的兩個好消息,也可以讓矽谷暫時鬆口氣了。
正在融資的不止有Anthropic。
據《華爾街日報》等媒體,OpenAI正在洽談巨額融資,擬融資額至多400億美元,估值可能被推高至3000億美元。 此外,xAI也在進行新一輪融資,以750億美元估值尋求100億美元融資。 他們無疑也都感受到了DeepSeek帶來的投資者擔憂。
Anthropic至少證明了,在當下矽谷搞投入的AI路徑尚未神話破滅,& ldquo; 大力出奇迹” 在某種程度上依然可以打動人心,雖然可能需要付出比之前多的遊說成本。
但戰爭遠沒有結束。
一方面,Anthropic依然面臨著商業化難題,而這一點在後DeepSeek時代顯得更加刺眼。 Anthropic此前估值和收入比達到68.6倍,而OpenAI大概在42.4倍的水准。
據The Information,Anthropic的收入預計將從2025年的22億美元激增到2027年的120億美元。 挑戰在於開支,今年Anthropic預計“ 燒錢” 30億美元,已經比前一年的56億美元低了。 公司高層表示,預計到2027年可以停止赤字開支,實現盈利。
另一方面,自身商業化難解的同時,外部競爭也在加劇。
Grok 3剛剛發佈,Anthropic發佈混合模型,緊接著穀歌的視頻生成模型Veo 2 API也曾宣佈在年初發佈,還有OpenAI的GPT-4.5隨時可能降生,以及GPT-5預計在5月底發佈。
開源的戰場也越來越熱鬧。 馬斯克的xAI延續新代發佈、開源上一代模型的做法,宣佈將開源Grok 2。 而OpenAI—& mdash; 此前和Anthropic一起被視為“ 閉源” 的代表—& mdash; 也松了口,奧特曼面對DeepSeek的大火,直接坦言過去站在了“ 錯誤的一邊”, 在社交媒體上發起投票,釋放將有一個“ 開源項目” 的訊號。
而眼下,DeepSeek也沒有坐以待斃,而是宣佈啟動“ 開源周”, 現時已經開源FlashMLA(直譯為快速多頭潜在注意力機制)的程式碼,以及EP通信庫。
Anthropic頂住了DeepSeek的壓力,發佈混合模型、傳出超目標融資的消息。 但要讓好消息延續,仍有諸多挑戰。
原文網址:https://zh.gushiio.com/ai/2857.html