deepseek的“鲶魚效應”

2025年中國人工智慧拉開了大幕,真正的爆發正在迎面趕來。

文|潮汐商業評論

蛇年前夕,deepseek猶如一顆“原子彈”般震撼了全球人工智慧領域。

這款主打“極致性價比”的大語言模型,不僅在性能上比肩openai的頂尖模型o1,其成本更是僅為gpt-4o的十分之一,api調用成本更是低至openai的三十分之一。

這證明了ai企業依靠燒錢卷“投流”“獲客”的路徑不可行,更凸顯了長期主義地原始創新和低成本研發的重要性。

這也打破了技術閉源的openai和英偉達的市場壟斷,更引發了全球科技巨頭的股價波動,英偉達市值一夜之間蒸發4.3萬億元。

目前,deepseek累計用戶已經超過了1.25億。它像鲶魚一樣,攪動全球人工智慧領域,讓國內ai基建重拾信心,被稱為“國運”級別的存在。

01 新路徑彎道搶跑

ai大模型是一個重資產行業,2024年scaling law仍未失效,隨著模型不斷變大,訓練新模型需要更多的數據、更多的算力。

這意味著需要充足的資金支撐。一位大廠高層給出判斷,做大模型,“一年低消也要20億-30億美金”。

deepseek的出現,證明了ai企業依靠燒錢卷“投流”“獲客”的路徑是不可行的,以往中國ai大模型“卷”算力、“卷”價格、“卷”獲客、“卷”變現能力,如今人們更認可長期主義的原始創新,企業應當思考架構創新和低成本研發,而不是一味燒錢。

在過去的2024年,月之暗面的kimi和字節跳動的豆包輪番成為大眾追捧的ai應用。它們背後是重金推廣和瘋狂卷算力。

以抖音為例,2024年字節跳動才開始在大模型上發力,憑藉此前的火山雲基礎設施和人才團隊積累,以及大規模資金投入和四處挖人。在網際網路四巨頭裡,字節跳動在ai領域的投入上高達800億人民幣,遠超騰訊、阿里、百度。

字節跳動旗下火山引擎支持多芯、多雲架構,擁有超大規模算力,支持萬卡集群組網、萬億參數moe大模型;提供超高性能網絡,支持3.2tbpsrdma網絡,全球網絡pop覆蓋廣,時延優化最高達75%,在算力資源上優勢也很明顯。

deepseek的出現推動了ai技術更加普及和高效,其崛起將推動小型化模型即邊緣ai的推廣,使雲端和邊緣處理的混合ai模型被認為是ai未來的發展方向。

02 與友商們都“交個朋友”

deepseek解決了國產ai領域的困局,應用的落地,激活了整個行業。國產晶片、軟硬體公司、雲廠商紛紛接入deepseek“交個朋友”。

大模型企業們對於算力的需求不斷攀升,對於雲服務的需求提升明顯。騰訊雲、阿里雲、華為雲、百度智能雲、火山引擎等數十家雲計算服務龍頭,拆掉了圍牆,都推出限時優惠、包年包月等選項。

在晶片領域,華為升騰、沐曦科技、摩爾線程、壁仞科技等10多家國產ai晶片企業,都表示適配了deepseek原版或“蒸餾”後的小尺寸版本。

同時,國產手機品牌和新能源汽車品牌也紛紛接入deepseek。

另外,deepseek也刺激了阿里雲通義團隊發布旗艦模型“qwen2.5-max”,成為第二家可以比肩美國openai公司o1系列的國產大語言模型,讓行業內外為之振奮。

deepseek的效應還在持續,將吸引以華為為代表(還包括寒武紀、海光、摩爾線程等)的國產算力廠商會投入更大資源支持國產大模型的適配,政府資源的支持力度也會加大,這有利於國內人工智慧的產業鏈更好發展。

同時也會加劇競爭,頭部優勢廠商變強,一批原先瞄準通用大模型為目標的創業公司和網際網路公司將因為資源無法支撐而退出角逐,轉而做特定方向的人工智慧應用落地,這有助於我們國內人工智慧產業資源的更合理分布。

deepseek驗證的長思維鏈模式,有助於整個產業鏈降低在數據推理路徑標註的投入,未來大模型在需要複雜推理的應用落地過程會進一步加快。

從deepseek的推出到應用端鋪開布局,再到投資者重新理解中國科技企業的技術潛力、對科技股價值重估,這種轉換讓人炫目。deepseek“國運”系身一點都不誇張。

03 國產大模型有了新奔頭

deepseek的爆火出圈,也讓美國和歐洲看到,中國在大模型產業已經形成一批頗具實力和影響力的公司,其中有字節跳動、阿里、騰訊等大廠身影,也有月之暗面、智譜、minimax等初創企業。

客觀來講,國內無論是deepseek v3/r1、訊飛星火x1,還是字節的豆包、阿里的通義千問等國產大模型,目前和openai的o3相比在現實物理規律的理解和運用、超複雜科學問題的求解、多模態視頻流輸入理解等高難度任務上還是有差距。

通用人工智慧也不僅局限於此,在多模態大模型、具身智能、世界模型、環境模擬器等多個方面,中國的人工智慧都有可挖掘的巨大空間,尤其是在高製程人工智慧晶片的量產和演進能力方面。

當然,中國人工智慧還是會面臨一些挑戰。

deepseek基於以英偉達算力取得的如此大的成就,勢必會引發海外針對晶片供應的封鎖手段不斷升級,給國產大模型的發展帶來更多限制。

尤其是美國大概率會對我國的英偉達算力獲取和國產算力海外投片採取更嚴苛的限制措施,h800、a100、h20等卡將會被全面禁止,給deepseek帶來的限制將日益增多。

所以實現國產算力的自主可控將更為關鍵。幸運的是,國產所有大模型中已經有一家公司憑藉國產算力做出了成績。

訊飛星火大模型的訓練和推理都在國產算力上進行的,並且僅用了1萬張910b國產算力卡。科大訊飛不僅用比友商少數倍的算力取得了大模型研發上的一些成果,而且還做了大量國產算力平台上的無人區的適配和效率優化,可以說是真正把國產算力做到了極致效率,這比在英偉達上的實現更需要技術實力和勇氣,也更具有戰略意義。

如果訊飛星火能取得成功,將會像deepseek一樣,給予了我國同行們比以往更有信心和勇氣做底層的技術創新。

從這個角度上看,deepseek也只是為2025年中國人工智慧拉開了大幕,真正的爆發正在迎面趕來。

潮汐編輯部的jesse最近兩周已經習慣了在成稿後來一場“人機對話”,以期獲得些意外的觀點。這次當她把問題輸入,只見對話框旋轉半天后,deepseek彈出了一行字:“伺服器繁忙,請稍後再試。& rdquo;

deepseek以“白菜價”技術打破壟斷,用開源生態凝聚產業鏈,最終引爆了國內ai從技術到商業的全面升級。可這一切都來的太快了,烈火烹油,總要給deepseek和整個ai行業一點時間適應。

正如deepseek創始人梁文鋒在採訪中所說,“以後硬核創新會越來越多。當這個社會讓硬核創新的人功成名就,群體性想法就會改變。我們只是還需要一堆事實和一個過程。& rdquo;

你看,商業就是這樣。

聲明:本文內容僅代表該投稿文章作者觀點,不代表藍鯨號立場。
未經授權不得隨意轉載,藍鯨號保留追究相應責任的權利

原文網址:https://zh.gushiio.com/gushi/1593.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *