大模型開源潮:DeepSeek領銜,六小虎、大廠齊發力,格局重構進行時

“當下閉源模型份額高於開源,未來一兩年內會發生顛覆性變化。”

大模型開源潮:DeepSeek領銜,六小虎、大廠齊發力,格局重構進行時插图1

圖片來自視覺中國

藍鯨新聞2月26日訊(記者武靜靜
)DeepSeek連續五天的開源動作還在持續,不僅將全球開源的討論推到了新的高點,也帶來了更多閉源和開源的爭議和疑問。

甚至OpenAI近日也公佈了開源計畫,OpenAI CEO Sam Altman在社交平臺X上就公司下一個開源項目是
o3-mini級模型還是手機端側模型
徵詢公眾意見,讓用戶投票二選一。 此前,在2月6日,OpenAI也罕見地公開了最新模型o3-mini系列模型的思維鏈。

接下來,六小虎和大廠如何應對? 閉源大模型商業模式如何面對市場新拷問?

六小虎陸續開源,大廠加速佈局

被動或主動,從1月中旬以來,六小虎就陸續用實際的開源行動來應對這波開源潮。

1月15日,MiniMax發佈並首次開源了其最新一代基礎大模型MiniMax-01系列模型,包含基礎語言大模型MiniMax-Text-01和視覺多模態大模型MiniMax-VL-01,公開了科技報告,並開源了兩個模型的完整權重。

在2025 GDC全球開發者先鋒大會上,MiniMax副總裁劉華分享稱,開源是推動行業發展的關鍵,此次開源,是希望更多開發者可以參與底層生態建設,
加速非Transformer架構的創新。
“ 線性注意力探索方面,我們也只是起步,所以我們對所有的技術創新進行了全面的開源,希望有更多的開發者一起探索非transformer的底層架構,& rdquo;

2月18日,階躍星辰和吉利汽車集團聯合宣佈,將雙方合作的階躍兩款Step系列多模態大模型向全球開發者開源—& mdash; Step-Video-T2V視頻生成模型和Step-Audio語音模型。

階躍星辰副總裁李璟稱,& ldquo; 開源模型能够為模型公司帶來更多的支持者和科技社區的迴響,從而促進模型的反覆運算和優化。& rdquo;

李璟透露,接下來,階躍星辰會繼續開展更多開源計畫,在行業方面更加聚焦,之後也將也
即將在三月份開源圖生視頻
大模型

之後,在2月23日淩晨,Kimi宣佈開源其最新技術報告和大模型Moonlight。

頭部的基礎大模型創業公司之外,另一個備受關注的是大廠。

其中,阿裡對於開源的態度一直是支持,自2023年8月起,阿裡雲相繼開源Qwen、Qwen1.5、Qwen2、Qwen2.5等4代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大語言、多模態、數學和程式碼等全模態。 資料顯示,現時阿裡千問(Qwen)衍生模型數量已超過10萬個。

阿裡最新一次開源發生在2月25日晚間,阿裡雲旗下視覺生成基座模型萬相2.1(Wan)也宣佈開源,其中14B和1.3B兩個參數規格的全部推理程式碼和權重全部開源,同時支持文生視頻和圖生視頻任務。

出乎意料的是,在2月14日,百度宣佈將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源。
從宣佈開源計畫到最終開源,百度計畫用四個月來實現,
足以看出此次開源是計畫之外,也需要重新投入人力和資源才能達成。

現時位元組在大模型領域的開源主要在訓練框架方面,尚未公佈更多基礎大模型的開源動作。

當下閉源份額高於開源,未來一兩年內會發生顛覆性變化

隨著各家都在緊鑼密鼓地佈局,更多討論也隨之而來,開源是否會衝擊現在閉源模型的商業模式,大模型生態將會發生什麼變化?

在2025全球開發者先鋒大會開幕式上,香港科技大學校董會主席、美國國家工程院外籍院士沈向洋、指出:& ldquo;
DeepSeek的開源是開源社區的勝利
。將了不起的模型開源出來,可以讓更多的人有機會在這些模型的基礎上做更多了不起的事情”

大模型開源潮:DeepSeek領銜,六小虎、大廠齊發力,格局重構進行時插图3

沈向洋認為,現時市場上,
閉源的份額可能略高於開源

但這種情況在未來一兩年內可能會發生很大的變化。
“ 開源和閉源並不是完全對立的,可以通過合理的商業模式實現兩者的平衡,未來需要找到一個平衡點,使得開源和閉源能够更好地共存和發展。& rdquo;

沈向洋並
不認為開源就意味著就無法創造商業利益,
他提到:& ldquo; 可以通過提供軟件服務等形式實現商業模式的創新。 例如,Red Hat通過提供Linux相關的軟件服務,成為了市值數百億美元的公司。& rdquo;

從科技和產品上來看,開源和閉源產品各有優劣勢。

Hugging Face工程師王鐵震分享稱,相對於閉源模型,開源模型給予用戶所有的掌控權,包括給用戶微調模型的權利,還有在數據隱私方面有非常好的優勢,可以
根據特定領域的數據進行訓練,從而更好地適應和解决該領域的問題。

但他也提到,
閉源模型的優勢在於其產品化和易用性
。“ 閉源模型是一個產品,用戶只需調用API即可,無需自己部署和維護。 相比之下,開源模型更像是一個工具,用戶需要自己搭建機房、申請服務器、進行部署,並且需要一定的科技團隊來支持。& rdquo;

開源和閉源的更多討論還在持續,短期來看,DeepSeek的開源勢必會縮窄各大模型能力差距,開源和閉源模型能力差异也越發不明顯,大模型的格局將會形成新的走向。

接下來,不論對大廠還是創業公司,如何打造產品能力,與產業深度融合,把壁壘建得更深厚,將成為大模型市場競爭的關鍵。

大模型開源潮:DeepSeek領銜,六小虎、大廠齊發力,格局重構進行時插图5

原文網址:https://zh.gushiio.com/gushi/3087.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *