2024,“大模型六小虎”逐夢ai圈

文章來源:甲子光年

2024,“大模型六小虎”逐夢ai圈插图image source: generated by ai

2024年,從“百模大戰”的喧鬧中所沉澱下來的創業公司第一梯隊,大概是一個“6+2”的格局。

“6”為智譜、minimax、百川智能、月之暗面、階躍星辰與零一萬物,業內也常稱為“大模型六小虎”;“2”即兩家規模稍小但各具特色的公司:深度求索(deepseek)與面壁智能。

在chatgpt剛發布不久,大模型六小虎是創業賽道最閃耀的明星。但到了今年下半年,形勢正在悄然生變。

近期幾位投資人都對“甲子光年”表示,有兩家小虎已經隱隱有掉隊的勢頭,而且每個投資人給出的剛好是兩個相同的名字。“但是也沒有說哪家活得特別好的,明年再跑跑看吧。按現在的估值來算,不管哪家都是低於預期的。”其中一位投資人補充道。

另一位投資人表示,六家的綜合能力大致在同一緯度,但融資規模已有差異。

此外,幻方量化旗下的深度求索在今年一鳴驚人,近期發布的deepseek v3在多項評測成績上一舉超越阿里qwen-2.5與meta llama 3.1,成為開源模型的新王。有人認為,deepseek事實上已經躋身“六小虎”之列。

六小虎的競爭也在無限擴大,在2023年後知後覺的科技巨頭在2024年後來居上。在海外,谷歌剛剛立下軍令狀,要在關鍵的2025年吹響反擊的號角。在國內,字節跳動也在ai戰略上全面出擊。

2025年,大模型創業公司將會如何應對?

1.agi夢開始的地方

把時間尺度稍微拉長,才能更直觀地感受暗流涌動。不妨先回顧一下大模型六小虎的起點。

智譜與minimax是唯二兩家成立時間早於chatgpt發布的公司,他們比大多數人更早看到了技術的拐點。

智譜成立於2019年6月,是國內第一批,也可能是第一個探索大模型的公司。成立的第一天,智譜寫下了“讓機器像人一樣思考”的願景。

智譜一周年的司慶日正好撞上了openai發布gpt-3。當天張鵬與受邀而來的張鈸院士深入討論了gpt-3的技術前景。張鵬隱隱意識到,這個被稱為“大模型”的技術,將是未來的技術方向。張鵬說:“openai做的這個事情,也是我們一直期待去做的,一定追尋去做的,更是一定要去做的。”

智譜成立兩年後,minimax成立。2021年,閆俊傑在一個不到100平米的房間裡寫下了minimax的初心和路徑,要實現“intelligence with everyone”。閆俊傑當時寫下的三個判斷至今依然未變:做下一代ai;做接近圖靈測試的智能體;智能創造極致體驗

024,“大模型六小虎”逐梦AI圈"

閆俊傑在釘釘生態大會上分享minimax的day1,圖片來自“甲子光年”拍攝

在chatgpt發布之後,大模型迅速從一個冷門晦澀的技術詞彙搖身一變成為投融資市場最熱門的話題。很多人講不清楚大模型的概念,但不妨礙它是技術發展的共識。背負著成為“中國的openai”的期待,大模型六小虎應運而生。

在百川智能成立的公開信上,王小川激動地表示:“生活在二十一世紀初是如此幸運,波瀾壯闊的網際網路革命還沒有謝幕,通用人工智慧時代又呼嘯而來。多年前我曾斷言,機器掌握語言,通用人工智慧時代就來了;我也有暢想,搜索的未來是問答。chatgpt的騰空出世,地動山搖,這一切都開始成為現實。chatgpt發布到今天,僅僅131天,每天都有撲面而來的新進展、新突破。131天恍如隔世!”

同樣感到激動的還有楊植麟。在他看來,chatgpt所展現出的高級推理能力放在三五年前是不可思議的,它會催生資本與人才的變量,這是做ai的核心生產要素,並帶來一個可能性從0到1搭建構建agi(通用人工智慧)的組織。楊植麟把公司名字命名為自己最喜歡的搖滾樂隊pink floyd的專輯《月之暗面》,同時也代表了公司對於神秘與未知的探索精神。

2022年12月,姜大昕問chatgpt的第一個問題是:“你多大了?”在過去,這個對於人類再簡單不過的問題會難倒所有的機器,但chatgpt的回答是,它在2019年被訓練完成,今年是2022年,所以是3歲。姜大昕又問:“你明年多大?”這個問題的難點在於讓機器理解明年是“今年+1”,涉及到數字的推理,chatgpt又答對了。chatgpt的回答讓這位資深的技術專家出了一身雞皮疙瘩,姜大昕意識到劃時代的技術變革到來了。

李開復是這一批agi創業者中年齡最大的一位,他在40年前提交的cmu(卡內基梅隆大學)的博士申請信就是探索ai。李開複本可以以投資人的身份站在幕後,但在40年後終於看到通過agi的夢想有機會實現之時,李開復終究還是按捺不住心中的熱情而躬身入局。他在2023年3月20日發出英雄帖,籌備零一萬物。

024,“大模型六小虎”逐梦AI圈"

1983年李開復的cmu博士申請信

在短短3個月時間內,大模型六小虎陸續就位:百川智能成立於2023年3月,月之暗面、階躍星辰成立於2023年4月,零一萬物成立於2023年5月。

楊植麟曾解釋過公司成立時間以及融資窗口的緊迫性:“chatgpt擴散需要時間。有的人知道得早,有的人知道得晚,有的人一開始懷疑、後面變成震驚、再變成相信。找人找錢,跟timing結合得很緊。我們2023年2月開始集中做第一輪融資。如果delay(延遲)到4月,基本沒機會了。但如果2022年12月或2023年1月做也沒機會,當時有疫情,大家沒反應過來–所以,真正窗口就是一個月。”

回過頭來看,楊植麟的判斷基本上是完全正確的。2023年下半年之後成立的ai公司,要麼很難再拿到大額融資,也就很難再躋身第一梯隊;要麼就是像面壁智能(面壁的成立時間也較早,2022年8月)一樣,深耕端側大模型的垂直細分領域,或者像deepseek一樣,依附於“不差錢”的母公司幻方量化,可以相對理想主義地對agi展開“深度求索”。

大模型六小虎都帶有同一個理想–agi。但是如何實現agi,不同的公司逐漸形成戰略分化,這在2024年逐漸變得明顯。

2.“六小虎”戰略分化

2024年6月14日的智源大會上,楊植麟、王小川、張鵬、李大海四位“清華系”大模型獨角獸的創始人罕見同台,分享了各自對於“通往agi之路”的觀點。在智源研究院院長王仲遠的主持下,幾位創始人幾乎沒有直接的交鋒,但這仍然是一次難得的同台。

024,“大模型六小虎”逐梦AI圈"

圖片來自智源大會

agi是大家共同的目標,但一千個從業者有一千個agi,如何實現agi也分化出了不同的路線。

為了將agi從定性的描述變成定量的描述,deepmind、openai以及智譜都先後定義了agi的等級。

在智譜的定義中,l1代表ai學會使用語言,l2代表ai具備邏輯思維能力與多模態理解能力,l3代表ai學會使用工具(agent)的能力,l4代表自我學習的能力–也就是國際上非常熱的“超級對齊”,l5代表全面超越人類、探究科學規律的能力,已經趨近agi。

同時,智譜也定義了當前agi的進度條。他們認為,l1的進度已經達到80%,l2的進度為60%,o1是推理模型的新範式;l3的進度只有40%,agent的能力還處在非常早期的階段;l4、l5才剛剛起步。

024,“大模型六小虎”逐梦AI圈"

智譜公布的面向agi的路線圖

如果用一個詞來評價智譜的戰略,或許是“穩重求勝”。

過去兩年,智譜採取了最穩妥、確定性最高的路線,那就是緊盯行業內最好的公司openai,從底層的預訓練框架,到模型,到最上層的應用,做全方位的對標。但永遠當追隨者最好的結果也只能是老二。從2023年下半年開始,智譜就在很多場合強調,做中國的chatgpt遠非公司的目標。

今年openai的腳步有所放緩,智譜在對標openai之外,加大了對l3–agent的投入。在2023年11月的發布會上,張鵬在現場演示了用autoglm在微信里建群並在群里發出了100個、總價值2萬元的紅包。張鵬認為,agent像是在用戶和應用之間增加一個智能的調度層,連結所有應用甚至是所有設備,這可以看做是大模型通用作業系統(lm-os)的一種雛形。

另一家明確對標openai的大模型公司是階躍星辰。階躍星辰是六小虎中公開露面最晚的公司。從公司成立的第一天,階躍星辰就在公司展廳的展板上畫出了一條與openai相似的業務主線–從單模態模型到世界模型

姜大昕曾對“甲子光年”表示,openai的模型矩陣看似複雜,但背後的邏輯其實非常簡單。openai發布過的主流模型包括語言生成模型gpt-4系列、多模態生成模型dall-e與sora、多模態理解模型gpt-4v、端到端到端語音模型gpt-4o,以及最新發布的推理模型o系列。此外,openai還在積極布局具身智能,這是世界模型的核心載體之一。

姜大昕認為,大模型的演進將會經歷從早期語言、視頻、語音等各個模態獨立發展,然後逐步融合,到徹底融合的過程。姜大昕認為:“scaling law、多模態理解與生成的統一,是實現agi的核心認知。”

024,“大模型六小虎”逐梦AI圈"

這張技術路線圖由階躍星辰發布於2024年3月,“超級對齊”部分的q*、system2後來被證實為openai發布的o系列推理模型

minimax雖然成立較早,但一直對外保持低調的姿態。在2023年2月,minimax曾舉辦過一次小規模溝通會,核心創始人之一楊斌向“甲子光年”等居間了minimax自研的三個基礎模型:文本到視覺,文本到語音、文本到文本,minimax也是國內首家多模態大模型創業公司。當時,minimax的首款應用glow已經獲得近500萬用戶,後來該產品更名為星野,海外版為talkie。

minimax在2023年夏天開始研發moe混合專家架構,投入了80%的算力與研發資源。在經歷了兩次失敗後,minimax在2024年1月正式推出國內第一個moe大模型。2024年4月,minimax開始鑽研linear attention(線性注意力),成功研發出了新一代的基於moe+linear attention的模型,達到了可以比肩gpt-4o的水平。

在2024年8月31日的“minimax link夥伴日”上,閆俊傑表示“快”是minimax底層大模型的核心技術研發目標。閆俊傑還分享了他對於ai應用要提高滲透率和使用深度的三個關鍵因素:讓模型的錯誤率持續降低、無限長的輸入和輸出,以及多模態。

024,“大模型六小虎”逐梦AI圈"

閆俊傑分享minimax的模型及產品,圖片來自minimax

月之暗面並沒有公開過其技術路線圖,甚至沒有公布過其底層大模型的任何基礎信息。

在2023年10月,月之暗面發布其首款ai智能助手kimi,憑藉20萬字長上下文輸入一鳴驚人。當時,ahthropic的claude-100k模型只支持約八萬字,openai的gpt-4-32k只支持約2.5萬字。獨特的長上下文功能讓kimi在短期內獲得了大量的用戶,成為國內最受關注的ai智能助手。

用戶量越大,推理成本越高,kimi如何接住這“潑天的流量”?2024年7月,月之暗面聯合清華大學團隊發布了以kvcache為中心的分離式推理架構mooncake。月之暗面工程副總裁、ai infra負責人許欣然透露,這套系統承載了kimi線上80%的流量。

024,“大模型六小虎”逐梦AI圈"

mooncake推理系統架構圖,圖片來自月之暗面

許欣然還發布了一些“暴論”,第一條就是關於節省成本:“現在、立刻、馬上真能省很多錢(畢竟不能公開規模和每日請求的pattern,如果你說省不了那你都對)。”

在kimi之後,月之暗面也在探索更多技術路線,包括正在內測的視頻生成模型以及已經發布的數學模型k0-math、視覺思考模型k1。

024,“大模型六小虎”逐梦AI圈"

月之暗面正在內測的視頻生成模型的界面

王小川對於agi的願景最出人意料,但也在情理之中。去年百川智能完成了通用人工智慧團隊的組建,今年吸納了大量的醫療領域的專業人士,開始從通用人工智慧戰略聚焦醫療領域。

聚焦醫療似乎把路走窄了,但王小川並不這麼認為。王小川將能否人工製造醫生,作為判斷agi的重要標誌。王小川認為,agi的首要變化是它開始具備思考、學習、溝通和共情能力,以及多模態圖像處理能力。從學習範式的能力要求來看,我們實際上是在像評價人一樣評價它。因此,我們的評價指標或學習範式是向人類學習,數據來源於人類社會產生的數據,而醫生是所有職業中智力密度最高的職業之一。

“如果連醫生都製造不了,那就別談agi了。”王小川斬釘截鐵。

中國科學院院士、清華大學計算機系教授張鈸近期和“甲子光年”分享他看好的大模型企業時就提到了百川智能,他說:“從企業的角度來看,它(百川智能)有可能活下來,它在努力解決中國的醫療問題。現在國內大模型,你只能從應用角度去看。”

王小川也沒有像其他六小虎一樣跟進sora,是唯一一位明確表態不做視頻模型的創始人。2024年初sora震撼世界時,也震撼了百川智能的工程師,但跟進sora的想法很快就被王小川摁下了。在王小川心中,語言才是智能的“聖經”,sora既不代表agi,也不代表場景,而是階段性產物。

在不做視頻生成模型這一點上,王小川與跟他總是觀點相左的李彥宏罕見地達成了共識。在今年百度世界大會期間,李彥宏就對“甲子光年”表達了“不做sora,但非常看好多模態”的觀點。

024,“大模型六小虎”逐梦AI圈"

甲子光年創始人&ceo張一甲、矽星人創始人駱軼航對話李彥宏,圖片來自百度

3.預訓練的進與退

今年,海外的科技大廠在玩一種很新的收購–不直接收購公司,而是收購公司的ceo,包括一小部分團隊。比較知名的有三起:亞馬遜收購adept,微軟收購inflection.ai、谷歌收購character.ai。這被看作是矽谷大模型創業格局洗牌的一種信號。

8月3日,在谷歌收購character預訓練團隊的消息發布之後,矽基流動創始人&ceo袁進輝如此評價:“產模一體,略受打擊。”

產即產品,模即模型。其實,openai、anthropic以及後來異軍崛起的xai,都是產模一體的路線。所以說,不是產模一體的路線有問題,而是非頭部的創業公司是否有足夠的資金來支持產模一體的問題。

做模型的預訓練需要承擔高昂的成本。meta訓練llama 3.1用到了1.6萬張h100,馬斯克今年用122天搭建的目前世界上最大的ai訓練集群colossus包含了10萬張h100。如果僅僅計算gpu購買成本,按一張h100為3萬美金估算,llama 3.1的訓練成本高達4.8億美金,xai的訓練成本高達30億美金。這是國內的創業公司不可承受的。

根據公開信息,大模型六小虎的估值在200億元左右,融資額在百億人民幣左右。這些錢是否足夠支撐繼續做預訓練?

024,“大模型六小虎”逐梦AI圈"

今年10月,36kr的一篇報導稱,國內至少有兩家小虎要放棄預訓練了。不過,目前還沒有公司承認這一點。

李開復專門為此發文闢謠,零一萬物也在10月16日發布了新模型yi-lightning,該模型在公認比較權威的排行榜llm arena上一度排名全球第六,僅次於openai與谷歌,追平xai。

張鵬在12月10日的2024甲子引力年終盛典上表示,智譜一直在做預訓練,今年8月剛剛發布最新疊代的模型glm-4-plus。智譜大約4~6個月就會疊代一版新模型。

王小川在12月14日的極客公園if2025創新大會上也談到了此事。他先是肯定了中國一定要自己掌握預訓練。但同時也表示,受限於卡與算力,在中國做超級平台的預訓練是不現實的,百川選擇“由場景帶動預訓練”,在做超級應用時一定得要引領模型的進展。

階躍星辰在12月23日完成數億結雅b輪融資後表示,這筆融資將用於繼續投入基礎模型研發,強化多模態和複雜推理能力,並通過產品和生態加大覆蓋c端應用場景。

六小虎不放棄預訓練,或許還跟預訓練的scaling law放緩有關係。openai遲遲不發下一代預訓練模型,而是把重心轉移到了推理模型上,這讓人們懷疑預訓練的scaling law是否撞牆了。openai前首席科學家ilya在今年的neurips 2024大會上更是直接發表“暴論”:“我們所了解的預訓練將要結束了(pre-training as we know it will end)。”

024,“大模型六小虎”逐梦AI圈"

在neurips 2024大會上演講的ilya,圖片來自x

從另一個角度來看,如果預訓練的scaling law真的在放緩,對於agi的實現或許不是好事,但對於缺芯少卡的國內大模型公司來說不見得是壞事。當堆卡帶來的規模效應遞減,那麼工程化的價值就會被放大。

零一萬物的yi-lightning就是一個參考案例。據李開復居間,yi-lightning的訓練過程僅用了2000張gpu、耗費300萬美金,訓練成本大概只有openai的3%。李開復認為,中國大模型公司只要有足夠好的人才、想做好預訓練的決心,融資額跟晶片都不會是問題。

近期,deepseek v3的發布也側面印證了李開復的觀點。這一在多項評測成績上超越qwen-2.5-72b與llama-3.1-405b的開源新王,和世界頂尖的閉源模型gpt-4o以及claude-3.5-sonnet不分伯仲。deepseek v3僅僅使用了2048張h800做訓練,總訓練成本不到600萬美金,其gpu使用小時只有meta的十分之一。

除了預訓練之外,大模型的範式也在轉移。在openai發布o1推理模型後,openai研究科學家noam brown表示,o1模型代表一種新的推理的擴展範式,我們不再受預訓練的瓶頸限制。

當推理也有scaling law,大模型六小虎的戰線又被拉長了。一個最直接的問題是,預訓練與推理的算力如何分配?

張鵬在2024甲子引力年終盛典上透露,智譜對於預訓練與推理的算力投入大約是一半一半。

024,“大模型六小虎”逐梦AI圈"

智譜ceo張鵬,圖片來自2024甲子引力年終盛典

在2024年的雲棲大會上,姜大昕與楊植麟關於o1模型進行了一次對談。楊植麟認為,訓練與推理的算力占比會發生變化,預訓練不一定會降低,但推理一定會升高。之前只有達到一定算力門檻的公司可以做預訓練的算法創新,而現在算力相對較少的公司也可以通過後訓練的方式探索更多的機會。

姜大昕認為,推理側對於強化學習的訓練,算力需求不一定比預訓練要小,因為self play(自強化)理論上是沒有上限的。只是不太確定的是,self play的主模型要不要繼續scale,roi是否是正向的。如果是的話,算力的需求是平方級的增長。

目前,月之暗面已經率先發布推理模型,先後上線了數學模型k0-math、視覺思考模型k1,是跟進推理模型動作最快的創業公司。此外,阿里的qwq、deepseek的r1、崑崙天工的skywork o1也快速跟進。而在今天–2024年的最後一天,智譜也發布其首個基於擴展強化學習技術訓練的推理模型glm-zero-preview

預訓練勝負未分,推理模型又激戰正酣。大模型的下半場已經悄然拉開大幕,考驗每一家公司的戰略執行力。

4.艱難的商業化

與技術路線的分歧相比,商業化更是迫在眉睫、生死存亡。紅杉資本曾提出著名的“ai的6000億美金問題”,直指ai商業化收入與巨大的投資嚴重不匹配的問題。

李開復曾如此定義中國大模型的市場機會:“如果把開源、閉源分成兩種,國內、國外分成兩種,to b、to c分成兩種,那麼就至少有2x2x2=8個機會,而勝出者數量可能會進一步收窄。”

國內只有阿里qwen、deepseek完全採用了類似meta的開源路線,而其他開源公司主要採用了谷歌路線,即把較小參數的或者非最新版本的模型開源,而更大參數、更強的模型採用閉源,包括智譜、百川智能與零一萬物皆是如此。

張鵬曾解釋過開源模型的意義:第一,開源能讓大家知道智譜在做什麼;第二,開源以後可以讓更多的人參與大模型,用社區的方式匯集大家的熱情一起來推動大模型發展,這是開源最重要的一件事。開源並非為了贏得市場或者追求商業上的利益,要不然就不會選擇開源了,這是智譜一直以來對開源的定位。

最早開源的智譜吃到了先發優勢的紅利,是開源戰略最成功的創業公司。根據智譜公布數據,其開源模型系列全球累計下載量超過3000萬,併入選hugging face平台最受歡迎的人工智慧機構。

百川智能在2023年9月公布過其開源模型在開源社區的總下載量接近500萬次。零一萬物並未公布過開源模型下載量的數據。在hugging face上,零一萬物開源模型的累計下載次數在20萬左右。

在商業化策略上,to b還是to c並不完全是一道單選題,六小虎基本都是全面布局。在大多數投資人心中,to b想像空間相對更低,但商業化路徑更加明確;to c的想像空間巨大,是繼移動網際網路時代之後最大的機遇,但怎麼做,是否是創業公司的機會,尚無定論。

024,“大模型六小虎”逐梦AI圈"

在c端領域,月之暗面與minimax目前是兩家最強的產品公司。有數據可以佐證:根據sensor tower的數據,截至2024年6月,talkie的全球月活躍用戶數已達到1100萬,超過一半用戶來自美國,與character.ai硬碰硬;2024年11月,楊植麟公布kimi在10月份的全平台月活超過3600萬,在國內與節跳動的豆包直接交鋒。

階躍星辰、智譜也在c端躍躍欲試、各有千秋。躍問的多模態智能視覺搜索功能“拍照問”,是國內首個集成到iphone 16相機控制鍵中的大模型應用產品能力;而智譜則引入前阿里達摩院資深技術專家、支付寶中國首席數據官胡云華擔任智譜清言負責人。據智譜透露,智譜清言2024年已有2500萬用戶,年化收入(arr)超千萬元人民幣。

零一萬物將c端產品的重心放在了海外。此前據李開復透露,其海外的生產力工具應用總用戶接近千萬,今年的營收預期過億人民幣。

在b端領域,大模型繞不開定製化的難題。定製化模型之所以不容易賺錢,是因為當產品與服務不夠標準化的時候,就會變成按照人/天計算的商業模式。

現在,六小虎普遍在用“maas(model as a service)開放平台來尋找解法。每一家六小虎都有自己的maas開放平台,對外提供api接口來調用模型的能力。目前,除了kimi僅提供標準化的api之外,另外幾家大模型公司或多或少都會在行業深耕,提供更加個性化的行業解決方案。

智譜曾分享過其三種to b的商業化模式:第一,標準化的api;第二,雲端私有化解決方案;第三,完全私有化解決方案,也是最具中國特色的方案。

智譜定位基座大模型,而不做針對特定行業的垂直模型。張鵬曾告訴“甲子光年”:“我們不會直接扎到具體場景里做應用開發,很多行業存在技術、數據的壁壘,不是創業公司的體量能夠搞定的,更多希望是合作夥伴在垂直行業深耕。”

但也有小虎選擇繼續深入,做行業模型、垂直模型。2024年上半年表示“堅決做to c,不做不賺錢的to b”的零一萬物,在下半年發布了面向電商直播的數字人解決方案,以及面向智算中心的ai infra解決方案。百川智能則在核心醫療領域之外,發布了“全鏈路領域增強金融大模型baichuan4-finance”。

零一萬物聯合創始人祁瑞峰曾對“甲子光年”等表示,解決to b賺錢問題的關鍵是回到業務本身,真正讓大模型進入客戶核心業務場景,形成一個標準化、可規模複製的應用產品。

人們常把今天的“大模型六小虎”與此前的“ai四小龍”做對比,後者並沒有解決好to b定製化的問題。如果商業化難題能夠解決,四小龍就是六小虎的下限;如果商業化難題解決不了,四小龍或許就是六小虎的上限了。

5.更多的不確定性

2024年,最八卦、爭議最大、最受關注的大模型公司,可能非月之暗面莫屬了。

2024年2月,月之暗面完成由阿里領投的10億美金融資,創下國內大模型領域的單筆最大融資額紀錄。

2024年3月,在發布200萬字長文本功能後,月之暗面被二級市場炒作,“kimi概念股”由此誕生,為kimi智能助手以及月之暗面公司帶來巨大的曝光。

在這兩則好消息之後不久,月之暗面就被捲入了巨大的輿論漩渦中。

先有媒體報導“楊植麟套現數千萬美金”,後有朱嘯虎訴訟發難,月之暗面均委託律師來處理。這支年輕的創業明星團隊在技術上站上了世界前沿的舞台,卻在公司的管理與運營上暴露出了稚嫩與不足。

在這場風暴中,月之暗面的核心團隊非常穩定。而其他小虎則或多或少遭遇了核心人員的流失,從核心業務的負責人到聯合創始人級別均有波及。他們有的另起爐灶去創業,有的加入了更強大的大廠。

人才的流動本身是很正常的現象,但人才的去向卻反映了市場資源的流動趨勢。在2024年,有錢、有卡的大廠對人才的虹吸效應愈加明顯。

大廠的虹吸效應不僅是人才,還包括直接的業務競爭。最具代表性的是字節跳動,在短短一年內發生了180度的轉變。崑崙萬維創始人周亞輝今年11月28日在朋友圈點評道:“年初說字節23年的ai戰略不及格,但這完全不影響字節24年ai戰略的滿分表現。”

024,“大模型六小虎”逐梦AI圈"

圖片來自周亞輝的朋友圈

在基礎大模型的技術側,字節跳動已經點滿了大模型的科技樹。豆包大模型昨日宣稱,距5月15日首次亮相僅7個月,其在通用語言、視頻生成、語音對話、視覺理解等方面模型能力均已跨入國際第一梯隊,綜合能力對標gpt-4o。在上下文這樣的功能點上,豆包大模型已經做到300萬字窗口的長文本能力,每百萬tokens處理延遲僅需15秒。這一上下文窗口長度和時延水平達到目前業界極限。

在ai產品端,字節跳動過去一年不僅一口氣推出了十幾款ai應用,而且在投流競爭上具備天然優勢。字節跳動掌握了中國最大的聚合廣告投放平台 “穿山甲”,同時有抖音等流量巨大的超級app。從今年4月起,抖音就不再接受其它ai產品的投放。

在b端,大模型也漸漸被大廠主導。2024年5月,火山引擎掀起價格戰,整個行業快速跟進,大模型api的價格一降再降。

今年大模型招投標也出現越來越多大廠的身影。在今年上半年的一次統計中,中國電信、科大訊飛、智譜、百度雲、中國移動分別拿下大模型項目的前五位。在這些大模型落地的隱秘角落,大廠正取代大模型創業公司而占據主導地位。

2024年,“ai一天、人間一年”的狂飆突進在慢慢消退,備受期待的大模型公司也逐漸把節奏放緩了下來。

技術的發展總有一個規律,那就是人們往往高估技術的短期效應,而低估技術的長期影響力。如果我們仍舊以agi為目標,目前它仍舊處在初級階段。

2025年,大模型還會有更多的故事與更多的變化。那時候,我們也將更能看清楚agi的模樣。

原文網址:https://zh.gushiio.com/ai/148.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *