“大模型六虎”階躍星辰3月將開源圖生視頻模型,並成立新的生態基金
階躍星辰創始人、CEO薑大昕
DeepSeek熱潮下,& ldquo; 大模型六虎” 們逐步開始“ 分化”, 更多轉向產業界和落地商業化階段。
GuShiio.com股市智慧AGI 2月21日消息,
今天舉行的首届Step UP生態開放日上, AI“ 大模型六虎” 之一的階躍星辰公佈開源大模型、Agent智慧體進展和全新的開源推理和視頻推理模型等。
階躍星辰創始人、CEO薑大昕在演講中表示,公司朝著實現AGI的目標穩步前進,現時已進入Agent(智慧體)的發展階段。 他指出,智慧體的發展依賴於兩大關鍵要素:一是多模態能力,讓智慧體充分地感知和理解世界; 二是推理能力,使智慧體能够進行長思維鏈的慢思考,主動規劃、嘗試、反思,通過不斷糾錯提供準確的答案。
同時,薑大昕透露,
今年3月,階躍星辰將開源新的圖生視頻模型。
此外,階躍星辰還發佈全新陞級的“ 繁星計畫” 2.0,其中包括與國有企業上海儀電、上海國有資本投資有限公司、徐匯資本等籌集一個階躍星辰生態基金,但未透露具體金額,但該項計畫旨在為Agent應用開發者提供模型、算力、資本、數據和企業孵化等全方位支持,並將聯合模速空間為優質創業項目提供辦公場地支持,在上海打造大模型產業聚集效應。
據悉,
階躍星辰成立於2023年4月,由微軟前全球副總裁薑大昕創辦,ResNet作者之一的AI科學家張祥雨、擁有豐富大規模集羣與系統建設經驗的AI系統專家朱亦博等都先後加入階躍星辰,主要瞄準AGI。
2024年12月,階躍星辰宣佈完成B輪融資,總融資金額達數億美元,覈心投資方包括上海國有資本投資有限公司及其旗下基金,戰畧和財務投資人包括騰訊投資、五源資本、啟明創投等。
過去一年,階躍星辰共發佈11款多模態大模型,覆蓋語音辨識、語音生成、多模態理解、影像及視頻生成的全面能力。 今年1月,階躍星辰發佈了Step R-mini,成為Step系列的首款推理模型,進一步拓展了大模型的能力邊界。
階躍星辰近期持續發力開源,
已陸續開源兩款模型—& mdash; 300億參數的圖生視頻模型Step-Video-T2V,以及1300億參數的語音模型Step-Audio。 此外,就在2月18日,階躍星辰與清華大學聯合開源了大規模强化學習RL的推理模型Open-Reasoner-Zero,擁有7B、32B版本。 其中,32B版表現優於DeepSeek-R1-Zero-Qwen-32B,訓練步驟减少到原有1/30,效率提升了25倍。
對於開源的原因,
薑大昕表示,在DeepSeek感召下,階躍星辰在多模態領域有個深厚的積累,也創建了强大的模型,開發者也熱切的盼望在多模態領域是否也能够出現非常强大的多模態模型,囙此,階躍星辰選擇在近期發佈開源多模態模型科技。
“ 多模理解持續領先,多模推理率先探索。& rdquo; 顯然,從訓練轉移到推理,多模態會成為主流的需求。
薑大昕還透露了階躍星辰未來兩個重點關注的方向:多模態推理以及Agent智慧體科技,以實現階躍星辰AGI的技術路線“ 單模態— 多模態— 多模理解和生成的統一— 世界模型— AGI”。
其中,在多模態推理,
階躍星辰正在進行“ 視覺推理模型” 研發,他提到,這一模型能够實現視覺空間下的慢思考。
“ 類比世界這個階段,訓練模型的主要範式是模仿學習,而學習的主要目標是各種模態的表徵,包括從聲音、文字、影像、視頻一直到4D時空的物理世界。 對於複雜問題的求解,人腦是啟動了一套‘ 第二系統’, 或者就是說慢思考的能力。 在每個步驟,如果我們發現開始的思路不對,可能還會重新設想我們的思路,不斷探索,直到解决成功為止。& rdquo; 薑大昕稱。
Agent層面,
階躍星辰將智慧終端Agent視為大模型科技落地的覈心突破點,在薑大昕看來,影響Agent的兩個關鍵因素,多模態和慢思考在2024年都有了顯著的進展。 囙此,階躍星辰重點佈局垂類Agent(企業和開發者)、智慧終端Agent(汽車、手機、具身智慧、IoT)智慧體落地,包括與吉利汽車集團、千里科技、 OPPO、 智元機器人、TCL等企業展開合作,共同打造垂直場景下的創新C端應用體驗。
“ 那麼所謂主動就是Agent,能够主動的觀察用戶所處周圍的環境,或者說他周圍的context是主動的發起或者完成任務,而不是僅僅被動的接受任務。 大家要想能够自主完成複雜任務,這個目標還需要一些輔助的功能。& rdquo; 薑大昕表示,隨著底座大模型能力的不斷增強,Agent能力還會不斷進化,會經歷五個階段。 最終,Level 5從智商上升到了情商。
此外,值得一提的是,& ldquo; AI四小龍” (商湯、曠視、依圖、雲從)之一的曠視科技聯合創始人印奇,帶著新身份“ 千里科技董事長”, 與吉利汽車集團副總裁、吉利汽車研究院院長李傳海,一同出現在生態日圓桌論壇上。
這是印奇首次亮相。
據悉,2月18日,力帆科技正式更名為千里科技(SH:601777,前稱為力帆股份),而蛻變陞級而來的全新品牌將聚焦“ AI+車” 的覈心戰畧,以科技創新為核心競爭力,創新產業發展模式,全面增進自動駕駛、智慧座艙等領域的研發實力。 而印奇是千里科技的股東、公司董事長,吉利產投也是千里科技股東之一。
AI一日,世上一年,現在千里,一日千里。 印奇表示,現時最成功的AI產品,仍然是特斯拉和抖音,不過,大模型也將給應用帶來更大的市場空間。
GuShiio.com股市智慧AGI整理了印奇首次亮相的現場提到的重要資訊:
- 印奇認為身份沒有變化,一直還是AI創業,他認為AGI、機器人(robotic)在過去創業歷程中是非常重要的兩個方向。
- 印奇稱,
一個產業的發展方向和節奏,有可能節奏比方向更重要。
因為在中國創業,大家經歷了十幾年,出現一輪又一輪的AI創業者,每個領域科技發展一直往前,而商業模式也有很多變化。 囙此,我們需要在技術成熟之後,同時找到一個最覈心的載體,而新一輪大模型時代有可能是AI創業者最幸福的時代,科技上AGI載體有可能是車,這是面向“ 具身智慧” 的必要路徑。 - 今天沒有真正的AI+的覈心應用場景出來。 過去十年,+ AI的兩個最重要的成功案例,一個是特斯拉,一個可能是抖音,一個是線下一個是線上,這些都是原有產業的領軍者,用AI給產業做的巨大賦能。 但是,AI+的概念是,用AI大模型時代做全新的應用,且它AI比重超過50%,創造的是10倍的價值,這樣應用至今還沒有出現。 而我相信,未來的AI+車,有可能是第一個落地的場景。
- 關
於智能駕駛和智慧駕艙:智駕領域,我自己的判斷,未來3年應該是收斂期,L3、L4逐步的去推廣化,這是整個車生態化智能化的開端,甚至這可能是“ 第一季剛打完”, 只有當這個車能自動行駛,可能是給車後面的大眾化和像人化提供基礎。 這是大模型在車上的Agent應用有潜力和有希望的一個點。
- 千里科技的覈心定位是“ AI+車”, 主要構建AI原生以及軟硬結合,希望基於吉利汽車服務好吉利生態,利用好階躍大模型的能力,需要有一個整體解決方案的供應商,真正把科技、產品、軟硬體結合在一起。
- 談DeepSeek:春節很熱鬧,我認為所有的產業發展都是連續的,DeepSeek是非常優秀的中國開源模型嗲錶,而中國AI發展是連續的過程,也是厚積薄發的過程。
- 當前發展中,最重要的是Agent和終端的關係,隨著Agent到來,我聽到的“ 把終端做三個分類” 這一觀點:我、你、他。 其中,& ldquo; 我” 這種類型的硬體是手機為代表的,眼鏡、耳機都是器官的延伸,一類大的硬體; 第二是“ 你” 類硬體,汽車、未來的具身智慧; 第三是“ 他” 類硬體,當年小米生態IoT之類。
- 囙此,Agent最重要的兩個硬體就是手機和車。 未來,和Agent結合的切口和爆發點有不一樣的點在於,Agent能讓終端跨過細分應用,變成直接給用戶提供服務。 大家可以設想,偏效率和工具的應用如果有一個更好的生態,對用戶來講是越來越無感的,每個硬體能够幫用戶觸達,幫他解决一些物理的執行,那麼用戶真不在乎服務的提供商是誰,需要的是可靠的,高性能低價格的服務,硬體會變得史無前例的重要,當年我們覺得手機很重要,但是未來終端會更重要。 而看整個產業鏈,其實終端並沒有發揮最大的商業價值,而移動互聯網做了大量的價值分享,我認為,和好的終端構建更親密、戰畧關係,以及將終端利益的新價值分配,匹配大模型時代,可能是未來三年比較重要的話題。
- 現在,差异化變得重要,AI和硬體都沒有卷到第一,但是做“ 組合拳”, 將真正在AI閉環上走通價值鏈條。
- 隨著Agent擁有情感化,人和車的關係將會重構。 如果5年後,使用車的時長平均超過3小時,那麼車的内容可能就變了,可能就不僅是交通工具,它會變成一個“ 第三空間”, 囙此,車就會變成繼手機之後另外一個“ 大腦”, 把“ 駕駛角色+空間角色+機器人陪伴角色” 等三種角色融合到一起。
此次開放日上,吉利汽車集團、千里科技和階躍星辰聯合宣佈,將進一步加強三方現有科技合作夥伴關係,推動“ AI+車” 的深度融合。
“ 我覺得,聊天機器人現在和人類連接還是非常膚淺的,因為聊天機器人只能通過聊天內容來知道用戶情况,而人類是可以陪伴在用戶的左右,Agent產品需要真正的做到感同身受,從而提供情緒價值。& rdquo; 薑大昕在演講結尾表示。
原文網址:https://zh.gushiio.com/ai/2463.html