裝上DeepSeek後,CTO更焦慮了

文章來源:鈦媒體

裝上DeepSeek後,CTO更焦慮了插图1Image source: Generated by AI

開年,各個企業都在爭相接入DeepSeek,初創團隊在公有雲上連夜調用API開發智慧客服等輕量化應用,金融機構迫切採買DeepSeek一體機,各地政府則悄然在政務雲上部署了DeepSeek……不同賽道的企業正以迥異姿態湧入這場智能升級的軍備競賽。

對於CTO而言,DeepSeek的驚人模型效果,無疑讓科技從業者們振奮。 但更多的CTO也開始焦慮:在企業大面積使用大模型之後,如何通過大模型加速自己企業的智能化陞級? 如何規劃? 如何投入? 做什麼方向? 聚焦哪些業務場景? 如何更新科技棧……

企業到底怎麼在業務流程中用好包括DeepSeek在內的大模型?

在京東雲看來,企業應用大模型將經歷四個階段,答案也在其中:

  • 開始時,不管能否找到應用價值,企業都選擇先讓員工把大模型用起來,現時,國內大多數企業都處在這個階段,將DeepSeek的部署作為首要工作。
  • 隨著通用模型使用的深入,企業會開始輕量化的嘗試,首選就是智慧體,部分企業已開始這一階段的探索。
  • 智慧體應用深入後,企業會發現通用模型在解决企業專業問題上存在瓶頸,大中型企業就會利用自己的數據蒸餾垂直模型,這就進入了第三階段,用垂直模型替換通用模型。
  • 最後垂直模型强化智慧體的能力,部分智慧體就會成長為超級智慧體,多智慧體協同產生新的業態,進入終極的場景智慧。

輕量智慧體破局:

從“能用”到“好用”

智慧體是打開大模型價值的第一把鑰匙。 科技行業已達成一個共識,智慧體已經成為企業數智化轉型的覈心驅動力。 作為主流應用形態,智慧體不僅能提升運營效率,還能降低AI使用的門檻。

根據德勤《2025年技術趨勢》預測,智慧體將成為未來企業的重要組成部分。

裝上DeepSeek後,CTO更焦慮了插图3

這些場景已在京東內部發揮巨大業務價值。 例如在專業助手方面,JoyCoder智慧編碼助手能幫助開發者預測程式碼、生成注釋、進行智慧評審,生成的程式碼採納率超過40%,開發週期縮短30%。 在行銷上,通過AIGC科技可以快速生成高品質的行銷文案和商品場景圖,製作效率提升高達90%。 比如,言犀數字人能自動生成直播腳本,已經覆蓋7500個直播間,帶貨GMV總量超百億。

京東雲相關負責人表示:“我們總結出的五個場景,已經能覆蓋企業用智慧體,提升業務效率的80%通用需求,在現階段,智慧體落地過程中,把覈心場景打穿打透,遠比一味追求智慧體數量,重要得多。”

現時京東雲將這些智慧體能力,沉澱在言犀智慧體平臺,對外支持更多企業在智慧體方面探索。

例如,食品行業上下游角色分散,會議對決策管理至關重要。 在味全食品,京東雲搭建了一套會議管理系統,可自動生成會議文字記錄,並分類歸檔,有效提升公司運轉效率; 在中國飛機租賃,該公司專業知識複雜,人工査詢影響決策效率,京東雲構建一個智慧問答系統,提供高效、準確的問答互動,並依據迴響持續優化效能,大幅提升員工辦公效率。

企業在智慧體上取得成效後,對於很多中型和大型企業來說,考慮到未來AI應用越來越深入廣泛,自建智算基礎設施將成為決策的必答題。

構建智算底座:

科技決策者的“重投入時刻”

當AI算力密度突破40kW/機櫃,模型參數邁向萬億級,企業構建智算基礎設施已超越科技陞級範疇,成為重塑產業話語權的戰畧抉擇。 那些率先完成智能化改造的企業,正像百年前電氣化革新的先行者那樣,在數位時代的版圖上刻下新的座標。

從通用計算向智算陞級,基礎設施面臨三重挑戰:高密度智算的供電/製冷、算力集羣的微秒級互聯、異構算力的動態調度。 例如,隨著服務器功耗提高,單機櫃功率上升趨勢明顯,現時普通資料中心是4-6kW,為滿足GPU服務器的運行,現在新建智算中心單機櫃的功率需求已經達到20~40kW,按照最新發佈的GPU服務器的參數,智算中心單機櫃功率需求將達到40~120kW。 同時,現在GPU服務器要求網絡組網距離越近越好,並且有明確的傳輸距離的要求,這種要求直接造成機房房間功率密度也同時新增。

基於京東集團複雜場景實踐,京東雲構建了一站式大模型產品矩陣,從底層的智算基礎設施,到中間層的模型服務和工具,再到上層的Agent應用開發,支持企業快速部署大模型及應用。

裝上DeepSeek後,CTO更焦慮了插图5

在高密度智算的供電/製冷方面
,智算中心功率密度是傳統資料中心的5倍,對供電、散熱的要求嚴苛。 京東雲自研的阿爾法智慧算力模塊,支持液冷系統一體化交付,PUE控制在1.15以內,同等規模成本直降15%; 新一代液冷服務器,散熱效能提升50%,單機櫃20kW年度省電8500度。

在算力集羣互聯互通方面
,計算、存儲、網絡的“黃金三角”,對大模型高效使用至關重要。

  • 京東雲超智算一體化算力集羣,單集羣萬卡、全域10萬卡級集羣調度能力,依託軟硬體協同優化,驅動大模型算力利用率(MFU)躍升至75%。
  • 雲海AI存儲,千億級大模型全棧支持,4K隨機寫IOPS突破1000萬級極速響應,存算分離架構實現效能與成本雙30%突破,構建超大規模AI訓練的普惠存儲底座。
  • 京東雲高性能雲網絡,RDMA頻寬提升至‌3.2T級‌,端到端通信時延壓降至‌2微秒級‌,支撐千億參數模型‌無損訓練‌,釋放AI算力極限。

在異構算力的動態調度方面
,京東雲vGPU AI算力平臺,為應對大模型異構算力需求而生。 支持多元算力統一納管與精細化運維,通過深度優化DeepSeek架構,滿血版推理性能提升50%。 同時借助AI全場景密態計算以及容器隔離科技,確保模型參與訓練數據雙域零洩露,為用戶提供金融級安全防護。

裝上DeepSeek後,CTO更焦慮了插图7

在行業實踐中,京東雲成功支持某新能源汽車頭部廠商、某全球新能源科技領導企業,打造覆蓋全集團的智慧計算底座,實現千卡級AI算力集羣的精細化管理。 科技上一方面創新多元算力調度,顯著提升GPU利用率,另一方面創建全生命週期AI開發環境,實現開箱即用,大幅提升研發效率。 現時,該平臺已支撐起企業智慧駕駛研發、人形機器人等20餘個覈心場景,成為集團的" 數智發動機"。 預計一年內,兩家企業大模型訓練週期將縮短40%,每年節省的算力成本相當於新建兩座資料中心。

垂直模型蒸餾:

邁向全面智慧場景的關鍵一躍

當通用大模型完成科技啟蒙,千載難逢的良機屬於那些擁有高品質自有數據的企業。 他們通過運用自有數據完成模型蒸餾,率先推動產業效率變革,讓AI應用走向真實價值深水區,打開全面智慧場景。

京東雲認為,全面智慧場景形成,可以通過兩種途徑實現:一是智慧體成長為超級智慧體,成為新的業態。 二是對過去數位化場景的智能升級。

在京東內部,一場針對大模型小型化的效率改造正在悄然展開。 通過在通用大模型注入京東零售、金融、健康等體系內複雜、真實、動態的領域數據,言犀大模型已經跑在了健康諮詢、金融行銷、程式碼生成、協同辦公等多個智慧場景,在特定任務中的準確率較通用模型提升超過20%。 更關鍵的是,神經元剪枝科技實現" 瘦身不减智", 模型顯存節約70%、推理速度提升1.5倍,讓千億、萬億級參數模型也能輕盈落地。

效果突破的背後,是京東在
模型蒸餾、數據治理與混合、訓練配方優化、大小模型協
同等多領域沉澱下來的大模型開發計算科技。 最近,京東探索研究院自研的這套模型開發計算研究成果也將首登Nature,並通過言犀AI開發計算平臺,向外部企業開放服務。

大模型應用的科技紅利形成多點開花的應用圖景,向外生長:

  • 在數據要素領域
    ,大模型正在重構企業數據價值鏈。 面對海量非結構化數據,傳統人工處理僅50-60%的準確率,企業數據要素服務平臺通過大模型可實現99%的精准識別;
  • 在智慧運維領域
    , AI NOC智慧運維系統將重大故障定位時間從小時級壓縮至秒級,背後是沉澱了超萬名研發人員經驗的運維知識庫;
  • 在都市治理領域
    ,& quot; 一錶通" 系統通過智慧體自動抓取數據,將基層工作效率提升70%,ICOS都市平臺將政務應用開發週期縮短60%。
  • 在智慧行銷領域
    ,超35萬商家借助AIGC生成商品圖,30億字的行銷種草文案由AI生成、50萬條AI采銷短視頻實时投放中… 產業數據的轉化效率已發生質變。 金融增長雲還開放了包括4.6億京東金融用戶運營Knowhow,通過互動式行銷、廣告投放、行銷內容生成三大智慧場景,幫助銀行客戶實現AUM、MAU增長超30%。

這些場景驗證了垂直模型的兩大價值支點——既要深入業務毛細血管獲取數據養分,又要通過工程化改造適配真實業務場景。 京東通過自身複雜業務場景錘煉出的模型蒸餾科技,正在降低更多企業的AI准入門檻,輕鬆拿到大模型時代的入場券。

當京東雲向產業打開他的大模型“工具箱”,CTO們的焦慮有了新注腳:科技部署只是起點,真正的競爭在於如何將AI轉化為業務進化基因,重塑AI生產力。 那些在輕量化應用中積累場景認知、在智算底座建設時預留科技彈性、在垂直蒸餾中構建知識壁壘的企業,正悄然拉開身比特。

有業內人士斷言:“大模型淘汰的不是科技,而是組織的遲鈍。”當DeepSeek將AI能力民主化,CTO的焦慮本質上是企業數位化轉型的集體陣痛——這場關乎生存的進化競賽中,焦慮或許是最好的清醒劑。

原文網址:https://zh.gushiio.com/ai/3123.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *