全網都在扒的deepseek團隊，是清北應屆生撐起一片天

GuShiio.com鼔獅智能 • 2025年2月7日 pm1:09 • AI科技

文章來源：量子位

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图 image source: generated by ai

deepseek-v3大模型橫空出世，以1/11算力訓練出超過llama 3的開源模型，震撼了整個ai圈。

緊接著，“雷軍開千萬年薪挖deepseek研究員羅福莉”的傳聞，也使得人們把目光聚焦向deepseek的人才。

這下不只科技圈，全網都在好奇，連小紅書上都有人發帖詢問，這究竟是一隻怎樣的團隊？

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图1

國際上，也有人把創始人梁文鋒的訪談翻譯成英語，還加了注釋，試圖從中尋找這家公司崛起的蛛絲馬跡。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图2

量子位整理各種資料發現，deepseek團隊最大的特點就是年輕。

應屆生、在讀生，特別是來自清北的應屆生在其中非常活躍。

他們中的一些人，2024年一邊在deepseek搞研究，另一邊新鮮熱乎的博士學位論文剛評上獎。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图3

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图4

他們中有的參與了從deepseek llm v1到deepseek-v3的全程，有的只是實習了一段時間也做出重要成果。

為deepseek提出mla新型注意力、grpo強化學習對齊算法等關鍵創新的，幾乎都是年輕人。

deepseek核心成員揭秘

2024年5月發布的deepseek-v2，是致使這家大模型公司破圈的關鍵一環。

其中最重要的創新是提出了一種新型注意力，在transformer架構的基礎上，用mla（multi-head latent attention）替代了傳統的多頭注意力，大幅減少了計算量和推理顯存。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图5

在一眾貢獻者中，高華佐和曾旺丁為mla架構做出了關鍵創新。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图6

高華佐非常低調，目前只知道是北大物理系畢業。

另外，在“大模型創業六小強”之一階躍星辰的專利信息中也可以看到這個名字，暫不確定是否是同一人。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图7

而曾旺丁來自北郵，研究生導師是北郵人工智慧與網絡搜索教研中心主任張洪剛。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图8

deepseek-v2工作中還涉及到了另一項關鍵成果–grpo。

deepseek-v2發布前三個月，deepseek-math問世，其中提出了grpo（group relative policy optimization）。

grpo是ppo的一種變體rl算法，放棄了critic模型，而是從群體得分中估算baseline，顯著減少了訓練資源的需求。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图9

grpo在圈內得到廣泛關注，另一家國內開源大模型阿里qwen 2.5的技術報告中也透露用到了grpo。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图10

deepseekmath有三位核心作者是在deepseek實習期間完成的工作。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图11

核心作者之一邵智宏是清華交互式人工智慧（coai）課題組博士生，師從黃民烈教授。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图12

他的研究領域包括自然語言處理、深度學習，特別對如何能構建一個穩健且可擴展的ai系統感興趣，這個ai系統能利用多樣化的技能整合異構信息，並能準確回答各種複雜的自然語言問題。

邵智宏之前還曾在微軟研究院工作過。

deepseekmath之後，他還參與了deepseek-prover、deepseek-coder-v2、deepseek-r1等項目。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图13

另一位核心作者朱琪豪是北大計算機學院軟體研究所2024屆博士畢業生，受熊英飛副教授和張路教授指導，研究方向為深度代碼學習。

據北大計算機學院官方居間，朱琪豪曾發表ccf-a類論文16篇。在ase和esec/fse上分別獲得acm sigsoft傑出論文獎一次，提名一次。一篇論文進入esec/fse會議同年的引用前三名。

在deepseek團隊，朱琪豪還基於他的博士論文工作，主導開發了deepseek-coder-v1。

其博士論文《語言定義感知的深度代碼學習技術及應用》也入選了2024ccf軟體工程專業委員會博士學位論文激勵計劃。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图14

△圖源：北京大學計算機學院公眾號

還有一位核心作者同樣來自北大。

北大博士生peiyi wang，受北京大學計算語言學教育部重點實驗室穗志方教授指導。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图15

除了deepseek-v2 mla、deepseekmath grpo這兩項關鍵破圈成果，值得一提的是，還有一些成員從v1就加入其中，一直到v3。

代表人物之一代達勱，2024年博士畢業於北京大學計算機學院計算語言所，導師同樣是穗志方教授。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图16

△圖源：北京大學計算機學院公眾號

代達勱學術成果頗豐，曾獲emnlp 2023最佳長論文獎、ccl 2021最佳中文論文獎，在各大頂會發表學術論文20篇+。

2024年中國中文信息學會“博士學位論文激勵計劃”共入選10篇來自中國大陸高校的博士畢業論文，其中就有他的《預訓練語言模型知識記憶的機理分析及能力增強關鍵技術研究》。

以及北大元培學院的王炳宣。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图17

王炳宣來自山東煙臺，2017年進入北大。

碩士畢業加入deepseek，參與了從deepseek llm v1開始的一系列重要工作。

清華這邊的代表人物還有趙成鋼。

趙成鋼此前是衡水中學信息學競賽班成員，ccf noi2016銀牌得主。

之後趙成鋼進入清華，大二時成為清華學生超算團隊正式成員，三次獲得世界大學生超算競賽冠軍。

趙成鋼在deepseek擔任訓練/推理基礎架構工程師，有英偉達實習經歷。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图18

△圖源：清華新聞網

deepseek是一支怎樣的團隊

這些鮮活的個體，足以引發人們的讚嘆。

但還不足以回答最初的問題，deepseek到底是一支怎樣的團隊？有怎樣的組織架構？

答案或許還要從創始人梁文鋒身上找。

早在2023年5月，deepseek剛剛宣布下場做大模型，還沒發布成果的時候，梁文鋒在接受36氪旗下“暗涌”採訪時透露過招人標準。

看能力，而不是看經驗。
我們的核心技術崗位，基本以應屆和畢業一兩年的人為主。

從後面一年多陸續發表的論文貢獻名單中也可以看出，確實如此，博士在讀、應屆以及畢業一兩年的成員占很大一部分。

即使是團隊leader級別也偏年輕化，以畢業4-6年的為主。

例如領導deepseek的後訓練團隊的吳俁，2019年北航博士畢業、在微軟msra參與過小冰和必應百科項目。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图19

吳俁博士期間接受北航李舟軍教授和msra前副院長周明博士的聯合培養。

與他師出半個同門的是郭達雅，中山大學印鑑教授與msra周明博士聯合培養，2023年博士畢業。

2024年7月他加入deepseek，主要參與了一系列數學和代碼大模型的工作。

郭達雅上學期間還有一項事跡，本科期間在msra實習一年裡發表兩篇頂會論文，他笑稱“在剛入學的第三天，就完成了中大博士生的畢業要求。”

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图20

除了團隊成員年輕化之外，deepseek在國內ai公司中突出的特點：非常重視模型算法和硬體工程的配合。

deepseek v3論文總共200位作者，並不都是負責ai算法或數據。

有這樣一批人從早期的deepseek llm v1到v3一直都在參與，他們更多偏向算力的部分，負責優化硬體。

他們以deepseek ai的名義發表了論文《fire-flyer ai-hpc》，通過軟硬體協同設計降低訓練成本，解決傳統超算架構在ai訓練需求上的不足。

fire-flyer也就是幻方ai搭建的螢火2號

這支團隊中有的人在英偉達工作或實習過，有的來自同在杭州的阿里雲，也有許多人從幻方ai借調又或乾脆轉崗到deepseek，參與了每一項大模型工作。

而如此重視軟硬體協同的成果，就是以llama 3 405b的1/11算力，訓練出性能更高的deepseek-v3了。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图21

最後，我們還發現deepseek開源項目中有一個特別的存在，不是語言模型相關工作，卻是3d生成相關。

這項成果由清華博士生孫景翔在deepseek實習期間，與導師劉燁斌以及deepseek成員合作完成。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图22

像這樣實習生在deepseek做出重要成果的還有中山大學邏輯學專業的辛華劍。

他在deepseek實習期間參與了用大模型證明數學定理的deepseek-prover，現在在愛丁堡大學讀博士。

全網都在扒的deepseek團隊，是清北應屆生撐起一片天插图23

看過這些例子，再一次回到梁文鋒的訪談，或許更能理解這隻團隊的運作結構。

不做前置的崗位分工，而是自然分工
每個人對於卡和人的調動是不設上限的，每個人可以隨時調用訓練集群，只要幾個人都有興趣就可以開始一個項目
當一個idea顯示出潛力，也會自上而下地去調配資源。

這難免讓人想起ai界另一家不可忽視的力量，沒錯就是openai。

同樣的用人不看經驗，本科生、輟學生只要有能力照樣招進來。

同樣的重用新人，應屆生與00後可以調動資源從無到有研究sora。

同樣的面對潛力方向，整個公司從頂層開始設計布局和資源推動。

deepseek，可能是組織形態上最像openai的一家中國ai公司了。

參考連結：
[1]https://mp.weixin.qq.com/s/Cajwfve7f-z2Blk9lnD0hA
[2]https://mp.weixin.qq.com/s/r9zZaEgqAa_lml_fOEZmjg
[3]https://mp.weixin.qq.com/s/9AV6Qrm_1HAK1V3t1MZXOw
[4]https://mp.weixin.qq.com/s/y4QwknL7e2Xcnk19LocR4A
[5]https://mp.weixin.qq.com/s/C9sYYQc6e0EAPegLMd_LVQ

原文網址：https://zh.gushiio.com/ai/152.html

deepseek概念股 deepseek概念股一覽表 deepseek關聯A股公司 deepseek預測股票 deepseek預測足球

讚！ (0)

GuShiio.com鼔獅智能

0

ai席捲學術圈，高校忍不了了

Previous 2025年2月7日 pm1:03

3個月dau增長2.8倍，這款ai圖片app避免了“一波流魔咒”？

Next 2025年2月7日 pm1:14

AI科技

chatgpt每月 200 美金仍在虧損，openai或調整定價模式

文章來源：ai范兒 image source: generated by ai 在人工智慧領域的激烈競爭中，即便是行業領軍企業 openai 也面臨著嚴峻的經營挑戰。該公司執行長 …

2025年2月7日
AI科技

杭州六小龍，迎來第一個IPO

文|光錐智慧，作者|劉俊宏魏琳華，編輯|&nbsp；王一粟資本市場終於盼來了&ldquo；杭州六小龍&rdquo；的投資機會。 2月14日，杭…

4天前
AI科技

普華永道發布2025年ai預測：ai agents將勞動力提升1倍

image source: generated by ai 全球四大會計事務所之一的pwc（普華永道）發布了2025年ai領域6大預測報告。普華永道表示，生成式ai的出現，使得開…

2025年2月7日
AI科技

AI算命：科技迷信的狂歡，還是未來的心靈燈塔？

文|深讀商業，作者|艾彤，編輯|&nbsp；劉滿心在這個科技日新月异的時代，AI算命似乎成了年輕人尋求心靈慰藉的新寵。但在這場看似高科技的狂歡背後，是科學的進步，還…

1天前
AI科技

DeepSeek爆火一個月：騰訊全面擁抱，Kimi投放暴跌92%

文|&nbsp； DataEye 1月20日，前後相隔僅幾小時的時間裏，深度求索與月之暗面先後發佈了科技路徑相似的DeepSeek-R1及Kimi K1.5多模態思考模型…

1天前
AI科技

穀歌發佈AI co-scientist：獨自提出可驗證科學假設，已有多項科研成果

文|學術頭條提出一個新穎可行的研究方向，並清楚地知道如何進行後續的探索，對於加速科學發現至關重要。然而，對於人類科學家而言，這是一個既有廣度又有深度的難題，不僅需要瞭解本領域的…

1天前
AI科技

讓AI程式設計去幹活能掙到40萬美元？！ OpenAI推出最新評估測試基準，結果令人詫異

文章來源：頭部科技 Image source: Generated by AI 大型語言模型（LLM）正在改變軟體發展管道，AI現在能不能大規模替代人類程式師成為一個備受行業關注的…

1天前
AI科技

沒有博士學位卻開啟了gpt時代，奧特曼盛讚alec radford，愛因斯坦級天才

image source: generated by ai 幾天前，openai 宣布組織結構調整，裂變成了一家營利性公司和一個非營利組織。與此同時，openai ceo 山姆·奧…

2025年2月7日
AI科技

馬化騰把臥榻之側留給梁文鋒

文|字母榜，作者|馬舒葉，編輯|趙晋傑幾乎在梁文鋒坐到馬化騰旁邊同時，騰訊多款產品開始擁抱DeepSeek。近期，根據&ldquo；智慧湧現&rdquo；…

1天前
AI科技

全球頂尖ai科學家許主洪加盟阿里巴巴，負責ai to c基礎研究應用

(圖片來源：鈦媒體agi編輯林志佳拍攝） 2025開年，行業領先的 ai 科學家加入阿里巴巴。 2月6日消息，鈦媒體agi獲悉，全球頂尖人工智慧科學家許主洪教授（steven ho…

2025年2月7日

發佈留言