第一批DeepSeek開發者,已經開始逃離了

文|字母榜,作者|馬舒葉,編輯|趙晋傑

在DeepSeek服務繁忙的回復背後,不只是普通用戶的焦急等待,當API介面響應突破臨界閾值,DeepSeek開發者的世界,也出現了持續震盪的蝴蝶效應。

1月30日,接入DeepSeek的base北京的AI開發者林森,突然收到程式後臺報警,還沒來得及為DeepSeek的出圈高興幾天,林森的程式便因為無法調用DeepSeek,後臺被迫癱瘓了3天。

一開始,林森以為這是因為在DeepSeek的帳戶餘額不足導致的。 直到2月3日春節假期過後返工,他終於接到了DeepSeek暫停API充值的通知。 此時,儘管帳戶內餘額充足,他也無法再調用DeepSeek了。

林森接到後臺通知的第三天,DeepSeek官方於2月6日正式對外發佈公告,宣佈暫停API服務充值。 近半個月過去,截至2月19日,DeepSeek開放平臺的API充值服務仍未恢復正常。

第一批DeepSeek開發者,已經開始逃離了插图1

圖注:DeepSeek開發者平臺仍未恢復充值
圖源:字母榜截圖

在意識到後臺癱瘓是由於DeepSeek服務器超載,
而自己作為開發者,長達數天,卻沒有收到任何提前告知,更沒有任何售後維護服務時,林森有種“ 被拋弃” 的感覺。

“ 就像家門口有一家小店,你是老顧客,辦了卡,一直和老闆相處很好。 突然有一天,小店被評為米其林餐廳,老闆把老顧客拋在一邊,之前辦的卡也不認了。& rdquo; 林森形容道。

作為2023年7月開始部署DeepSeek的第一批開發者,林森為DeepSeek的出圈感到振奮,但如今,為了維持運轉,他只能切換至ChatGPT,畢竟“ ChatGPT雖然貴一點,但至少穩定。& rdquo;

當DeepSeek從口口相傳的小店變成網紅打卡的米其林餐廳,更多和林森一樣調用無門的開發者們,紛紛開始逃離DeepSeek。

2024年6月,小窗AI問答機在產品早期階段就接入了DeepSeek V2,讓小窗合夥人婁池頗為驚豔的是,那個時間點,DeepSeek是唯一能全文背誦《嶽陽樓記》不會出錯的大模型。 囙此,團隊用DeepSeek承擔了產品最覈心的功能角色之一。

但對於開發者而言,
DeepSeek雖好,穩定性卻始終有所欠缺。

婁池告訴
字母榜(ID:wujicaijing)
,春節期間,不僅是C端用戶訪問繁忙,開發者們也時常無法調用DeepSeek,團隊决定選擇幾個已經接入DeepSeek的大模型平臺同時調用。

畢竟,& ldquo; 現在已經有幾十個平臺有滿血版DeepSeek R1了。& rdquo; 用這些大模型平臺的R1,配合Agent和Prompt,也能滿足用戶的需求。

為了爭搶DeepSeek外溢而出的開發者群體,有頭部雲廠商開始面向開發者頻頻舉辦活動,
“ 參與活動就免費送算力,如果不大批量調用,小開發者幾乎能免費使用。& rdquo;
易標AI技術總監楊惠超表示。

不過,DeepSeek熱度當前,
在第一批開發者們出逃之際,更多開發者仍在蜂擁而至,希望蹭到前者的流量紅利。

郗鑒創業的項目,是通過調用DeepSeek的API來進行角色扮演的AI陪伴APP,2月2日上線首周就獲得了約3000名的活躍用戶。

儘管有用戶回饋DeepSeek的API調用時有報錯,但已經有60%的用戶希望郗鑒儘快推出安卓版。 在郗鑒的社交媒體後臺,每天都有至少幾十個用戶私信要下載連結,& ldquo; 搭建在DeepSeek上的AI陪伴平臺”, 無疑成了APP出圈的新標籤。

經字母榜統計,在DeepSeek官網內收錄的接入DeepSeek的各類APP名單,2025年前APP名單僅有182行,如今已經擴展到了488行。

一面是DeepSeek成為“ 國產之光” 爆火出圈,7天湧入1億用戶,另一面,則是第一批部署在DeepSeek上的開發者,正因為超載人流導致的服務繁忙,而紛紛轉投其他大模型。

對開發者而言,長時間的服務异常不再是簡單的故障,而演變成為程式碼世界和商業邏輯間的裂縫,他們被迫在遷移成本下進行生存演算,無論是湧入,還是逃出,開發者們都需要面對DeepSeek爆火帶來的餘震。

01

春節期間小程式後臺被迫癱瘓三天后,至大年初六,為了保證程式正常運轉的林森,離開已經部署一年多的DeepSeek,轉回了ChatGPT。

即使API調用價格高了近10倍,但此時保證服務的穩定,成了優先順序更高的選項。

值得注意的是,開發者離開DeepSeek轉向其他大模型,並不如用戶在APP內切換調用模型一般輕鬆。
“ 不同的大語言模型,甚至是同一個語言模型的不同版本,對於提示詞的迴響結果都有細微的差別。& rdquo;
即便林森仍在持續調用ChatGPT,將所有關鍵節點從DeepSeek遷移ChatGPT,並保證穩定且高品質的內容迴響,仍然花了他半天多的時間。

切換這個動作本身也許只需要兩秒鐘,但“ 更多開發者,換一個新模型要花上一個星期反復調整提示詞,並重複測試。& rdquo; 林森告訴字母榜,

在林森這樣的小開發者們看來,DeepSeek服務器不足可以理解,只是如果能提前通知,能避免許多損失,無論是時間成本,還是APP維護成本。

畢竟,
“ 登入DeepSeek開發者後臺需要手機號注册,只需要一個簡訊,就可以提前告知開發者。& rdquo; 如今,這些損失將由曾在DeepSeek默默無名時就開始支持他們的開發者自己承擔。

當開發者和某個大模型平臺深度耦合,穩定性無疑成了不必宣之於口的契約,一個頻繁波動的服務介面,足以讓開發者重新審視對平臺的忠誠度。

就在去年,林森在調用Mistral大模型(法國頭部大模型公司)時,因為Mistral帳單系統錯誤而重複付費,在他發出郵件後,Mistral不到1小時就糾正了問題,並附上了100歐元的代金券作為賠償。 這樣的應對,也讓林森產生了更多信任。 如今,他也將一部分服務遷回到了Mistral。

易標AI技術總監楊惠超則在DeepSeek V3版本發佈之後,就開始醞釀一場逃離。

不用DeepSeek來寫詩或者吐槽,如果用DeepSeek來寫標書呢? 負責公司內AI標書項目的楊惠超,在DeepSeek推出V3版本後已經著手尋找替代方案。 對他來說,在標書這樣的專業領域,& ldquo; DeepSeek穩定性越來越不足。& rdquo;

DeepSeek R1版本火出圈的推理能力,並不吸引楊惠超。 畢竟,
“ 作為開發者,軟件主要的推理能力是靠程式和算灋,並不是太依靠模型的基礎能力。 底層即便用最老的GPT 3.5,依靠算灋糾正都可以產出一個很好的結果,
模型只要回復答案穩定就可以。& rdquo;

在實際調用過程中,DeepSeek在楊惠超眼中,似乎更像是一個聰明卻會偷懶的“ 好學生”。

陞級V3版本後,楊惠超發現,DeepSeek對一些複雜問題有了更高的回答成功率,但穩定性卻也攀升到了難以接受的程度,& ldquo; 現在問10條問題,至少有一條輸出不穩定,在要求生成的內容之外,DeepSeek往往喜歡自由發揮,額外生成和問題無關的內容。& rdquo;

比如,標書內不允許出現錯誤字元,同時,大模型返回的結果,開發者們往往指定用Json結構(用指令每次調用大模型使得穩定返回固定欄位)去輸出數據,便於後續函數調用,但出現錯誤或者不準確,都會導致後續調用失敗。

“ DeepSeek R1, 或許相對此前的V3版本,推理能力提升了很多,但是穩定性達不到商業化的水準。& rdquo;
在@生產力Mark帳號內,楊惠超提到。

第一批DeepSeek開發者,已經開始逃離了插图3

圖注:DeepSeek V3生成過程中出現亂碼
圖源:@生產力Mark帳號

作為2024年初,DeepSeek-coder時期就加入的第一批用戶,楊惠超並不否認DeepSeek是一個好學生,只是如今,為了保證生成標書的質量和穩定性,楊惠超只能將目光轉向國內其他更偏B端用戶的大模型企業。

畢竟,曾經被稱為AI界拼多多的DeepSeek,正是憑藉著性價比的標籤,迅速聚集起一批中小AI開發者。 但現在想直接穩定地調用DeepSeek,就必須進行本地部署。
“ 部署一個DeepSeek R1,需要30萬 ~ 40萬元的成本,如果用線上的API計算,30萬元我一輩子都用不完。& rdquo;

既不够便宜,又不够穩定,調用無門的楊惠超們,正在批量離開DeepSeek。

02

曾經,林森們是第一批堅定選擇DeepSeek的人。

2024年6月份,林森在開發自己的AI小程式少年聽世界時,曾經對比了當時國內外幾十家大模型平臺。 他需要用大模型每天處理數千條新聞,並且篩選、排序,找出適合青少年聽的科技、自然新聞,並且對新聞文字進行處理。

這不僅要求大模型聰明,還得便宜。

涉及到每天數千條的新聞處理,對token的消耗極大,對獨立開發者的林森來說,ChatGPT模型很貴,只適合處理覈心環節,對大量文字的快速篩選和分析,還要靠別的價格更低的大模型做支持。

同時,無論是國外的Mistral、 Gemini , 還是ChatGPT,調用都很繁瑣:你需要在國外有一個具體的服務器,還要做中繼站,同時需要用國外的信用卡購買token。

林森便是通過英國朋友的信用卡,才能在ChatGPT帳戶完成充值。 而一旦服務器在海外,API響應速度也會有所延遲,
這都讓林森將目光投向國內,尋找一款ChatGPT平替。

DeepSeek讓林森頗為驚豔。& ldquo; 當時DeepSeek並不是最有名的,但卻是迴響最穩定的。& rdquo; 以每10秒請求一次API調用為例,其他國內大模型100次內可能有30%的時候,不返回任何內容,但DeepSeek次次返回,並都能維持不遜色ChatGPT和BAT們大模型平臺的回復質量。

而相比起ChatGPT和BAT們的大模型API調用價格來說,DeepSeek真的太便宜了。

林森將大量新聞閱讀和初步分析的工作交給DeepSeek後,發現DeepSeek的調用成本10倍低於ChatGPT。
經過指令優化後,每天調用DeepSeek的成本低到2-3元,
“ 可能跟ChatGPT相比,它不是最好的,但DeepSeek的價格是極低的,對於我的項目來講,它的性價比非常高。& rdquo;

第一批DeepSeek開發者,已經開始逃離了插图5

圖注:林森用大模型收錄新聞並分析(左)最終呈現在少年聽世界小程式(右)
圖源:
林森提供

性價比,成了開發者們選擇DeepSeek的首要原因。
2023年,楊惠超一開始將公司的AI項目從ChatGPT切換到了Mistral,主要便是為了控制成本。 隨後2024年5月份DeepSeek推出V2版本,將API打到了2元每百萬token,這無疑是對其他大模型廠商的降維打擊,這也成了楊惠超將公司做AI標書工具的項目切換到DeepSeek的緣起。

同時,經過測試後,楊惠超發現,國內早已靠雲服務在B端吃下市場的BAT們,& ldquo; 平臺太重了”。

對於易標AI這樣的初創公司來說,如果選擇BAT,會面臨雲服務的捆綁消費。
對於只是簡單調用大模型服務的楊惠超來說,無疑DeepSeek的API調用更加省事。

在遷移成本上,DeepSeek也勝了一籌。

無論是林森還是楊惠超,初始的APP開發都是基於OpenAI的介面形式,如果切換到BAT們的大模型平臺,都要把底層重新開發一遍。 但DeepSeek相容OpenAI like介面,切換大模型只需要修改平臺地址,& ldquo; 1分鐘無痛切換。& rdquo;

小窗AI問答機正式銷售的第一天就搭載了DeepSeek,並將5個覈心角色中語文和作文指導的角色交給了DeepSeek進行構建。

作為合夥人,婁池也在去年6月就被DeepSeek驚豔到。& ldquo; DeepSeek在中文理解上能力很棒,是那個時間點唯一全文背誦《嶽陽樓記》不會出錯的大模型。& rdquo; 婁池告訴字母榜,
相比起其他大模型中規中矩、班味十足的檔案式輸出,用DeepSeek教孩子寫作文,往往贏在了寫作的想像力上。

在社交媒體風靡用DeepSeek寫詩、寫科幻小說之前,DeepSeek的華麗文風,就讓小窗AI團隊眼前一亮。

對於開發者們來說,他們仍在期待DeepSeek恢復調用,眼下無論是遷移到BAT們部署了滿血版DeepSeek R1的平臺,還是轉向其他大模型廠商,都似乎是“ 菀菀類卿”。

03

但競爭對手正在努力追平DeepSeek深度推理的出圈特長。

國內,近期百度、騰訊都陸續在自研大模型中加入深度思考能力; 國外,OpenAI也在2月緊急上新“ Deep Research”, 把推理大模型的思考能力用於聯網蒐索,並將對Pro、Plus和Team用戶開放。 穀歌人工智慧實驗室(Google DeepMind)也在2月發佈了Gemini 2.0模型系列,其中2.0 Flash Thinking實驗版本則是一款增强推理能力的模型。

值得關注的是,DeepSeek仍然以文字閱讀為主,但不管是ChatGPT還是Gemini 2.0,在支持深度思考之餘,都已經將推理能力引入多模態,支持視頻、語音、檔案、圖片等多種輸入模態。

對DeepSeek來說,在追趕多模態之餘,更大的挑戰還來自競爭對手在價格上的逼近。

在雲平臺部署側,一眾頭部雲廠商都選擇接入DeepSeek,一邊分食流量,一邊靠雲服務綁定客戶。
對DeepSeek大模型的調用,某種程度上甚至成了綁定企業雲服務的“ 贈品”。

百度創始人李彥宏近期提出,在大語言模型領域,& ldquo; 每12個月,推理成本就可以降低90%以上。& rdquo;

在推理成本下降的趨勢下,BAT們的API調用價格持續走低已成必然,DeepSeek的性價比優勢,正在迎來大廠新一輪價格戰的壓力。

不過,大模型API價格戰只是起步,面向開發者,大模型廠商們還拼起了服務。

林森接觸過大大小小眾多的大模型平臺,讓他印象深刻的是,某科技大廠會有專門的客戶經理進行對接,無論是不穩定還是出現科技問題,都會主動和開發者聯系。

而儘管作為一個開源的大模型平臺,目標是為開發者提供更普惠的AI支持,DeepSeek甚至在官網沒有面向開發者出具發票的入口。

“ 每次API充值完,不像其他大模型平臺一樣可以直接在後臺開發票,DeepSeek需要繞到官網外,添加客服企業微信開具發票。& rdquo; 楊惠超告訴字母榜,無論是價格還是服務,
DeepSeek“ 性價比” 的標籤,似乎都有點立不穩了。

某頭部大廠AI產品經理告訴字母榜,有的互聯網公司leader堅持用DeepSeek替換原有大模型,完全不管替換模型重新調整Prompt所耗費的時間。 同時,即便滿血版的DeepSeek R1,也有不少通用能力如‌ Function calling等並不支持。

相比起用雲服務跑通了B端服務場景的BAT們,在便捷度上,DeepSeek仍然差著AI大廠一截。

只是DeepSeek的流量效應暫未褪去,趕潮人依然眾多。

有部分公司宣稱接入DeepSeek,只是開始調用API,充值了幾百塊。 有的公司公告部署了DeepSeek模型,但其實只是讓員工看了看B站教程,下載了一鍵安裝包。
在這波DeepSeek熱潮裏,泥沙俱下,魚龍混雜。

潮水終將褪去,但DeepSeek要做的功課顯然更多了。

原文網址:https://zh.gushiio.com/ai/2041.html

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *