有人預(yù)料到 DeepSeek 能引爆全球嗎?至少,DeepSeek-V3 發(fā)布前,在大模型戰(zhàn)場前線 " 賣鏟子 " 的袁進(jìn)輝心里也是打鼓的。
1 月 28 日,他在社交媒體上回憶起一個故事:DeepSeek 爆火前一個月,梁文鋒曾建議硅基流動部署 DeepSeek-V3,至少準(zhǔn)備 20 臺 H800,80 臺最好。袁進(jìn)輝迅速算了算賬,一個月 80 臺 H800 服務(wù)器就要支出五六百萬的算力成本,這些機(jī)器還不一定能用滿。" 風(fēng)險太大了,就沒下注。"
隨后 DeepSeek 火爆全球,洶涌的流量讓其官網(wǎng)和 App 很快崩潰,熱情的用戶急于找到能正常使用 DeepSeek 的渠道。袁進(jìn)輝感慨:" 現(xiàn)在 DeepSeek 這么火,決策失誤,欲哭無淚。"
很快,這種懊悔轉(zhuǎn)變成強(qiáng)大的行動力。苦于算力不足的硅基流動找到華為,全力完成 DeepSeek-R1 & V3 在昇騰芯片上的適配工作。整個春節(jié)期間,硅基流動團(tuán)隊沒有休息過一天。
他們的動作夠快,承接住了第一波流量。2 月 1 日,硅基流動首發(fā)了基于華為昇騰算力的滿血版 DeepSeek-R1 & V3,迅速吸引了大批開發(fā)者和個人用戶。
△圖源:SimilarWeb
這是一次巧妙的合作,一舉掃清市場對于國產(chǎn)芯片性能瓶頸的疑慮,證明了在國產(chǎn)芯片上部署 DeepSeek,也可以獲得持平全球高端 GPU 部署模型的效果。同時,這次合作無意間觸發(fā)了一場國產(chǎn)替代的狂歡。
硅基流動也借此證明了自己的 AI Infra 實(shí)力。" 尤其這次上線 DeepSeek R1 & V3 之后,涌過來的合作線索,暫時都看不過來。" 袁進(jìn)輝說。
就在硅基流動爆火之前, 《智能涌現(xiàn)》獲悉,硅基流動(SiliconFlow) 在 2024 年底 就已完成億元人民幣 Pre-A 輪融資,由華創(chuàng)資本領(lǐng)投,普華資本跟投,老股東耀途資本繼續(xù)超額跟投,華興資本擔(dān)任獨(dú)家財務(wù)顧問 。
值得注意的是,本輪融資之前,硅基流動已引入美團(tuán)作為戰(zhàn)略股東。
2024 年 8 月,《智能涌現(xiàn)》曾采訪過創(chuàng)始人袁進(jìn)輝,當(dāng)時硅基流動正好成立一周年,剛發(fā)布 MaaS 平臺 SiliconCloud。
你可以將 SiliconCloud 想象為一個 " 大模型 API 超市 ",開發(fā)者只需要注冊賬號,選擇自己想要的模型,就可以開發(fā)應(yīng)用,免去購買服務(wù)器的負(fù)擔(dān)。甚至,經(jīng)過硅基流動適配和優(yōu)化后的模型,還能做到比原廠模型響應(yīng)更快、推理成本更低。
在這一年間,硅基流動經(jīng)歷了起碼十倍的市場增長。SiliconCloud 已經(jīng)獲得了超三百萬的用戶,日均調(diào)用上千億 Token ——去年剛上線時,這個數(shù)字還是日均百億。
△圖源:硅基流動
在開發(fā)者圈子中,硅基流動有著良好的口碑,因提供親民價格和優(yōu)異性能的模型服務(wù)被稱為 " 賽博菩薩 "。現(xiàn)在,SiliconCloud 已經(jīng)上線了包括滿血版 DeepSeek-R1 & V3、Qwen、FLUX.1、CosyVoice 等在內(nèi)的上百款主流模型,也提供模型訓(xùn)練、微調(diào)、托管到部署的全套工具,滿足開發(fā)者及企業(yè)客戶的不同應(yīng)用場景需求。
2024 年 7 月,硅基流動也推出了一款新產(chǎn)品:基于 ComfyUI 的云節(jié)點(diǎn)插件 BizyAir。
BizyAir 是一款圖像生成工具,能夠讓 AI 開發(fā)者與創(chuàng)作者無需考慮顯卡和環(huán)境限制,即可直接使用云計算資源完成生圖任務(wù)。截至目前,BizyAir 支持?jǐn)?shù)十種模型,支持 ComfyUI 本地節(jié)點(diǎn)混跑,已經(jīng)獲得了近萬名用戶。
硅基流動在這一年間也開始了 To B 商業(yè)化擴(kuò)展,與華為、亞馬遜云科技、英偉達(dá)等頂級云廠商、芯片廠商、大模型公司及應(yīng)用公司建立了合作伙伴關(guān)系。
企業(yè)服務(wù)方面,硅基流動已經(jīng)在大語言模型、文生圖、視頻生成等多個場景,有標(biāo)桿客戶案例的落地。硅基流動目前提供四種服務(wù)模式,包括專屬實(shí)例、算力納管、私有版 MaaS、基于華為昇騰 910 系列 NPU 的一體機(jī)。
毫無疑問,DeepSeek 已經(jīng)一掃 2024 年大模型領(lǐng)域的陰霾,一場宏大征程的序幕已經(jīng)展開。2024 年,袁進(jìn)輝曾對《智能涌現(xiàn)》表示,在 GPT-4o 出來后,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯推理能力。
OpenAI o1、DeepSeek R1 的出現(xiàn),意味著大模型在 " 邏輯能力 " 這個問題上前進(jìn)了一大步,這對應(yīng)用市場是巨大利好。
" 可以預(yù)期,國內(nèi)外基于 DeepSeek 的應(yīng)用將爆發(fā),這一天終于要到來了。" 袁進(jìn)輝說。
以下為《智能涌現(xiàn)》與創(chuàng)始人袁進(jìn)輝的問答:
《智能涌現(xiàn)》 :上一輪融資之后,硅基流動在產(chǎn)品方面有什么節(jié)點(diǎn)性的進(jìn)展?關(guān)鍵性能提升的程度如何?
袁進(jìn)輝 :主要是適配了華為昇騰芯片、開源了 ComfyUI 云節(jié)點(diǎn) BizyAir,以及持續(xù)上線最新模型,并且上線了模型微調(diào)、托管等功能。
底層推理框架的性能依然保持業(yè)內(nèi)領(lǐng)先,性能優(yōu)化是一項需要長期、持續(xù)性投入的工作。
《智能涌現(xiàn)》 :推出相關(guān)產(chǎn)品后,市場都有怎樣的反饋?商業(yè)落地上有什么關(guān)鍵性進(jìn)展?
袁進(jìn)輝 :SiliconCloud 獲得了爆發(fā)式增長,目前平臺有超三百萬用戶,日均調(diào)用超千億 Token;BizyAir 在沒做什么推廣的情況下獲得了近萬名用戶。
商業(yè)落地方面,尤其這次上線 DeepSeek R1 & V3 之后,涌過來的合作線索暫時都看不過來。
《智能涌現(xiàn)》 :去年 7 月硅基流動上線了 BizyAir,為什么會推出這個產(chǎn)品?戰(zhàn)略定位是什么?
袁進(jìn)輝 :BizyAir 是一個意外驚喜。起初,這是一個試驗(yàn)性項目,其實(shí)還是幫助用戶用高性價比的推理服務(wù)資源,更方便地進(jìn)行生圖。在 BizyAir 之前,我們開源的圖片 / 視頻生成推理加速組件 OneDiff,由于性能好、靈活、支持模型豐富,已經(jīng)有較好的口碑。在做 OneDiff 的過程中,我們了解到生圖用戶的常見痛點(diǎn),包括出圖慢、工作流組合繁瑣、上手門檻高等,所以我們嘗試開發(fā)了 BizyAir,發(fā)布后受到了不少用戶的喜愛以及自發(fā)傳播。
《智能涌現(xiàn)》 :去年你說,大模型的語言能力、知識能力方面的限制都解決得比較好了,除了邏輯。Deepseek V3 之后,是不是邏輯能力也做得足夠好了,2025 年會迎來現(xiàn)象級的應(yīng)用嗎?
袁進(jìn)輝 :那時還沒有 OpenAI o1、DeepSeek-R1。它們的發(fā)布已經(jīng)展示出模型的強(qiáng)大邏輯推理能力,并且 DeepSeek-R1 把思考過程完整地展示了出來,看上去更像是一個有思辨能力的人在思考。
現(xiàn)在,開發(fā)者基于標(biāo)準(zhǔn) API 可以做很多很酷的應(yīng)用了,可以預(yù)期,國內(nèi)外基于 DeepSeek 這樣的開源模型的應(yīng)用將爆發(fā),這一天終于要到來了。
《智能涌現(xiàn)》 :最近硅基流動迅速基于昇騰上線了 DeepSeek,春節(jié)期間也有大量開發(fā)者涌入,你們在前線看到的情況是怎么樣的?
袁進(jìn)輝 :我原本以為我們能接住這波用戶,但市場對 DeepSeek-R1 & V3 的需求量太大了,目前不得不對免費(fèi)用戶進(jìn)行限流,當(dāng)然,我們也在積極擴(kuò)展資源,希望能讓用戶敞開用。
我們作為一個面向開發(fā)者與企業(yè)客戶的 API 平臺,但是光官網(wǎng)的 Playground 就有幾十萬日活,可見 DeepSeek 需求量之大。
《智能涌現(xiàn)》 :很多第三方企業(yè)宣布接入 DeepSeek-R1 & V3 ,但為什么實(shí)際能提供滿血版的企業(yè)很少?
袁進(jìn)輝 :一方面,部署滿血版 DeepSeek R1 & V3 需要的算力資源非常大,用 80 臺 H800 來部署,每月需要五六百萬的算力成本,一般企業(yè)與其自己本地部署,顯然接入硅基流動 SiliconCloud 這樣的云服務(wù) API 更劃算;
另一方面,要部署 DeepSeek R1 & V3 這樣的 MoE 模型技術(shù)挑戰(zhàn)很大,需要專業(yè)的 AI Infra 團(tuán)隊才能部署成功且把性能優(yōu)化得很好,硅基流動 SiliconCloud 曾是國內(nèi)最早部署上線 DeepSeek 模型的第三方平臺,也是首個在國產(chǎn)芯片上適配部署 DeepSeek-R1 & V3 的 AI Infra 公司。
來源:36氪