男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

DeepSeek 的東風(fēng),吹過中國 AI 產(chǎn)業(yè)鏈

創(chuàng)投圈
2025
02/10
21:53
分享
評論

 

DeepSeek 投下的重石激起了千層浪,不僅被推到全世界的聚光燈下,也迎來了意料之外的眾多機會。

上線不到一個月,DeepSeek 應(yīng)用端就成為了全球增速最快的 AI 應(yīng)用,日活用戶數(shù)呈現(xiàn)出一條陡峭的增長曲線。據(jù) AI 產(chǎn)品榜統(tǒng)計,截至 1 月 31 日,DeepSeek 應(yīng)用(APP)全球日活已突破 2000 萬,超過字節(jié)跳動的豆包,是 ChatGPT 的 41.6%。

但當(dāng)用戶想和 DeepSeek 進(jìn)行頻繁、深度的對話時,卻常常會出現(xiàn)卡頓的情況,得到 " 服務(wù)器繁忙,請稍后再試 " 的回復(fù)。有用戶戲稱,DeepSeek 之所以將模型命名為 R1,是因為每天只能運行(Run)一次。

2 月 6 日,DeepSeek 還表示,因當(dāng)前服務(wù)器資源緊張,已暫停 API 服務(wù)充值。截至發(fā)稿,充值服務(wù)仍未恢復(fù)。有 AI 從業(yè)者告訴藍(lán)鯨新聞,團隊原先基于 DeepSeek 模型構(gòu)建了 AI 搜索功能。但 DeepSeek 爆火后出現(xiàn) API 服務(wù)卡頓、響應(yīng)超時的情況,導(dǎo)致搜索結(jié)果無法生成。春節(jié)期間他們不得不加班加點,將服務(wù)轉(zhuǎn)移到備用的 GPT-4o 模型上。

中上游的 " 搶灘 " 行動

DeepSeek 讓 AI 迎來了 " 破圈 " 時刻,對上下游產(chǎn)業(yè)鏈來說則蘊含著無數(shù)商機,手握大量算力的云廠商、芯片廠商開始迅速行動起來。

最先有所動作的便是國內(nèi)外云廠商,微軟、亞馬遜等云巨頭趕在春節(jié)伊始就在自家云平臺上接入了 DeepSeek-R1 模型。自 2 月 1 日起,華為云、阿里云、百度智能云、字節(jié)火山引擎、騰訊云等國內(nèi)主要云廠商也紛紛宣布上線 DeepSeek 模型,面向開發(fā)者和企業(yè)客戶提供模型部署服務(wù)。

緊隨其后的是各大國產(chǎn)芯片廠商。目前已有十?dāng)?shù)家國產(chǎn)芯片宣布完成了對 DeepSeek 模型的適配和上線,包括沐曦、天數(shù)智芯、摩爾線程、壁仞科技等。這些芯片廠商或基于自身構(gòu)建的算力平臺,或與下游的 AI Infra 平臺聯(lián)手,支持 DeepSeek 模型的部署。

一位從業(yè)者對藍(lán)鯨新聞解釋稱,云廠商的敏捷反應(yīng)得益于它們接入 DeepSeek 的成本較低。DeepSeek 模型是基于英偉達(dá) GPU 訓(xùn)練出來的,而云廠商通常存有大量的此類芯片,可以直接、快速地完成部署。國內(nèi)芯片廠商在硬件上使用的指令集不同,因此需要另做適配和移植工作,相應(yīng)的工作量和成本會更大一些。

無論是云廠商還是芯片廠商,都希望能趕上這輪 DeepSeek 的熱度。當(dāng) DeepSeek 官方的 API 服務(wù)不穩(wěn)定時,能夠吸引部分用戶跳轉(zhuǎn)到自家平臺上,憑借已有的算力資源,為用戶提供 DeepSeek 的模型服務(wù)。有使用者在初步體驗后表示,一些平臺的價格和推理速度能夠滿足其需求,之后會考慮通過第三方平臺開發(fā)基于 DeepSeek-R1 的 AI 應(yīng)用。

社交平臺上也涌現(xiàn)出不少第三方平臺的推廣信息,稱能夠繞開 DeepSeek 官網(wǎng)的擁堵,提供流暢、穩(wěn)定的使用體驗,其中部分平臺還亮出了 " 國產(chǎn)芯片 + 國產(chǎn)大模型 " 的招牌。例如硅基流動與華為云團隊聯(lián)手,在其大模型云服務(wù)平臺上線了基于華為云昇騰云服務(wù)的 DeepSeek 模型,華為也在純血鴻蒙版小藝助手 App 中集成了 DeepSeek-R1。

硅基流動創(chuàng)始人兼 CEO 袁進(jìn)輝在社交平臺上透露,DeepSeek-V3 模型發(fā)布前,DeepSeek 創(chuàng)始人梁文鋒曾建議可以用最少 20 臺英偉達(dá) H800 服務(wù)器在其平臺上部署??紤]到成本問題,他們沒有這么選擇。

DeepSeek 走紅后,硅基流動團隊才決定用國產(chǎn)芯片進(jìn)行適配。于是和華為達(dá)成合作,春節(jié)假期 " 加班加點,遇到問題隨時討論,晚上也開會討論到很晚 "。最終在 2 月 1 日,正式上線了基于國產(chǎn)芯片的 DeepSeek 模型服務(wù)。

國產(chǎn)算力的良機

當(dāng)談及 DeepSeek 模型是如何與國產(chǎn)芯片搭配在一起時,首先要對大模型的訓(xùn)練和推理階段進(jìn)行區(qū)分。在訓(xùn)練階段,大模型還處于學(xué)習(xí)過程中,需要輸入大量的數(shù)據(jù),不斷調(diào)整內(nèi)部參數(shù),來發(fā)現(xiàn)規(guī)律。而推理則是大模型完成訓(xùn)練后,進(jìn)行實際應(yīng)用的環(huán)節(jié)。

一位前大廠 AI 工程師對藍(lán)鯨新聞進(jìn)一步解釋稱,模型在訓(xùn)練階段對算力和帶寬的要求更高,同時大模型廠商需要試驗不同的模型結(jié)構(gòu)、算子,大多會優(yōu)先選擇使用英偉達(dá)的 GPU 硬件及其 " 開發(fā)工具包 "CUDA。推理階段對軟硬件的要求較低,因此成為許多國產(chǎn)芯片主打的場景,針對已訓(xùn)練好的模型進(jìn)行兼容和優(yōu)化。

有國產(chǎn)芯片廠商告訴藍(lán)鯨新聞,雖然 DeepSeek 在結(jié)構(gòu)上有微創(chuàng)新,但仍然是大語言模型。對 DeepSeek 的適配都是在推理應(yīng)用環(huán)節(jié),所以并不難,能夠很快實現(xiàn)。

DeepSeek 因低成本引發(fā)熱議后,曾一度造成英偉達(dá)股價暴跌,單日市值蒸發(fā)創(chuàng)下美股記錄。一個廣泛傳播的說法是,DeepSeek 在模型開發(fā)過程中繞開了英偉達(dá)的 CUDA 框架,由此能夠降低對英偉達(dá)的依賴。究其來源,是 DeepSeek 在 V3 模型技術(shù)報告中提到," 我們專門采用定制的 PTX(并行線程執(zhí)行)指令,并自動調(diào)優(yōu)通信塊大小,從而顯著減少了 L2 緩存的使用及對其他 SM 的干擾。"

使用 PTX 編程語言是否意味著 DeepSeek 跨過了英偉達(dá) CUDA 的壟斷?有從業(yè)者表示這種說法是完全錯誤的,因為 PTX 是屬于 CUDA 的一部分,并沒有繞開 CUDA。

該從業(yè)者解釋稱,CUDA 是一個軟件套裝,包括上層的開發(fā)語言、豐富的 API 工具庫、編譯工具等,提供給開發(fā)者對 GPU 進(jìn)行編程。PTX 則是 CUDA 的中間層匯編語言,更接近于硬件層面,通常不直接面向開發(fā)者?;?CUDA 的開發(fā)更為上層,因此難以在 GPU 上進(jìn)行更精細(xì)的控制。而使用 PTX 這一更低層次的編程語言,能夠更靈活地控制底層硬件,優(yōu)化程序性能," 這也是 DeepSeek 之所以所需算力更少的創(chuàng)新點之一。"

盡管 DeepSeek 模型仍是基于英偉達(dá) GPU 訓(xùn)練出來的,但無論是它所展現(xiàn)出的對計算資源的高效利用,還是由此引起的國產(chǎn)芯片適配潮,對于芯片產(chǎn)業(yè)都是重大利好。

有從業(yè)者表示,此前國內(nèi)大模型公司也會用國產(chǎn)芯片去做一些模型推理或測試訓(xùn)練的工作,但規(guī)模有限,并沒有達(dá)到這次的程度。受 DeepSeek 帶動,國產(chǎn)芯片的利用率將會得到極大的提升。

AI 應(yīng)用落地之年真的來了?

中上游掀起的波瀾終會向下游傳導(dǎo),隨著 DeepSeek 熱潮蔓延,AI 應(yīng)用層也開始大范圍地行動起來。過去幾天,智能硬件、汽車金融等各行各業(yè)都在積極接入 DeepSeek 模型,希望借助其能力來升級自身服務(wù)。

上周,閱文集團宣布旗下作家輔助創(chuàng)作產(chǎn)品 " 作家助手 " 已集成 DeepSeek-R1 模型,稱這是 "DeepSeek 首次在網(wǎng)文領(lǐng)域的應(yīng)用 "。閱文集團對藍(lán)鯨新聞表示,當(dāng)調(diào)用幫助作家查資料、找靈感的智能問答功能時,DeepSeek 對于作家的提問意圖有較強的理解推導(dǎo)能力,能夠聽懂潛臺詞和言外之意。

同時,R1 模型展示出的超長思維鏈對網(wǎng)文作家來說也具備較高的啟發(fā)性。" 網(wǎng)文作家、尤其是成熟作家,經(jīng)常抱怨的是 AI 內(nèi)容的老套重復(fù),他們需要的是啟發(fā)和思考梳理。" 閱文稱。接入 DeepSeek 后,當(dāng)作家讓 AI 生產(chǎn)包含某網(wǎng)站熱點元素的網(wǎng)絡(luò)小說提綱時,除了提供生成的答案,AI 還會在思考過程中先清晰地羅列具體元素,并給出對應(yīng)熱門書目,從而輔助作家獲取需要的專業(yè)內(nèi)容。

在 DeepSeek 帶來的競爭壓力下,OpenAI 上周宣布將其最新模型 o3-mini 系列模型的思維鏈也予以公開。但其研究員表示,這些思維摘要雖然已經(jīng)非常接近,卻并不是原始的思維鏈。有開發(fā)者之前對藍(lán)鯨新聞分析稱,OpenAI 此舉可能是出于用戶體驗、隱私保護、輸出質(zhì)量、技術(shù)成本和商業(yè)機密等多方面的考慮,既能提供有用的思考過程,又不會帶來負(fù)面影響。

去年 5 月,DeepSeek 就曾因低定價引爆國內(nèi)大模型 " 價格戰(zhàn) "。業(yè)內(nèi)普遍認(rèn)為,大模型降價將有助于推動應(yīng)用的落地。就 DeepSeek 此番接連發(fā)布的兩款模型而言,V3 模型的價格優(yōu)惠期雖已于 2 月 9 日結(jié)束,API 調(diào)用價格仍是 GPT-4o 的十幾分之一。推理模型 DeepSeek-R1 的定價比所對標(biāo)的 o1 正式版也要低上 27-55 倍。

硅基智能是一家專注 AI 數(shù)字人、硅基智慧屏等服務(wù)的企業(yè),其創(chuàng)始人、董事長兼 CEO 司馬華鵬對藍(lán)鯨新聞表示," 大模型底座的成本降低了,AI 基礎(chǔ)設(shè)施建設(shè)的成本下降,對于行業(yè)發(fā)展是非常大的促進(jìn)。AI 應(yīng)用會出現(xiàn)大爆發(fā),將會產(chǎn)生更多超級應(yīng)用的出現(xiàn)。"

DeepSeek 對模型的開源和思維鏈的公開,讓硅基智能看到了升級其 AI 數(shù)字人能力及服務(wù)的可能。春節(jié)期間團隊快速反應(yīng),接入了 DeepSeek 模型,以提升硅基智能數(shù)字人系列產(chǎn)品在自然語言理解、情感識別等方面的能力。

2 月 10 日,硅基智能再攜手算力企業(yè)華鯤振宇發(fā)布全新解決方案。整合硅基智能自研的 AI 數(shù)字人引擎,并依托鯤鵬、昇騰集群作為國產(chǎn)高性能算力底座,使 DeepSeek 大模型在海量數(shù)據(jù)處理下具備卓越的響應(yīng)速度與穩(wěn)定性。

對國內(nèi) AI 產(chǎn)業(yè)鏈來說,這個蛇年春節(jié)勢必過得并不輕松。而 DeepSeek 所引發(fā)的漣漪,或要再等待一些時間,匯聚成更龐大的浪潮。

來源:藍(lán)鯨財經(jīng)

THE END
廣告、內(nèi)容合作請點擊這里 尋求合作
免責(zé)聲明:本文系轉(zhuǎn)載,版權(quán)歸原作者所有;旨在傳遞信息,不代表砍柴網(wǎng)的觀點和立場。

相關(guān)熱點

相關(guān)推薦

1
3