進(jìn)入 2024 年,大模型似乎有熄火之勢(shì):資本市場(chǎng),與之關(guān)聯(lián)的概念炒不動(dòng)了,英偉達(dá)股價(jià)動(dòng)輒暴跌重挫,引發(fā) " 泡沫戳破 " 的擔(dān)憂;
消費(fèi)市場(chǎng),BATH 們的推新活動(dòng)少了,產(chǎn)品更新迭代的速度慢了,民眾的關(guān)注度降了……
熱鬧的大概只剩下兩場(chǎng)酣仗:自 5 月 15 日字節(jié)跳動(dòng)宣布 " 以厘計(jì)費(fèi) ",打響國(guó)內(nèi)大模型 " 價(jià)格戰(zhàn) " 的第一槍,百度文心、訊飛星火、阿里通義、騰訊元寶等紛紛跟進(jìn);
同時(shí),地鐵、寫字樓、機(jī)場(chǎng)等白領(lǐng)人群密集區(qū)域,百度文心、訊飛星火、阿里通義、騰訊元寶、華為盤古的 Slogan,你方唱罷我登臺(tái),貼臉營(yíng)銷如槍林刀樹。
" 海水 " 與 " 火焰 " 交融的場(chǎng)面,不得不讓人思考,大模型的出路究竟在哪里?難點(diǎn)、卡點(diǎn)、節(jié)點(diǎn)又是什么?
01 難點(diǎn):盈利難&落地難
強(qiáng)如 OpenAI,也面臨 " 恰飯 " 的難題。
援引外媒報(bào)道,OpenAI 預(yù)估虧損 50 億美元,全年運(yùn)營(yíng)總成本高達(dá) 85 億美元,照此估算,其現(xiàn)金流大概率在一年內(nèi)耗盡。
而在一篇題為《How does OpenAI Survive》的長(zhǎng)文中,作者對(duì) OpenAI 的商業(yè)模式產(chǎn)生了質(zhì)疑:
"OpenAI 的營(yíng)收在 35 億至 45 億美元之間,但其運(yùn)營(yíng)虧損可能高達(dá) 50 億美元,其收入遠(yuǎn)遠(yuǎn)無(wú)法覆蓋成本。而為了推出下一代的大模型 GPT5,OpenAI 需要更多的數(shù)據(jù)和算力,這又是一大筆花費(fèi)。"
說(shuō)千道萬(wàn),靠著 " 碎鈔式 " 的大力出奇跡后,大模型卻仍未找到一條合理的盈利路徑。
據(jù)《節(jié)點(diǎn)財(cái)經(jīng)》觀察,市面上的大模型,大部分都采取 To C+To B,即會(huì)員訂閱 + 開發(fā)者 API 調(diào)用 " 兩條腿 " 走路。
但無(wú)論是 To C,還是 To C,能一上來(lái)就產(chǎn)生付費(fèi)的寥寥無(wú)幾,若再刨除重負(fù)的減項(xiàng),多半是鼻子大過(guò)臉。
以本土大模型先行者百度為例,2024 年 Q1,其云業(yè)務(wù)收入為 47 億元,同比增長(zhǎng) 12%,其中 6.9% 來(lái)自外部客戶使用大模型及生成式 AI 相關(guān)服務(wù),約為 3.24 億元。
而在 2023 年 Q4,大模型為百度云貢獻(xiàn)了 6.6 億元增量收入。
這是國(guó)內(nèi)唯一披露大模型收益的廠商,本身又是家大業(yè)大,有底氣拼到底的巨擘。但只談創(chuàng)收,忽略創(chuàng)利,就是耍流氓。
可想而知,其余不敢明示賬目的選手,內(nèi)心有多迷茫、煎熬。
不掙錢,難掙錢的背后,是大模型落地難的窘境。
雖然大佬們高呼 "ChatGPT" 的問(wèn)世是 "iPhone 時(shí)刻 ",第四次工業(yè)革命,新一代的 " 火 " 和 " 電 ",但坦率地講,當(dāng)下大模型還有很多局限性,包括認(rèn)知偏差、能動(dòng)性欠缺、泛化性能弱、幻覺(jué)等。
比如,數(shù)值運(yùn)算就是大模型明顯的弱項(xiàng),或者說(shuō)大模型是妥妥的 " 文科生 ",做數(shù)學(xué)題的智商可能連二、三年級(jí)的小學(xué)生都不如。
《節(jié)點(diǎn)財(cái)經(jīng)》親測(cè),在 Kimi 輸入:"9.11 和 9.8 哪個(gè)大?" 一頓啰嗦后,Kimi 給出了完全不正確的答案。
圖源:Kimi 官網(wǎng)
比如,大模型資料更新不及時(shí),必須外掛知識(shí)庫(kù)才能在一定程度上緩解這個(gè)痛點(diǎn),并且還是無(wú)法完全解決 " 一本正經(jīng)地胡說(shuō)八道 " 的尷尬。
前幾天刷屏的 SearchGPT,就在各地網(wǎng)友興致勃勃等待灰測(cè)展現(xiàn) AI 搜索的 " 洪荒之力 " 時(shí),《大西洋月刊》澆了一盆冷水,眼尖的記者發(fā)現(xiàn):
問(wèn)的是關(guān)于 " 八月份北卡羅來(lái)納州的布恩音樂(lè)節(jié) " 的細(xì)節(jié),SearchGPT 的回答分為 5 條,3 條里包含事實(shí)錯(cuò)誤——有的是把舉辦日期弄錯(cuò),有的是把距離和車程搞混,有的是把場(chǎng)館網(wǎng)址張冠李戴。
再如,大模型絕對(duì)是 " 健忘癥 " 患者,我們?cè)诤退鼘?duì)話時(shí),尤其是多輪對(duì)話時(shí),難免要化身 " 復(fù)讀機(jī) ",一遍一遍重復(fù)相同的話術(shù)。
而在 B 端,因?yàn)閷?shí)戰(zhàn)經(jīng)驗(yàn)不足,生分于對(duì)方的 Know-How,加之環(huán)境的復(fù)雜多變性,大模型面臨的挑戰(zhàn)更艱巨。某業(yè)內(nèi)人士表示,迄今大模型在行業(yè)中尚沒(méi)有一個(gè)成熟的案例。
02 卡點(diǎn):數(shù)據(jù)、算力、成本
深入肌理地分析,大模型的 " 落地難 " 又與自身的三大卡點(diǎn):數(shù)據(jù)、算力、成本息息相連。
卡在數(shù)據(jù)
如果把大模型比作一頭巨獸,那它的顯著特征之一便是 " 不停進(jìn)食 ":需要高質(zhì)量、大面積的語(yǔ)料做長(zhǎng)久期、高頻次地投喂、催肥。
換言之," 食物 " 的品質(zhì)、多寡、新鮮度、多樣性等,決定了大模型的迭代進(jìn)度和學(xué)習(xí)效果。
無(wú)疑,這對(duì)數(shù)據(jù)的挖掘、獲取提出嚴(yán)峻考驗(yàn),關(guān)系到各方的權(quán)益保障、利益分配、版權(quán)歸屬等,通常涉及到敏感信息時(shí),數(shù)據(jù)的清洗、標(biāo)注、脫敏又會(huì)很繁雜。
前陣,免費(fèi)網(wǎng)文 APP 番茄小說(shuō)因一份 "AI 協(xié)議 " 引發(fā)軒然大波。根據(jù)該份協(xié)議,平臺(tái)可以將簽約作品,含名稱、大綱、簡(jiǎn)介、章節(jié)等,作為 " 哺育 "AI 大模型的素材,用于各種應(yīng)用場(chǎng)景,如智能對(duì)話、智能文本創(chuàng)作等。
不過(guò),這一舉動(dòng)遭到作者的普遍反對(duì),認(rèn)為其不僅威脅網(wǎng)絡(luò)寫手的生計(jì),還損害了原創(chuàng)內(nèi)容的價(jià)值,甚至發(fā)起聯(lián)合斷更以示抗議。
卡在算力
如果把 AI 鏈路比作一間工廠,那么算力便是維持工廠運(yùn)轉(zhuǎn),量級(jí)夸張且進(jìn)價(jià)不菲的 " 燃料 "(煤、石油、電力等)。
公開資料顯示,初始 ChatGPT 匹配的算力是 1 萬(wàn)塊英偉達(dá) A100(AI 芯片),花費(fèi)超過(guò) 7 億元。后續(xù)調(diào)優(yōu)每天消耗的算力大概是 3640PFLOPS,即 7 至 8 個(gè)算力達(dá) 500PFLOPS 的 Data Center 的支撐,整體基建開支以百億計(jì)。
按照廣發(fā)證券的測(cè)算,在暫不考慮軟件層面算法優(yōu)化的前提下,本土 AI 大模型在訓(xùn)練與判斷、預(yù)測(cè)階段所需算力,相當(dāng)于 1.1 萬(wàn)臺(tái)或 3.8 萬(wàn)臺(tái)(樂(lè)觀假設(shè)下)高端 AI 服務(wù)器,大致對(duì)應(yīng)約 126 億元到 434 億元的資金體量。
進(jìn)一步地,隨著大模型規(guī)模狀大,算力需求會(huì)倍數(shù)遞增,已然超越硬件的摩爾定律。據(jù)悉,ChatGPT 從 1.0 到 3.0,參數(shù)量從 1.17 億狂飆到 1750 億。
而目前,我們?cè)谒懔@塊既面臨外部 " 卡脖子 ",內(nèi)部建設(shè)又相對(duì)落后,碎片化、傳輸慢、協(xié)同難、人才緊缺等 " 痼疾 " 亟待突破,導(dǎo)致大模型的實(shí)效遜于國(guó)外。
" 大模型只有兩個(gè)梯隊(duì),OpenAI 和 Others,國(guó)產(chǎn)用哪家都一樣 ",多位 AI 從業(yè)者談道。
卡在成本
大模型 " 桎梏 " 于算力,實(shí)際也是 " 桎梏 " 于成本。
計(jì)算機(jī)飛入千家萬(wàn)戶,售價(jià)下探,變得親民、接地氣,很關(guān)鍵;智能手機(jī)能人手一部,物美價(jià)廉的小米功不可沒(méi);新能源汽車的熱賣,離不開動(dòng)力電池的 " 跳水式 " 降價(jià)……
從人類歷史的進(jìn)程看,任何一項(xiàng)新技術(shù)的推廣、普及,都離不開對(duì)成本的有效、大力壓縮、控制。
硬幣的背面,是科技發(fā)展和工業(yè)文明進(jìn)步共同作用下,制造效率、運(yùn)算精度提升,人均產(chǎn)值拔高,各類物料愈發(fā)便宜等因素集結(jié)的強(qiáng)大驅(qū)動(dòng)力,進(jìn)而減輕 C 端、B 端 " 太貴了,買還不買 " 的糾結(jié)。
大模型同理,浩大的開支也是其成長(zhǎng)途中的 " 絆腳石 "。試想,當(dāng)生態(tài)里只有唯一的 " 賣鏟人 "(英偉達(dá))賺錢,賺頭還不小,怎么可能持續(xù)呢?
好消息是,今年 2 月末,李彥宏透露,自發(fā)布以來(lái),百度不斷降低文心大模型在推理方面的成本,已降至去年 3 月版本的 1%。
03 節(jié)點(diǎn):在產(chǎn)業(yè)里 " 種植 " 大模型
毋庸置疑,大模型仍有諸多 " 短板 " 和缺陷,但新技術(shù)的魅力向來(lái)在于探索 " 無(wú)人區(qū) ",跋涉 " 深水區(qū) "。
很多眼下看似微弱的 " 火種 ",往往都孕育著日后 " 納須彌于芥子 " 的宏壯。盡管迄今為止的大模型,大家都是拿著錘子找釘子,但我們已經(jīng)看到,其正逐步向產(chǎn)業(yè)邁進(jìn),嘗試扮演了一些淺層的 Agent 的角色。
最醒目的標(biāo)識(shí)便是,大模型不再坐而論道,只會(huì)聊天、寫詩(shī)、作畫,而是起而動(dòng)之,走出實(shí)驗(yàn)室,去往礦區(qū)、政務(wù)、金融、醫(yī)藥、金融、物流等具體領(lǐng)域,努力兌現(xiàn)自己的終極使命。
比如,在礦區(qū),下井工人常年深陷光線昏暗、浮塵彌漫的環(huán)境,疊加經(jīng)年累月高強(qiáng)度的勞碌,使不少人都患上了風(fēng)濕、耳鳴等職業(yè)病,更甚者,還可能遭遇瓦斯、透水等意外,但礦區(qū)作業(yè)又十分依賴人力,特別是主運(yùn)系統(tǒng)巡檢。
華為的盤古礦山大模型這時(shí)候便派上用場(chǎng)了。其覆蓋煤礦的采、掘、機(jī)、運(yùn)、通、洗選等流程下的 1000 多個(gè)細(xì)分場(chǎng)景,用 AI 取代人成為主運(yùn)智能監(jiān)測(cè)系統(tǒng)的眼睛,能夠精準(zhǔn)識(shí)別大塊煤、錨桿等異常情況,異物識(shí)別準(zhǔn)確率達(dá) 98%,動(dòng)作規(guī)范識(shí)別準(zhǔn)確率超過(guò) 95%,且全時(shí)段巡邏助力工作人員,避免因漏檢造成的安全事故,縮短停機(jī)時(shí)間。
京東表示,基座大模型是靠卡訓(xùn)出來(lái)的,企業(yè)大模型是靠人用出來(lái)的。
物流領(lǐng)域,攬收、派送、分揀、輔助,應(yīng)對(duì)突發(fā)事件等,快遞員每天都背負(fù)著繁重的任務(wù),還要熟悉貨物處理規(guī)程、安全操作標(biāo)準(zhǔn)、客服要求等多達(dá)上百個(gè)規(guī)范,把這些統(tǒng)統(tǒng)記牢,肯定要耗費(fèi)大把功夫,還容易混淆。
京東言犀大模型的小哥終端助手大大化解了上述煩惱。它告別了只 " 動(dòng)腦 " 的境界,能直接 " 下手 ",快遞員動(dòng)動(dòng)嘴,小哥終端助手就能立即將送貨通知發(fā)給客戶。如今,小哥終端助手為 JD 商城近 35 萬(wàn)自有配送員 " 效勞 "。
再如,零售行業(yè),基于京東言犀大模型的 AIGC 營(yíng)銷工具 " 京點(diǎn)點(diǎn) ",不僅可以幫助商家一鍵出商品圖,還支持了超過(guò) 2000 種視覺(jué)元素道具;不僅可以豐富吸睛資源和表現(xiàn)力,還能依循商品屬性、特點(diǎn)和宣傳想要的個(gè)性化布局,實(shí)時(shí)、自主撰寫創(chuàng)意賣點(diǎn)、種草文案、直播腳本等。
總的來(lái)說(shuō),把大模型 " 種植 " 在產(chǎn)業(yè)里,讓大模型在產(chǎn)業(yè)里生長(zhǎng)、發(fā)芽,儼然是現(xiàn)在大廠的共識(shí),必須攻克的難關(guān)。長(zhǎng)遠(yuǎn)看,該共識(shí)亦如 " 星星之火 " 終會(huì)燎原曠野。
寫在最后
當(dāng)喧囂過(guò)后,大模型這場(chǎng)豪華游戲,能留在牌桌的玩家,注定只是少數(shù)。
面對(duì)數(shù)據(jù)、算力、成本等現(xiàn)實(shí)問(wèn)題,供需兩端漸漸回歸理性??梢灶A(yù)見(jiàn),在真 " 好用 " 和能 " 吸金 " 之間,大模型還有很長(zhǎng)的路要走。
來(lái)源:節(jié)點(diǎn)財(cái)經(jīng)