這幾天,你是否刷到過(guò)大火的各地博物館讓文物 " 舞動(dòng)起來(lái) " 的短視頻?
又是否看到過(guò)讓馬斯克都直呼驚嘆的,那些被 " 復(fù)活 " 的世界名畫?
再或者,你一定看到過(guò) AI 魔改過(guò)爭(zhēng)議很多的老牌影視劇。
是的,這一切背后都是 AI。
就在 2024 年最后一個(gè)月,國(guó)內(nèi)外科技大廠更是集體炫技,AI 應(yīng)用正在以迅雷不及掩耳之勢(shì)加速落地。
在人工智能時(shí)代,技術(shù)創(chuàng)新的速度讓摩爾定律、新摩爾定律不斷被打破。
我們此前就討論過(guò),隨著這兩年科技公司對(duì)算力和 AI 的史詩(shī)級(jí)投入,大模型底座技術(shù)漸成熟并由大廠開(kāi)源后,AI 界走向了更務(wù)實(shí)的道路——應(yīng)用落地。
最新的權(quán)威數(shù)據(jù)統(tǒng)計(jì):幾乎每六個(gè)中國(guó)人中,就有一人正在使用 AI 產(chǎn)品。
更有從業(yè)者直言," 最快 5 年之內(nèi),中國(guó)人一周只需要工作 4 天 "。
我們做好準(zhǔn)備來(lái)迎接這個(gè)新時(shí)代了嗎?
用 AI 造世界:文生圖、生視頻、生 3D 大模型加速開(kāi)源
12 月 10 日,OpenAI 旗下視頻生成模型 Sora,終于在首次亮相 10 個(gè)月后正式開(kāi)放,新版工具 Sora Turbo 可以生成最長(zhǎng)達(dá) 20 秒的視頻。或許是由于等待的太久,用戶火熱的試用熱情一度讓 OpenAI 緊急關(guān)閉用戶注冊(cè)。
但是 Sora 姍姍來(lái)遲的這 10 個(gè)月的空檔期內(nèi),AI 圈已經(jīng)翻天覆地。
比 Sora 早一周,12 月 3 日,有著 "AI 教母 " 之稱的李飛飛聯(lián)合創(chuàng)立并擔(dān)任 CEO 的 AI 公司 World Labs 官宣了首個(gè)成果—— 3D 世界生成模型,可以讓用戶從單張圖片生成 3D 世界的 AI 系統(tǒng),并且用戶可以與之互動(dòng)。比如,通過(guò)鍵盤和鼠標(biāo)在生成的 3D 場(chǎng)景里移動(dòng)、轉(zhuǎn)換視角。
緊隨其后,12 月 4 日,谷歌也發(fā)布了 Genie 2,一個(gè)能把靜態(tài)照片變成可玩游戲的 AI 系統(tǒng),同樣可以實(shí)現(xiàn)從靜態(tài)照片到可交互 3D 場(chǎng)景的轉(zhuǎn)換。
就在一個(gè)月前,著名游戲公司任天堂旗下寶可夢(mèng)公司也宣布過(guò)一項(xiàng)類似的技術(shù),用 " 大規(guī)模地理空間模型 ",讓用戶距離空間智能更近了一步。簡(jiǎn)單說(shuō),用戶可以自行上傳圖像,構(gòu)建 3D 地圖,能精確而真實(shí)地看到放置到物理環(huán)境中的數(shù)字內(nèi)容,而且這些內(nèi)容是持久的,還能與他人共享。
大洋的另一端,中國(guó) AI 技術(shù)同樣突飛猛進(jìn),在 Sora 跳檔的這 10 個(gè)月里加速趕超。
就在李飛飛官宣新技術(shù)的同一天,騰訊版 Sora 大模型面世,并免費(fèi)開(kāi)源!
12 月 3 日,騰訊混元大模型官宣了最新的文生視頻大模型 HunYuan-Video,用戶只需要輸入一段描述,即可生成視頻,該模型參數(shù)量達(dá) 130 億,是當(dāng)前最大的視頻開(kāi)源模型。從文本、到 AI 繪圖到 3D 生成再到視頻,騰訊混元大模型已經(jīng)全系開(kāi)源。
有參與測(cè)評(píng)的博主發(fā)布評(píng)論稱,其生成的視頻不僅語(yǔ)義理解精準(zhǔn),更是 " 最有電視劇質(zhì)感的 AI 大模型 ",甚至看不出一絲的 AI 味,對(duì)比以往文生視頻模式,即使面面占比很小的人臉都不會(huì)糊。
半個(gè)多月前,字節(jié)跳動(dòng)視頻生成模型 PixelDance 和 Seaweed 在即夢(mèng) AI 正式上線,并面向公眾免費(fèi)開(kāi)放使用,僅需 60 秒即能生成時(shí)長(zhǎng) 5 秒的高質(zhì)量 AI 視頻。
更早的半年之前,今年 6 月快手可靈文生視頻 APP 發(fā)布,至今已經(jīng)經(jīng)歷了十余次更新,包括發(fā)布圖生視頻功能以及 1.5 模型的上線等。
在文生圖領(lǐng)域,AI 技術(shù)也在快速迭代。例如,12 月 2 日,字節(jié)即夢(mèng) AI 上線了最新的圖片 2.1 模型,解決了 AI 圖像無(wú)法生成中文字體的問(wèn)題,讓海報(bào)設(shè)計(jì)的效率再次大幅提升。
某種意義上,ChatGPT 停止服務(wù)中國(guó)市場(chǎng)并不是壞事。
今年中國(guó)大模型廠家底層技術(shù)不斷降價(jià)并開(kāi)源,帶動(dòng)了更多中小創(chuàng)業(yè)者走上 AI 新牌桌。更重要的是,上述這些文生圖、文生視頻等以及文心一言、騰訊元寶、字節(jié)豆包、阿里千問(wèn)等 C 端 AI 應(yīng)用,在中國(guó)速度下都以免費(fèi)的形式飛入了尋常百姓家。
QuestMobile 數(shù)據(jù)顯示,2024 年 10 月,AI 原生應(yīng)用行業(yè)月活躍用戶規(guī)模達(dá)到 8976 萬(wàn),同比增長(zhǎng) 373.0%。
AI+SaaS:智能體將是通往未來(lái)的新船票
視覺(jué) AI 應(yīng)用火,更火的是 " 智能體 "。
在 AI 改變虛擬和真實(shí)世界視覺(jué)聯(lián)系的同時(shí),AI 正在各式各類的 SaaS 應(yīng)用中落地,各種形式的智能體已成為 AI 大模型落地的新載體,并且展現(xiàn)出強(qiáng)大的商業(yè)化前景。
所謂智能體,又叫 AI Agent,是以 AI 大模型作為基礎(chǔ),構(gòu)建的可以進(jìn)行交互、完成特定任務(wù)、或提供專業(yè)知識(shí)的智能系統(tǒng)或應(yīng)用程序。
通俗說(shuō),智能體可以體現(xiàn)為,裝在傳統(tǒng)軟件 App 里的 AI 插件,也可以是一個(gè)獨(dú)立的 AI APP。
相比較傳統(tǒng)的 SaaS 需要完全由人工來(lái)操作完成,智能體最大的特點(diǎn)是,接受互動(dòng)對(duì)話指令,并直接產(chǎn)出結(jié)果,包括生成視頻、圖片、文章或完成一件工作。簡(jiǎn)言之,所有的 AI 應(yīng)用都可以稱之為智能體。
OpenAI 首席執(zhí)行官 Sam Altman 曾提出,未來(lái)每個(gè)人都可以擁有一個(gè)智能體。
Salesforce 首席執(zhí)行官 Marc Benioff 更是直言,AI 的未來(lái)發(fā)展不在于大語(yǔ)言模型,而在于開(kāi)發(fā) AI 自主代理,即智能體。
產(chǎn)品智能化已經(jīng)是 SaaS 廠商在新時(shí)代下必須迎接的事實(shí),在一些 TO B 場(chǎng)景內(nèi),許多傳統(tǒng) SaaS 應(yīng)用在 AI 加持下獲得了新的發(fā)展。
比如,做電商服務(wù)的有贊最新推出了 " 加我智能 " 功能,其智能體功能包括商機(jī)指引、智能托管、營(yíng)銷專家、智能經(jīng)營(yíng)報(bào)告、智能穿搭、智能銷售等等。
正是有贊創(chuàng)始人白鴉預(yù)言,未來(lái)的生意,數(shù)字化是基礎(chǔ),客戶運(yùn)營(yíng)是抓手,所有這些都可以交給智能技術(shù)完成。" 我非常堅(jiān)信,最多 10 年,最快 5 年之內(nèi),中國(guó)人一周只需要工作 4 天。用工具解決問(wèn)題,數(shù)字化和智能化帶來(lái)效率提升是必然的趨勢(shì)。"
再比如,做教育的粉筆,最新升級(jí)了粉筆 AI 老師產(chǎn)品,這個(gè)智能體以對(duì)話形式存在,具備 AI 導(dǎo)練、學(xué)習(xí)規(guī)劃、考情咨詢、智能督學(xué)等在內(nèi)的多項(xiàng)功能,可以幫用戶規(guī)范的作答思路,形成標(biāo)準(zhǔn)化作答習(xí)慣,并詳細(xì)解答答案,優(yōu)化學(xué)習(xí)方向和可改進(jìn)細(xì)節(jié),主打一個(gè)專業(yè)、細(xì)心的教育陪伴。
互聯(lián)網(wǎng)大廠中,百度、阿里、騰訊、字節(jié)跳動(dòng)、華為等皆已布局智能體賽道,并推出一站式智能體開(kāi)發(fā)平臺(tái),為開(kāi)發(fā)者、創(chuàng)作者提供更為便捷的操作應(yīng)用路徑。
美國(guó)著名孵化器 YCombinator 最新一期圓桌討論中提出觀點(diǎn):垂直 AI 智能體的規(guī)??赡苁?SaaS 的十倍。
美國(guó)一線 AI 從業(yè)者提到,AI 大模型技術(shù)正在重塑軟件行業(yè)。如果說(shuō) 2004 年在瀏覽器中可以增加 XML HTTP 請(qǐng)求這個(gè)功能,開(kāi)啟了互聯(lián)網(wǎng)應(yīng)用程序的新時(shí)代,帶來(lái)了整個(gè) SaaS 軟件行業(yè)的 20 年繁榮;那么大型語(yǔ)言模型—— LLM 的出現(xiàn),則是開(kāi)啟了智能體時(shí)代的新篇章。
這一切正在發(fā)生。
QuestMobile 最新報(bào)告提到,當(dāng)下 LLM 的落地應(yīng)用在網(wǎng)頁(yè)端、移動(dòng)端都已比較成熟,正逐步拓展至智能硬件端,不斷深入用戶日常生活并提供更自然便捷的交互體驗(yàn)。
市場(chǎng)研究機(jī)構(gòu) Research and Market 在 11 月 11 日發(fā)布的報(bào)告中指出,未來(lái)五年 AI 智能體的市場(chǎng)規(guī)模將增加 420 億美元。
在騰訊研究院最新發(fā)布的《2025 數(shù)字科技前沿應(yīng)用趨勢(shì)》中指出,AaaS 催化 AI 原生應(yīng)用落地將是明年大趨勢(shì)之一。
AI 的新時(shí)代已經(jīng)勢(shì)不可擋。
來(lái)源:明晰野望