北京海淀跑出一個未來獨角獸:Sand AI(三呆科技),今日獲得數(shù)千萬美元融資,由經(jīng)緯領(lǐng)投,跟投方包含華業(yè)天成、創(chuàng)新工場、IDG、襄禾、商湯國香。
值得注意的是,該公司的創(chuàng)始人來自美團前高管王慧文創(chuàng)立的光年之外(2023 年),但隨著光年之外的閃崩,他創(chuàng)立了 Sand AI。
那么,在巨頭圍剿、玩家眾多的視頻 AI 生成賽道,這家成立僅 1 年半的初創(chuàng)公司為何還能獲得資本青睞?
01
Sand AI 的崛起與資本市場的熱捧密不可分。2024 年 5 月,今日資本領(lǐng)投其早期融資輪,這一動作被創(chuàng)始人徐新視為 " 對一級市場堅守的宣言 "。
資本押注的背后,是 Sand AI 選擇的差異化路徑:在 OpenAI 的 Sora 引爆 " 擴散模型(Diffusion)" 主流路線時,該公司卻押注 " 自回歸模型(Auto Regressive)",試圖通過時序因果邏輯解決視頻生成中的物理規(guī)律模擬難題。
其核心產(chǎn)品 Magi-1 定位為 " 開源可測的研究與工業(yè)級工具 ",用戶可通過官網(wǎng)生成 1-10 秒視頻,或下載模型權(quán)重自行訓(xùn)練。與 Sora 的封閉生態(tài)不同,Sand AI 將代碼、技術(shù)報告全數(shù)公開,吸引全球開發(fā)者共同優(yōu)化模型。
創(chuàng)始人曹越的履歷,為 Sand AI 注入技術(shù)的理想主義色彩。他是清華特獎與馬爾獎雙料得主,曾在微軟亞研院主導(dǎo)多項基礎(chǔ)模型研究。2023 年,他離開王慧文創(chuàng)立的光年之外,決意探索 " 更接近 AGI 本質(zhì)的視頻生成范式 "。
曹越認為,傳統(tǒng)視頻生成技術(shù)存在兩大桎梏:一是擴散模型依賴概率采樣,難以保證時間軸上的因果連貫性;二是行業(yè)過度追求畫面精美度,忽視底層物理規(guī)律建模。他曾以 " 人物行走時左右腿交替 " 為例,指出多數(shù)模型只能學(xué)到動作相關(guān)性,卻無法理解 " 重力與肌肉協(xié)作 " 的因果鏈條。
Sand AI 的關(guān)鍵發(fā)展節(jié)點如下:
2023 年 10 月:公司成立,曹越組建首批團隊,成員多來自微軟亞研院、智源研究院,聚焦自回歸模型預(yù)研。
2024 年 7 月:今日資本領(lǐng)投 A 輪,隨著徐新的言論引發(fā)行業(yè)關(guān)注,Sand AI 從隱身模式走向臺前。
2025 年 4 月:發(fā)布 Magi-1,支持跨場景物理一致性、秒級時間軸控制等特性,單段視頻生成成本降至 0.1 美元,較行業(yè)平均水平降低 70%。
02
值得關(guān)注的是,Magi-1 并非單純的技術(shù) demo。其商用版本已接入多家短視頻平臺的創(chuàng)作者工具鏈,支持廣告、影視預(yù)告片等場景的快速出片。
Sand AI 所處的 AI 視頻生成行業(yè)(二級分類:多模態(tài)生成軟件),正經(jīng)歷從技術(shù)探索到商業(yè)落地的關(guān)鍵躍遷。據(jù) Fortune Business Insights 數(shù)據(jù),2024 年全球市場規(guī)模達 6.1 億美元,預(yù)計 2032 年將突破 25 億美元,年復(fù)合增長率 19.5%。
然而,繁榮背后卻暗藏多元競爭。
- 技術(shù)路線之爭:OpenAI 的 Sora、快手的可靈、字節(jié)的即夢等頭部玩家選擇擴散模型路線,追求畫面質(zhì)量與藝術(shù)表現(xiàn)力;而 Sand AI、谷歌 VideoPoet 則押注自回歸模型,強調(diào)物理規(guī)律與長視頻邏輯。
- 生態(tài)策略差異:大廠依托流量優(yōu)勢構(gòu)建封閉生態(tài)(如快手可靈嵌入短視頻創(chuàng)作工具),而 Sand AI 通過開源吸引開發(fā)者,試圖建立底層技術(shù)標準。
當前市場仍屬藍海,但分化跡象已現(xiàn):海外 Runway、Pika 占據(jù)創(chuàng)意設(shè)計細分市場,國內(nèi)快手可靈憑借 6.5 億月活用戶占據(jù)應(yīng)用層高地,而 Sand AI 則與智譜清影、生數(shù)科技 Vidu 等爭奪開發(fā)者生態(tài)話語權(quán)。
曹越在近期訪談中坦言:" 未來 3 年,視頻生成將進入‘因果推理’時代,誰能教會 AI 理解重力、流體、碰撞,誰就能打開 AGI 的大門。"
目前,Sand AI 推出訂閱制與積分制兩種付費模型:訂閱制:提供 9.9 美元 / 月的基礎(chǔ)套餐,支持每秒 10 積分的視頻生成(初始注冊用戶獲贈 500 積分);企業(yè)定制:針對影視級長視頻需求,提供按需計費的高階服務(wù),支持秒級時間軸控制與跨場景物理一致性優(yōu)化。
總體而言,作為視頻生成領(lǐng)域的新銳企業(yè),其商業(yè)化進程雖處于早期階段。
來源:鉛筆道