不知經(jīng)常往舊金山城里跑的小伙伴,有沒有在路邊見過這樣的廣告:
" 按周、天或小時(shí)租用 H100 芯片。
3.2TB/s InfiniBand 高速網(wǎng)絡(luò),k8s / Slurm 開源系統(tǒng),就是這種東西。"
下面還寫了一排官網(wǎng)地址給你 " 撕 "。
作為全世界生成式人工智能的火熱據(jù)點(diǎn),舊金山街道遍布的各類 AI 廣告早已成為它的 " 城市特色 "??杉幢闳绱耍?這個(gè) " 出租算力 " 的概念仍然很酷,而且是把高高在上的英偉達(dá) H100 變得如此接地氣,在 AI 圈內(nèi)引起了一陣小波瀾。
半年多過去,這家做算力生意的初創(chuàng)公司「San Francisco Compute」從名不見經(jīng)傳的 "Underdog" 來到臺(tái)前。上周,Sam Altman 親弟弟 Jack Altman 主理的 Alt Capital 領(lǐng)投其 1200 萬美元種子輪融資,讓它的估值來到約 5 億人民幣(7000 萬美元)。
AI 算力市場的 "Airbnb"
我們知道,能否及時(shí)獲取足量計(jì)算資源可能會(huì)決定一家 AI 初創(chuàng)公司的成敗。而通常只有規(guī)模最大、資金最充足、關(guān)系最廣的大公司才能確保獲得所需算力。高性能 AI 芯片不僅成本高昂,還需要簽訂長期合同,這對資金有限、業(yè)務(wù)需求多變的中小企業(yè)構(gòu)成了巨大障礙。
SF Compute 就是為了解決這個(gè)難題而生。它專注于為早期公司提供經(jīng)濟(jì)實(shí)惠、短期靈活的超級計(jì)算資源訪問權(quán)限,幫助它們更高效、更經(jīng)濟(jì)地開發(fā)和訓(xùn)練 AI 模型。有點(diǎn)類似 Airbnb 在住宿領(lǐng)域的做法:通過共享和按需租賃,讓用戶以較低成本獲取所需資源,短時(shí)間內(nèi)使用大量計(jì)算能力。
具體是通過以下兩種服務(wù)模式:
1. 短期計(jì)算資源租賃
與需要簽訂長期合同(通常為 1-3 年)的傳統(tǒng)提供商不同,SF Compute 提供按周、按天、甚至按小時(shí)計(jì)費(fèi)的短期算力租賃服務(wù)。同時(shí)具備可擴(kuò)展的集群,讓用戶根據(jù)實(shí)際需求來動(dòng)態(tài)調(diào)整其計(jì)算資源使用量,完全實(shí)現(xiàn) "GPU 定制自由 "。
你可以租 768 個(gè) H100 使用一周,也可以借 8 個(gè) H100 運(yùn)行 2 小時(shí)。SF Compute 還為 512 - 4096 個(gè) GPU 的大規(guī)模預(yù)訂提供有競爭力的定價(jià)。例如租賃 512 個(gè) H100 兩周只需 50 萬美元,遠(yuǎn)低于在其它提供商那里一年 1200 萬美元的花費(fèi)。
這種以實(shí)惠價(jià)格 " 爆發(fā)式 " 訪問巨大算力的靈活選項(xiàng),特別適合需要高性能計(jì)算但不想承擔(dān)長期財(cái)務(wù)負(fù)擔(dān)的用戶。包括資金有限、業(yè)務(wù)可能快速變化的 AI 初創(chuàng)公司,以及實(shí)驗(yàn)室或研究員需要強(qiáng)大算力支持的短期項(xiàng)目等。
根據(jù) SF Compute 官網(wǎng)信息(下圖):當(dāng)前 GPU 使用價(jià)格為 2.85 美元 / 小時(shí),下一個(gè)可用時(shí)間段是 8 月 4 日。從現(xiàn)在到明年 1 月 5 日的可用容量在逐步增加,到年底達(dá)到 912 個(gè) H100 GPU。
目前三個(gè)公共算力集群部署中:Angel Island 集群有 192 個(gè) H100 GPU,于去年 11 月上線。Bay Bridge 和 Coit Tower 分別有 512 和 1024 個(gè) H100 GPU,計(jì)劃明年春季上線。
2. 計(jì)算能力交易平臺(tái)
除租賃服務(wù)外,SF Compute 還在開發(fā)一個(gè)計(jì)算能力交易平臺(tái),以使用戶更便捷地按需買賣計(jì)算資源,進(jìn)一步降低算力獲取難度和成本。通過允許小型 AI 公司與大企業(yè)競爭來民主化高性能計(jì)算的訪問。
據(jù)悉,公司已經(jīng)獲得了相當(dāng)于 8000 個(gè) H100 的資源來支持這一計(jì)劃。剛籌集的 1200 萬元資金也會(huì)投入平臺(tái)建設(shè)。
坐標(biāo)舊金山腦谷,16 人團(tuán)隊(duì)里三分之二當(dāng)過創(chuàng)始人
SF Compute 總部位于硅谷舊金山,辦公室就設(shè)在 AI 公司扎堆密集、被稱為 " 腦谷 " 的 Hayes Valley。2023 年由Alex Gajewski(右)和Evan Conrad(左)共同創(chuàng)立。
Alex Gajewski任公司 CEO,畢業(yè)于哥倫比亞大學(xué)數(shù)學(xué)系。在開始舊金山計(jì)算公司之前,Alex 曾創(chuàng)立 Metaphor,主導(dǎo)訓(xùn)練了一個(gè)覆蓋十億頁面的大型對比模型和一個(gè)神經(jīng)搜索引擎。他還在公司加速器 AI Grant 第一批項(xiàng)目中發(fā)揮了重要作用。職業(yè)生涯致力于減少創(chuàng)建最先進(jìn) AI 模型的障礙和促進(jìn)多樣化的公司生態(tài)系統(tǒng)。
Evan Conrad在科技行業(yè)擁有豐富的職業(yè)生涯。曾在 OpenAI 的 ChatGPT Enterprise 部門短暫工作過,擔(dān)任過八個(gè)月的 AI Grant 董事。之前聯(lián)合創(chuàng)立了 Quirk 和 Moder LLC 并分別工作近四年。他還擔(dān)任過 Segment 軟件工程師,有 Amazon 和 AppDetex 的實(shí)習(xí)經(jīng)歷。
兩人創(chuàng)立 SF Compute 的淵源也很有意思。
因成為合租室友而相識(shí)后,Alex 和 Evan 本來是打算成立一家 AI 音樂初創(chuàng)公司。為了擴(kuò)展音樂生成模型并向潛在投資者展示成果,他們聯(lián)系了當(dāng)時(shí)的每一家 GPU 提供商,以尋求 1 個(gè)月的算力訪問權(quán)限。結(jié)果被所有人告知最少購買期限是一年,費(fèi)用 100 萬美元起步,而他們根本就拿不出 100 萬。
" 沒人愿意只賣一個(gè)月的使用權(quán)。這很好理解:如果你運(yùn)營一個(gè)大型集群,最好是以 1 到 3 年的合同出售并預(yù)先支付所有費(fèi)用。這樣風(fēng)險(xiǎn)更小,利潤更高。為什么要把集群賣給 Junelark 這種幾乎沒有資金的兩人音樂初創(chuàng)公司,況且他們可能在合同結(jié)束前就倒閉了?" Evan 說," 不幸的是,我們就是 Junelark。我們的朋友也大多數(shù)是這種情況。"
" 如果你不是那些‘神圣的少數(shù)’之一,實(shí)際上就被市場定價(jià)排除在外。 沒有重大資金支持,你根本沒得選擇。"
尋求 GPU 受挫的兩人于是嘗試聯(lián)系其他同樣需要計(jì)算能力的創(chuàng)始人,認(rèn)為如果有十幾家初創(chuàng)公司一起加入,他們就能共同負(fù)擔(dān)得起一份年度合同。
沒想到短短幾周內(nèi),就吸引來 170 家 AI 公司簽約??吹竭@個(gè)龐大的市場需求后,兩人果斷放棄了 AI 音樂夢想,決定成為一個(gè)專門為大規(guī)模訓(xùn)練任務(wù)提供超級計(jì)算資源靈活訪問的 GPU 云供應(yīng)商。
不僅是 " 淋過雨后方知給他人撐傘 ",在算力民主化、資源共享、扶持小型實(shí)體與大企業(yè)競爭這些備受硅谷科技社區(qū)推崇的理念背后,SF Compute 也正中大量 AI 公司創(chuàng)始人苦于拿不到算力推進(jìn)項(xiàng)目的痛點(diǎn)。
五個(gè)月前 Evan Conrad 在一次演講中表示,SF Compute 每個(gè)月都在把算力賣給學(xué)術(shù)實(shí)驗(yàn)室、研究人員、初創(chuàng)公司,這是其他人永遠(yuǎn)不會(huì)重視的客戶。
當(dāng)時(shí)他們的運(yùn)營利潤約為 100 萬美元,預(yù)計(jì)在兩個(gè)新集群上線后將增加 10 倍,達(dá)到每年 1000 萬美元。公司的早期客戶中還包括哈佛大學(xué)和普林斯頓大學(xué)的研究實(shí)驗(yàn)室,以及 PlayHT Inc.、Phind 和 Liquid AI Inc. 等初創(chuàng)公司。
目前 SF Compute 在 LinkedIn 的關(guān)聯(lián)員工為 16 個(gè)人。Evan 在 X 發(fā)文透露,其中有 10 名員工都是前創(chuàng)始人。他們也正在招聘核心基礎(chǔ)設(shè)施工程師、機(jī)器學(xué)習(xí)系統(tǒng)工程師和產(chǎn)品工程師職位(有興趣的可以關(guān)注一下)。
公司風(fēng)格頗有《硅谷》電視劇里的感覺。員工們編程累了,就會(huì)解物理題目來 " 放松 "。
也用文章開頭那種樸實(shí)無華的方式打了許多本地硬廣。
再看幾個(gè),比如路邊公告牌:
候車大廳:
以及下面這條," 為你的下一個(gè) H100 賬單立省 2000 萬美元。"
用戶 Micheal Black 說," 唯在舊金山有這樣的 sense。做廣告的關(guān)鍵是了解你的客戶。我在想,是的,我確實(shí)想在 H100 上省 2000 萬!"
硅谷這片科技熱土,歷來盛產(chǎn)充滿冒險(xiǎn)精神的創(chuàng)業(yè)者和想創(chuàng)業(yè)的人們。通常現(xiàn)在一場前沿 AI 活動(dòng)的觀眾里,一半以上都是人工智能相關(guān)公司創(chuàng)始人。
這些人對訪問大量高性能 AI 計(jì)算資源有著迫切的渴求,卻總被財(cái)大氣粗的成熟企業(yè)擠到一邊,可能手握出色的想法、技術(shù)卻無法到現(xiàn)實(shí)世界驗(yàn)證和呈現(xiàn)。而今 San Francisco Compute 的出現(xiàn),讓雙方得以互相成就。
市場競爭與未來發(fā)展
當(dāng)然,SF Compute 并不是唯一一家提供部分計(jì)算能力訪問的公司,在市場中也面對幾家頗為強(qiáng)大的同行對手。
例如 Lambda Inc,最初是一家面部識(shí)別公司,后來轉(zhuǎn)向?yàn)榘ㄓ⑻貭柟竞蛧啦吭趦?nèi)的頂尖機(jī)構(gòu)提供按需的 GPU 工作站、服務(wù)器和云計(jì)算資源。更知名些的有 " 英偉達(dá)小弟 "CoreWeave,起初是一家加密貨幣挖礦公司,也轉(zhuǎn)型成 GPU 加速云計(jì)算服務(wù)供應(yīng)商,專注于支持生成式 AI 和其他需要高性能計(jì)算的任務(wù)。最近它完成了 11 億美元融資,估值已達(dá) 190 億美元。另外還有提供低成本算力租賃服務(wù)的 Vast.ai 公司,和擁有全球分布 GPU 云及無服務(wù)器端點(diǎn)的 RunPod 公司等。
雖然競爭激烈,但 SF Compute 在短至小時(shí)的租賃時(shí)間和集群使用量上的靈活度、更具競爭力的價(jià)格和專注中小企業(yè)甚至個(gè)人等方面,還是拉攏了屬于自己的特定客戶群體。而未來即將推出的計(jì)算資源交易平臺(tái),也將成為它下一大制勝優(yōu)勢。
SF Compute 稱,接下來會(huì)把團(tuán)隊(duì)主要工程人員翻倍至 30 人,進(jìn)一步增強(qiáng)服務(wù)能力,提高市場地位。
作為投資人,Jack Altman 預(yù)計(jì)會(huì)有越來越多的用例出現(xiàn):" 風(fēng)險(xiǎn)投資公司和其他鎖定長期 GPU 交易的公司都可以利用這個(gè)平臺(tái)來買賣訪問權(quán)。許多群體可能成為客戶。"Jack Altman 說,"San Francisco Compute 已經(jīng)展開了許多合作洽談,我認(rèn)為這是一個(gè)非常值得看好的方向。"
來源:硅星人