關(guān)于抖音曇花一現(xiàn)的預(yù)言似乎都落空了,AI崛起的勢(shì)頭真的擋不住了?創(chuàng)投圈
抖音尬舞機(jī)誕生記
在剛剛過去的 2017 年里,如果要盤點(diǎn)整個(gè)互聯(lián)網(wǎng)行業(yè)最引人矚目的產(chǎn)品,抖音無(wú)論如何都會(huì)榜上有名。
從 3 月爆發(fā)起,抖音全年保持了令人震驚的增長(zhǎng)態(tài)勢(shì),以至于此前所有關(guān)于他將會(huì)曇花一現(xiàn)的預(yù)言統(tǒng)統(tǒng)落空。就在 12 月的月末,抖音更是實(shí)現(xiàn)了一波強(qiáng)勁地增長(zhǎng),順利登頂中國(guó) App store 的免費(fèi)榜。
事實(shí)上,早在 9 月,抖音就已經(jīng)進(jìn)入了位居 App Store 攝影與錄像分榜第一,并進(jìn)入總榜前十。而登頂之后,也并未迅速跌落,即使到了今天,抖音在 App Store 上仍僅次于支付寶和微信,位列第三。
(抖音 3 月以來(lái)的百度指數(shù))
那么,抖音是如何能在 2017 年一路勢(shì)如破竹,甚至在年末戰(zhàn)勝微信、支付寶這樣巨頭登頂 App Store 的呢?
和外界大多數(shù)所分析推演的不同,來(lái)自抖音內(nèi)部的結(jié)論是,新技術(shù)新功能的不斷開發(fā)迭代是產(chǎn)品能夠持續(xù)走高的重中之重。
以歲末的這次登頂為例,抖音內(nèi)部歸功于產(chǎn)品新推出的功能玩法。12 月 21 日,抖音的新版本上線了名為「尬舞機(jī)」的功能,上線的第二天,抖音就成功登頂。
是什么讓抖音在 2017 年實(shí)現(xiàn)了現(xiàn)象級(jí)的表現(xiàn)?如同尬舞機(jī)這樣為抖音帶來(lái)質(zhì)的變化的功能又有哪些?其中如尬舞機(jī)這樣的技術(shù)功能又貢獻(xiàn)幾何?這些功能又有什么特殊之處?
帶著這些問題,我們采訪了抖音產(chǎn)品負(fù)責(zé)人王曉蔚,以下是采訪內(nèi)容實(shí)錄:
Q:抖音年末的這波爆發(fā)真的是因?yàn)樾鹿δ堋皋挝铏C(jī)」嗎?它是如何做到的,從產(chǎn)品表現(xiàn)來(lái)看怎么樣?能詳細(xì)介紹一下這個(gè)功能嗎?
抖音:其實(shí)在封閉開發(fā)的時(shí)候我們就有這樣的期待(登頂),畢竟從 9 月開始抖音就穩(wěn)定在 App Store 前十。所以開發(fā)的時(shí)候項(xiàng)目組的同學(xué)都憋著一口氣,想要把這個(gè)功能做爆炸,最后也確實(shí)實(shí)現(xiàn)了。
尬舞機(jī)研發(fā)上的技術(shù)支持來(lái)自今日頭條人工智能實(shí)驗(yàn)室(簡(jiǎn)稱 AI lab)。它其實(shí)是人體關(guān)鍵點(diǎn)檢測(cè)技術(shù)的應(yīng)用。依靠這項(xiàng)技術(shù),我們能夠檢測(cè)到圖像中所包含人體的各個(gè)關(guān)鍵點(diǎn)的位置,從而實(shí)現(xiàn)從用戶姿態(tài)到目標(biāo)姿態(tài)的準(zhǔn)確匹配。簡(jiǎn)單來(lái)說是把就把跳舞機(jī)、kinect 這樣的體感游戲搬到了手機(jī)上。體感類游戲之前受技術(shù)條件的限制,大家只能借助特定硬件設(shè)備才能玩。尬舞機(jī)的出現(xiàn)標(biāo)志著,憑借先進(jìn)的深度學(xué)習(xí)技術(shù)的支持,我們已經(jīng)能夠讓我們的手機(jī)實(shí)時(shí),精準(zhǔn)地「讀懂」人體的姿態(tài)和動(dòng)作,讓普通用戶隨時(shí)隨地能夠體驗(yàn)這種游戲形式。
上午新版本放出以后,就有很多用戶參與進(jìn)來(lái)了。因?yàn)檗挝铏C(jī)玩起來(lái)沒什么門檻,效果又很「尬」,玩的好的會(huì)很酷,玩的不好也會(huì)顯得蠢萌蠢萌的,用戶把視頻分享到 social 渠道不會(huì)有什么負(fù)擔(dān)。事后來(lái)看尬舞機(jī)視頻的站外分享量都非常高。其實(shí)到了當(dāng)天半夜,我們就已經(jīng) App Store 登頂了,也就不到 20 個(gè)小時(shí)吧,那個(gè)時(shí)候我們?cè)ǖ耐茝V活動(dòng)都還沒開始。
Q:我們看到近期一些其他產(chǎn)品也推出了類似的功能,從結(jié)果上來(lái)看,都沒有尬舞機(jī)對(duì)抖音的貢獻(xiàn)那么直接明顯,這是否說明產(chǎn)品的增長(zhǎng)其實(shí)不完全是新功能的作用?
抖音:很多看上去相似的功能,因?yàn)楣こ棠芰Φ牟煌?,在?shí)現(xiàn)效果上會(huì)有很大差異。以尬舞機(jī)為例,動(dòng)作識(shí)別準(zhǔn)確率高,用戶才能玩起來(lái),否則只會(huì)讓人反感。
而要想做好這個(gè)功能,需要解決兩個(gè)難題。第一,人體的形變范圍比較大,受衣服變化、物體遮擋等影響嚴(yán)重,在日常場(chǎng)景下準(zhǔn)確地檢測(cè)人體關(guān)鍵點(diǎn)一直是計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)熱點(diǎn)問題。第二個(gè)難點(diǎn)是,要實(shí)現(xiàn)精準(zhǔn)檢測(cè),需要耗費(fèi)高昂的計(jì)算資源,無(wú)法在手機(jī)端實(shí)現(xiàn)日常場(chǎng)景應(yīng)用。
由于這兩個(gè)難點(diǎn)的存在,市面上很多產(chǎn)品的類似功能只能實(shí)現(xiàn)半身檢測(cè),甚至人臉檢測(cè)。這樣功能的實(shí)現(xiàn)效果上會(huì)大打折扣,玩法上也會(huì)有很多限制。
對(duì)此,頭條 AI lab 的同事創(chuàng)新了技術(shù)方案。相比于業(yè)界流行的自頂向下(Top-Down)的方案,我們采用的是自底向上(Bottom-Up)的方案。核心是我們針對(duì)移動(dòng)端設(shè)備自研的網(wǎng)絡(luò)結(jié)構(gòu),極大地減少計(jì)算量,同時(shí)讓準(zhǔn)確率大幅提升,實(shí)現(xiàn)了在移動(dòng)端的實(shí)時(shí)無(wú)損運(yùn)行。
我們的人體關(guān)鍵點(diǎn)模型是業(yè)界領(lǐng)先的水平。從實(shí)現(xiàn)效果來(lái)看,我們?cè)趪?guó)內(nèi)首次把檢測(cè)范圍擴(kuò)大到了全身。而對(duì)于更簡(jiǎn)單,也更廣泛實(shí)用化的人臉關(guān)鍵點(diǎn)檢測(cè)技術(shù),可以對(duì)視頻進(jìn)行實(shí)時(shí)檢測(cè)。也積累了很大的人臉庫(kù),可以很準(zhǔn)確的識(shí)別人臉。
Q:所以尬舞機(jī)是抖音的「大招」嗎?最開始立項(xiàng)要做的原因是什么?
抖音:整個(gè)功能前后封閉開發(fā)了一個(gè)多月,內(nèi)部確實(shí)對(duì)尬舞機(jī)的效果是有期待的。但不是以憋大招的心態(tài)去做的,像尬舞機(jī)這樣玩起來(lái)更簡(jiǎn)單,效果更酷炫的功能這一年來(lái)抖音一直在做。包括背景分割、音樂濾鏡、AR 貼紙等等,都是基于我們的 AI 技術(shù)開發(fā)的特效功能。只不過這次登頂了所以大家都關(guān)注到了。
之所以做這些還是跟我們的初心有關(guān),當(dāng)初我們做抖音的時(shí)候就覺得應(yīng)該有一個(gè)適合中國(guó)年輕人的音樂短視頻社區(qū)產(chǎn)品。這個(gè)產(chǎn)品要年輕人喜歡玩,能輕松自在表達(dá)自己,展現(xiàn)自我,要有意思。所有的功能設(shè)置都是圍繞這個(gè)目標(biāo)展開的,中國(guó)年輕人的歌舞基礎(chǔ)很弱,想要更多的人能夠參與表達(dá),就要在產(chǎn)品層面做更好的引導(dǎo),降低他們表達(dá)的門檻,讓他們更容易變酷。
這也是為什么抖音的濾鏡和特效會(huì)受到追捧,因?yàn)槲覀兇_實(shí)在這方面投入了很多心血去做好它。說一個(gè)挺有意思的事,最近「國(guó)民閨女」關(guān)曉彤也開始玩抖音了??瓷先ニ娴倪€是挺開心的,最近我們發(fā)現(xiàn)她把個(gè)性簽名改成了「這里的濾鏡和美顏?zhàn)屛覠o(wú)法自拔」,這也算是對(duì)我們的特效功能的一種認(rèn)可吧。
Q:所以抖音的濾鏡和特效的不同之處是什么呢?
抖音:還是我們的技術(shù)。背后的很多「黑科技」讓我們的特效不僅僅停留于其他平臺(tái)的賣萌貼紙。
舉個(gè)例子,抖音有一個(gè)「實(shí)時(shí)染發(fā)」的特效,即能在手機(jī)上實(shí)時(shí)改變頭發(fā)顏色,模擬現(xiàn)實(shí)生活中的染發(fā)效果。這個(gè)功能是站內(nèi)最受歡迎的特效之一,別的平臺(tái)還沒有辦法實(shí)現(xiàn)。
(實(shí)時(shí)染發(fā)特效)
其中的難點(diǎn)是頭發(fā)的分割。因?yàn)轭^發(fā)非常細(xì),邊緣部分的識(shí)別和分割非常難。我們專門針對(duì)頭發(fā)做了識(shí)別優(yōu)化?;谧匝械木W(wǎng)絡(luò),我們的頭發(fā)分割能達(dá)到發(fā)絲級(jí)的精度。我們通過頭發(fā)追蹤技術(shù)和自研著色技術(shù),估計(jì)頭發(fā)的反射率,能夠在不同的原始發(fā)色和光照條件下渲染大多數(shù)顏色。
Q:這些「黑科技」對(duì)于抖音這一年的增長(zhǎng)到底起了哪些作用?
抖音:這么講吧,基本上每次有新玩法新功能出現(xiàn),都能在數(shù)據(jù)上獲得直觀的體現(xiàn)。不僅是尬舞機(jī),「單身狗」、「大臉怪」、「憨厚」等,我們這些在社交網(wǎng)絡(luò)受到廣泛喜愛的特效,都為我們吸引來(lái)了很多新用戶,并形成了很好的品牌效應(yīng)。
Q:對(duì)于這些新功能新玩法,抖音內(nèi)部有一套運(yùn)作機(jī)制來(lái)持續(xù)地開發(fā)嗎?
抖音:談不上什么固定的機(jī)制,其實(shí)冒出來(lái)的想法遠(yuǎn)多于最終能夠落地實(shí)現(xiàn)的。這些想法一方面來(lái)自我們自己產(chǎn)品運(yùn)營(yíng)同學(xué)的腦洞,另一方面,我們也會(huì)從用戶那里汲取靈感,有些想法是用戶直接反饋給我們,有些則是我們從用戶的視頻里發(fā)現(xiàn),通過技術(shù)手段來(lái)實(shí)現(xiàn)。
前不久,今日頭條與北京大學(xué)共同完成的「互聯(lián)網(wǎng)信息摘要與機(jī)器寫稿關(guān)鍵技術(shù)及應(yīng)用」項(xiàng)目獲得了吳文俊人工智能技術(shù)發(fā)明獎(jiǎng)。吳文俊獎(jiǎng)被外界譽(yù)為「中國(guó)智能科學(xué)科技最高獎(jiǎng)」。
背后有頭條 AI lab 的支持,也是抖音比較幸運(yùn)的地方,這讓我們的很多想法有機(jī)會(huì)落地。這可能也是我們相對(duì)于其他同類產(chǎn)品的優(yōu)勢(shì)。反過來(lái)包括抖音在內(nèi)頭條的眾多產(chǎn)品業(yè)務(wù)線,為 lab 前沿的 AI 技術(shù)研究提供了應(yīng)用的場(chǎng)景。
來(lái)源|懂懂筆記
1.砍柴網(wǎng)遵循行業(yè)規(guī)范,任何轉(zhuǎn)載的稿件都會(huì)明確標(biāo)注作者和來(lái)源;2.砍柴網(wǎng)的原創(chuàng)文章,請(qǐng)轉(zhuǎn)載時(shí)務(wù)必注明文章作者和"來(lái)源:砍柴網(wǎng)",不尊重原創(chuàng)的行為砍柴網(wǎng)或?qū)⒆肪控?zé)任;3.作者投稿可能會(huì)經(jīng)砍柴網(wǎng)編輯修改或補(bǔ)充。

- 小滿科技完成6500萬(wàn)元人民幣C輪融資,華創(chuàng)資本領(lǐng)投
- 暢溪完成A輪5500萬(wàn)元融資,國(guó)中創(chuàng)投領(lǐng)投
- TOGO途歌完成2600萬(wàn)美元B+輪融資,海益得凱欣基金領(lǐng)投
- 2017電商死亡名單
- 社區(qū)新零售,還有哪些淘金機(jī)會(huì)?
- 今日頭條整改:機(jī)器并非想象中聰明無(wú)比
- 38歲前慘到?jīng)]鞋穿,如今他卻以5500億傲視群雄!
- 30天內(nèi)融資5.2億美元!金山云完成D輪融資,投后估值達(dá)21.2億美元
- 2018年新三板的五大現(xiàn)實(shí)問題
- 阿里加持哈羅單車,主導(dǎo)ofo10億美元融資,為什么?