谷歌 DeepMind 新研究：利用 AI 模型為無(wú)聲視頻配音

每日快訊

2024

06/19

22:02

IT之家

評(píng)論

來(lái)源：IT之家

據(jù)谷歌 DeepMind 新聞稿，DeepMind 近日公布了一項(xiàng)利用 AI 為無(wú)聲視頻生成背景音樂(lè)的 "video-to-audio" 技術(shù)。

IT 之家獲悉，當(dāng)前 DeepMind 這款 AI 模型依然存在局限性，需要開(kāi)發(fā)者使用提示詞為模型預(yù)先 " 介紹 " 視頻可能的聲音，暫時(shí)不能直接根據(jù)視頻畫(huà)面添加具體音效。

據(jù)悉，該模型首先會(huì)將用戶(hù)輸入的視頻進(jìn)行拆解，此后結(jié)合用戶(hù)的用戶(hù)文字提示，利用擴(kuò)散模型反復(fù)運(yùn)算，最終以生成與視頻畫(huà)面協(xié)調(diào)的背景聲音，例如輸入一條 " 在黑暗中行走 " 的無(wú)聲視頻，再添加 " 電影、恐怖片、音樂(lè)、緊張、混凝土上的腳步聲 " 等文字提示，相關(guān)模型就能生成恐怖風(fēng)格的背景音效。

DeepMind 同時(shí)表示，該 "video-to-audio" 模型可以為任何視頻生成無(wú)限數(shù)量的音軌，還能夠通過(guò)提示詞內(nèi)容判斷生成的音頻 " 正向性 " 或 " 反向性 "，從而令生成的聲音更貼近某些特定場(chǎng)景。

展望未來(lái)，DeepMind 表示研究人員正進(jìn)一步優(yōu)化這款 "video-to-audio" 模型，計(jì)劃未來(lái)能夠讓模型直接根據(jù)視頻內(nèi)容，無(wú)須通過(guò)提示詞即可生成視頻背景音，同時(shí)還將改善視頻中人物對(duì)白的口型同步能力。

THE END

廣告、內(nèi)容合作請(qǐng)點(diǎn)擊這里尋求合作

數(shù)碼

免責(zé)聲明：本文系轉(zhuǎn)載，版權(quán)歸原作者所有；旨在傳遞信息，不代表砍柴網(wǎng)的觀點(diǎn)和立場(chǎng)。

相關(guān)熱點(diǎn)

采用 M2 Ultra/M4 芯片，消息稱(chēng)蘋(píng)果委托富士康組裝

海通證券分析師杰夫普（Jeff Pu）近日發(fā)布投資簡(jiǎn)報(bào)，認(rèn)為蘋(píng)果公司已經(jīng)開(kāi)始構(gòu)建基于 M2 Ultra 芯片的 AI 服務(wù)器。

每日快訊

AI 作曲編曲工具 Suno V3 亮相：可創(chuàng)作多種風(fēng)格流派

一家 AI 初創(chuàng)公司 Suno 近日發(fā)布了首款能夠生成 " 廣播級(jí) " 歌曲的工具，能夠在數(shù)秒之內(nèi)創(chuàng)作出兩分鐘的完整歌曲，所有用戶(hù)均可免費(fèi)訪問(wèn)。

評(píng)測(cè)

小米 Redmi Book Pro 14/16 2024 筆記本官宣，全面

小米官宣將于 2 月 22 日晚發(fā)布 Redmi Book Pro 2024 筆記本，號(hào)稱(chēng)是 " 小米筆記本業(yè)務(wù)的全新篇章 "，用手機(jī)的產(chǎn)業(yè)能力深度賦能筆記本業(yè)務(wù)，并且全面接入小米澎湃 OS。

每日快訊

怎么跟華為對(duì)打！博主曝光 iPhone 16 設(shè)計(jì)圖：回歸

據(jù)國(guó)外媒體報(bào)道稱(chēng)，iPhone 16 的所謂設(shè)計(jì)圖流出，而據(jù)此渲染出的效果是，回歸豎排雙攝。

評(píng)測(cè)

需 iPhone 借助，蘋(píng)果 Vision Pro 頭顯系統(tǒng)恢復(fù)細(xì)節(jié)

如果 Vision Pro 頭顯出現(xiàn)系統(tǒng)故障，用戶(hù)應(yīng)該如何恢復(fù)呢？根據(jù)蘋(píng)果解鎖的最新細(xì)節(jié)，整個(gè)恢復(fù)過(guò)程類(lèi)似于 Apple Watch 和 Apple TV，需要 iPhone 借助完成。

每日快訊

男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

谷歌 DeepMind 新研究：利用 AI 模型為無(wú)聲視頻配音

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬(wàn)塊”

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒(méi)跑了！

iPhone 13機(jī)模曝光：值得等！

蘋(píng)果計(jì)劃在美國(guó)生產(chǎn) Apple Car 汽車(chē)電池

關(guān)注我們

男人网站,国产精品对白刺激久久久,性XXXX欧美老妇506070,哦┅┅快┅┅用力啊┅┅在线观看

谷歌 DeepMind 新研究：利用 AI 模型為無(wú)聲視頻配音

相關(guān)熱點(diǎn)

最新文章

相關(guān)推薦

“特斯拉又割了我 7 萬(wàn)塊”

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒(méi)跑了！

iPhone 13機(jī)模曝光：值得等！

蘋(píng)果計(jì)劃在美國(guó)生產(chǎn) Apple Car 汽車(chē)電池

關(guān)注我們

用 eSIM 取代手機(jī)卡，究竟難在哪里？

這就是 iPhone 13 的“殺手級(jí)新功能”？網(wǎng)友：炒華為冷飯！

谷歌Pixel 6真機(jī)曝光：最美安卓屏幕沒(méi)跑了！

iPhone 13機(jī)模曝光：值得等！