Aug X推出了Augie 利用AI克隆聲音
微新創(chuàng)想(idea2003.com) 8月11日 消息:Aug X推出了Augie,一個(gè)由人工智能驅(qū)動(dòng)的視頻創(chuàng)作平臺(tái),集成了語(yǔ)音克隆功能,可以在不預(yù)定錄音室的情況下閱讀廣告文案。
Aug X與ElevenLabs合作,讓用戶可以錄制自己或別人的聲音,并克隆它用于其他短視頻。Augie平臺(tái)主要針對(duì)營(yíng)銷人員和社交媒體團(tuán)隊(duì),讓人們可以快速地為視頻添加旁白、照片、文字和音樂,而無需學(xué)習(xí)音頻和視頻編輯。
Aug X的創(chuàng)始人Jeremy Toeman說,公司想要增加語(yǔ)音克隆功能是因?yàn)橐庾R(shí)到有些人不喜歡對(duì)著麥克風(fēng)說話或錄制旁白。
他說:“你會(huì)驚訝地發(fā)現(xiàn),有多少人使用了我們的語(yǔ)音克隆功能后向我們表示感謝,因?yàn)樗麄儾幌矚g錄制旁白。”
在向The Verge的演示中,Toeman說用戶可以將腳本寫入或上傳到Augie,然后使用預(yù)先錄制的聲音(人們需要錄制一段自己說任何話的聲音片段)或從其庫(kù)中選擇一個(gè)。然后,這個(gè)聲音就會(huì)以適合視頻氛圍的語(yǔ)氣(嚴(yán)肅、熱情、恐怖等)來閱讀腳本。
用戶還可以從一個(gè)照片庫(kù)中選擇——Aug X從Getty獲得了照片的授權(quán)——或使用人工智能生成的圖像來添加到視頻中。
Toeman設(shè)想營(yíng)銷團(tuán)隊(duì)可以在不需要預(yù)定公司發(fā)言人在錄音室的時(shí)間的情況下快速制作短視頻。
Augie于 5 月份公開測(cè)試。目前,使用Augie的每個(gè)人都可以使用語(yǔ)音克隆功能。Toeman說,最終,它可能會(huì)限制非付費(fèi)訂閱者的視頻長(zhǎng)度和質(zhì)量以及克隆聲音的數(shù)量,因?yàn)榕c合作伙伴運(yùn)行語(yǔ)音克隆服務(wù)器的費(fèi)用很高。
語(yǔ)音克隆并不是新鮮事;三星甚至讓人們使用人工智能聲音來回應(yīng)電話,現(xiàn)在像Aug X這樣的公司將這項(xiàng)技術(shù)整合到更全面的服務(wù)中。在一首深度偽造的德雷克歌曲中,使用了一個(gè)由人工智能生成的說唱歌手聲音后,它幫助重新點(diǎn)燃了對(duì)版權(quán)和非法使用別人形象的擔(dān)憂。
Toeman說:“我們已經(jīng)預(yù)先考慮了可能出錯(cuò)的地方,所以我們對(duì)誰可以使用預(yù)先錄制的聲音進(jìn)行克隆非常謹(jǐn)慎。”
他補(bǔ)充說,與Augie庫(kù)中的那些聲音相比,錄制的聲音只能供個(gè)人賬戶使用。所以同一個(gè)組織中的另一個(gè)人必須在他們自己的Augie賬戶上重新錄制他們發(fā)言人的聲音才能克隆他們的演講。用戶不能上傳錄音,平臺(tái)只接受用實(shí)時(shí)麥克風(fēng)錄制的聲音。所以,把你前任的聲音放在揚(yáng)聲器上,這樣你就可以用一個(gè)奇怪地樂于助人的朋友假裝打電話是不會(huì)在Augie上起作用的。
該公司還與其語(yǔ)音克隆合作伙伴ElevenLabs合作,以識(shí)別由人工智能生成的聲音和視頻。