導讀:隨著機器學習技術的發(fā)展,多家大型科技公司提供現(xiàn)成的文本轉語音的模型。
近日美國一家人工智能公司Veritone推出了一款名叫Marvel.AI的聲音平臺,為名人提供聲音克隆服務。
公司總裁Ryan Steelberg說:“對于名人而言,除了使用個人形象的廣告代言,他們的聲音也是工作業(yè)務的一部分,但通常名人們的時間比較緊張,沒有足夠的時間去演播室錄音”。所以,Veritone公司就推出了這項服務,幫助名人們生成他們聲音的深層復制品(deepfakes of their voices),并在需要的時候使用。
一、Marvel.AI兩種服務模式:可自助,可個性化定制
隨著機器學習技術的發(fā)展,多家大型科技公司提供現(xiàn)成的文本轉語音的模型。但機器語音太過生硬,為了制作出精品的人聲語音系統(tǒng),Veritone作為世界首個人工智能操作系統(tǒng)aiWare的創(chuàng)建者,最近搭建了Marvel.AI語音平臺,該平臺可以制作合成語音,讓內容創(chuàng)作者、名人等用戶生成他們聲音的復制品,以達到難辨真?zhèn)蔚娜寺曅Ч?,用于電臺、有聲讀物或是其他平臺的應用。
對用戶而言,Marvel.AI將提供兩種服務。
第一種是自助服務模式,人們可以從原有的聲音目錄中選擇自己的喜歡的模型,然后根據(jù)需要創(chuàng)建語音。這種模式類似于亞馬遜和微軟等公司之前提供的變音服務。
第二種是個性化制定模式,客戶只需要提交自己的聲音數(shù)據(jù)。之后,Veritone本著“一切為了顧客服務”的原則,為他們創(chuàng)建一個克隆的語音模型,并保存在公司的系統(tǒng)中。只要客戶有需求,就能立刻把模型調出開始復制使用。Marvel.AI還將搭建一個市場,為那些有潛在需求的客戶,提供多樣化的聲音模型選擇,但目前其定價不明確。
Steelberg堅信,對這此類服務市場是有需求的,他們已經(jīng)準備好商業(yè)化應用了。
二、為名人省時省力,但存在信用風險
Veritone雖然自稱是一家“人工智能公司”,但其大部分收入來自廣告和內容授權。該公司有個Veritone Licensing部門,對包括CBS和CNN等在內的廣播公司,以及NCAA和美國網(wǎng)球公開賽等體育組織擁有的視頻檔案進行授權。
Ryan Steelberg說聲稱,與那些專注于人工智能技術的初創(chuàng)公司相比,Veritone在授權和廣告方面的經(jīng)驗將賦予其優(yōu)勢。但這對廣告商和贊助商來說,無疑是非常耗錢又費時的項目。畢竟,名人都是靠自身形象、聲音來引流的,但當大眾粉絲們發(fā)現(xiàn),自己的偶像或是崇拜者連聲音都是合成的,那之后還會消費其代言的產品嗎?
三、克服機械音、提高安全度是Veritone的發(fā)展重點
近年來,在廣告領域,語音合成技術被廣泛應用。在這波語音創(chuàng)作洪流中,Veritone平臺的發(fā)展取決于合成人聲的真實性。它是否能帶動大眾的情緒,聲音聽起來要像是人類發(fā)出的,而不是機器。
此外,對于這項技術,在社會上也存在諸多爭議。由于Marvel.AI可以創(chuàng)建任何音頻模型,這就給個人隱私泄露和音頻濫用問題的出現(xiàn)提供了可能。例如之前出現(xiàn)的不法之徒,利用語音合成來進行電話詐騙的案例,讓語音克隆服務的安全度遭到質疑。
Steelberg也曾提到,通過復制音頻檔案,該項技術能夠讓已經(jīng)逝世人的聲音“復活”。從技術層面上看,這是一項不錯的創(chuàng)新技術;但從道德角度上看,這確實有點讓人感到毛骨悚然。比如通過人工智能復活英國戴安娜王妃的語音,用于商品代言,消費者們會買單嗎?
結語:智能語音發(fā)展的同時,也要保障用戶安全
在全面進入數(shù)字化的時代,智能語音服務是未來的發(fā)展趨勢,從智能語音客服到廣告行業(yè)的人聲合成語音,都有著潛在的發(fā)展市場。
但在研發(fā)克隆語音服務的同時,負責技術開發(fā)的科技公司,應更加重視服務帶來的用戶隱私和安全問題。在智能語音行業(yè),各大科技企業(yè)使該技術商業(yè)化的同時,需不斷地規(guī)范市場化運作,保障用戶權益。
來源:Gizmodo