應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

AI 字幕在兒童頻道里吐“臟話”:中招比例高達(dá) 40%,亞馬遜谷歌都很“祖安”

2022-02-28 15:50 IT之家
關(guān)鍵詞:AI字幕機(jī)器翻譯

導(dǎo)讀:被 AAAI 2022 收錄的一篇新研究發(fā)現(xiàn),在 7013 個(gè)兒童視頻中,接近 40% 的節(jié)目出現(xiàn)了少兒不宜或臟話等詞匯。

AI 自動(dòng)生成的字幕,能離譜到什么程度?不僅把“螃蟹”(crab)誤聽(tīng)成“廢話”(crap),當(dāng)場(chǎng)爆粗:

關(guān)鍵在于,這些是 AI 給兒童節(jié)目自動(dòng)生成的字幕。被 AAAI 2022 收錄的一篇新研究發(fā)現(xiàn),在 7013 個(gè)兒童視頻中,接近 40% 的節(jié)目出現(xiàn)了少兒不宜或臟話等詞匯。

甚至在一個(gè) 113 集的兒童機(jī)器人學(xué)習(xí)欄目中,AI 就“爆粗”了 103 次,平均接近一集一次!對(duì)此,油管(YouTube)在接受《連線》采訪時(shí)回應(yīng):我們?yōu)?13 歲以下的兒童開(kāi)發(fā)了 YouTube Kids,這個(gè) App 會(huì)關(guān)閉字幕生成功能。

但如果真有字幕需求的話,如何才能想辦法減少這種 AI 生成錯(cuò)誤?一起來(lái)看看。

亞馬遜谷歌都很“祖安”

先來(lái)看看這篇論文的調(diào)查結(jié)果。研究人員一共從油管上選出了 24 個(gè)兒童頻道,分別記錄了這些頻道的播放量和訂閱量??梢钥闯?,這些篩選出來(lái)的視頻播放量基本都達(dá)到了百萬(wàn)級(jí),訂閱人數(shù)也同樣不少。

然后,研究人員分別試了一下谷歌和 AWS(亞馬遜網(wǎng)頁(yè)服務(wù))的字幕生成效果。結(jié)果顯示,AI 字幕的“少兒不宜”率可謂離譜:在 7013 個(gè)視頻中,谷歌 AI 出現(xiàn)錯(cuò)誤字幕的次數(shù)達(dá)到 2768 次,接近 40%。亞馬遜的 AI 字幕錯(cuò)誤率還要更高,達(dá)到了 3672 次,超過(guò) 52%。

具體來(lái)說(shuō),兩個(gè) AI 分別容易在這些“不太恰當(dāng)”的字詞上出錯(cuò):

△圖左亞馬遜,圖右谷歌

在這些數(shù)據(jù)集中,有一些詞語(yǔ)又尤為“少兒不宜”,例如一些罵人的臟詞:

經(jīng)過(guò)作者們?nèi)斯z查(例如確認(rèn)原視頻是否真的說(shuō)了臟話),發(fā)現(xiàn) AI 主要容易在以下幾種情況中出錯(cuò):

  • 背景音樂(lè)嘈雜

  • 說(shuō)話者為嬰兒

  • 說(shuō)話者為兒童

  • 說(shuō)話者以英語(yǔ)為第二語(yǔ)言

  • 說(shuō)話者在唱歌

△包括但不限于這些情況

那么,有沒(méi)有什么辦法減少這種情況發(fā)生呢?

語(yǔ)序連貫的錯(cuò)誤更容易修復(fù)

研究人員提出了一個(gè)新的數(shù)據(jù)集,利用近音字詞來(lái)構(gòu)建禁忌詞的“替換”備選。例如,對(duì)于 crap 這一可能出現(xiàn)的“粗口”,研究人員就給它設(shè)置了 crab、craft 等讀音相似的字詞,便于 AI 在搞錯(cuò)時(shí)進(jìn)行替換。

具體來(lái)說(shuō),他們?cè)?BERT、XLM、XLNet 等 NLP 模型上,針對(duì)“完形填空”任務(wù)進(jìn)行了重新訓(xùn)練,也就是用 [MASK] 遮住部分單詞,讓 AI 來(lái)填寫(xiě)對(duì)應(yīng)的內(nèi)容。

結(jié)果顯示,在語(yǔ)序正常、前后文案有邏輯的視頻中,AI 替換的準(zhǔn)確率更高(藍(lán)色為正確替換詞):

然而在一些邏輯不強(qiáng)的文案中,成功替換的效果就沒(méi)有那么好了:

AI 字幕在兒童頻道里吐“臟話”:中招比例高達(dá) 40%,亞馬遜谷歌都很“祖安”

最終,Megatron 和 Levenshtein 等模型展現(xiàn)出了最好的修復(fù)效果,分別給亞馬遜 AI 帶來(lái)了超過(guò) 25% 的正確修復(fù)率,給谷歌 AI 帶來(lái)了超過(guò) 28% 的修復(fù)率。

AI 字幕在兒童頻道里吐“臟話”:中招比例高達(dá) 40%,亞馬遜谷歌都很“祖安”

看來(lái) AI 在字幕生成能力上還是任重道遠(yuǎn)啊。

論文地址:

https://github.com/sumeetkr/UnsafeTranscriptionofKidsContent/blob/main/YouTube_Transcription_Final.pdf

參考鏈接:

https://www.dailymail.co.uk/sciencetech/article-10553233/YouTube-AI-putting-explicit-language-captions-videos-aimed-children.html