應用

技術

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點新聞
企業(yè)注冊個人注冊登錄

實現(xiàn)人工智能的“想象力”

2021-08-10 09:08 51CTO

導讀:南加州大學的一組研究人員正在幫助人工智能想象看不見的東西,這項技術也可能帶來更公平的人工智能。

首先請在腦海中想象一只橙色的貓。然后,想象同一只貓,皮毛已經(jīng)變成了煤黑色?,F(xiàn)在,想象這樣一只貓在長城上昂首闊步。

在上述一系列想象活動中,你大腦中的一系列神經(jīng)元會基于你之前對世界的認知,快速呈現(xiàn)出不同的圖像。也就是說,作為人類,其實很容易一個具有不同屬性的對象。但對于計算機來說,盡管深度神經(jīng)網(wǎng)絡在某些任務上取得了可以與人類表現(xiàn)相匹敵甚至超越的突破,但始終無法與人類的“想象力”相抗衡。

如今,一個來自南加州大學的研究團隊開發(fā)出了一種新的人工智能,可以利用類人的能力想象出某個前所未有的具有不同屬性的物體。這篇以Zero-Shot Synthesis with Group-Supervised Learning為題的論文于今年5月7日發(fā)表在ICLR2021(深度學習領域的頂級學術會議)會上。

“我們受到人類視覺泛化能力的啟發(fā),嘗試在機器上模擬人類的想象力,”該研究的主要作者葛云浩說,“人類可以通過不同的屬性(例如形狀、姿勢、位置、顏色)來分離所學知識,然后將它們重新組合,從而想象出一個新的物體。我們的論文試圖用神經(jīng)網(wǎng)絡來模擬這個過程。”

人工智能的泛化

假如,你想創(chuàng)建一個生成汽車圖像的人工智能系統(tǒng)。理想情況下,你可以為算法提供一些汽車圖片,從而讓它可以從不同角度生成各種型號、外形、顏色的汽車,從保時捷到龐蒂亞克到皮卡,不一而足。

這是人工智能長期追求的目標之一:創(chuàng)建可以進行推理的模型。達成這一目標就意味著,給定幾個示例,模型就能夠提取基本規(guī)則,并將它們應用到大量前所未見的新示例中。但機器通常是根據(jù)樣本特征進行訓練的,比如像素,而不考慮對象的屬性。

關于“想象”的科學

在這項新研究中,研究人員試圖用一種“退糾纏(disentanglement)”的概念來克服這一限制?!巴思m纏”可以用于“深度偽造(deepfake)”,葛云浩提到,通過“退糾纏”人的臉部表情和特征進行“換臉”,人們可以合成新的圖像和視頻,用另一個人替換原主身份,同時保留原來的動作。與之相似,新方法采用一組樣本圖像——而不是像傳統(tǒng)算法那樣一次一個樣本——并挖掘它們之間的相似性以實現(xiàn)所謂的“可控退糾纏表征學習”。然后通過重新組合這些知識來實現(xiàn)“可控的新圖像合成”,或者你可以稱之為“想象”。

他以《變形金剛》為例進行了說明:它可以在電影中取材——威震天的形狀、大黃蜂的顏色、紐約時代廣場的背景。合成結果就是一輛大黃蜂顏色的威震天汽車在時代廣場上飛馳,即使訓練期間并沒有出現(xiàn)過這個樣本。

這個過程類似于人類的推理:當一個人看到一個物體的顏色時,我們可以輕松地通過用新顏色替換原始色來將其應用于任何其他物體。使用他們的技術,這個團隊生成了一個包含 156 萬張圖像的新數(shù)據(jù)集,有助于該領域的未來研究。

理解世界

雖然“退糾纏”并不是個新點子,但研究人員表示,他們的框架幾乎可以和任何類型的數(shù)據(jù)或知識兼容,這就擴大了應用機會。比如,通過將敏感屬性從等式中完全移除,將種族和性別相關知識分解,從而推進人工智能更加公平。

再比如,在醫(yī)學領域,它可以幫助醫(yī)生和生物學家發(fā)現(xiàn)更多有用的藥物,通過將藥物功能與其他特性分開,然后將它們重新組合以合成新藥;在自動駕駛領域,允許自動駕駛汽車想象并避免在訓練過程中從未見過的危險場景,從而推進創(chuàng)建更安全的人工智能。

計算機科學教授洛倫·伊蒂說:“深度學習已經(jīng)在很多領域展示了無與倫比的性能和前景,但這往往是通過淺層模仿達成,并沒有更深入地了解使每個個體獨一無二的屬性。這種新的‘退糾纏’方法第一次真正釋放了人工智能系統(tǒng)的想象力,使它們更接近人類對世界的理解?!?/p>