導(dǎo)讀:研究人員采用了一個(gè)由兩個(gè)知識驅(qū)動(dòng)策略和兩個(gè)數(shù)據(jù)驅(qū)動(dòng)策略組成的AI代理從而以最佳方式利用當(dāng)前決策的已知和未知信息來最佳估計(jì)后續(xù)決策。
幾十年來,解決游戲的努力一直局限于解決雙人游戲,即棋盤游戲如跳棋、類似國際象棋的游戲等,其通過應(yīng)用一些人工智能(AI)搜索技術(shù)和收集大量的游戲統(tǒng)計(jì)數(shù)據(jù)來正確并有效地預(yù)測游戲結(jié)果。然而這樣的方法和技術(shù)并不能直接應(yīng)用于解謎領(lǐng)域,因?yàn)榻庵i一般都是單獨(dú)玩的單人游戲且有獨(dú)特的特點(diǎn)如隨機(jī)或隱藏信息。
因此,這里出現(xiàn)了一個(gè)問題,即AI技術(shù)如何能保持其在解決雙人游戲方面的性能但又能應(yīng)用于單人游戲?
多年來,謎題和游戲一直被認(rèn)為是可以互換的或者說是對方的一個(gè)部分。事實(shí)上,情況可能并非一直如此。從現(xiàn)實(shí)世界的角度來看,“游戲”是我們每天都要面對的東西,處理的是未知的東西。而“謎題”是指已知的東西,甚至有些東西是隱藏的還沒有被揭開的。那么在解謎的背景下,“謎題”和“游戲”之間的邊界是怎樣的?
來自日本高級科學(xué)技術(shù)研究所的Hiroyuki Iida教授及其同事在發(fā)表于《Knowledge-based Systems》的最新研究文章中試圖回答這兩個(gè)問題。據(jù)悉,這項(xiàng)研究的重點(diǎn)是兩個(gè)重要的貢獻(xiàn):(1)通過掃雷測試平臺定義了單人游戲背景下的謎題的可解性;(2)提出了一種新AI代理,其使用四種策略的統(tǒng)一組合--PAFG解算器。通過利用掃雷謎題的已知信息和未知信息,所提出的結(jié)算器在解決該謎題方面取得了跟最先進(jìn)的研究相當(dāng)?shù)男阅堋?/p>
研究人員采用了一個(gè)由兩個(gè)知識驅(qū)動(dòng)策略和兩個(gè)數(shù)據(jù)驅(qū)動(dòng)策略組成的AI代理從而以最佳方式利用當(dāng)前決策的已知和未知信息來最佳估計(jì)后續(xù)決策。因此,對于像掃雷這樣的單人隨機(jī)謎題可以建立起謎題和游戲范式之間的界限。
這樣的條件在現(xiàn)實(shí)世界的問題中起著特別重要的作用,因?yàn)樵谶@些問題中,已知和未知之間的界限通常是模糊且非常難以識別的。Iida教授指出:“隨著AI代理提高解謎性能的能力,可解性的邊界變得明顯。這樣的情況允許明確定義‘謎題’和‘游戲’的條件,通常在許多現(xiàn)實(shí)生活中發(fā)現(xiàn),如確定高風(fēng)險(xiǎn)投資、評估重要決策的風(fēng)險(xiǎn)水平等等?!?/p>
隨著現(xiàn)有技術(shù)和新的計(jì)算范式的面世,存在許多不確定因素,如物聯(lián)網(wǎng)、基于云的服務(wù)、邊緣計(jì)算、神經(jīng)形態(tài)計(jì)算等。這種情況對人(即技術(shù)承受力)、社區(qū)(即技術(shù)接受度)、社會(即文化和規(guī)范)甚至國家層面(即政策和規(guī)則變化)都可能是如此?!叭祟惷刻斓幕顒?dòng)都涉及很多‘游戲’和‘謎題’條件。然而,在規(guī)模上映射可解性范式,可以建立已知和未知之間的邊界條件從而使未知的風(fēng)險(xiǎn)最小化并使已知的利益最大化,”這項(xiàng)研究的論文第一作者Chang Liu說道,“這樣的壯舉是通過將知識驅(qū)動(dòng)的技術(shù)、人工智能技術(shù)和可衡量的不確定性(如獲勝率、成功率、進(jìn)度率等)推向高潮,同時(shí)仍保持謎題的趣味性和挑戰(zhàn)性來實(shí)現(xiàn)的。”