技術(shù)
導(dǎo)讀:據(jù)外媒NewScientist報(bào)道,加拿大哥倫比亞大學(xué)研究小組創(chuàng)造了一種機(jī)器學(xué)習(xí)工具——DarkNPS,可以用AI快速篩選新精神活性物質(zhì)
AI連毒品也可以檢測(cè)了!
據(jù)外媒NewScientist報(bào)道,加拿大哥倫比亞大學(xué)研究小組創(chuàng)造了一種機(jī)器學(xué)習(xí)工具——DarkNPS,可以用AI快速篩選新精神活性物質(zhì)(new psychoactive substance,NPS),這是與可卡因和海洛因類似的興奮劑藥物。由于NPS的化學(xué)多樣性及其在非法市場(chǎng)上的存在時(shí)間短等性質(zhì),目前該藥物的檢測(cè)措施面臨重大挑戰(zhàn)。
DarkNPS可以大大縮短新出現(xiàn)的NPS識(shí)別時(shí)間,并有效縮短對(duì)其化學(xué)結(jié)構(gòu)的搜索范圍。該論文發(fā)表于Nature子刊Nature Machine Intelligence。
01.AI查毒只需幾小時(shí),準(zhǔn)確率達(dá)86%
新精神活性物質(zhì)又稱“策劃藥”或“實(shí)驗(yàn)室毒品”,是不法分子為逃避打擊而對(duì)管制毒品進(jìn)行化學(xué)處理所得到的毒品類似物,具有與管制毒品相似或更強(qiáng)的興奮、致幻、麻醉等效果。加拿大不列顛哥倫比亞大學(xué)研究小組成員Michael Skinnider和他的同事創(chuàng)造了一種名為DarkNPS的機(jī)器學(xué)習(xí)工具,通過(guò)AI工具進(jìn)行簡(jiǎn)單的分析,快速提取出精神活性“新型藥物”化學(xué)結(jié)構(gòu)的可能分子結(jié)構(gòu)。
該工具可以快速開(kāi)發(fā)實(shí)驗(yàn)室測(cè)試服務(wù),以篩選與可卡因和海洛因等毒品具有類似效果的、且無(wú)法在當(dāng)前測(cè)試中檢測(cè)到的藥物使用情況。研究小組從世界各地的法醫(yī)實(shí)驗(yàn)室收集了大約1700種已知新型設(shè)計(jì)藥物的化學(xué)結(jié)構(gòu),對(duì)其進(jìn)行訓(xùn)練。訓(xùn)練集包括每種藥物的串聯(lián)質(zhì)譜結(jié)果,也就是翻譯并分析其部分重組蛋白數(shù)據(jù),可以提供有關(guān)分子質(zhì)量及其包含的元素的信息。這使得AI能夠識(shí)別串聯(lián)質(zhì)譜數(shù)據(jù)和化學(xué)結(jié)構(gòu)之間的模式。
Skinnider表示:“我們的方法可以將識(shí)別NPS所需的時(shí)間從幾周或幾個(gè)月縮短到幾個(gè)小時(shí)。”給定一種以前未知的NPS的串聯(lián)質(zhì)譜數(shù)據(jù),DarkNPS可以猜測(cè)其分子結(jié)構(gòu)。該過(guò)程準(zhǔn)確度約為51%。如果AI能夠?qū)ζ浞肿咏Y(jié)構(gòu)的前10項(xiàng)進(jìn)行預(yù)測(cè),其準(zhǔn)確度將增加到86%,這意味著該工具能有效縮小對(duì)分子結(jié)構(gòu)的搜索范圍。Skinnider說(shuō):“這不僅節(jié)省了大量時(shí)間,還能更快識(shí)別新上市的新精神活性物質(zhì)?!?/p>
02.1700個(gè)實(shí)例生成穩(wěn)健AI模型
研究小組在論文中表示,DarkNPS可以僅使用質(zhì)譜數(shù)據(jù)自動(dòng)闡明未知NPS的化學(xué)結(jié)構(gòu),并基于化學(xué)結(jié)構(gòu)的深層生成模型。該研究小組的模型橫跨化學(xué)和深度學(xué)習(xí)領(lǐng)域,因?yàn)樗鼈冇锌赡芨鶕?jù)需要生成具有任意物理化學(xué)或生物性質(zhì)的分子,從而解決所謂的“逆向設(shè)計(jì)”問(wèn)題。這項(xiàng)工作的大部分集中在分析具有活性的特定藥物對(duì)策分子結(jié)構(gòu)可能性上。
研究小組表示,他們?cè)谘芯窟^(guò)程中尋求生成與一個(gè)或多個(gè)分析測(cè)量特性相匹配的類NPS分子,并使用適用于處理低級(jí)數(shù)據(jù)存儲(chǔ)區(qū)的策略來(lái)實(shí)現(xiàn)這一目標(biāo)。從約1700個(gè)實(shí)例中學(xué)習(xí)設(shè)計(jì)藥物的穩(wěn)健生成模型,并從這個(gè)模型中取樣,隨機(jī)產(chǎn)生與現(xiàn)有的NPS存儲(chǔ)空間類似的新的分子結(jié)構(gòu)。研究過(guò)程顯示,從模型中取樣新分子的頻率可以用來(lái)表明最有可能解釋觀測(cè)到的精確質(zhì)量的化學(xué)結(jié)構(gòu)。將生成的結(jié)構(gòu)與串聯(lián)質(zhì)譜數(shù)據(jù)相結(jié)合,進(jìn)一步提高了結(jié)構(gòu)解析的準(zhǔn)確性。DarkNPS最先闡明了2021年2月首次出現(xiàn)在歐洲的NPS的分子結(jié)構(gòu)。該模型的最終結(jié)果是建立新型精神活性物質(zhì)的深層生成模型。
03.AI生成數(shù)據(jù),為模型提供數(shù)據(jù)庫(kù)
許多計(jì)算工具已經(jīng)開(kāi)發(fā)出來(lái),能夠在質(zhì)譜數(shù)據(jù)中自動(dòng)識(shí)別藥物及其代謝產(chǎn)物。然而,所有這些工具都需要一個(gè)已知化學(xué)結(jié)構(gòu)的數(shù)據(jù)庫(kù),可以將觀察到的質(zhì)譜數(shù)據(jù)與之進(jìn)行比較。因此,這些工具無(wú)法用于識(shí)別現(xiàn)有數(shù)據(jù)庫(kù)中未發(fā)現(xiàn)的新合成設(shè)計(jì)藥物。該研究小組推斷,通過(guò)生成一個(gè)新的、類似核動(dòng)力源的化學(xué)結(jié)構(gòu)數(shù)據(jù)庫(kù),就可以自動(dòng)識(shí)別完全未知的核動(dòng)力源。因此,研究人員著手學(xué)習(xí)核動(dòng)力源化學(xué)結(jié)構(gòu)的深層生成模型,從中隨機(jī)取樣新的核動(dòng)力源結(jié)構(gòu)(圖1a-b)。目前包含NPS結(jié)構(gòu)最新、最全面的資源數(shù)據(jù)庫(kù)是用于NPS篩選的數(shù)據(jù)庫(kù)HighResNPS,來(lái)自世界各地?cái)?shù)十家法醫(yī)實(shí)驗(yàn)室的貢獻(xiàn)者在生物樣本或執(zhí)法部門緝獲的物品中檢測(cè)到新物質(zhì)時(shí),會(huì)向HighResNPS提交數(shù)據(jù)。盡管如此,在2020年6月初,該數(shù)據(jù)庫(kù)僅包含1753個(gè)獨(dú)特的NPS結(jié)構(gòu)。
這一數(shù)據(jù)集的有限規(guī)模反映了非法市場(chǎng)上出現(xiàn)并隨后被法醫(yī)實(shí)驗(yàn)室檢測(cè)到的核動(dòng)力源數(shù)量。然而,通常用于訓(xùn)練化學(xué)結(jié)構(gòu)生成模型的數(shù)據(jù)集將包含數(shù)十萬(wàn)個(gè)數(shù)據(jù)。之后,該研究團(tuán)隊(duì)獲得了194種NPS藥物的數(shù)據(jù),發(fā)現(xiàn)其中176種出現(xiàn)在AI生成的數(shù)據(jù)中。研究人員還通過(guò)使用AI推斷1億種可能的化學(xué)結(jié)構(gòu),研究未來(lái)可能生成的藥物。此外,哥倫比亞大學(xué)梅爾曼公共衛(wèi)生學(xué)院的研究人員正在研究使用機(jī)器學(xué)習(xí)來(lái)評(píng)估法律及其與處方阿片類藥物分配模式的關(guān)系?!皺C(jī)器學(xué)習(xí)方法越來(lái)越多地應(yīng)用于類似的高維數(shù)據(jù)問(wèn)題,并可能為其他形式的政策分析提供一種補(bǔ)充方法,包括作為篩選工具來(lái)識(shí)別需要進(jìn)一步關(guān)注的政策和法律規(guī)定相互作用?!备鐐惐葋喆髮W(xué)流行病學(xué)副教授Silvia Martins說(shuō)。
04.結(jié)語(yǔ):AI+醫(yī)療,落地場(chǎng)景更廣闊
“機(jī)器學(xué)習(xí)方法越來(lái)越多地應(yīng)用于類似的高維數(shù)據(jù)問(wèn)題,并可能為其他形式的政策分析提供一種補(bǔ)充方法,包括作為篩選工具來(lái)識(shí)別需要進(jìn)一步關(guān)注的政策和法律規(guī)定相互作用?!备鐐惐葋喆髮W(xué)流行病學(xué)副教授Silvia Martins說(shuō)。NPS特殊的化學(xué)結(jié)構(gòu),使得不法分子有可乘之機(jī),而AI模型能夠快速識(shí)別其分子結(jié)構(gòu),并利用AI從藥物分子結(jié)構(gòu)中預(yù)先推斷其可能的情況,提前阻止某些藥物流入市場(chǎng)。這為AI工具的應(yīng)用提供了新范例,能夠評(píng)估類似的藥物分子結(jié)構(gòu)、藥物分配模式等問(wèn)題。