技術(shù)
導(dǎo)讀:我們提出了一個(gè)車輛指數(shù)的算法,比如這張圖給出了一個(gè)城市某一塊區(qū)域的衛(wèi)星圖片,大家可以看到停車場(chǎng),或者高速公路上有很多車輛行駛,我們通過(guò)AI的算法可以準(zhǔn)確檢測(cè)出地面上車輛的數(shù)量。
今天經(jīng)濟(jì)學(xué)已經(jīng)變成了一個(gè)可以被感知的“有生命的活體”,我們稱之為可感知經(jīng)濟(jì)學(xué)(Senseable Economics)。
可感知經(jīng)濟(jì)學(xué)是說(shuō),我們?nèi)绾螌@得的傳感器數(shù)據(jù),結(jié)合人工智能技術(shù),去分析一些重大社會(huì)學(xué)和經(jīng)濟(jì)學(xué)的問(wèn)題。
我最近看了一個(gè)BBC新拍的紀(jì)錄片,叫《從太空看地球》,這張圖片是衛(wèi)星拍攝的地球某一個(gè)角落的圖像,大家可以猜一下金黃色的部分是什么東西?
第一眼看到這個(gè)圖片的時(shí)候,我以為這是某個(gè)區(qū)域發(fā)現(xiàn)了一個(gè)重大的金礦,這里閃爍著金子的光芒。
但其實(shí)鏡頭再繼續(xù)放大,我發(fā)現(xiàn)它又像油漆,是不是某一個(gè)行為藝術(shù)學(xué)家做了一幅藝術(shù)作品呢?
然后鏡頭又繼續(xù)拉近,我發(fā)現(xiàn)它既不是油畫(huà),它也不是金礦,其實(shí)是云南羅平的油菜花。
通過(guò)衛(wèi)星從不同的尺度去觀看地球的壯觀景象讓人非常感慨,我想起了英國(guó)著名天文學(xué)家弗雷德·霍伊爾(Fred Hoyle)爵士說(shuō)過(guò)這么一句話:
“一旦我們有辦法,可以從地球之外的角度去拍攝我們的地球,那么我們將可以釋放一個(gè)有史以來(lái)最為偉大的思想。”
今天,隨著太空技術(shù)的發(fā)展,弗雷德爵士的這句話已經(jīng)變成現(xiàn)實(shí):
第一,衛(wèi)星已經(jīng)變得越來(lái)越小。
以前大家想到衛(wèi)星的時(shí)候,可能是一個(gè)長(zhǎng)達(dá)幾百米,重達(dá)幾噸,造價(jià)幾億的龐然大物,但現(xiàn)在,衛(wèi)星已經(jīng)變得非常小,有的只有幾十厘米長(zhǎng),重約幾公斤,造價(jià)也從幾億美元降低到了大概幾萬(wàn)美元。
圖上最小的那顆衛(wèi)星,它是美國(guó)Planet Labs公司發(fā)射的鴿子衛(wèi)星,這個(gè)公司已經(jīng)成功向太空發(fā)射了300顆這樣的衛(wèi)星,它們每天對(duì)地球進(jìn)行實(shí)時(shí)的分析和監(jiān)測(cè)。
此外,我們向太空發(fā)射的衛(wèi)星的數(shù)量也越來(lái)越多。
這張圖來(lái)自《經(jīng)濟(jì)學(xué)人》,顯示的是從上個(gè)世紀(jì)60年代一直到今天,不同國(guó)家向太空成功發(fā)射衛(wèi)星的數(shù)量變化。綠色代表的是中國(guó),數(shù)量已經(jīng)開(kāi)始領(lǐng)先其他國(guó)家。
這些衛(wèi)星可以用來(lái)干什么呢?
可以監(jiān)測(cè)經(jīng)濟(jì)數(shù)據(jù)。非洲的一些國(guó)家,極端貧困,晚上沒(méi)有任何燈光亮度。世界銀行如果想去幫助這些非洲國(guó)家,首先就得想盡辦法去分析、了解這個(gè)區(qū)域的經(jīng)濟(jì)發(fā)展?fàn)顩r。
那怎么操作呢?
首先是使用衛(wèi)星拍攝的彩色的遙感圖片,斯坦??茖W(xué)家通過(guò)人工智能技術(shù)和CN算法(Color Names,目標(biāo)跟蹤算法的一種)去分析這些圖像,結(jié)合遷移學(xué)習(xí)和衛(wèi)星燈光亮度圖,進(jìn)而預(yù)測(cè)非洲貧困國(guó)家的經(jīng)濟(jì)收入水平和貧困狀況。
結(jié)果到底準(zhǔn)不準(zhǔn)?
左邊這張圖是2017年非洲某個(gè)國(guó)家官方統(tǒng)計(jì)的經(jīng)濟(jì)收入數(shù)字,右邊這張圖就是用人工智能技術(shù)分析遙感圖像,經(jīng)過(guò)深度學(xué)習(xí)、遷移學(xué)習(xí)的結(jié)果,大家可以看出兩者之間是非常相關(guān)的。
我們能不能用衛(wèi)星拍攝的遙感圖片去監(jiān)測(cè)不同尺度的經(jīng)濟(jì)活動(dòng)?
這張圖上中國(guó)區(qū)域里的每一個(gè)小點(diǎn)就是一個(gè)工業(yè)園區(qū),一共有4000多個(gè),基本覆蓋了大概50萬(wàn)平方公里。
我們針對(duì)這4000個(gè)工業(yè)園區(qū)的衛(wèi)星圖像,通過(guò)人工智能技術(shù)去分析它的變化,提取特征,然后監(jiān)測(cè)它的經(jīng)濟(jì)和制造活動(dòng),紅色代表這塊的區(qū)域經(jīng)濟(jì)活動(dòng)比較強(qiáng)。
這是怎么做到的?
首先針對(duì)一塊區(qū)域,通過(guò)深度學(xué)習(xí)去學(xué)習(xí)它的特征,大家可以想一下,如果有一片區(qū)域原來(lái)一開(kāi)始是一個(gè)草坪,后來(lái)它變成了一塊水泥地,那就說(shuō)明這一塊區(qū)域產(chǎn)生了經(jīng)濟(jì)活動(dòng)。
那么,透過(guò)這4000多個(gè)工業(yè)園區(qū)的衛(wèi)星圖像數(shù)據(jù),我們就可以實(shí)時(shí)感知中國(guó)生產(chǎn)制造業(yè)的發(fā)展,也就意味著我們可以通過(guò)衛(wèi)星去管制一個(gè)區(qū)域的PMI指數(shù)(采購(gòu)經(jīng)理指數(shù)),我們稱之為SMI指數(shù)(衛(wèi)星制造業(yè)指數(shù))。
衡量宏觀經(jīng)濟(jì)走勢(shì)的時(shí)候,最常見(jiàn)的一個(gè)值叫PMI指數(shù),這個(gè)指數(shù)一般是通過(guò)訪談或者電話采購(gòu)經(jīng)理獲取,更新頻率大概是一個(gè)月一次。
而通過(guò)衛(wèi)星感知PMI指數(shù),基本上可以實(shí)現(xiàn)一個(gè)星期更新一次,頻率大大地提高,而且大家可以看到,SMI指數(shù)和官方給出的PMI指數(shù)整體還是非常接近的。
除了能夠分析不同區(qū)域的經(jīng)濟(jì)發(fā)展,我們還想通過(guò)衛(wèi)星遙感數(shù)據(jù),去幫助我們分析一個(gè)城市不同區(qū)域的經(jīng)濟(jì)狀況。
一個(gè)城市的發(fā)展和城市的交通物流是息息相關(guān)的。
我們提出了一個(gè)車輛指數(shù)的算法,比如這張圖給出了一個(gè)城市某一塊區(qū)域的衛(wèi)星圖片,大家可以看到停車場(chǎng),或者高速公路上有很多車輛行駛,我們通過(guò)AI的算法可以準(zhǔn)確檢測(cè)出地面上車輛的數(shù)量。
綠色的小塊就是我們通過(guò)衛(wèi)星圖像檢測(cè)的車的位置,我們通過(guò)檢測(cè)車輛,然后再評(píng)估車輛的數(shù)量,就可以評(píng)估一個(gè)區(qū)域的經(jīng)濟(jì)發(fā)展程度。
大家知道現(xiàn)在中國(guó)每年我們政府有將近1000億的扶貧基金去幫助農(nóng)村進(jìn)行發(fā)展,農(nóng)村的經(jīng)濟(jì)也發(fā)生了翻天覆地的變化,但是這些變化到底怎么去量化,怎么去評(píng)估?
大家知道中國(guó)有句老話叫“想致富,先修路”,所以如果我們能夠通過(guò)衛(wèi)星圖像去識(shí)別農(nóng)村路網(wǎng)的變化,我們就可以去評(píng)估一個(gè)農(nóng)村經(jīng)濟(jì)的變化。
因?yàn)橹袊?guó)的農(nóng)村分布比較分散,你很難用衛(wèi)星的夜光數(shù)量和亮度去評(píng)估,所以左邊和右邊兩張圖白色的區(qū)域,就是我們通過(guò)深度學(xué)習(xí)算法,識(shí)別出兩個(gè)不同的農(nóng)村區(qū)域的路網(wǎng)的結(jié)果,據(jù)此我們就可以去評(píng)估不同農(nóng)村區(qū)域的發(fā)展,評(píng)估扶貧的進(jìn)度等等。
講完通過(guò)衛(wèi)星觀看地球,接下來(lái)我再介紹另外一種數(shù)據(jù)。
大家看,這是一張什么圖?
大家可以看到這樣一個(gè)關(guān)于中國(guó)的亮度圖,相對(duì)比衛(wèi)星拍攝的夜光亮度,這個(gè)數(shù)據(jù)我覺(jué)得更加壯觀,也更加細(xì)膩。
我們除了能夠看到整個(gè)中國(guó)人口的黑河——騰沖的分布線,我們還可以清晰地看到北京、上海、廣州三個(gè)非常亮的區(qū)域,以及整個(gè)我們祖國(guó)的山川河流輪廓,都可以從里面看到。
它不是衛(wèi)星拍攝的夜光數(shù)據(jù),而是2015年除夕一天手機(jī)位置數(shù)據(jù)經(jīng)過(guò)脫敏聚合后的可視化結(jié)果。
這是中國(guó)的華北平原區(qū),我們甚至可以看到黃河的形狀,右下角是太湖,崇明島,在整個(gè)華北平原上像星星一樣的這些小點(diǎn)可能是某個(gè)四五線城市,或者是某個(gè)縣城,我們對(duì)比除夕這一天的數(shù)據(jù)和平時(shí)數(shù)據(jù),發(fā)現(xiàn)這些點(diǎn)的燈光明顯比平時(shí)亮了很多。
因?yàn)檫@幾個(gè)省,山東、河南、河北是外出務(wù)工大省,在除夕這天,很多人返回家里與家人團(tuán)聚,所以使得這塊區(qū)域的亮度比平時(shí)亮了非常多。
手機(jī)位置數(shù)據(jù)如何去評(píng)估一個(gè)區(qū)域的經(jīng)濟(jì)發(fā)展,感知一個(gè)區(qū)域經(jīng)濟(jì)的變化呢?
這里是一個(gè)MIT的研究人員在英國(guó)做的一個(gè)項(xiàng)目,他們拿出了三萬(wàn)個(gè)小區(qū)的電話通訊數(shù)據(jù),認(rèn)為任何兩個(gè)小區(qū)之間的通話意味著它們之間存在社會(huì)關(guān)聯(lián),據(jù)此搭建起了人脈網(wǎng)絡(luò),統(tǒng)計(jì)出通話網(wǎng)絡(luò)多樣性指數(shù)。
舉個(gè)簡(jiǎn)單的例子,比如說(shuō)我們打開(kāi)自己的微信朋友圈,我們可以通過(guò)幾個(gè)維度來(lái)定義我們的人際網(wǎng)絡(luò)多樣性指數(shù)。
比如說(shuō)我們有多少個(gè)好友;我們的好友都分布在中國(guó)的哪些省份;我們這些好友的職業(yè)是不是分散得很廣,如果說(shuō)你的好友又多,分布區(qū)域又廣,他的職業(yè)分布又廣,恭喜你,其實(shí)你的好友多樣性指數(shù)非常高。
而且他們研究發(fā)現(xiàn),把右邊這張圖X軸的多樣性指數(shù),和不同小區(qū)的收入水平做關(guān)聯(lián),他們發(fā)現(xiàn)這兩者之間呈現(xiàn)73%的關(guān)聯(lián)性,也就是說(shuō),如果你的好友很多的話,分布區(qū)域越廣,分布越散的話,你就是傳說(shuō)中的土豪。
同樣,我們還可以通過(guò)移動(dòng)的數(shù)據(jù)來(lái)做人口普查的分析,大家知道中國(guó)每10年做一次人口普查,費(fèi)時(shí)費(fèi)力,而且可能等我們做完人口普查,人口結(jié)構(gòu)又發(fā)生了變化。
這個(gè)是歐洲的研究人員通過(guò)分析葡萄牙手機(jī)基站數(shù)據(jù),做的人口密度動(dòng)態(tài)評(píng)估。A是官方統(tǒng)計(jì)的人口動(dòng)態(tài)密度,B是用手機(jī)位置數(shù)據(jù)來(lái)估算的人口動(dòng)態(tài)密度,C是用衛(wèi)星遙感圖像來(lái)分析出來(lái)的人口密度分布。
大家可以看到,B和C和A的結(jié)果都非常接近,數(shù)據(jù)分析這兩者之間的關(guān)聯(lián)性將近90%。
此外,我們還可以通過(guò)手機(jī)的數(shù)據(jù)去預(yù)測(cè)不同國(guó)家區(qū)域的貧困程度,這是伯克利大學(xué)的科學(xué)家分析非洲盧旺達(dá)這些國(guó)家的貧困收入。
他們通過(guò)分析用戶的手機(jī)數(shù)據(jù),比如打電話的時(shí)長(zhǎng),各種社交網(wǎng)絡(luò)關(guān)系和出行信息來(lái)作為特征,通過(guò)機(jī)器學(xué)習(xí)算法去預(yù)測(cè)一個(gè)人的收入水平,然后他們把不同區(qū)域的數(shù)據(jù)再聚合起來(lái),就能得出聚合后不同區(qū)域的收入水平和貧困狀況。
通過(guò)這種方法,他們得出了整個(gè)盧旺達(dá)國(guó)家的人均收入和財(cái)富分布的變化,這個(gè)數(shù)據(jù)其實(shí)和官方公布的結(jié)果非常接近,但是它可以幾乎是實(shí)時(shí)地更新,可以動(dòng)態(tài)地更新,可以為世界銀行這種機(jī)構(gòu)提供非常有價(jià)值的參考。
最后,我想分享一個(gè)用手機(jī)數(shù)據(jù)回答的一個(gè)長(zhǎng)期以來(lái)困擾很多中國(guó)人的經(jīng)濟(jì)謎團(tuán),那就是中國(guó)的房地產(chǎn)空置率到底是多少?中國(guó)傳說(shuō)中的空城或者叫鬼城到底在哪里?
傳統(tǒng)的手段,可以入戶調(diào)查,或者看晚上有多少個(gè)空調(diào),亮了多少盞燈來(lái)分析一個(gè)區(qū)域的空置率的變化,我們是通過(guò)用機(jī)器學(xué)習(xí)的算法,去分析預(yù)測(cè)用戶的居住地和工作地的分布。
這張圖是上海某區(qū)域的工業(yè)園區(qū)和居民區(qū)的分布密度圖,結(jié)合用戶的手機(jī)數(shù)據(jù)和衛(wèi)星圖像深度學(xué)習(xí)檢測(cè)不同的住宅區(qū),不同的工業(yè)園區(qū),我們就可以評(píng)估一個(gè)住宅區(qū)的空置程度。
通過(guò)這種方法,我們是第一次通過(guò)數(shù)據(jù)的手段去感知到了中國(guó)空置率比較高的一些樓盤(pán),這個(gè)項(xiàng)目叫做“空城計(jì)”,計(jì)算的計(jì)。
這張圖給出了監(jiān)測(cè)到空置區(qū)樓盤(pán)比較多的九個(gè)中國(guó)城市,在這里就不點(diǎn)名了,大家可以根據(jù)自己地理學(xué)知識(shí),結(jié)合衛(wèi)星圖像去感知這是哪個(gè)城市的哪個(gè)區(qū)域。
我們?cè)谧鲞@個(gè)項(xiàng)目的同時(shí),也發(fā)現(xiàn)了一個(gè)非常有趣的現(xiàn)象。大家知道國(guó)外的媒體經(jīng)常拿鄭州的鄭東新區(qū)作為鬼城的典型例子,但其實(shí)我們?cè)趦扇昵暗难芯恐芯桶l(fā)現(xiàn),其實(shí)鄭東新區(qū)的勞動(dòng)力活躍指數(shù)已經(jīng)非常高,我們很難再把它當(dāng)成一個(gè)鬼城。
大家知道,比如在上海,我們可能有2000萬(wàn)人,如果這個(gè)城市多了十萬(wàn)人,或者少了十萬(wàn)人,我們是很難感受到的,但是數(shù)據(jù)就可以看出來(lái),一個(gè)城市的勞動(dòng)力趨勢(shì)的變化,它就像一個(gè)城市的心電圖一樣。
這是通過(guò)數(shù)據(jù)分析得出的東莞和南寧的月度勞動(dòng)力趨勢(shì)圖。
由于中國(guó)有兩個(gè)法定長(zhǎng)假,春節(jié)和國(guó)慶,因此對(duì)月度的勞動(dòng)力趨勢(shì)帶來(lái)了季節(jié)性波動(dòng),但是我們依然可以通過(guò)長(zhǎng)期的數(shù)據(jù),看到不同城市整體的勞動(dòng)力的趨勢(shì)是上升還是下降。
因?yàn)橐粋€(gè)城市的發(fā)展,無(wú)論如何都離不開(kāi)勞動(dòng)力,它包括了像你我這樣可能需要996的工作者,也包括那些可能一年只能回家一次的農(nóng)民工,所以如果我們能夠通過(guò)數(shù)據(jù)去感知一個(gè)城市勞動(dòng)力的變化,我們就可以去預(yù)測(cè)這個(gè)城市將來(lái)的走勢(shì)。
我們這個(gè)研究當(dāng)時(shí)得到了美國(guó)彭博新聞社的報(bào)道,彭博當(dāng)時(shí)采訪了北大光華管理學(xué)院的Jeffery Towson教授,他這樣評(píng)價(jià)我們這個(gè)研究,我覺(jué)得非常形象,他說(shuō):
“之前我們分析一個(gè)區(qū)域的經(jīng)濟(jì)就好像是拿著一個(gè)手電筒去看,現(xiàn)在我們幾乎是點(diǎn)了一盞燈,一下子我們所有東西都可以看得非常清楚。”
這都?xì)w功于我們今天傳感器和物聯(lián)網(wǎng)的發(fā)展。
我們今天主要講了兩個(gè)案例,一個(gè)是天上的衛(wèi)星,一個(gè)是地下的手機(jī)的數(shù)據(jù),
未來(lái),隨著5G的到來(lái),傳感器可能會(huì)遍布在我們身邊每個(gè)地方。
可能我們今天看到這個(gè)燈,它上面就是有一個(gè)傳感器,能夠幫助我們感受到區(qū)域的燈光的亮度,和這塊區(qū)域用電的亮度,那么通過(guò)這些數(shù)據(jù)就可以更加準(zhǔn)確地,去實(shí)時(shí)地感知我們整個(gè)經(jīng)濟(jì)的發(fā)展。
我們放遠(yuǎn)了往前看五年或者十年,可能上海的大街上跑的是幾十萬(wàn)輛無(wú)人車,它們就好比幾十萬(wàn)雙眼睛,幫助我們?nèi)ビ^察著這個(gè)城市的一點(diǎn)一滴的變化。
它能夠幫我們感知到海底撈,麥當(dāng)勞前面有多少個(gè)用戶,也能幫助我們觀察到張江高科技園區(qū),不同的公司面前有多少員工出現(xiàn)。
所有的這些數(shù)據(jù)都可以幫助我們?nèi)シ治鑫覀兘?jīng)濟(jì)的發(fā)展,感知我們經(jīng)濟(jì)的動(dòng)態(tài)。
更能讓我們感知到經(jīng)濟(jì)背后的溫度和故事。