技術(shù)
導(dǎo)讀:技術(shù)、車企合作、綜合生態(tài),人車交互產(chǎn)業(yè)或許正在跑著一場(chǎng)鐵人三項(xiàng)。但在無(wú)人駕駛真正到來(lái)之前的相當(dāng)長(zhǎng)一段時(shí)間中,車載語(yǔ)音交互都會(huì)是汽車場(chǎng)景技術(shù)與體驗(yàn)進(jìn)化的主旋律。在語(yǔ)言的迷宮下,人和車以另一種方式相遇了。
“BAT抵達(dá)車聯(lián)網(wǎng)”,是最近引發(fā)無(wú)數(shù)媒體關(guān)注的一個(gè)“風(fēng)口話題”。
在熱鬧的討論中,我們知道了這個(gè)火熱的賽道上有BAT等科技巨頭,還有傳統(tǒng)車企,造車新貴,以及解決方案提供商,一時(shí)間風(fēng)起云涌好不熱鬧。
但如果我們從頭琢磨一下,可能會(huì)發(fā)現(xiàn)今天對(duì)車聯(lián)網(wǎng)的討論,多少有點(diǎn)“失焦”:所謂車聯(lián)網(wǎng)這個(gè)賽道,究竟在爭(zhēng)奪什么?而BAT進(jìn)場(chǎng)與不進(jìn)場(chǎng),到底有什么區(qū)別?各家科技巨頭與車企在車聯(lián)網(wǎng)領(lǐng)域的進(jìn)度各有什么不同?
這些問題的答案,很可能藏在一個(gè)很多司機(jī)今天還并不重視的角落里:人車對(duì)話。
人和車聊天這事兒,真的有這么重要嗎?
咱們先來(lái)思考這么一個(gè)問題:給車連上網(wǎng),到底干嘛用?
聲音是不可代替的交互:車聯(lián)網(wǎng)賽道的真正軸心
我們知道,所謂的車聯(lián)網(wǎng),是泛指通過汽車端的信號(hào)傳輸裝置,接受網(wǎng)絡(luò)信息與服務(wù)的技術(shù)解決方案。包括車輛遠(yuǎn)程控制、遠(yuǎn)程安全、駕駛場(chǎng)景下的網(wǎng)絡(luò)服務(wù)等多個(gè)領(lǐng)域——也就是所謂的讓車變成一個(gè)終端。
而今天熱絡(luò)的車聯(lián)網(wǎng)產(chǎn)業(yè),普遍關(guān)注的是兩個(gè)問題:
1、改善駕駛效率與體驗(yàn)。比如用戶可以基于互聯(lián)網(wǎng)技術(shù)控制汽車、輔助駕駛等等。
2、獲得駕駛外的增值服務(wù)。比如用戶通過車載網(wǎng)絡(luò)獲得的導(dǎo)航、內(nèi)容、天氣、支付服務(wù)等等。
那么重點(diǎn)來(lái)了,這兩種服務(wù)到底要怎么賦予駕駛者呢?
都集成到手機(jī)上…開車玩手機(jī)好像不對(duì)?放在車載屏幕上,讓用戶觸屏控制?哪有人那么閑沒事停車觸屏一下再開?而且既然都停車了,那干脆玩手機(jī)好不好?
所以有種說(shuō)法,叫做車上最沒用的設(shè)備就是屏幕??梢哉f(shuō),在車聯(lián)網(wǎng)的商業(yè)想象中,讓用戶放棄方向盤來(lái)獲得網(wǎng)絡(luò)服務(wù),是一種反人性的設(shè)計(jì)。那么網(wǎng)絡(luò)服務(wù)、駕駛服務(wù)怎么才能無(wú)縫對(duì)接給駕駛者呢?答案只可能是人車語(yǔ)音交互。
讓駕駛者通過語(yǔ)音來(lái)控制一部分不方便控制的車載設(shè)備,再通過語(yǔ)音交互來(lái)獲得外接互聯(lián)網(wǎng)服務(wù),是車聯(lián)網(wǎng)場(chǎng)景中唯一成立的交互模式。可以看到,在初期試水之后,無(wú)論是車廠還是科技企業(yè),都將矛頭對(duì)準(zhǔn)了人車對(duì)話交互這一塊“車聯(lián)網(wǎng)樞紐”。
而在車載語(yǔ)音交互的成長(zhǎng)過程中,科技巨頭陸續(xù)進(jìn)場(chǎng)與獨(dú)角獸崛起,就變成了一個(gè)合乎技術(shù)邏輯的事情。
車載語(yǔ)音交互不長(zhǎng)的歷史上,已經(jīng)涌現(xiàn)出了以下幾種“江湖流派”,讓“語(yǔ)言交互戰(zhàn)”成為了車聯(lián)網(wǎng)戰(zhàn)場(chǎng)上貨真價(jià)實(shí)的戰(zhàn)略高地
安卓改裝流:國(guó)產(chǎn)車的常規(guī)套路
最早認(rèn)識(shí)到語(yǔ)音交互價(jià)值的,當(dāng)然是汽車企業(yè)本身。而最早布局車聯(lián)網(wǎng)系統(tǒng)的,也是一批以自主品牌車廠為主的車企,他們普遍通過改裝原生安卓的方式來(lái)搭建自己的“車載UI”。
而在這套交互邏輯里,也涌現(xiàn)出了原生版本的車載語(yǔ)音交互。
這種 “原生態(tài)”語(yǔ)音交互系統(tǒng),一般由車企自己開發(fā),實(shí)際技術(shù)供應(yīng)商往往是長(zhǎng)三角、珠三角的小工廠,因此沒什么技術(shù)研發(fā)成本。一般來(lái)說(shuō)形式是一個(gè)安卓系統(tǒng)改裝的操作平臺(tái),然后用戶可以在車載系統(tǒng)上安裝各種各樣的APP,形似一個(gè)安裝在車上的安卓平板。然后用戶可以使用某些APP中的語(yǔ)音控制,來(lái)控制FM、地圖等應(yīng)用。
吉利吉客、比亞迪Dili nk等系統(tǒng)算是這個(gè)流派中相對(duì)成熟的。這類車企自制系統(tǒng),優(yōu)點(diǎn)是成本低廉,可以某種程度上作為營(yíng)銷噱頭。
但缺點(diǎn)也十分明顯:由于必須進(jìn)入APP內(nèi)部的語(yǔ)音交互,所以用戶說(shuō)什么其實(shí)與車無(wú)關(guān),只是控制APP而已。而且往往交互邏輯中有大量需要觸屏操作的地方,用戶在行駛中必須經(jīng)常觸屏,對(duì)交通安全也是個(gè)隱患。
總體而言,改裝安卓流派并不被看好。所以,有AI技術(shù)撐腰的科技巨頭們來(lái)了。
車載音箱流:科技公司進(jìn)場(chǎng)人車交互的開端
今天更多主流車企,開始注意到了車內(nèi)語(yǔ)音交互能夠帶給駕駛者諸多便利,甚至可以說(shuō)是車載顯示器唯一合理的解決方案,于是主流車企+車載語(yǔ)音技術(shù)開始熱絡(luò)了起來(lái)。而科技巨頭以自己的語(yǔ)音技術(shù)優(yōu)勢(shì),切入車聯(lián)網(wǎng)領(lǐng)域,就變成了順理成章的情況。
國(guó)內(nèi)的Apollo小度車載系統(tǒng),國(guó)外亞馬遜的Alexa,都可以作為車企的語(yǔ)音交互解決方案來(lái)進(jìn)行合作。
比如說(shuō),今年早些時(shí)候,寶馬已經(jīng)宣布將與亞馬遜的Alexa合作,在新出車型中搭載車載語(yǔ)音助手。駕駛者可以與語(yǔ)音助手直接對(duì)話,查詢地點(diǎn)、選擇想要收聽的內(nèi)容,以及相應(yīng)的綜合服務(wù)。而用戶可以選擇是否需要搭載Alexa。
這種模式,從技術(shù)邏輯上來(lái)看,可以被理解為在整車完成后,把語(yǔ)音助手集成在車載交互中,嵌入到車輛的網(wǎng)絡(luò)交互設(shè)備里。說(shuō)白了,有點(diǎn)像在汽車中安裝一個(gè)智能音箱,只是在交互形態(tài)和使用目的上與家用音箱不同。
還有一種科技企業(yè)的進(jìn)場(chǎng)方式,是向車企的車聯(lián)網(wǎng)項(xiàng)目輸送技術(shù)。比如東風(fēng)風(fēng)神與百度DuerOS、博泰共同打造過Windli nk 3.0。百度在其中扮演AI語(yǔ)音技術(shù)輸出商的角色。
目前,國(guó)外的亞馬遜、微軟,國(guó)內(nèi)的科大訊飛、百度DuerOS,都有相應(yīng)的車載交互體系,已經(jīng)被搭載到很多車輛當(dāng)中。
這種嵌入式的車載音箱流,優(yōu)點(diǎn)是基本以成熟的AI語(yǔ)音交互系統(tǒng)作為底本,能夠產(chǎn)生不錯(cuò)的對(duì)話體驗(yàn)。無(wú)論是方言識(shí)別、自然語(yǔ)言處理還是對(duì)用戶的數(shù)據(jù)學(xué)習(xí),都比原生態(tài)版本強(qiáng)出一大截。
相應(yīng)的問題是,這類系統(tǒng)由于大多是后裝或準(zhǔn)后裝模式,無(wú)法與汽車建立底層的機(jī)械聯(lián)系,所以能夠帶給用戶的操作比較有局限性。說(shuō)白了,這更像是車企為由需要用戶準(zhǔn)備了一份錦上添花的禮包。
但如果語(yǔ)音交互向走的更遠(yuǎn),車企與科技企業(yè)似乎必須走的更近才行。
整車前裝流:巨頭醞釀中的下一個(gè)故事
在讀者相對(duì)更熟悉的無(wú)人駕駛領(lǐng)域,我們已經(jīng)可以得出這樣一個(gè)結(jié)論:拋開車廠玩科技,基本是條死胡同。
在人車交互領(lǐng)域同樣如此,假如離開了車企的制造基礎(chǔ),那么科技企業(yè)帶來(lái)的感知智能交互技術(shù),就像是在車內(nèi)擺放了一盆可有可無(wú)的裝飾。
只有科技企業(yè)與車企更緊密合作,將人機(jī)交互的可控范圍加大,車聯(lián)網(wǎng)技術(shù)才可能帶來(lái)真正的駕駛升級(jí)體驗(yàn)。這或許也意味著,車載網(wǎng)絡(luò)交互系統(tǒng),必須有后裝改為前裝:讓AI語(yǔ)音系統(tǒng)可以進(jìn)入汽車的機(jī)械系統(tǒng)里,甚至盡量靠近控制中樞。
換言之,語(yǔ)音交互能夠部分取代車輛駕駛控制,在科技企業(yè)看來(lái)才是王道。
這個(gè)領(lǐng)域已經(jīng)有科技巨頭進(jìn)駐,比如阿里與上汽合作的斑馬網(wǎng)絡(luò),核心業(yè)務(wù)方向就是結(jié)合AliOS的整車底層平臺(tái),為車企提供前裝人機(jī)交互系統(tǒng)。
前裝的直接價(jià)值,在于能夠讓語(yǔ)音交互控制車上更多的部件。比如車窗、雨刷、天窗、空氣凈化器等等。
另一個(gè)意義在于,前裝可以在車上安裝更多傳感器與麥克風(fēng)陣列,讓人控制車的同時(shí),車也可以主動(dòng)感知到人的存在。由此能夠分清誰(shuí)在說(shuō)話、判斷每一個(gè)人的狀態(tài)等等。
此外還由一個(gè)區(qū)別在于,科技企業(yè)假如只提供技術(shù)解決方案,那么車聯(lián)網(wǎng)連接的將還是一般互聯(lián)網(wǎng)內(nèi)容,無(wú)法獲得專屬于車的支付、內(nèi)容、旅游等產(chǎn)品服務(wù),而前裝系統(tǒng)可以直接綁定車主ID,這是讓車變手機(jī)的一個(gè)先決條件。
當(dāng)然,整車前裝AI交互系統(tǒng)的故事才剛剛開始。
一方面大量車企并未適應(yīng)這種模式,因?yàn)橄胍@得更好的語(yǔ)音交互體驗(yàn),系統(tǒng)需要直接接入車輛的機(jī)械控制中樞,這在很多車廠看來(lái)是有安全隱患的。
但整車前裝,科技企業(yè)與車企深度合作的路子很可能會(huì)越走越遠(yuǎn)。今年 Google I/O 大會(huì)開幕前,Google 還宣布了與沃爾沃的合作,雙方會(huì)合作打造不同于安卓的車載智能系統(tǒng)??萍计髽I(yè)走向與車企的平等合作,AI語(yǔ)音交互成為車輛本身的一部分,在方向上應(yīng)該沒有什么疑問。
當(dāng)然了,我們更期待的,可能是語(yǔ)音交互成為駕駛的全部。
無(wú)人駕駛流:人類還在等待的人車對(duì)話
顯然,車聯(lián)網(wǎng)技術(shù)真正在等待的,是與無(wú)人駕駛的合流。雖然這個(gè)目標(biāo)在今天來(lái)看還遠(yuǎn),但從技術(shù)邏輯上看,車輛語(yǔ)音交互有一天會(huì)成為全面取代手動(dòng)的交互模式。
就像今天有些車主會(huì)堅(jiān)持認(rèn)為,我用手控制挺好的,為什么要說(shuō)話控制車?這其實(shí)涉及很多駕駛習(xí)慣問題,難以一概而論。但不可否認(rèn)的是,假如最終我們只用說(shuō)說(shuō)話,車就可以準(zhǔn)確舒適地把我們帶到目的地,那么與車的對(duì)話將具有絕對(duì)價(jià)值。
這個(gè)邏輯所形容的,是L4級(jí)別無(wú)人駕駛中的語(yǔ)音交互。這個(gè)層級(jí)里,車輛將拋棄方向盤,也就是說(shuō)駕駛場(chǎng)景已經(jīng)被取代。但如何獲得更舒適的出行體驗(yàn)、選擇道路導(dǎo)航方式、緊急情況下的制動(dòng),今天看來(lái)還是需要人類進(jìn)行主動(dòng)干預(yù)的。而干預(yù)的方式,應(yīng)該還是以人車對(duì)話為主。
今天已經(jīng)有很多無(wú)人駕駛項(xiàng)目,開始研發(fā)無(wú)人駕駛場(chǎng)景下的人車對(duì)話機(jī)制。這種場(chǎng)景下,用戶需要下達(dá)的命令往往是復(fù)雜抽象的,有點(diǎn)類似我們做出租車時(shí)給司機(jī)的建議。那么要讓無(wú)人駕駛系統(tǒng)具象化這些建議,并落實(shí)成出行模式,就需要強(qiáng)大的自然語(yǔ)言處理能力、深度語(yǔ)義理解能力作為支撐。
作為無(wú)人駕駛的必備配套技術(shù),這個(gè)領(lǐng)域目前已經(jīng)匯集了中外各路AI豪杰和車企,但同時(shí)也存在大量機(jī)會(huì)。讓人車可以像乘客和司機(jī)一樣對(duì)話,還有很遠(yuǎn)的路要走。
車載語(yǔ)音這條賽道,究竟在比什么?
綜上所述,車聯(lián)網(wǎng)這一局棋,某種程度上來(lái)看,真正在考驗(yàn)的是車載語(yǔ)音交互的技術(shù)解決能力和綜合服務(wù)體驗(yàn)。
因?yàn)轳{駛時(shí)的網(wǎng)絡(luò)服務(wù)必須圍繞聲音進(jìn)行,那么聲音能夠獲得的權(quán)限越大,交互技術(shù)越精準(zhǔn),生態(tài)服務(wù)越充沛,消費(fèi)者的體驗(yàn)也就會(huì)越好。
這一場(chǎng)關(guān)于人車對(duì)話的賽跑,無(wú)論是科技巨頭,還是新晉獨(dú)角獸、造車新貴,都必須考慮三個(gè)方面的問題:
1、AI語(yǔ)音技術(shù)的體驗(yàn)分:AI語(yǔ)音交互、IoT系統(tǒng)、云計(jì)算,這些技術(shù)體系進(jìn)入汽車,是一個(gè)廣泛而深刻的過程。而這個(gè)過程中,對(duì)科技企業(yè)拿出的技術(shù)解決能力是有嚴(yán)格要求的。車載場(chǎng)景不同于家居,有復(fù)雜的干擾環(huán)境,和必須快速執(zhí)行命令的性能要求。如何讓人車對(duì)話時(shí),可以更好地完成遠(yuǎn)場(chǎng)喚醒、方言識(shí)別、特殊語(yǔ)序識(shí)別,是接下來(lái)AI公司需要繼續(xù)努力的。
2、與車企合作的親密分:如果我們認(rèn)同語(yǔ)音交互控制車輛部分越多越好,前裝優(yōu)勢(shì)大于后裝這個(gè)邏輯,那么人車交互體驗(yàn)就是建立在科技企業(yè)與車企的緊密合作基礎(chǔ)上。而在今天,即使是已經(jīng)全面領(lǐng)先的斑馬和AliOS,也面臨客戶群不夠多、合作品牌相對(duì)單一的問題。如何讓高端車、合資或者外資品牌車也部署“中國(guó)智造”的AI交互系統(tǒng),或許還是任重道遠(yuǎn)的工作。
3、外接生態(tài)的服務(wù)分:對(duì)于車主來(lái)說(shuō),真正的價(jià)值撬點(diǎn)可能并不在語(yǔ)音控車上,而在于車載系統(tǒng)能夠提供的導(dǎo)航、內(nèi)容與綜合服務(wù)生態(tài),是否真正帶來(lái)了體驗(yàn)改變。而這對(duì)于人機(jī)交互技術(shù)的提供者來(lái)說(shuō),還是相對(duì)困難的。而外接生態(tài)相對(duì)成熟的互聯(lián)網(wǎng)公司,似乎在這個(gè)邏輯上更有勝率。
技術(shù)、車企合作、綜合生態(tài),人車交互產(chǎn)業(yè)或許正在跑著一場(chǎng)鐵人三項(xiàng)。但在無(wú)人駕駛真正到來(lái)之前的相當(dāng)長(zhǎng)一段時(shí)間中,車載語(yǔ)音交互都會(huì)是汽車場(chǎng)景技術(shù)與體驗(yàn)進(jìn)化的主旋律。在語(yǔ)言的迷宮下,人和車以另一種方式相遇了。
而就車聯(lián)網(wǎng)而言,一個(gè)探尋的時(shí)代,也許會(huì)從語(yǔ)言與聲音的魔法中,慢慢開始它的覺醒。至少相比大部分車聯(lián)網(wǎng)偽需求來(lái)說(shuō),用聲音來(lái)觸發(fā)服務(wù),是駕駛場(chǎng)景中無(wú)可避免的選擇。