“自動駕駛”汽車是怎么樣看路的?
【太平洋汽車網(wǎng) 技術(shù)頻道】你能分辨照片上是不是有只貓嗎?即便三歲小孩這都不是啥問題(照片特別離譜的除外)。
可你能教會一臺機(jī)器辨認(rèn)一只貓嗎?好像有點(diǎn)難度,我們得先告訴機(jī)器啥是貓。機(jī)器和人的思維畢竟不太一樣,我們教小朋友認(rèn)貓,只要告訴他那個喵喵叫的就是貓,他很快就能記住,并且能舉一反三,但這個方法顯然不適合人機(jī)器學(xué)習(xí)。而現(xiàn)在就有一大群人正在做類似的事,其中一批就是教自動駕駛汽車認(rèn)路的工程師。
近幾年來,高階輔助駕駛甚至自動駕駛的概念越來越被頻繁的提及,而自動輔助駕駛技術(shù)也在快速的發(fā)展。我們平時開車需要用眼睛觀察路況,而自動(輔助)駕駛便是通過感知硬件來感知周圍的路況。目前汽車上應(yīng)用到的感知硬件包括但不限于:攝像頭、毫米波雷達(dá)、超聲波雷達(dá)、激光雷達(dá)以及V2X相關(guān)硬件等。
對于自動駕駛感知,純視覺路線與多傳感器融合路線之爭由來已久,融合路線中激光雷可以精準(zhǔn)的還原周遭環(huán)境的三維特征;毫米波雷達(dá)對惡劣天氣有著更強(qiáng)的適應(yīng)性,且能夠同時探測被測物體的距離與速度;高精度地圖能夠讓車輛提前對沿途道路有更精確的了解;V2X能夠借助旁人獲知視野之外的情況……
但不論哪種路線,都不會把攝像頭排除在外。攝像頭是目前最主流的自動駕駛感知硬件,類似人眼看世界,系統(tǒng)算法會自動分析圖像并找出其中的各種事物。雙目攝像頭還可以像人眼一樣通過夾角分析出前方障礙物的距離。即便視覺感知也有自己的弱點(diǎn),其十分依賴算法,而算法需要海量的數(shù)據(jù)進(jìn)行訓(xùn)練,對于后來者有極高的門檻。此外,攝像頭受逆光、能見度等環(huán)境因素影響頗大,識別準(zhǔn)確率在不同環(huán)境下會有較大波動。
因?yàn)樽詣玉{駛汽車,也終究是要在為人類設(shè)計(jì)的交通體系之中。而人類的感知環(huán)境,憑借的就是眼睛的成像,攝像頭剛好就是為了還原人眼看到的世界而設(shè)計(jì)的,因此要讓自動駕駛汽車看到人類駕駛員在路上看到的所有信息(包括顏色、文字、標(biāo)線等),攝像頭自然是不可或缺的。所謂純視覺路線與多傳感器融合路線之爭,爭論的焦點(diǎn)其實(shí)只是“只有攝像頭夠不夠”的問題。
奠定攝像頭在自動駕駛感知系統(tǒng)中堅(jiān)實(shí)地位的,除了前面提到的可以獲取與人眼一樣多的信息外,還有很重要的一點(diǎn),人類自己能看到的東西,才能更有效的“教”給機(jī)器。自動駕駛近年來的飛速進(jìn)步,依賴的是人工智能技術(shù)近年來取得的突破性發(fā)展。而人工智能近年來應(yīng)用進(jìn)展最為迅速的領(lǐng)域,一個是語音識別,一個是圖像識別,剛好對應(yīng)人類的“聽”和“看”的能力。下面我們就從人工智能的發(fā)展史,聊聊自動駕駛視覺感知背后的算法。
我們還是先說貓,想教機(jī)器認(rèn)識貓,可以把貓的一些特征告訴機(jī)器,比如橘貓是橘色的。后果可想而知,橘子、抱枕、金毛,甚至一些不可描述的東西都可能會被誤認(rèn)為是貓。顯然顏色并不靠譜,那我們再加一些特征,比如貓有尖尖的耳朵、一對黑眼睛、四條腿、長長的胡須等等。終于,機(jī)器認(rèn)識了一只橘貓。
可一不小心,老虎、獅子、兔猻等等也都被認(rèn)成了貓。而一些角度非常規(guī)的貓的照片,又莫名其妙被開除了貓籍。很顯然,我們輸入的條件太過籠統(tǒng)又不夠細(xì)致。那是不是只要輸入足夠多、足夠細(xì)的條件,機(jī)器就能認(rèn)識所有的貓了?很長一段時間,人工智能專家也是這么認(rèn)為的。
二十世紀(jì)五十年代中期,人工智能誕生之初,部分學(xué)者便創(chuàng)造了“規(guī)則式”人工智能,后來定名為“專家系統(tǒng)”(expert systems)。他們用定制的邏輯規(guī)則來教計(jì)算機(jī)怎么思考,專家系統(tǒng)很快讓計(jì)算機(jī)在跳棋等游戲中擊敗了人類高手,甚至直接摸到了這類游戲的天花板。
可近二十年的發(fā)展高潮,人工智能都沒有什么能落地的應(yīng)用,讓人工智能在七十年代中期陷入第一次寒冬。直到1980年卡耐基梅隆大學(xué)發(fā)明的軟件XCON投入使用,這個幫助顧客自動選配計(jì)算機(jī)配件的軟件程序,包含了設(shè)定好的超過2500條規(guī)則,在后續(xù)幾年處理了超過80000條訂單,準(zhǔn)確度超過95%,每年節(jié)省超過2500萬美元,XCON和同時期的其他實(shí)用專家系統(tǒng),揭開了人工智能的第二次高潮。
隨著人工智能的熱度攀升,自動駕駛相關(guān)的項(xiàng)目也紛紛上馬。不過大家最熟悉的,要數(shù)這一時期拍攝的美劇《霹靂游俠》里,那臺神奇的智能汽車KITT。劇中,KITT有一塊每秒運(yùn)算可達(dá)10億次的CPU和5000兆字節(jié)容量的數(shù)據(jù)庫,不僅能夠自動駕駛,還能進(jìn)行人機(jī)對話等等。不過事實(shí)上,劇中暢想的CPU和數(shù)據(jù)庫水平,甚至不如一臺iPhone4。
隨著摸索的深入,專家系統(tǒng)的局限愈發(fā)凸顯。彼時研發(fā)語音識別的團(tuán)隊(duì),花費(fèi)大量金錢聘請很多的語言學(xué)專家,參與規(guī)則的制定,可惜語音識別的準(zhǔn)確率,始終也只能徘徊在60%左右。人類不可能窮盡所有規(guī)則的可能性,彼時計(jì)算機(jī)硬件水平也制約著人工智能的進(jìn)步。
歷史的時鐘還沒能進(jìn)入九十年代,人工智能在互聯(lián)網(wǎng)、計(jì)算機(jī)的發(fā)展熱潮中,黯然陷入了第二次寒冬。
1997年,國際象棋世界冠軍卡斯帕羅夫面對去年的手下敗將,IBM開發(fā)的人工智能“深藍(lán)”時,顯得并不從容。被當(dāng)時媒體稱為“人類智力的最后一道防線”的國際象棋,以卡斯帕羅夫的落敗宣告失守。
這一事件引發(fā)了社會熱議,人工智能也從此時開始了緩慢的回溫。當(dāng)然,各路媒體很快反應(yīng)了過來,“人類智力的最后一道防線”又被放在了橫在人工智能面前的最后一種棋類游戲——圍棋。
讓人工智能在圍棋上戰(zhàn)勝人類,這是個橫在”專家系統(tǒng)“的天花板之上的挑戰(zhàn)。不是因?yàn)闊o法窮盡的規(guī)則,而是太多的可能性遠(yuǎn)超出計(jì)算機(jī)的算力極限。答案我們今天都知道了,2016年,谷歌開發(fā)的人工智能AlphaGo戰(zhàn)勝圍棋世界冠軍李世石,之后又接連挫敗柯潔等圍棋世界冠軍,徹底宣告了人工智能的勝利。
不過,AlphaGo其實(shí)早已不再是專家系統(tǒng),而是如今炙手可熱的神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)。
神經(jīng)網(wǎng)絡(luò)的誕生并不比專家系統(tǒng)更晚,同樣在人工智能誕生的五十年代,模仿人類大腦通過計(jì)算機(jī)搭建神經(jīng)網(wǎng)絡(luò),讓機(jī)器能夠自主學(xué)習(xí)就已經(jīng)被提出。不過在此后的半個多世紀(jì),沒有足夠強(qiáng)大的硬件和充足的數(shù)據(jù)庫,基于神經(jīng)網(wǎng)絡(luò)的人工智能雖然從未中斷,卻鮮有建樹。
七八十年代,正是IBM最輝煌的一段時期,IBM內(nèi)部有一大批人工智能相關(guān)的項(xiàng)目在推進(jìn)。其中Jelinek領(lǐng)導(dǎo)了一直很不起眼的小團(tuán)隊(duì),單獨(dú)開發(fā)了一套基于統(tǒng)計(jì)概率的語音識別系統(tǒng),這與當(dāng)時大量聘請語言學(xué)專家的專家系統(tǒng)背道而馳。有趣的是,并不是這個團(tuán)隊(duì)有多么高明的遠(yuǎn)見。Jelinek領(lǐng)導(dǎo)的團(tuán)隊(duì)只是IBM內(nèi)部一直不是特別起眼的小團(tuán)隊(duì),在專家系統(tǒng)火熱的當(dāng)時,這個團(tuán)隊(duì)小到甚至請不起想要的語言學(xué)專家。
陰差陽錯的,他們開發(fā)的系統(tǒng)識別準(zhǔn)確率,甚至超過了不少專家系統(tǒng)。這個系統(tǒng)框架對至今的語音和語言處理都有著深遠(yuǎn)的影響,可惜要等到二十多年后這個發(fā)明才得到廣泛的應(yīng)用。2006年,Hinton在卷積神經(jīng)網(wǎng)絡(luò)領(lǐng)域取得了新的突破,人工智能才終于在此后幾年間迎來了第三次高潮。
當(dāng)然除了個人的成果,時代的發(fā)展才是促使人工智能高潮的更大原因。2010年前后,芯片算力已經(jīng)發(fā)展到上世紀(jì)無法比擬的高度。1982年拍攝《霹靂游俠》時,對智能汽車KITT那每秒運(yùn)算可達(dá)10億次的CPU和5000兆字節(jié)容量的數(shù)據(jù)庫已經(jīng)是人們想象中無敵的存在,如今連最普通的入門智能手機(jī)都已經(jīng)超越了其性能,更別說今天智能汽車需要的硬件水平了。
同時移動互聯(lián)網(wǎng)帶來的社交媒體熱潮,無意間在互聯(lián)網(wǎng)上累積了海量的數(shù)據(jù)。網(wǎng)絡(luò)上海量的經(jīng)過標(biāo)記的數(shù)據(jù),給深度學(xué)習(xí)的發(fā)展帶來了優(yōu)渥的環(huán)境。
如今基于卷積神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)的人工智能程序,人類不再干預(yù)計(jì)算機(jī)的思考,而是“喂”給計(jì)算機(jī)大量的數(shù)據(jù),讓計(jì)算機(jī)自己去學(xué)習(xí)、分析。此時計(jì)算機(jī)不是被人的思維左右,而是形成計(jì)算機(jī)獨(dú)立的認(rèn)知概念。
我們再回到開頭的“貓”的問題,社交平臺上無數(shù)的“貓奴”,每天上傳巨量的貓主子圖片。把這些帶有貓標(biāo)記的圖片處理后統(tǒng)統(tǒng)“喂”給人工智能系統(tǒng),人工智能便能夠輕松的判斷,圖片里是不是有一只貓。只是就算開發(fā)他的工程師,也并不完全清楚,她到底掌握了哪些具體特征進(jìn)行的識別。
這樣的人工智能其實(shí)并不具備類似人類的“意識”,現(xiàn)在發(fā)展的人工智能短期內(nèi)也無需擔(dān)心機(jī)器“覺醒”的問題。僅僅是基于大量的數(shù)據(jù)總結(jié)歸納,形成機(jī)器獨(dú)有的一套邏輯。“喂”給機(jī)器的數(shù)據(jù)要多,但也不能過量,超量的數(shù)據(jù)可能會讓系統(tǒng)過擬合,反而影響了性能。
說了這么多,還沒有回到最初的問題,自動駕駛汽車是如何認(rèn)路的?
很顯然,如今的自動駕駛汽車也是基于卷積神經(jīng)網(wǎng)絡(luò)開發(fā)的人工智能系統(tǒng),包含了感知-決策-規(guī)劃-控制等,其中首要的便是感知,也就是我們說的看路。自動駕駛需要看到并認(rèn)識前方的道路和路上的潛在障礙物才能夠執(zhí)行后續(xù)的操作。
訓(xùn)練負(fù)責(zé)自動駕駛的算法,同樣需要海量的相關(guān)數(shù)據(jù)作為支撐。我們之前多次討論過關(guān)于自動駕駛純視覺路線和多傳感器融合路線的優(yōu)劣,不過對于算法的訓(xùn)練,照片和視頻顯然是最為易得也最容易進(jìn)行標(biāo)記的數(shù)據(jù)。大家可以想象一下對激光雷達(dá)甚至毫米波雷達(dá)這種并非人類正常感知的數(shù)據(jù)進(jìn)行標(biāo)記有多復(fù)雜。這也是為什么,即便是多傳感器融合路線,攝像頭依舊是感知硬件中的YYDS了。
在我們普通人的認(rèn)知中,人工智能必然是十分高科技的一個行業(yè)。其中一部分工種當(dāng)然是,但這也是一個勞動密集型的產(chǎn)業(yè)。“喂”給自動駕駛算法的數(shù)據(jù)并非隨便從網(wǎng)上批量下載就可以,需要有大量的測試人員進(jìn)行專業(yè)的數(shù)據(jù)采集,還需要有海量的標(biāo)注員對圖片進(jìn)行標(biāo)記,對照片中的行人、路障等等障礙物進(jìn)行標(biāo)記,之后才能夠“喂”給算法進(jìn)行深度學(xué)習(xí)。
這樣的模式不僅吃力,并且精度緩慢。于是人們又想到了讓機(jī)器對機(jī)器進(jìn)行訓(xùn)練,被稱為“無監(jiān)督學(xué)習(xí)算法”。在獲得一定數(shù)量的數(shù)據(jù)后,機(jī)器就可以完成對常規(guī)數(shù)據(jù)的自行標(biāo)記,再用機(jī)器標(biāo)記的數(shù)據(jù)訓(xùn)練更多的人工智能算法,這也幫助了如今人工智能的飛速進(jìn)步。
而人們不得不面對的另一個難題是自動駕駛的“長尾效應(yīng)”,自動駕駛?cè)粘S?xùn)練中獲得的大量數(shù)據(jù)已經(jīng)解決了日常常見的絕大多數(shù)頭部場景中的潛在風(fēng)險(xiǎn),但那些不受重視的突發(fā)場景極為罕見,但種類繁多,日常中很難采集到足夠的數(shù)據(jù)樣本對自動駕駛進(jìn)行訓(xùn)練,但因此累計(jì)的總量也已經(jīng)對自動駕駛的安全性構(gòu)成了很大的威脅。
以特斯拉為例,在2021年“AI DAY”上,特斯拉介紹了一些罕見場景,例如一起前方卡車卷起的風(fēng)雪遮擋前方車輛的極端案例。為了解決這一現(xiàn)實(shí)中并不多見,但發(fā)生時會異常危險(xiǎn)的事件,特斯拉利用超級計(jì)算機(jī)模擬更多的類似場景多神經(jīng)網(wǎng)絡(luò)進(jìn)行了大量訓(xùn)練。特斯拉日常解決的這類“長尾”場景遠(yuǎn)不是個例。馬斯克介紹說,他們會模擬各種能想到的罕見案例,甚至包括了“城市道路出現(xiàn)悠哉散步的麋鹿”,乃至“飛碟墜落”這種完全不可能發(fā)生的奇特危險(xiǎn)。
但另一個難題是如何發(fā)現(xiàn)這類罕見場景,特斯拉在AI DAY上透露,特斯拉搜集在Autopilot駕駛時,駕駛員突然介入改為人工駕駛的場景,這類場景普遍是自動駕駛目前尚不能完全解決意外情況。特斯拉會利用超級計(jì)算機(jī)分析這個視頻案例,找出駕駛員中斷Autopilot的原因。又或者司機(jī)在高速路上突然剎車、堵車時有人插隊(duì)、雷達(dá)與攝像頭判斷結(jié)果不一致、車輛發(fā)生事故/險(xiǎn)些發(fā)生事故等等,將這些具體的案例,交給超級計(jì)算機(jī)來分析處理,然后重復(fù)前文提到的模擬同類場景訓(xùn)練。
從二十世紀(jì)五十年代人工智能概念被提出,歷經(jīng)七十余年,經(jīng)歷了三起兩落的發(fā)展,人工智能終于取得了長足的進(jìn)步。自動駕駛是人工智能應(yīng)用的熱門場景之一。當(dāng)然人工智能目前尚不完善,自動駕駛也難免遭遇一些尷尬,但其實(shí)現(xiàn)方式?jīng)Q定了這就是一條需要不斷積累、試錯的歷程??萍紡膩聿皇且货矶偷?,也就是在這些尷尬的失誤幫助下,才能不斷成長。(文:太平洋汽車網(wǎng) 郭睿)
>>點(diǎn)擊查看今日優(yōu)惠<<