百度王亮:純視覺“通吃”,用AI原生思維重構(gòu)自動(dòng)駕駛視覺感知技術(shù)
1月15日,極越01迎來交付以來的首次重大整車OTA升級(jí),百度Apollo與極越聯(lián)合研發(fā)的OCC占用網(wǎng)絡(luò)(Occupancy Network)功能提前體驗(yàn)是此次OTA升級(jí)的最大亮點(diǎn)。極越01也將通過V1.3版本陸續(xù)升級(jí)該技術(shù),屆時(shí)將形成以“BEV+OCC+Transformer”的高階智駕的完整體系,大幅提升“純視覺”智駕方案應(yīng)對(duì)異形障礙物識(shí)別和場(chǎng)景泛化的能力。
作為“純視覺”方案的核心技術(shù)之一,OCC占用網(wǎng)絡(luò)是一種基于深度學(xué)習(xí)的三維重建方法。為了讓智能汽車更好地感知世界,OCC占用網(wǎng)絡(luò)通過一個(gè)個(gè)像素立方體,將實(shí)時(shí)變化的真實(shí)世界在3D空間里進(jìn)行實(shí)時(shí)重建,并將汽車視覺世界里各種不規(guī)則的物體,如障礙物、道路、建筑,甚至花草樹木,快速、精準(zhǔn)地完成等比例復(fù)刻,顯著增強(qiáng)智能汽車?yán)斫庵車h(huán)境的能力。
這也意味著,與傳統(tǒng)感知方案相比,OCC占用網(wǎng)絡(luò)功能加持下,智能汽車具備看到的世界精度更精準(zhǔn)、異形障礙物識(shí)別更精準(zhǔn),距離感知更精準(zhǔn)、立體空間感知更精準(zhǔn)等優(yōu)勢(shì)。
(百度智能駕駛事業(yè)群組(IDG)首席研發(fā)架構(gòu)師,IDG技術(shù)委員會(huì)主席王亮)
“OCC占用網(wǎng)絡(luò)補(bǔ)上了極越‘純視覺’技術(shù)方案的最后一塊拼圖,極越01初步具備通用視覺障礙物檢測(cè)的能力,后續(xù)通過持續(xù)使用、數(shù)據(jù)輸入、產(chǎn)線不斷地迭代和精進(jìn),極越01的感知能力還會(huì)以肉眼可見的速度增強(qiáng)。我們希望未來所有自動(dòng)駕駛感知相關(guān)的問題,都能用純視覺大模型來解決。”在極越汽車機(jī)器人進(jìn)化日上,百度智能駕駛事業(yè)群組(IDG)首席研發(fā)架構(gòu)師,IDG技術(shù)委員會(huì)主席王亮分享了百度 Apollo“純視覺”高階智能駕駛方案的最新技術(shù)和實(shí)踐。
基于百度Apollo的技術(shù)賦能,依托“BEV+OCC+Transformer”的高階智駕的完整體系,極越01能夠?qū)崿F(xiàn)對(duì)障礙物更加精細(xì)的刻畫,3D精度可以做到厘米級(jí),比肩甚至超過激光雷達(dá)精度。
隨著純視覺技術(shù)方案的上車應(yīng)用,智能駕駛也將進(jìn)一步擺脫“硬件堆料”,降低城區(qū)高階智能駕駛功能的上車成本,加速城區(qū)高階智能駕駛功能普及。
“從推出國(guó)內(nèi)第一個(gè)純視覺BEV+Transformer動(dòng)態(tài)障礙物感知技術(shù),到此次國(guó)內(nèi)首發(fā)OCC占用網(wǎng)絡(luò)技術(shù),整套純視覺方案在極越01的全面落地的背后,是百度在AI視覺大模型領(lǐng)域的高強(qiáng)度研發(fā)投入和業(yè)內(nèi)天花板級(jí)別的高精度數(shù)據(jù)訓(xùn)練。”王亮表示。
在百度Apollo的技術(shù)生態(tài)中,有超過7000萬(wàn)公里的高質(zhì)量的Robotaxi原始數(shù)據(jù)積累,打下了“純視覺技術(shù)方案”的“冷啟動(dòng)”數(shù)據(jù)基礎(chǔ)。依托百度AI超過170億參數(shù)的視覺大模型、高標(biāo)準(zhǔn)的自動(dòng)化標(biāo)注產(chǎn)線實(shí)現(xiàn)日均產(chǎn)能過百萬(wàn)(幀)、高質(zhì)量標(biāo)注數(shù)據(jù)BEV+OCC精標(biāo)訓(xùn)練數(shù)據(jù)過億(幀),大幅提升數(shù)據(jù)處理效率和精度。同時(shí),百度和極越已基于近2EFLOPS高算力訓(xùn)練集群,實(shí)現(xiàn)模型高效訓(xùn)練、每周快速迭代。
未來,隨著AI技術(shù)的持續(xù)演進(jìn)和大模型的應(yīng)用,“純視覺”技術(shù)路線將成為未來高階智能駕駛的全行業(yè)共性發(fā)展趨勢(shì)。百度Apollo也將把多年積累的AI能力以及L4自動(dòng)駕駛能力應(yīng)用在量產(chǎn)乘用車領(lǐng)域,加速城區(qū)高階智能駕駛功能的普及。
>>點(diǎn)擊查看今日優(yōu)惠<<