本文介紹了waymo行為預(yù)測算法VectorNet。
在交通場景中,各個道路使用者(車輛、自行車、行人等)的行為充滿了不確定性,對于這些行為的預(yù)測也應(yīng)是概率的而非確定性的。
優(yōu)秀駕駛員的關(guān)鍵素質(zhì)之一是能夠預(yù)見和預(yù)測道路上其他人可能會做什么。例如,另一輛車并入我們的車道或我們前面的騎自行車的人左轉(zhuǎn)的可能性是多少?能夠準(zhǔn)確預(yù)測其他道路使用者的意圖的能力,可以使無人車做出最安全的決策。
其他道路參與者的行為往往很難預(yù)測,通常需要對交通場景有一個整體的了解,包括車道的寬度,四向交叉路口規(guī)則,交通信號燈和標(biāo)志等。
預(yù)測模塊往往要承接感知、定位、地圖模塊,通過預(yù)測算法,可以給出障礙物未來的運動軌跡,輸出給下游規(guī)劃模塊。
盡管行為預(yù)測大致思路是相同的,但是不同研究者在算法等方面的考量還是有很大差別的。本文來介紹一下Waymo是如何做的。
Waymo通過高精地圖與傳感器的實時信息相結(jié)合,為車輛提供語義環(huán)境。其他道路使用者的行為通常很復(fù)雜,并且很難用一組基于地圖的交通規(guī)則來描述,因為駕駛模式在不同位置之間會有所不同,并且其他道路使用者可能會違反這些規(guī)則。所以,需要通過機器學(xué)習(xí)來使系統(tǒng)學(xué)習(xí)新的行為類型來建模并降低這種復(fù)雜性。
而研究駕駛行為預(yù)測,必然涉及道路網(wǎng)絡(luò)建模,即道路的拓?fù)浣Y(jié)構(gòu)。
將高度詳細(xì)的地圖合并到行為預(yù)測模型中的最流行方法是通過將地圖渲染為像素并使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)對場景信息(例如交通標(biāo)志,車道和道路邊界)進(jìn)行編碼。但是,此過程需要大量的計算和時間。此外,將地圖作為圖像處理會給建模長距離幾何圖形(例如前方合并的車道)帶來挑戰(zhàn),這會影響預(yù)測的質(zhì)量。
為了解決這些痛點并更好地預(yù)測他人的行為以做出更好的決策,Waymo 開發(fā)了一種新的模型VectorNet,與CNN相比,該模型可提供更準(zhǔn)確的行為預(yù)測,同時使用更少的計算量。
VectorNet如何啟用Waymo驅(qū)動程序
地圖要素和傳感器輸入都可以簡化為點,多邊形或曲線。例如,車道邊界包含多個建立樣條曲線的控制點;人行橫道是由多個點定義的多邊形;停車標(biāo)志由單點表示。曲線,多邊形和點都可以近似表示為包含多個控制點的折線。折線進(jìn)一步分成矢量片段。這樣,我們可以將所有道路特征和其他對象的軌跡表示為此類矢量的集合。借助這種簡化的視圖,waymo著手設(shè)計了一種可以有效處理傳感器和地圖輸入的網(wǎng)絡(luò)。
這是一種新穎的層次圖神經(jīng)網(wǎng)絡(luò):在第一級(由折線子圖組成)中,VectorNet 收集每條折線內(nèi)的信息;在第二層(稱為全局交互圖)中,VectorNet 在折線之間交換信息。
12下一頁>(免責(zé)聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請進(jìn)一步核實,并對任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負(fù)任何法律責(zé)任。
任何單位或個人認(rèn)為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。 )