雷鋒網(wǎng)新智駕按:4月24日,雷鋒網(wǎng)新智駕聯(lián)合MMC在2017年上海車展舉辦“構(gòu)建智能駕駛的關(guān)鍵”主題沙龍,本文來(lái)自清華大學(xué)自動(dòng)化系統(tǒng)工程研究所教授姚丹亞的分享。本文講述了V2X技術(shù)在自動(dòng)駕駛中的一個(gè)重要應(yīng)用場(chǎng)景,即自動(dòng)駕駛汽車在路口會(huì)車時(shí)的通行決策問(wèn)題。
*清華大學(xué)自動(dòng)化系統(tǒng)工程研究所教授姚丹亞在上海車展新智駕&MMC沙龍現(xiàn)場(chǎng)
有一篇來(lái)自清華大學(xué)的論文名叫《基于完全信息動(dòng)態(tài)博弈的無(wú)燈控交叉口的車輛協(xié)同駕駛模型》(作者:楊卓,姚丹亞),它試著解決了一個(gè)可能很多人都想過(guò)但還沒(méi)有解決的問(wèn)題,那就是使自動(dòng)駕駛汽車在路口會(huì)車時(shí)相互協(xié)調(diào),最終彼此配合完成通行決策。
你可以將它看作V2X助力自動(dòng)駕駛決策的應(yīng)用之一。對(duì)于V2X對(duì)自動(dòng)駕駛的作用,人們談得更多的是V2X在環(huán)境感知中的作用,即除汽車自身的傳感器感知外,借助V2X完成更大范圍的環(huán)境感知。
但V2X還有一個(gè)重要作用,就是協(xié)同決策。目前我們能做到在自主感知的基礎(chǔ)上決策,但V2X環(huán)境使“群決策”成為可能,在可能在未來(lái)會(huì)是自動(dòng)駕駛中的一個(gè)重要應(yīng)用。
如何基于V2X實(shí)現(xiàn)群決策?
以一個(gè)具體的場(chǎng)景為例,即無(wú)信號(hào)交叉路口的車車協(xié)同。兩輛車抵達(dá)路口,在沒(méi)有控制中心的情況下,聽誰(shuí)的?它們之間是一個(gè)博弈的關(guān)系,要通過(guò)博弈,保證雙方安全又順利地通過(guò)交叉路口。
首先,做一個(gè)簡(jiǎn)單的場(chǎng)景描述。
1、存在參與車輛,左邊駛來(lái)一輛車,下方駛來(lái)一輛車,已知彼此的速度、加速度和位置,以及達(dá)到路口會(huì)車點(diǎn)的距離。
2、路口為無(wú)信號(hào)交叉路口,即在沒(méi)有信號(hào)燈控制。
3、存在V2X環(huán)境,車車間可以進(jìn)行交互。
以上是前提假設(shè)。接下來(lái)將問(wèn)題拆分。
第一,判斷車輛間是否存在沖突。我們選擇一個(gè)指標(biāo)來(lái)描述這個(gè)沖突,這個(gè)指標(biāo)就叫作“沖突時(shí)間差”,即兩輛車到達(dá)沖突點(diǎn)的時(shí)間差值。該差值越小,就越有可能相撞,如為零則相撞,如差值很大,則代表在完全不同的時(shí)刻通過(guò)交叉點(diǎn),定不會(huì)相撞。
第二,如果存在沖突,如何提前避免。在這個(gè)部分要考慮的因素很多,為了保證安全,當(dāng)兩輛車存在沖突時(shí),需要用一個(gè)算法保證它們最后不相撞。因此,二者通過(guò)路口可以看成一個(gè)博弈問(wèn)題。博弈包括三個(gè)要素。
要素一:對(duì)象,要存在博弈雙方,此處的對(duì)象是車輛。
要素二:策略,忽略具體的油門、剎車等不同操作,用一個(gè)“加速度”來(lái)作為各種操作的表現(xiàn)形式,加速度構(gòu)成了策略。
要素三:收益,需要定義博弈的收益。我們?cè)谀P屠锒x了三種收益,即安全、快速、舒適。安全是首要需求,即不能撞車;快速指的是使車輛盡快通過(guò)路口;舒適指符合人的駕駛習(xí)慣,不能過(guò)度加速和減速,保證駕駛舒適。
以上就是一些決策的基本場(chǎng)景假設(shè)。
基于此,兩輛車的路口博弈在數(shù)學(xué)上可以看作一個(gè)有約束的多目標(biāo)規(guī)劃問(wèn)題。即,將不同加速度組合的情況下,使獲得的收益“Ω”達(dá)到最大。其中涉及一些數(shù)學(xué)問(wèn)題,如多重納什均衡、求最優(yōu)解等,我們?cè)谶@個(gè)模型中是用遺傳算法求取最優(yōu)解。
下面就具體地來(lái)計(jì)算這個(gè)問(wèn)題。
對(duì)于兩輛車,首先要判斷其是否進(jìn)入沖突區(qū)。博弈系統(tǒng)的實(shí)例模型如下所示,紅點(diǎn)表示沖突點(diǎn)(碰撞的點(diǎn)),通過(guò)車輛到達(dá)沖突點(diǎn)的時(shí)間差判斷是否進(jìn)入沖突區(qū)域。
*出自該模型作者曾發(fā)表的論文
若兩輛車并未進(jìn)入沖突區(qū),則不需要博弈,正常行駛即可。一旦進(jìn)入沖突區(qū),博弈即開始,通過(guò)博弈使得收益最大。前面講到三個(gè)收益指標(biāo)(安全、快速、舒適),此時(shí)就要具體定義這三個(gè)指標(biāo)。
1、安全性指標(biāo)。安全性指標(biāo)指已到達(dá)沖突點(diǎn)的時(shí)間差,在這個(gè)模型中,該差值一定要大于某個(gè)給定的閾值,才能確保安全。這個(gè)公式比較簡(jiǎn)單,基本是中學(xué)時(shí)候關(guān)于距離、速度、時(shí)間的簡(jiǎn)單公式。
2、快速性指標(biāo)。指的是兩個(gè)周期內(nèi)速度的變化,是當(dāng)前時(shí)刻加速度值的直接反應(yīng)。
3、舒適性指標(biāo)。舒適性指標(biāo)其實(shí)可以直接用加速度的絕對(duì)值來(lái)表示,絕對(duì)值越大,舒適型越差,在這個(gè)模型中我們基本選擇0.25g加速度指標(biāo)來(lái)進(jìn)行博弈。當(dāng)然,前提還是要安全,如果要發(fā)生碰撞了,那么舒適性指標(biāo)是可以犧牲的。此外,舒適性指標(biāo)也定義了一些不良加速度行為,如加速度增幅達(dá)到200%,或是該加速時(shí)變成反向加速度等。
對(duì)于以上三個(gè)收益值,需要做一個(gè)標(biāo)準(zhǔn)化的工作。三種數(shù)據(jù)的量綱不同,有的是時(shí)間,有的是加速度,如何求和呢?這其中就涉及到標(biāo)準(zhǔn)化問(wèn)題。這里不具體解釋,基本的計(jì)算方法是將當(dāng)前值減去期望值除以標(biāo)準(zhǔn)差。最后,需要用到遺傳算法,盡可能得到全局最優(yōu)解。
仿真實(shí)驗(yàn)
對(duì)于這套理論,我們還沒(méi)有用在實(shí)車控制中,只是進(jìn)行了仿真實(shí)驗(yàn)。這是個(gè)具體的仿真例子。兩輛車初始速度分別為60km/h和50km/h,距離沖突點(diǎn)的距離分別為250米和150米,設(shè)定約束條件:最大速度不能超過(guò)70km/h,最小速度是零(即停車),加速度值控制在±0.3g之間。用于求解的遺傳算法在此不贅述,它主要用于獲得最優(yōu)解的。下圖,是兩車路口會(huì)車的仿真實(shí)驗(yàn)結(jié)合曲線圖。
*出自該模型作者曾發(fā)表的論文
從上圖可以看出,這次仿真實(shí)驗(yàn)得到了蠻有意思的結(jié)果。在這個(gè)場(chǎng)景下,兩輛車出現(xiàn)了兩次博弈的過(guò)程。第一次,計(jì)算得出到?jīng)_突點(diǎn)的時(shí)間差小于給定閾值,進(jìn)行了一輪博弈后,沖突危險(xiǎn)解除,判斷安全后又開始自由駕駛;自由駕駛一段時(shí)間以后又進(jìn)入了一次博弈過(guò)程,最后直到車輛安全通過(guò)路口。
上面的圖給出了許多博弈曲線。第一排曲線是收益曲線,紅色、藍(lán)色代表兩輛車分別的收益,綠色表示兩輛車的總收益。第二排是加速度曲線,拿加速度曲線來(lái)說(shuō),博弈的效果不是特別好,因?yàn)樘鴦?dòng)很大,博弈算法還有些需要完善的地方。第三排是速度曲線。
最后一排的碰撞時(shí)間差(TDTC)。我們?yōu)門DTC設(shè)置一個(gè)閾值,當(dāng)TDTC小于閾值的時(shí)候,就會(huì)告知存在碰撞風(fēng)險(xiǎn),開始博弈。而這個(gè)過(guò)程是變化的,一旦TDTC超出閾值,就證明沒(méi)有風(fēng)險(xiǎn),雙方就可以自由駕駛。最后車輛安全駛離交通路口,這是一個(gè)完整的博弈過(guò)程。
在一些具體參數(shù)上,主要考慮三點(diǎn)。
第一,收益。如圖,對(duì)于第一輛車而言,它得到的是負(fù)收益,第二輛車是正收益,我們的博弈規(guī)則,是將二者相加,盡量使得整體收益最大。
第二,高速度占比和不良加速度。
第三,收益函數(shù)的系數(shù)。這是一個(gè)很重要的參數(shù),這個(gè)系數(shù)會(huì)直接影響最后博弈的效果。具體的確定的方法,我認(rèn)為是值得研究的。比如,α大是更強(qiáng)調(diào)安全,β大是強(qiáng)調(diào)快速性,γ大是強(qiáng)調(diào)舒適性,看你如何選擇評(píng)估方式。
總結(jié)
該模型的研究,考慮到了駕駛安全、舒適等指標(biāo)之間的博弈和決策,避免碰撞是最重要的部分,同時(shí)也要盡可能避免那些降低舒適性的操作。未來(lái),通過(guò)豐富策略集,可以在模型的基礎(chǔ)上,有更多方向、更多方式的相關(guān)研究。
同時(shí),群決策算法是一個(gè)亮點(diǎn)。剛才只是兩輛車的模型,我們的博士生還在研究路口多車博弈的通用模型。
當(dāng)然,我們現(xiàn)在的實(shí)驗(yàn)還在仿真基礎(chǔ)上,不過(guò)也在做一些實(shí)用的產(chǎn)品。我們課題組和一個(gè)叫作星云互聯(lián)的公司合作,開發(fā)了一些V2X的產(chǎn)品,如智能車載終端、路側(cè)通信機(jī)、路側(cè)主機(jī)等,其中內(nèi)置了多種通信模塊,支持多種通信方式接入,完成車車、車路之間的數(shù)據(jù)交互。目前我們的產(chǎn)品,主要應(yīng)用在各種自動(dòng)駕駛和智能駕駛測(cè)試場(chǎng),同時(shí),還推出了了一些實(shí)際應(yīng)用。例如我們?cè)谛@公交系統(tǒng)中裝入了路側(cè)系統(tǒng)、校園公交車上安裝了車載裝置,用以測(cè)試和積累數(shù)據(jù)。此外,我們還在蕪湖交警支隊(duì)的支持下,在中心城區(qū)路口建設(shè)了V2X基礎(chǔ)設(shè)施。之后,我們還和很多的企業(yè)和測(cè)試場(chǎng)開展更多的合作,在實(shí)際的項(xiàng)目中進(jìn)行測(cè)試。
- 蜜度索驥:以跨模態(tài)檢索技術(shù)助力“企宣”向上生長(zhǎng)
- 預(yù)計(jì)2024年中國(guó)折疊屏手機(jī)出貨量將達(dá)910萬(wàn)部,華為占據(jù)半數(shù)份額
- Counterpoint:59%的受訪者計(jì)劃在一年內(nèi)升級(jí)到Gen AI智能手機(jī)
- 美國(guó)ITC裁定聯(lián)想智能手機(jī)侵犯愛立信專利
- 英特爾高通隔空叫陣:兩大巨頭在較什么勁?
- IDC最新預(yù)測(cè):2024年P(guān)C和平板電腦市場(chǎng)將增長(zhǎng)3.8%至4.035億臺(tái)
- 蘋果Vision Pro頭顯即將登陸中國(guó)臺(tái)灣,12月17日正式發(fā)售
- 全球折疊屏手機(jī)出貨量首次遭遇季度下滑,三星旗艦機(jī)型表現(xiàn)不佳是主因
- HUAWEI Mate X6 震撼登場(chǎng),折疊引領(lǐng)者,巔峰再跨越
- 五年持續(xù)領(lǐng)跑,華為折疊屏一步領(lǐng)先,一路領(lǐng)先
- 全新HUAWEI MatePad Pro 13.2 英寸首發(fā)亮相,鴻蒙專業(yè)生產(chǎn)力體驗(yàn)再升級(jí)
免責(zé)聲明:本網(wǎng)站內(nèi)容主要來(lái)自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準(zhǔn)確性及可靠性,但不保證有關(guān)資料的準(zhǔn)確性及可靠性,讀者在使用前請(qǐng)進(jìn)一步核實(shí),并對(duì)任何自主決定的行為負(fù)責(zé)。本網(wǎng)站對(duì)有關(guān)資料所引致的錯(cuò)誤、不確或遺漏,概不負(fù)任何法律責(zé)任。任何單位或個(gè)人認(rèn)為本網(wǎng)站中的網(wǎng)頁(yè)或鏈接內(nèi)容可能涉嫌侵犯其知識(shí)產(chǎn)權(quán)或存在不實(shí)內(nèi)容時(shí),應(yīng)及時(shí)向本網(wǎng)站提出書面權(quán)利通知或不實(shí)情況說(shuō)明,并提供身份證明、權(quán)屬證明及詳細(xì)侵權(quán)或不實(shí)情況證明。本網(wǎng)站在收到上述法律文件后,將會(huì)依法盡快聯(lián)系相關(guān)文章源頭核實(shí),溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。