沒有人喜歡在紅燈前等待。但有信號燈的十字路口對司機(jī)來說不僅僅是個小麻煩,并且車輛在等待信號燈變化時(shí)會存在浪費(fèi)燃料以及排放溫室氣體的情況。如果駕駛者可以精確地安排他們的行程從而使他們每次都能直接通過紅綠燈會怎么樣呢?
雖然這可能只是人類司機(jī)在特別幸運(yùn)的情況下發(fā)生,但它可以也由使用AI控制其速度的自主車輛更穩(wěn)定地實(shí)現(xiàn)。
在一項(xiàng)新研究中,麻省理工學(xué)院(MIT)的科學(xué)家們展示了一種機(jī)器學(xué)習(xí)的方法。該方法可以學(xué)習(xí)控制一隊(duì)自主車輛,當(dāng)它們接近并通過一個有信號燈的十字路口時(shí)能夠保持交通順暢。
根據(jù)模擬結(jié)果,他們的方法可以減少燃料消耗和排放,與此同時(shí)還能提高平均車速。如果道路上的所有汽車都是自主的,那么該技術(shù)就會得到最好的結(jié)果,但即使只有25%的汽車使用他們的控制算法,它仍會帶來巨大的燃料和排放效益。
“這是一個非常有趣的地方,它可以進(jìn)行干預(yù)。沒有人的生活會因?yàn)樗麄儽欢略谝粋€十字路口而變得更好。在很多其他氣候變化干預(yù)措施中有一個預(yù)期的生活質(zhì)量差異,所以那里有一個進(jìn)入的障礙,”這項(xiàng)研究的論文高級作者Cathy Wu指出。據(jù)悉,他是土木與環(huán)境工程系Gilbert W. Winslow職業(yè)發(fā)展助理教授,也是數(shù)據(jù)、系統(tǒng)和社會研究所(IDSS)和信息與決策系統(tǒng)實(shí)驗(yàn)室(LIDS)的成員。
LIDS和電氣工程與計(jì)算機(jī)科學(xué)系的研究生Vindula Jayawardana都是該研究的論文第一作者。該研究將在歐洲控制會議上發(fā)表。
錯綜復(fù)雜的十字路口
雖然人類可能會不假思索地駛過綠燈,但十字路口可能會出現(xiàn)數(shù)十億種不同的情況,具體取決于車道的數(shù)量、信號燈的運(yùn)作方式、車輛的數(shù)量和速度、行人和騎車人的存在等等。
解決交叉口控制問題的典型方法是使用數(shù)學(xué)模型來解決一個簡單、理想的交叉口。這在紙面上看起來不錯,但在現(xiàn)實(shí)世界中很可能站不住腳,因?yàn)槟抢锏慕煌J酵腔靵y的。
對此,Wu和Jayawardana換了個角度思考,他們用一種被稱為深度強(qiáng)化學(xué)習(xí)的無模型技術(shù)來處理這個問題。強(qiáng)化學(xué)習(xí)是一種試驗(yàn)和錯誤的方法,控制算法學(xué)習(xí)做出一系列的決定。當(dāng)它找到一個好的序列時(shí)它就會得到獎勵。通過深度強(qiáng)化學(xué)習(xí),算法利用神經(jīng)網(wǎng)絡(luò)學(xué)到的假設(shè)找到通往良好序列的捷徑--即使有數(shù)十億的可能性。
這對于解決像這樣的長線問題很有用。Wu指出,控制算法必須在一個較長的時(shí)間段內(nèi)向車輛發(fā)出500條以上的加速指令。另外她還補(bǔ)充道:“而且我們必須在我們知道我們已經(jīng)很好地緩解了排放并以良好的速度到達(dá)十字路口之前得到正確的順序。”
不過這里還存在一個問題,那就是研究人員想讓系統(tǒng)能學(xué)習(xí)一種策略以減少燃料消耗并限制對旅行時(shí)間的影響。這些目標(biāo)可能是相互沖突的。
“為了減少旅行時(shí)間,我們希望汽車開得快,但為了減少排放,我們希望汽車慢下來或根本不動。這些相互競爭的獎勵可能會讓學(xué)習(xí)代理人感到非常困惑,”Wu說道。
雖然解決這個問題的普遍性很有挑戰(zhàn)性,但研究人員采用了一種被稱為獎勵塑造的技術(shù)來進(jìn)行變通。通過獎勵塑造,他們給系統(tǒng)一些它自己無法學(xué)習(xí)的領(lǐng)域知識。在這種情況下,每當(dāng)車輛完全停止時(shí),他們就對系統(tǒng)進(jìn)行懲罰,這樣它就會學(xué)會避免這種行為。
交通測試
一旦研究人員開發(fā)出一種有效的控制算法,他們就會使用一個具有單一交叉口的交通模擬平臺對其進(jìn)行評估。該控制算法被應(yīng)用于一個由聯(lián)網(wǎng)的自主車輛組成的車隊(duì),這些車輛可以跟即將到來的交通信號燈進(jìn)行通信以接收信號燈的相位和時(shí)間信息并觀察其周圍環(huán)境。該控制算法告訴每輛車如何加速和減速。
當(dāng)車輛接近十字路口時(shí),他們的系統(tǒng)并沒有造成任何走走停停的交通。在模擬中,更多的汽車在單一綠燈階段通過,這超過了模擬人類司機(jī)的模型。當(dāng)跟其他同樣旨在避免走走停停的交通的優(yōu)化方法相比,他們的技術(shù)帶來了更大的燃料消耗和排放減少。如果路上的每輛車都是自主的,那么他們的控制系統(tǒng)可以減少18%的燃料消耗和25%的二氧化碳排放,與此同時(shí)將行駛速度提高20%。
Wu表示:“一次干預(yù)有20%至25%的燃料或排放減少,這真的令人難以置信。但我覺得有趣的是,也是我真正希望看到的,是這種非線性的比例。如果我們只控制25%的車輛,這給我們帶來50%的燃料和排放減少的好處。這意味著我們不必等到我們達(dá)到100%的自動駕駛車輛才能從這種方法中獲益?!?/p>
接下來,研究人員希望研究多個交叉口之間的互動效應(yīng)。另外,他們還計(jì)劃探索不同的交叉口設(shè)置如車道數(shù)量、信號燈、計(jì)時(shí)等如何影響出行時(shí)間、排放和燃料消耗。此外,他們還打算研究當(dāng)自動駕駛車輛和人類司機(jī)共享道路時(shí)他們的控制系統(tǒng)會如何影響安全。
雖然這項(xiàng)工作仍處于早期階段,但Wu認(rèn)為這種方法在近期內(nèi)可以更可行地實(shí)施。
(舉報(bào))