近年來人工智慧在軟硬體技術的突飛猛進與各領域應用的迅速發展,可預期未來運用人工智慧、影像辨識、資通訊(ICT)、車聯網(V2X)與5G等技術,特別有助於紓緩因交通號誌控制不夠智慧,導致民眾行的痛點。本計畫延續111年「我國人工智慧車聯網之號誌控制模式探討」之研究計畫,進行與縣市政府合作之現場實驗測試,實作測試過程中視需求持續精進人工智慧號誌控制模式,透過強化學習通用環境之探討與建置、導入多目標強化學習演算法、以及探討車流模擬測試模型於各種車流場景之泛用性,期望能提升人工智慧號誌控制模式之運作效率。此外,同時納入高速公路匝道儀控之人工智慧號誌控制課題與相關模擬模式發展探討,優先構建交流道區域號誌協控車流模擬環境、以及進行分散式AI號誌協控模型(多代理人機制)初步發展設計,以期逐步發展我國在人工智慧號誌控制之實力構建,期能支援我國都市智慧號誌控制在人工智慧與車聯網環境下之車流運作效率及交通安全提升。
本計畫在人工智慧強化學習號誌控制模型優化與精進上,能依據各路口各方向交通變化,即時計算下個階段的號誌時制內容;在臺南市的「台86-19甲」單一路口案例,即時計算下一個時相號誌綠燈秒數,在臺北市的「中山北路-德行東路」3個路口幹道則以單一代理人控制3個路口,以共同號誌周期長度與不同時比方式來進行動態調整,以兼顧車流續進。實測結果顯示,臺南市及臺北市實驗場域依據不同偏好進行決策,且在各個時段中均能找到一組偏好,大部分的績效比固定時制為佳;另多任務AI強化學習模式模型即使將不同時段資料一起進行訓練,雖然尚無法比分開訓練的模型績效為佳,但整體表現已接近。在交流道區域的匝道儀控與平面路口強化學習號誌協控模型發展部分,遴選桃園楊梅交流道來構建模擬實證場域,導入多號誌控制代理人機制,並於績效評估上額外考量駕駛人感受等相關指標,將匝道和平面道路的輸入資料集中到一個中央化代理人(agent)的「中央化訓練(Centralized Training)」,本計畫於113年將進行強化學習號誌協控模型的學習訓練與實測工作。