Mempelajari Kebijakan Mengemudi Interaktif melalui Simulasi Berbasis Data
Uncategorized

Mempelajari Kebijakan Mengemudi Interaktif melalui Simulasi Berbasis Data

Agen cerdas dapat mencapai kontrol berkelanjutan yang kompleks dan keterampilan pengambilan keputusan dengan mempelajari representasi dari persepsi mentah hingga tindakan kontrol tingkat tinggi. Namun, pembelajaran kebijakan end-to-end menantang untuk navigasi otonom karena sering kali terbatas pada lingkungan jalan yang sederhana, navigasi tanpa interaksi, atau pengujian hanya dalam pengaturan pasif.

Mempelajari Kebijakan Mengemudi Interaktif melalui Simulasi Berbasis Data

Kredit gambar: Unsplash/Kimi Lee, lisensi gratis

Sebuah makalah baru-baru ini di arXiv.org menyajikan kerangka kerja ujung ke ujung untuk simulasi fotorealistik dan pelatihan agen otonom dengan adanya interaksi agen statis dan dinamis.

Kebijakan yang dipelajari dapat langsung ditransfer ke kendaraan otonom skala penuh di dunia nyata. Eksperimen dunia nyata pada kendaraan otonom skala penuh dilakukan. Model menunjukkan kinerja tinggi dan generalisasi pada tugas-tugas kompleks seperti menyalip otonom dan menghindari agen dinamis yang diamati sebagian.

Simulator berbasis data menjanjikan efisiensi data yang tinggi untuk mendorong pembelajaran kebijakan. Saat digunakan untuk interaksi pemodelan, efisiensi data ini menjadi hambatan: Kumpulan data dasar yang kecil sering kali kekurangan kasus tepi yang menarik dan menantang untuk mempelajari mengemudi interaktif. Kami menjawab tantangan ini dengan mengusulkan metode simulasi yang menggunakan kendaraan ado yang dicat untuk mempelajari kebijakan mengemudi yang kuat. Dengan demikian, pendekatan kami dapat digunakan untuk mempelajari kebijakan yang melibatkan interaksi multi-agen dan memungkinkan pelatihan melalui metode pembelajaran kebijakan yang canggih. Kami mengevaluasi pendekatan untuk mempelajari skenario interaksi standar dalam mengemudi. Dalam eksperimen ekstensif, pekerjaan kami menunjukkan bahwa kebijakan yang dihasilkan dapat langsung ditransfer ke kendaraan otonom skala penuh tanpa menggunakan teknik transfer sim-ke-nyata tradisional seperti pengacakan domain.

Makalah penelitian: Wang, T.-H., Amini, A., Schwarting, W., Gilitschenski, I., Karaman, S., dan Rus, D., “Mempelajari Kebijakan Mengemudi Interaktif melalui Simulasi Berbasis Data”, 2021. Tautan: https://arxiv.org/abs/2111.12137



Posted By : togel hongkon