Forskere spår trafikantatferd ved hjelp av kunstig intelligens

For at en selvkjørende bil skal sirkulere trygt, er det avgjørende å kunne forutsi atferden til andre trafikanter. Et CSAIL-forskerteam ved MIT (Massachusetts Institute of Technology) har utviklet sammen med forskere ved Institute of Interdisciplinary Information Sciences (IIIS) ved Tsinghua University, Beijing, et nytt ML-system som en dag kan hjelpe førerløse biler med å forutsi de neste bevegelsene til kjøretøy i nærheten . sjåfører, syklister og fotgjengere i sanntid. De ga tittelen sin studie: M2I: fra faktorisert marginal baneprediksjon til interaktiv prediksjon».

Qiao Sun, Junru Gu, Hang Zhao er IIIS-medlemmene som deltok i denne studien, mens Xin Huang og Brian Williams representerte MIT.

Mennesker er uforutsigbare, noe som faktisk gjør det svært vanskelig å forutsi atferden til trafikanter i urbane områder. AI-løsningene som er i bruk for tiden er for enkle: for dem kan for eksempel en fotgjenger holde seg på samme fortau uten å prøve å krysse. Hvis de forventer at fotgjengere skal krysse, for å unngå dem parkerer roboten bare bilen, noen forutsier bare bevegelsene til en enkelt trafikant.

Del opp for å forutsi bedre

Baneprediksjon er mye brukt av intelligente kjøresystemer for å utlede fremtidige bevegelser av agenter i nærheten og identifisere risikoscenarier for å muliggjøre sikker kjøring. For teamet er eksisterende modeller utmerket til å forutsi de marginale banene til individuelle agenter, men de gir ikke et svar for trafikk i urbane områder der mange brukere samhandler, prediksjonsrommet øker eksponentielt med antallet.

MIT-forskere har funnet en tilsynelatende veldig enkel løsning på dette komplekse problemet: De bryter et problem med multi-agent atferdsprediksjon i flere små deler og angriper deretter hver enkelt individuelt, slik at en datamaskin kan løse denne komplekse oppgaven i sanntid. De kalte denne tilnærmingen M21. Dets atferdsprediksjonsrammeverk gjetter først forholdet mellom to trafikanter: hvilken bil, syklist eller fotgjenger som har forkjørsrett, og hvilken agent som vil gi forkjørsrett… Den bruker deretter disse relasjonene til å forutsi fremtidige stier til flere agenter.

READ  Vitenskapen bak skytesuksess er langt fra et lotteri

Ruter estimert av M21 ble funnet å være mer nøyaktige enn de fra andre ML-modeller, sammenlignet med faktisk trafikkflyt i et enormt datasett kompilert av det autonome kjøretøyselskapet Waymo (MIT-teknikken overgikk til og med den publiserte modellen). nylig av sistnevnte). Også ved å dele problemet inn i underproblemer kunne de bruke mindre minne.

Xin «Cyrus» Huang, doktorgradsstudent ved Institutt for luftfart og astronautikk og forskningsassistent i laboratoriet til Brian Williams, professor i luftfart og astronautikk, og medlem av Computer Science and Artificial Intelligence Laboratory (CSAIL), co-senior forfatter av studerer, sier:

«Det er en veldig intuitiv idé, men ingen har utforsket den fullt ut før, og den fungerer ganske bra. Enkelhet er definitivt et pluss. Vi sammenligner modellen vår med andre ledende modeller på feltet, inkludert Waymo, det ledende selskapet på dette feltet, og vår modell oppnår best ytelse i denne vanskelige referansen. Dette har et stort potensial for fremtiden. »

M21-metoden

I dette arbeidet utnyttet forskerne de underliggende relasjonene mellom de interagerende agentene. M21-algoritmen har to innganger: de tidligere banene til biler, syklister og fotgjengere som samhandler i et trafikkmiljø, for eksempel et fireveis kryss, samt et kart med gateplasseringer, kjørefeltkonfigurasjoner, etc.

Fra denne informasjonen trekker en relasjonsprediktor ut hvilken av de to agentene som har rett til å bestå først, og klassifiserer den ene som en passerer og den andre som en overdrager. Deretter gjetter en prediksjonsmodell, kalt en marginal prediktor, banen til den forbipasserende agenten, siden den oppfører seg uavhengig.

En andre prediksjonsmodell, kjent som den betingede prediktoren, gjetter hva den ettergivende agenten vil gjøre basert på handlingene til den forbipasserende agenten. Systemet forutsier en rekke forskjellige veier for dealeren og setteren, beregner sannsynligheten for hver enkelt, og velger deretter de seks felles utfallene med høyest sannsynlighet for å inntreffe.

READ  Søket som oppdaget tusenvis av nye arter

M2I-metoden gir en prediksjon av banen til disse midlene i løpet av de neste åtte sekundene. Du kan bremse et kjøretøy ned slik at en fotgjenger kan krysse gaten, og deretter øke hastigheten når du klarer krysset. I et annet eksempel ventet kjøretøyet til flere biler hadde passert før det svingte fra en sidegate inn på en trafikkert hovedvei.

Waymo Open Motion-datasetttesting

Forskerne trente modellene på Waymo Open Motion-datasettet, som inneholder millioner av virkelige trafikkscener som involverer kjøretøy, fotgjengere og syklister registrert av kjøretøymonterte lidar-sensorer (lysdeteksjon og avstandsavstand) og kameraer. De beholdt bare scenene der flere agenter grep inn.

De sammenlignet deretter de seks prediksjonsprøvene fra hver metode, vektet etter deres konfidensnivå, med de faktiske stiene som følges av biler, syklister og fotgjengere i en scene. Metoden hans var den mest nøyaktige. M21 overgikk også basismodeller i en metrikk kjent som overlappingshastighet; hvis to veier overlapper hverandre, indikerer dette en kollisjon. M2I hadde den laveste overlappingsraten.

Xinhuang sier:

«I stedet for bare å bygge en mer kompleks modell for å løse dette problemet, tar vi en tilnærming som ligner mer på måten et menneske tenker på når de resonnerer om interaksjoner med andre. Et menneske resonnerer ikke om alle hundrevis av kombinasjoner av fremtidig atferd. Vi tar beslutninger ganske raskt. En annen fordel med M2I er at fordi den deler opp problemet i mindre deler, er det lettere for brukeren å forstå modellens beslutningstaking. I det lange løp kan dette hjelpe brukere å stole mer på autonome kjøretøy. »

På den annen side kan ikke rammeverket redegjøre for tilfeller der to agenter påvirker hverandre, for eksempel når to kjøretøy kjører på hver sin fireveisstopp fordi sjåførene ikke vet hvem som skal vike. Teamet har til hensikt å bøte på denne begrensningen i fremtidig arbeid. Han håper også å bruke metoden sin til å simulere realistiske interaksjoner mellom trafikanter, som vil verifisere autonome kjøretøyprogrammeringsalgoritmer eller lage enorme mengder syntetiske kjøredata for å forbedre modellens ytelse.

READ  Google ønsker å utvide Privacy Sandbox til Android

Artikkelkilder: «M2I: From Factored Marginal Trajectory Forecasting to Interactive Forecasting» av Qiao Sun, Xin Huang, Junru Gu, Brian C. Williams og Hang Zhao. 28. mars 2022, datamaskinrobotikk.
arXiv:2202.11884

Legg att eit svar

Epostadressa di blir ikkje synleg. Påkravde felt er merka *