in

Gjennombrudd i kjørekommunikasjon

Som selvkjørende biler (autonome kjøretøy, AV) nærmer seg bred utbredelse, står et viktig problem igjen: Hvordan kan vi bygge bro mellom menneskelige passasjerer og deres robot-chauffører? Selv om AV-er har hatt bemerkelsesverdige fremskritt i å navigere komplekse trafikkmiljøer, er de fortsatt dårligere egnet til å tolke de nyanserte, naturlige språklige kommandoene som kommer så lett til menneskelige førere.

En ny innovativ studie utført av Lyles School of Civil and Construction Engineering ved Purdue University, ledet av assisterende professor Ziran Wang, prøver å løse dette problemet. Studien foreslår å integrere store språkmodeller (LLM-er) som ChatGPT i automatiserte kjøre-systemer for å bedre kommunikasjonen mellom mennesker og autonome kjøretøy.

Kraften i naturlig språk for selvkjørende biler

LLM-er representerer en stor utvikling i kunstig intelligens’ evne til å forstå og generere menneskelignende tekst. Disse avanserte AI-systemene trenes på store mengder tekstdata, noe som gjør dem dyktige i å forstå kontekst, nyanser og underliggende betydning på en måte som tradisjonelt programmerte responser ofte sliter med.

I konteksten av autonome kjøretøy tilbyr LLM-er en transformativ kapasitet. Tradisjonelle grensesnitt for AV-er er basert på spesifikke stemmekommandoer eller knappeinnstillinger, mens LLM-er kan tolke et bredt spekter av språklige instruksjoner. Dette betyr at passasjerer kan kommunisere med bilen sin på omtrent samme måte som de ville ha gjort med en menneskelig fører.

Dette gir betydelige forbedringer i kommunikasjonen. Tenk deg at du sier til bilen din: «Jeg er sein ute», og bilen automatisk beregner den mest effektive ruten og justerer kjørestilen sin for å trygt minimere reisetiden. Eller si at du informerer om at du «føler deg litt bilsyk», og bilen tilpasser bevegelsesprofilen sin for en jevnere tur. Disse nyanserte interaksjonene, som menneskelige førere intuitivt forstår, blir nå mulig for autonome kjøretøy ved hjelp av LLM-er.

Studien fra Purdue: Metodikk og funn

For å teste hvordan LLM-er kunne forbedre autonome kjøretøys evne til å samhandle med passasjerer, gjennomførte Purdue-teamet en rekke eksperimenter ved hjelp av nivå fire-autonome kjøretøy, som bare er ett steg unna full autonomi ifølge SAE Internationals standard.

Forskerteamet begynte med å trene ChatGPT på å svare på ulike kommandoer, fra direkte instruksjoner som «Kjør raskere» til mer indirekte forespørsler som «Jeg føler meg litt bilsyk nå». Deretter ble denne trenede modellen integrert med kjøretøyets eksisterende systemer, slik at bilen kunne ta hensyn til faktorer som trafikkregler, veiforhold, vær og sensorsignaler når den tolket kommandoer.

De eksperimentelle oppsettene var strenge. Hoveddelen av testene ble utført på en testbane i Columbus, Indiana – en tidligere flyplassbane som tillot trygge tester i høy hastighet. I tillegg ble det utført parkeringstester ved Purdues Ross-Ade Stadium. Under eksperimentene responderte det LLM-assisterte autonome kjøretøyet både på forhåndstrente og nye kommandoer fra passasjerene.

Resultatene var lovende. Deltakere rapporterte om betydelig lavere ubehag sammenlignet med typiske opplevelser i nivå fire-AV-er uten LLM-assistanse. Kjøretøyet overgikk også baselines for sikkerhet og komfort, selv når det reagerte på kommandoer det ikke var eksplisitt trent på.

Kanskje mest imponerende var systemets evne til å lære og tilpasse seg individuelle passasjerers preferanser underveis i en kjøretur. Dette viser potensialet for virkelig personlig tilpasset autonom transport.

Hva dette betyr for fremtiden til transportsektoren

For brukere har dette flere fordeler. Muligheten til å kommunisere naturlig med en selvkjørende bil reduserer læringskurven for ny teknologi, noe som gjør autonome kjøretøy mer tilgjengelig for flere brukere, inkludert de som kan være skremt av komplekse grensesnitt. Videre antyder personaliseringsmulighetene, som studien fra Purdue identifiserte, at fremtiden kan bringe selvkjørende biler som tilpasser seg den enkelte passasjers preferanser, og dermed gir en mer skreddersydd opplevelse for hver enkelt bruker.

Dette kan også bidra til økt sikkerhet. Ved å bedre forstå passasjerens intensjoner og tilstand – som å gjenkjenne at noen har dårlig tid eller føler seg uvel – kunne autonome kjøretøy justere kjørestilen sin deretter, noe som potensielt kunne redusere ulykker forårsaket av misforståelser eller passasjerenes ubehag.

Fra en industrisynvinkel kan denne teknologien bli et konkurransefortrinn i det hardt konkurrerende markedet for autonome kjøretøy. De produsentene som kan tilby en mer intuitiv og responsiv brukeropplevelse, kan få et betydelig forsprang.

Utfordringer og fremtidige muligheter

Til tross for lovende resultater, gjenstår det flere utfordringer før LLM-integrerte AV-er kan bli en realitet på offentlige veier. En av de viktigste utfordringene er behandlingstiden. Det nåværende systemet bruker i gjennomsnitt 1,6 sekunder på å tolke og svare på en kommando – noe som er akseptabelt i ikke-kritiske situasjoner, men potensielt problematisk i scenarioer som krever raske beslutninger.

En annen bekymring er risikoen for at LLM-er kan «hallusinere» eller feiltolke kommandoer. Mens forskerne hadde inkorporert sikkerhetsmekanismer for å redusere denne risikoen, er det avgjørende å behandle dette problemet mer inngående før teknologien er klar for virkelig kommersiell bruk.

Ser vi fremover, utforsker Wang og teamet flere retninger for videre forskning. De vurderer andre LLM-er, inkludert Googles Gemini og Metas Llama, for å sammenligne ytelsen. Foreløpige resultater antyder at ChatGPT per i dag overgår de andre både i sikkerhet og effektivitet, men publiserte resultater er fortsatt underveis.

En annen spennende mulighet forskerne ser på er inter-vehikel-kommunikasjon ved hjelp av LLM-er. Dette kan muliggjøre mer avansert trafikkstyring, som for eksempel at autonome kjøretøy forhandler om vikeplikt på kryss.

I tillegg jobber teamet med et prosjekt om store synsmodeller – AI-systemer som trenes på bilder snarere enn tekst – for å hjelpe autonome kjøretøy med å navigere i ekstreme vinterforhold slik vi ofte ser i Midtvesten. Denne forskningen, støttet av Center for Connected and Automated Transportation, kan ytterligere forbedre de autonome kjøretøyenes tilpasningsevne og sikkerhet.

Denne forskningen, som rapportert av unite.ai, markerer et viktig øyeblikk i utviklingen av autonom transportteknologi. Hvis denne teknologien fortsetter å utvikle seg, har den potensial til å revolusjonere måten vi interagerer med kunstig intelligens i hverdagen vår.