Kollaborativ persepsjon har blitt et kritisk forskningsområde innen autonome kjøretøy og robotikk. I disse feltene trenger ulike aktører, som for eksempel biler eller roboter, å samarbeide for å forstå omgivelsene sine på en mer nøyaktig og effektiv måte. Ved å dele sensoriske data mellom flere enheter, forbedres nøyaktigheten og dybden av hvordan miljøet oppfattes. Dette fører til tryggere og mer pålitelige systemer, spesielt i dynamiske miljøer der sanntidsbeslutninger spiller en viktig rolle for å forhindre ulykker og sikre jevn operasjon.
Utfordringer med databehandling og ressursbruk
En av de største utfordringene innen multi-agent persepsjon er å håndtere enorme mengder data på en måte som samtidig effektiviserer bruken av ressurser. Tradisjonelle metoder sliter med å balansere behovet for nøyaktig, langtrekkende romlig og tidsmessig persepsjon med behovet for å minimere både kommunikasjon og beregningskapasitet. Dette fører ofte til flaskehalser i systemytelse når lengre tidshorisonter og romlige avstander er nødvendig for å lage presise forutsigelser i komplekse omgivelser. Behovet for å modellere interaksjoner mellom agenter over tid blir dermed essensielt.
Cnn og transformers i multi-agent systemer
Mange eksisterende multi-agent persepsjonssystemer bruker metoder basert på konvolusjonelle nevrale nettverk (CNN) eller transformers for å bearbeide og slå sammen data fra flere agenter. Selv om CNNs er gode på å fange lokal romlig informasjon, har de ofte vanskelig for å håndtere lange avstander, hvilket begrenser deres evne til å modellere hele omgivelsene til en agent. Transformers, på den annen side, er flinkere til å fange langtrekkende avhengigheter, men de krever betydelige mengder beregningskraft, noe som gjør dem mindre egnet for sanntidsapplikasjoner. Eksisterende modeller, som V2X-ViT og distillasjonsbaserte modeller, har gjort fremskritt, men de møter fortsatt begrensninger når det gjelder å balansere ytelse og ressursbruk
Innovativ modell: collaMamba
Forskere ved State Key Laboratory of Networking and Switching Technology ved Beijing University of Posts and Telecommunications har nylig introdusert en ny rammeverkmodell kalt CollaMamba. Denne modellen benytter et spatialt-temporalt tilstandssystem (SSM) for å effektivt håndtere data i samarbeidsbaserte persepsjonssystemer mellom flere agenter. Ved å integrere Mamba-baserte encoder- og decoder-moduler, gir CollaMamba en ressurs-effektiv løsning som effektivt modellerer både romlige og tidsmessige avhengigheter mellom agenter. Modellen reduserer kompleksiteten i kommunikasjonen mellom agenter betraktelig og muliggjør samtidig deling av kompakte, men omfattende, representasjoner av data.
Bedre utnyttelse av ressurser
CollaMamba fokuserer på å forbedre både romlig og tidsmessig funksjonalitet. Modellen er bygget med et bakgrunnsnettverk som er designet for effektivt å fange årsakssammenhenger fra både enkelt-agent og multi-agent perspektiver. Dette gjør systemet i stand til å behandle komplekse romlige relasjoner over lengre distanser samtidig som den reduserer ressursbruken. I tillegg utnytter modellen en historie-basert funksjonsforbedringsmodul som analyserer data fra tidligere tidspunkter for å styrke aktuelle oppfattelser. Dette er spesielt nyttig når systemet trenger raffinerte analyser av uklare data.
Bærekraftig ytelse i testing
Resultatene fra testene viser at CollaMamba leverer imponerende forbedringer sammenlignet med eksisterende metoder. I en rekke eksperimenter, inkludert bruk av datasettene OPV2V, V2XSet og V2V4Real, demonstrerte CollaMamba betydelig reduserte ressurskrav. Eksempelvis ble databehandlingsbelastningen redusert med opptil 71,9 %, mens kommunikasjonsbelastningen ble redusert med 1/64. Tross disse reduksjonene forbedret modellen nøyaktigheten innen samarbeid innen persepsjon. Tilfeldigvis oppnådde CollaMamba-ST-versjonen en 4,1 % forbedring i presisjon på OPV2V-datasettet. Det mer strømlinjeformede varianten, CollaMamba-Simple, reduserte bruken av modellparamtere med 70,9 %, hvilket gjør den svært relevant for sanntidsbruk.
collaMamba i miljøer med dårlig kommunikasjon
CollaMamba utmerker seg i miljøer hvor kommunikasjonen mellom agenter kan være inkonsekvent. Versjonen CollaMamba-Miss er spesialdesignet for å forutsi manglende data fra nærliggende agenter ved hjelp av historiske romlig-temporale analyser. Dette gjør at modellen kan opprettholde høy ytelse selv når noen agenter ikke klarer å overføre data i tide. For eksempel viste tester at CollaMamba-Miss presterte meget godt, til tross for simulert dårlig kommunikasjonsforhold, med minimal reduksjon i nøyaktighet. Dette gjør modellen svært tilpasningsdyktig for virkelige situasjoner hvor forbindelsesproblemer kan oppstå.
En viktig milepæl
Forskere ved Beijing University of Posts and Telecommunications har med CollaMamba-modellen klart å håndtere en sentral utfordring innen samarbeidsbasert multi-agent persepsjon. Ved å fokusere på å redusere ressursbelastningen uten å ofre nøyaktighet, og ved å modellere romlige og tidsmessige data over større avstander, signaliserer CollaMamba en viktig milepæl innen autonome systemer. Modellen trekker veksler på historiske data for å forbedre dagens persepsjon og fungerer selv under utfordrende kommunikasjonsbetingelser, noe som gjør den til en svært anvendelig løsning i ekte verden.
Kilde: marktechpost.com