OpenAI, selskapet bak GPT-serien, har nylig fremvist en ny generasjon av kunstige intelligenser, kalt o1, som kan tenke lengre før de gir et svar. Modellen er utviklet for å håndtere utfordrende oppgaver, spesielt innen vitenskap, koding og matematikk. Selv om mye av det tekniske rundt modellen er holdt skjult, gir et fåtall ledetråder oss innsikt i dens kapasitet og hva den kan si om OpenAIs skiftende strategi. Her tar vi et nærmere blikk på lanseringen av o1 og hva dette kan bety for fremtiden til OpenAI og utviklingen av avansert AI.
kjennetegn ved o1-modellen: openais nye tankesett
o1 er OpenAI sitt nye AI-system, designet for å løse problemer på en mer gjennomtenkt måte. Disse modellene er opplært til å finpusse måten de tenker på, utforske strategier, og lære av egne feil. OpenAI melder at o1 har hatt bemerkelsesverdige fremskritt, og løste 83% av problemene på kvalifiseringseksamenen til den Internasjonale Matteolympiaden. Til sammenligning var tallet for GPT-4 på kun 13%. Modellen utmerker seg også i koding, hvor den har nådd hele 89-prosentilen i Codeforces-konkurranser. Ifølge OpenAI vil fremtidige oppdateringer av serien prestere på nivå med doktorgradsstudenter i emner som fysikk, kjemi og biologi.
openais skiftende AI-strategi
Siden starten har OpenAI lagt vekt på skalerbare modeller som nøkkelen til å avdekke avanserte AI-ferdigheter. Med GPT-1, som hadde 117 millioner parametere, tok OpenAI steget fra mindre, spesialiserte modeller til omfattende systemer med bredde. GPT-2, GPT-3, og den nyeste GPT-4 — med 1,7 billioner parametere — har vist hvordan større modeller og store mengder data kan gi markante forbedringer i ytelse.
Likevel ser det ut til at OpenAI nå gjør en betydelig dreining i sin tilnærming til AI-utvikling. Selv om selskapet fortsatt utforsker skalering, bøyer de seg nå mer mot å skape mindre, mer allsidige modeller, som ChatGPT-4o mini. Lanseringen av o1, med sitt fokus på lengre tankeprosesser, antyder at de beveger seg bort fra å kun stole på nevrale nettverks evne til mønstergjenkjenning, og i stedet utvikler mer sofistikerte kognitive prosesser.
fra raske reaksjoner til dypere tenkning
OpenAI opplyser at o1-modellen er spesifikt designet for å bruke mer tid på å vurdere før den gir et svar. Denne egenskapen ved o1 ser ut til å harmonere med teorien om dualprosess-modeller, et velkjent rammeverk innen kognitiv vitenskap som skiller mellom to tankemåter: raske og langsomme prosesser.
I denne teorien omtales system 1 som rask, intuitiv tankegang, der beslutninger tas automatisk, som å gjenkjenne et ansikt eller reagere umiddelbart på noe uventet. System 2 derimot refererer til en langsommere, mer overveid prosess, brukt til å løse komplekse problemer og fatte veloverveide beslutninger.
Historisk sett har nevrale nettverk – som står bak de fleste AI-modeller – vært særlig gode på å etterligne system 1-tankegang. De er raske, mønsterbaserte og skinner i oppgaver som krever raske, intuitive svar. Men de har ofte manglet i situasjoner hvor dypere, logisk resonnering behøves. Dette har vært gjenstand for pågående diskusjoner innen AI-feltet: Kan maskiner virkelig imitere de langsommere, mer metodiske prosessene som system 2 krever?
følger openai i googles fotspor med neurosymbolikk?
I flere år har Google utforsket neurosymboliske systemer for å kombinere nevrale nettverk med symbolsk resonnering. Eksempler på dette er modeller som AlphaGeometry og AlphaGo. Disse systemene har hatt suksess med å blande den intuitive mønstergjenkjenningen til store språkmodeller (LLMs) med den strukturerte logikken til symboliske resonneringsmotorer.
Motivasjonen for Googles skifte mot neurosymboliske systemer har vært to problemer: begrenset tilgang til store datasett for avansert resonnering, og behovet for å kombinere hurtig intuisjon med stringent logikk for å løse svært komplekse utfordringer. Resultatene har vært imponerende, hvor AlphaGeometry tok en sølvmedalje i Matteolympiaden, og AlphaGo slo verdensmestere i Go-spillet. Dette kan tyde på at OpenAI nå adopterer en lignende neurosymbolisk tilnærming som Google.
flytter grensene for hva AI kan prestere
Selv om vi ennå ikke vet nøyaktig hvordan OpenAI’s o1-modell fungerer, er det tydelig at selskapet har et sterkt fokus på kontekstuell tilpasning. Dette innebærer å utvikle AI-systemer som kan justere sine responser basert på kompleksiteten og nyansene i hvert problem. Der tidligere modeller har vært generelle problemløsere, kan disse modellene tilpasse sin tenkning bedre til forskjellige bruksområder – fra forskning til dagligdagse oppgaver.
En fascinerende mulighet er fremveksten av selvreflekterende AI. I motsetning til tradisjonelle modeller som kun baserer seg på eksisterende data, antyder o1s fokus på grundigere resonnering at morgendagens AI kan lære av sine egne erfaringer. Dette kan på sikt føre til maskiner som forbedrer sine problemløsningsstrategier over tid, noe som gjør dem mer tilpasningsdyktige og motstandsdyktige.
Som https://www.unite.ai skriver, peker arbeidene med o1-modellen også mot nye treningsmetoder. Prestasjonen i å håndtere komplekse oppgaver som IMO-kvalifiseringseksamener antyder at vi kan se mer spesialiserte, problemfokuserte treningsopplegg. Dette kan igjen resultere i mer skreddersydde datasett og treningsstrategier som bidrar til å bygge dypere kognitive ferdigheter hos AI-systemer, både for generelle og spesialiserte fagområder.
Modellens enestående prestasjoner innen matematikk og koding åpner også for spennende muligheter innen utdanning og forskning. Fra AI-tutorer som ikke bare gir svar, men også veileder gjennom logikken bak løsninger, til AI-systemer som bistår forskere med å generere hypoteser, designe eksperimenter og bidra til oppdagelser innen fysikk og kjemi.
Oppsummert introduserer OpenAI med o1-modellen en ny generasjon AI som er spesielt tilpasset komplekse og utfordrende oppgaver. Mens mange av detaljene rundt disse modellene fortsatt ikke er kjent, gjenspeiler utviklingen en dreining mot dypere kognitive prosesser, og kan markere et nytt kapittel i AI-utviklingen. Dette kan i fremtiden ha store konsekvenser ikke bare for forskningsmiljøer, men også for utdanning og flere andre samfunnsområder.