Dette projekt omhandler et forsøg på brug af statistisk genereret information til kontrol af robotter - specifikt visse typer af neurale netværk konfigureret som nonlineære approximatorer samt metoder til modellering af tidligere interaktioner og derigennem forudsigelse via simulation af planlagt aktion.
Klassisk kunstig intelligens - og herunder specialområdet klassisk Robotik - er traditionelt baseret på en metode der viser sig at have væsentlige konsekvenser for hvilke resultater der i praksis kan forventes fra sådanne systemer.
Den traditionelle AI er baseret på matematiske modeller, der kort forklaret består af et domæne (dvs. virkeligheden - processen eller fænomenet), en matematisk struktur der er en beskrivelse af denne, og en funktion der afbilder domænet over i den matematiske struktur. Denne matematiske struktur behandles ved hjælp af logisk teori (i form af formler) der muliggør håndtering og behandling af separate delkomponenter, der derefter rekombineres for at opnå det ønskede resultat, der "oversættes" tilbage til domænet ved en fortolkning.
Validiteten af en sådan matematisk model afhænger følgelig af hvor præcist den formår at formalisere virkeligheden, og derfor af hvor præcist den kan forudsige fænomenets opførsel. De vanskeligst formaliserbare domæner tilhører kategorien af nonlineære funktioner, hvor der ikke gives en lineær sammenhæng mellem funktionens delkomponenter, hvorfor det ikke giver mening at dele den op i mindre stykker for individuel processering - og hvor det slet ikke giver mening at fortolke individuelle delberegnede komponenter tilbage til domænet.
I korte træk er det dette problem med formalisering af nonlineære fænomener der er den centrale problemstilling for udvikling af kunstig intelligens – men er også i høj grad kardinalproblemet for robotik, der skal klare sig i en virkelig verden.
Der er to måder at prøve at løse dette problem på - der giver meget forskellige resultater. Den ene metode - der oftest bruges i nutidig traditionel robotik - er en kraftig udvidelse af processeringskraften der giver mulighed for at formalisere udvalgte aspekter ved domænet i form af konvertering til prædefinerede stykkevist-lineære funktioner - hvilket dog indebærer at formaliseringen af domænet bliver ekstremt kompliceret samtidig med at den krævede processeringskraft stiger eksponentielt med antallet af lineære sub-elementer. Så på trods af mere og billigere processeringskraft, så støder vi hurtigt ind i en barriere af kompleksitet som ikke er mulig at overvinde.
Den alternative metode er mere primitiv - og på samme tid langt mere avanceret. Udgangspunktet er at biologiske nervesystemer og hjerner jo klarer at agere i den virkelige verden - på en helt anden måde end ved formalisering, databehandling, og fortolkning. Neurale netværk, hvis arkitektur overfladisk set er struktureret som primitive nervesystemer, har en række egenskaber som det klassiske paradigme i høj grad mangler, såsom evne til at lære selv, generalisere lært stof, og ikke mindst en evne til at repræsentere non-lineære fænomener direkte. Muligheden for repræsentation af non-lineære fænomener er resultat af at neurale netværk netop ikke fungerer via en formalisering af domænet, men danner en statistisk repræsentation af – eller "retter sig ind efter" - en funktion i form af et læresæt. Vi har her en metode hvis output bliver en probabilistisk fremfor en formaliseret beskrivelse af det repræsenterede domæne.
Denne mulighed for probabilistisk repræsentation ser ud til at være af central betydning for mulighederne for udvikling af robotik til naturlige miljøer.
Jeg er i gang med en undersøgelse af de muligheder og perspektiver der er i en probabilistisk tilgang til aktionsorienteret kunstig intelligens - altså robotik - med primært fokus på et lille del-område der ser lovende ud, nemlig problematikkerne omkring real-world/real-time robotik.
Den traditionelle kunstige intelligens har meget svært ved at håndtere real-tids funktioner for agent/miljø-interaktioner. Psykiske væsener er så at sige "ballistisk" i verden, underlagt verdens struktur ikke bare fysisk, men også temporalt, hvilket medfører at kombinationen af proprioceptivt feedback og relativt langsom neural processering simpelt hen ikke slår til.
Løsningen er at anticipere - dette ser ud til at være en nødvendighed for et real-tids motorisk system. Og anticipation som biologisk funktion er ikke bare teknisk plausibel, den synes også at være selve den byggesten der muliggør psykisk - og dermed intelligent – liv. Dette er et eksempel på et generelt kontrolproblem for real-tids processering på information der ikke er tilgængelig - altså enten er fraværende enten spatialt eller temporalt. En tilgang til dette problem er at indsætte en såkaldt emulator i systemet, hvis rolle er at levere en hurtigere-tilgængelig "skitse" af sandsynlig feedback til brug for systemet. En emulator er en mekanisme som på basis af systemets status samt en efferenskopi af kontrolinformation hurtigt kan give en forudsigelse af hvordan systemet vil reagere - altså i form af en approksimation til den feedback som man senere forventer at ville få fra systemet.
Emulatoren modellerer systemet, og muliggør derved et pseudo-feedback-signal, selv i mangel på samme fra det virkelige system. Dette kan bruges til realisering af hurtig og præcis adfærd i et processeringsmæssigt "langsomt" biologisk-neuralt system - og vil blot kræve at man tilføjer et sekundært neuralt system, hvis funktion er at modtage kopier af efferente motoriske kontrolsignaler som inputargument, og - ved modellering af de relevante dynamiske egenskaber ved motorikken - at levere vikarierende proprioceptiv feedback i en situation hvor den "ægte" er temporalt fraværende. Denne "prædiktor" muliggør adækvat adfærd selv i tilfælde af total mangel på feedback – og muliggør at man kan "øve sig" på motorisk interaktion via prædiktoren uden brug af den virkelige verden - altså en mulighed for off-line træning af sansemotorikken - hvilket også vil understøtte planlægning og på længere sigt facilitere muligheden for evnen til mentale forestillinger.
Konkret er min opgave foreløbig relateret til Aldebaran's "Nao" - en simpel humanoid robot med et relativt let-tilgængeligt interface. Nao har 21 frihedsgrader (led), en god samling af feedback-sensorer - og notorisk svært ved at holde balancen når den går.
Det mit mål - i samarbejde med DTI's center for robotteknologi i Odense - at opbygge et modul, der via anticipation (modellering af og plan-evaluering i forhold til tidligere erfaringer) hjælper Nao med at holde balancen ved at forudsige hvornår han vil vælte før det rent faktisk sker - og som derfor kan korrigere hans aktioner i tide.
Robotten Nao - https://www.aldebaran.com/en
DTI's center for Robot-teknologi - http://www.teknologisk.dk/ydelser/robotteknologi/ekspertiser/22786
Død fysiolog lærer robotter at gå - https://ing.dk/artikel/dod-fysiolog-laerer-robotter-ga-79936
Statistical Robotics - http://www.idsia.ch/~juergen/statisticalrobotics.html