Home
Magazine Online di Psicologia, Intelligenza Artificiale, Neuroscienze e Scienze Cognitive

Il Ruolo delle Rappresentazioni nella Robotica Enattiva

Negli anni 90 la costruzione di Magnus ha contribuito ad alimentare entusiasmi e polemiche circa la controversa possibilità di dar vita a un sistema artificiale umanoide.

Magnus è una struttura neurale a molti automi, (realizzata da Aleksander nel 1992), che riceve come input immagini visive di un mondo virtuale bidimensionale immagazzinato in un computer. Magnus è in grado di formarsi delle rappresentazioni interne (gli automi) delle immagini che vede e che corrispondono, nello spazio dei pesi della sua rete neurale, a degli avvallamenti, cioè a un punto o un insieme di punti attrattori. Una delle capacità più sofisticate del sistema è la visualizzazione guidata dalle parole; nella fase di addestramento Magnus impara ad associare i nomi degli oggetti alle immagini di questi ultimi, grazie alla presentazione simultanea dei due stimoli. Nella fase successiva egli è in grado, dato il nome di un oggetto, di immaginarlo senza disporre dell’input visivo corrispondente (ciò che Magnus immagina appare su uno schermo collegato alla sua rete neurale). Inoltre, se gli viene fornito il nome di un altro oggetto, i suoi pensieri mostrano la giusta traiettoria nello spazio: se vi sono oggetti tra il primo e il secondo, il sistema li immagina. Il suo costruttore spiega quale sia il risultato principale ottenuto con Magnus: ”Seguendo attentamente la conoscenza dell’anatomia del sistema visivo, riuscii a dimostrare che potrebbe esistere un’area neurale che rappresenta coerentemente il mondo dal punto di vista dell’osservatore. E’ un’area che riceve segnali sia attraverso i canali visivi sia dalle attività muscolari del sistema e questo le conferisce la capacità di ricostruire un oggetto così com’è nel mondo, ma visto dalla prospettiva dell’osservatore. Si chiama ‘rappresentazione del mondo centrata sull’ego’ e si contrappone alle immagini che cadono sulla retina dell’occhio ed esistono nella corteccia visiva primaria. Tali rappresentazioni sono ‘centrate sull’occhio’e sono incoerenti l’una con l’altra al passare del tempo. L’area centrata sull’ego rappresenta il mondo come apparente estensione di se stessi, più che come viene colto dagli occhi. Siamo anche riusciti a dimostrare che quest’area può ricostruire ‘immagini mentali’ partendo da semplici espressioni costituite da un sostantivo e un aggettivo (un cerchio blu, un triangolo giallo). Questo sistema è effettivamente in grado di immaginare ‘una banana blu a pallini rossi’ anche se tale oggetto non ha mai fatto parte della sua esperienza di apprendimento. In breve, il processo è il seguente: le parole stimolano aree specializzate centrate sui sensori le quali rappresentano la ‘bluità’, la ‘bananità’ e così via, mentre l’area per il mondo centrato sull’ego fa il resto. E’ questa capacità di creare le rappresentazioni centrate sull’ego che a mio avviso conferma qual è la proprietà ingegneristica essenziale di cui ha bisogno un sistema neurale al fine di diventare visivamente consapevole”1.

Per chiarire l’idea che gli stati interni del sistema siano centrati sull’ego, analizziamo il meccanismo della ‘centratura sull’ego’ nel sistema visivo. Il compito che il sistema visivo svolge è quello di separare le caratteristiche delle scariche della retina (colore, intensità, bordi, movimento); questo avviene al livello della corteccia visiva primaria. Ma, in base ad esperimenti su soggetti con lesioni, è emerso che la nostra consapevolezza visiva scaturisce da aree più profonde del sistema visivo, quelle frontali, dove i neuroni ricevono informazioni sulle scariche dei neuroni muscolari che controllano la posizione degli occhi e della testa. In queste aree si vengono a creare mappe delle informazioni relative alla forma e al colore dell’immagine visualizzata che incorporano una compensazione della posizione degli occhi e della testa. In sostanza, la parte centrale della retina (fovea) “dipinge” un’immagine neurale integrando l’informazione proveniente dai segnali muscolari, mentre il resto della retina serve ad attirare la posizione dell’occhio verso cose del mondo il cui contenuto è importante per l’organismo. Queste superfici “dipinte” sono il luogo dove si creano le rappresentazioni centrate sull’ego e si realizza la consapevolezza visiva.

Tutto ciò suggerisce che il modo in cui un organismo percepisce un’immagine visiva sia sottoposto a fattori autoctoni di organizzazione dipendenti dal funzionamento dei processi percettivi (e non da credenze e condizionamenti culturali, generatori di un’attività inferenziale inconscia). Se le leggi della psicologia della Gestalt2, esposte da Wertheimer nel 1912, non sono indotte dall’esperienza percettiva ma ne sono costitutive, allora non possiamo scegliere cosa percepire ma l’organizzazione percettiva ci s’impone e la centratura sull’ego delle nostre rappresentazioni dipende semplicemente dalla centratura sull’ego delle nostre percezioni e questa, a sua volta, non è che un meccanismo percettivo non troppo dissimile dalle leggi della Gestalt, una sorta di modalità organizzativa del materiale sensibile. Queste idee ricordano fortemente i risultati ottenuti da Rosch nei suoi esperimenti sulla percezione dei colori e in particolare il fatto che la determinazione dei prototipi all’interno delle categorie naturali non ha natura inferenziale, né tanto meno linguistica.

“Insomma, i risultati dei gestaltisti e quelli sulle categorie basiche orientano verso soluzioni antitetiche agli esiti olistici della filosofia analitica e alla loro riproposizione da parte dei cognitivisti, suffragando una non totale indeterminatezza della traduzione (processi percettivi e processi interpretativi sono separabili o, quanto meno, i primi non sono plasmabili a piacere dai secondi), una non totale inscrutabilità del riferimento (veridicità delle percezioni, loro univocità sul piano fenomenologico e loro autonomia dai sistemi di credenze) e un non globale olismo”3.

Se finora la centratura sull’ego è parsa un meccanismo intrinseco al processo dell’organizzazione percettiva, simile alle operazioni di integrazione dell’immagine dei gestaltisti e indipendente dai processi interpretativi di tipo inferenziale (radicati a loro volta nella cultura, in un sistema di credenze, nel linguaggio, ecc), tale impressione sembra essere messa in crisi da queste parole diAleksander:”Oltre a ricreare quadri nella testa, le rappresentazioni centrate sull’ego fanno molto altro. Possono semplicemente ricreare quadri, però codificano qualsiasi cosa che sia attinente ai generatori di tali immagini del mondo e alla relazione tra l’organismo e tali oggetti. La parola ‘tazza’ non crea soltanto rappresentazioni neurali di un’immagine della tazza: la sua centratura sull’ego può comprendere rappresentazioni in aree motorie di come potrei afferrarla, riempirla, bervi e di come si potrebbe rompere se la lasciassi cadere. In altre parole, le rappresentazioni centrate sull’ego codificano tutta la mia esperienza di che cosa significa ‘tazza’ per me”4.

Sembra dunque che in questo caso la centratura sull’ego sia qualcosa di più di un meccanismo percettivo, qualcosa che richiede di richiamare alla memoria schemi d’azione fondati sull’esperienza precedente, l’ambiente con il quale si è interagito, le proprietà degli oggetti in esso incontrati e, non ultimo, il ruolo del “sé” nell’interazione con l’ambiente e con gli oggetti: in breve, un insieme di conoscenze sul mondo insieme alla consapevolezza che “io ne faccio parte”. Tutto questo mi pare abbia a che fare con il radicamento del soggetto in un contesto socio-culturale e linguistico che Aleksander omette di sottolineare. La mia rappresentazione di ‘tazza’dipenderà, oltre che dalla mia personale esperienza, dagli usi che nella società a cui appartengo se ne fanno e dalle credenze ad essi associate. Sembra allora che l’impostazione delineata dalla Gestalt necessiti di essere integrata con un modello della percezione e della cognizione che tenga in maggior conto l’interazione tra l’individuo e il suo contesto.

Capire la natura di ciò che Aleksander definisce “centratura sull’ego” significa capire le relazione intercorrente tra individuo e ambiente all’interno del dibattito tra soggettivisti e oggettivisti. Per questi ultimi, il mondo è come ci appare anche prima di essere conosciuto e la conoscenza non è altro che rispecchiamento di una realtà data. Nel caso della visione, ad esempio, ne deriva che i colori sono attributi intrinseci delle superfici in quanto determinati da proprietà fisiche. Secondo questa impostazione, le azioni sono capaci di adattarsi al mondo in quanto le caratteristiche del mondo esterno corrispondono a rappresentazioni all’interno del sistema.

E’ noto che nel funzionalismo quest’idea viene riformulata in chiave informatica: un sistema cognitivo diventa un elaboratore di informazioni che opera su simboli formali attraverso l’applicazione di regole codificate nel sistema e la mente diventa il filtro attraverso cui passano gli input per essere trasformati in output. Nonostante qui, diversamente da quanto accadeva nel comportamentismo, si guardi ai processi interni del sistema (dentro ‘la scatola nera’), l’idea di fondo è ancora quella secondo cui l’esterno causa l’interno, l’ambiente produce dei cambiamenti nel sistema e il rapporto tra l’attività cognitiva e il mondo è spiegato ipotizzando l’esistenza di rappresentazioni mentali all’interno del sistema, rappresentazioni che ri-costruiscono aspetti ambientali estrinseci e indipendenti. Sul versante opposto del dibattito troviamo gli idealisti che pongono l’accento sul fatto che non possiamo avere accesso al mondo se non attraverso le nostre rappresentazioni. Poiché non possiamo uscire da noi stessi per vedere quanto le nostre rappresentazioni siano in accordo con il mondo, noi semplicemente non abbiamo idea di cosa il mondo sia: esso è il presunto oggetto delle nostre rappresentazioni, o in maniera più estrema, una rappresentazione di second’ordine. Dunque, venuta meno la possibilità di radicarci in un fondamento esterno, non ci resta che aggrapparci alle nostre rappresentazioni interne. Per superare questo empasse filosofico, sono sorte concezioni naturalizzate della cognizione: sulla linea di pensiero oggettivista, ma non su quella che identifica conoscenza e rappresentazione, si colloca, ad esempio, l’approccio “ecologico”, così definito non solo perché tiene in alta considerazione la relazione tra l’individuo e l’ambiente ma anche perché ritiene che il significato sia già tutto nell’ambiente. Uno dei suoi principali sostenitori è James Gibson (The ecological approach to visual perception, 1979) secondo il quale gli organismi sono fatti in modo tale da estrarre dall’ambiente in cui vivono l’informazione necessaria per agire con successo, senza bisogno di utilizzare costruzioni mentali, interpretazioni o conferimenti di senso. Per Gibson, la percezione è un sistema d’estrazione e ciò che si estrae sono informazioni che identificano le proprietà topologiche e metriche dello spazio e le proprietà invarianti degli oggetti. Qui si pongono almeno due problemi: il primo legato al fatto che la percezione, per quanto diretta (cioè non mediata da credenze e aspettative), non esaurisce la cognizione e dunque si dovrà andare alla ricerca di principi organizzativi che, a partire dall’informazione sensoriale, diano vita a strutture di pensiero; il secondo riguarda la costanza percettiva: il riconoscimento di qualcosa che resta invariato richiede una qualche elaborazione dell’informazione.

La critica più aspra è venuta da Fodor e Pylyshyn ed ha preso di mira la nozione di ‘affordance’, che, nella teoria di Gibson, indica l’insieme di potenzialità che un oggetto, azione o situazione ha relativamente a un organismo che si trova in rapporto con esso/a ( ad esempio, noi afferriamo cose che si prestano ad essere afferrate dalla mano umana, i cani mangiano cose che hanno l’affordance della commestibilità, ecc). Fodor e Pylyshyn obiettano che qualunque cosa può essere nelle circostanze adatte una affordance per un organismo e che dunque il significato della cosa in questione è per l’organismo completamene indeterminato. Se poi, per rispondere all’obiezione, ci si appella all’atteggiamento dell’individuo verso l’oggetto o la situazione (nel senso che è questo atteggiamento a decidere del significato) non si può fare a meno di notare che esso è intriso di credenze, aspettative, scopi. Sembra dunque che non esistano informazioni neutrali, completamente scevre di contributi soggettivi. Gibson sottolinea, a sua volta, che esistono dei vincoli che delimitano le affordances possibili; ad esempio, tutti noi possiamo vedere l’ellisse (in prospettiva) di una moneta, ma non possiamo vederla come un cubo; se fosse questione di elaborazione mentale potremmo vederla come ci pare. Dunque, tali vincoli sono inscritti nelle leggi della percezione che governano l’interfaccia organismo-ambiente.

Gli esseri umani non hanno bisogno di rappresentarsi l’ambiente per interagire efficacemente con esso, così come l’edera non ha bisogno di formarsi un concetto delle superfici a cui può attaccarsi. Questa concezione, sebbene abbia il merito di avvalorare la relazione individuo-ambiente, non costituisce un’autentica alternativa al realismo cognitivo.

In Autopoiesis and Cognition (1980), Maturana e Varela presentano un modello alternativo della cognizione in cui l’organismo e il suo ambiente non sono più descrivibili l’uno indipendentemente dall’altro e in cui il modello di un mondo esterno già dato viene sostituito da quello di una realtà costruita. Un sistema autopoietico è innanzitutto un sistema autonomo, cioè distinguibile rispetto all’ambiente in cui vive e caratterizzabile come unità composta (fatta di diverse parti). In quanto tale, esso gode di struttura e di organizzazione. Quest’ultima realizza l’insieme delle relazioni che devono restare invariate perché l’unità composta non cambi la sua identità o si disintegri mentre la struttura può, anzi, deve assumere diverse forme all’interno della stessa organizzazione per garantirne l’invarianza. Un sistema è autopoietico se è in grado di guidare i propri processi di riproduzione, ossia se è dotato di chiusura operazionale. Il concetto di chiusura operazionale è stato introdotto per la prima volta nell’ambito delle neuroscienze per descrivere l’attività di automodifica del cervello. Più in generale:

“Un sistema operazionalmente chiuso è tale che il risultato dei suoi processi coincida con quegli stessi processi. Il concetto di chiusura operazionale è pertanto un modo per specificare classi di processi che, nel loro funzionamento, si rinchiudono su se stessi a formare reti autonome. Tali reti non ricadono nella classe dei sistemi definiti da meccanismi di controllo esterni (eteronomi) ma al contrario in quella definita da meccanismi interni di auto-organizzazione (autonomi)”5.

Dunque tutti gli esseri viventi sono autopoietici nella misura in cui gli unici prodotti della loro organizzazione sono loro stessi. Quando un individuo autopoietico interagisce con un ambiente, i cambiamenti strutturali che subisce sono innescati dall’ambiente ma determinati da lui stesso. Contrariamente a quanto accadeva nell’approccio ecologico alla cognizione, qui l’ambiente è una fonte di perturbazioni ma non di istruzioni mentre è la struttura stessa dell’essere vivente a determinare il suo cambiamento in rapporto alla perturbazione. Su queste basi Varela, Thompson e Rosch delineano la ‘via di mezzo della conoscenza’ che si allontana tanto dall’oggettivismo quanto dal soggettivismo, tanto dal realismo quanto dall’idealismo. La conoscenza è una struttura auto-organizzata e non consiste in statici rapporti di rappresentazione: essa è piuttosto ‘azione incarnata’o enazione ( tra i cui significati c’è ‘produrre’, ‘promulgare’, ‘emanare’):

“La cognizione dipende dal tipo di esperienza derivante dal possedere un corpo con diverse capacità sensomotorie” e “tali capacità sensomotorie individuali sono esse stesse incluse in un contesto biologico, psicologico e culturale più ampio”6.

Di nuovo, emerge l’importanza per un sistema cognitivo di avere un corpo e di essere collocato in un contesto più ampio di quello individuale, fattori a cui l’Intelligenza Artificiale simbolica è rimasta insensibile.

“Il significato non nasce con le manipolazioni di simboli, non è automaticamente secreto da una miracolosa materia grigia, e neppure è dono esclusivo della cultura. Abita però tutti e tre gli ambienti. Avere un corpo non vuol dire partecipare di un sistema di credenze condivise che guidano i comportamenti sociali; le strutture della corporeità non dipendono da strutture sociali e da codici comunicativi; semmai sono la cornice per tutte le possibili variazioni culturali. Il significato emerge tanto dall’accoppiamento tra organismo e ambiente (incluso l’ambiente culturale) quanto dalla separabilità, seppur parziale e virtuale, dell’organismo dall’ambiente (incluso l’ambiente culturale). Insomma, il significato non scaturisce né dall’interno, né dall’esterno, bensì dall’interfaccia tra l’uno e l’altro”7.

La distanza da Gibson è notevole:

“Mentre Gibson dichiara che l’ambiente è indipendente, noi sosteniamo che esso è prodotto (da storie di accoppiamento). Gibson dichiara che la percezione è rilevamento diretto, noi invece sosteniamo che essa sia enazione sensomotoria. Perciò anche le strategie di ricerca risultanti sono fondamentalmente diverse: i gibsoniani interpretano la percezione in larga misura in termini ottici (anche se ecologici) e pertanto cercano di costruire la loro teoria della percezione quasi interamente a partire dall’ambiente. Il nostro approccio, invece, procede specificando gli schemi sensomotori che consentono all’azione di essere guidata percettivamente, e pertanto noi costruiamo la teoria della percezione a partire dall’accoppiamento strutturale dell’animale”8.

In linea con l’epistemologia genetica di Piaget che spiegava come l’intelligenza sensomotoria del bambino potesse svilupparsi fino all’elaborazione di una concezione del mondo fatto di oggetti permanentemente situati nello spazio e nel tempo, Varela sottolinea la centralità dell’attività percettiva nella formazione delle strutture cognitive9. La percezione consiste in un’azione a sua volta guidata dalla percezione, il che equivale a dire che i processi sensori e motori sono inscindibili e che le strutture cognitive emergono da schemi senso-motori ricorrenti10. Questo approccio alla percezione fu, come Varela sottolinea, una delle intuizioni fondamentali dell’analisi di Merleau-Ponty, secondo il quale la percezione non è semplicemente vincolata dal mondo esterno ma contribuisce anche alla sua produzione/enazione:

“E’ proprio l’organismo, secondo la natura dei propri recettori, secondo le soglie dei suoi centri nervosi, secondo i movimenti degli organi, che trasceglie nel mondo fisico gli stimoli ai quali sarà sensibile. L’ambiente si costituisce nel mondo secondo l’essere dell’organismo, restando inteso che un organismo può sussistere soltanto a patto di trovare nel mondo un ambiente adeguato”11.

Tuttavia, l’attività percettiva non esaurisce la cognizione ma si limita a porle dei vincoli, peraltro già messi in luce dall’articolo:”What the frog’s eye tells the frog’s brain”(1959) in cui Maturana, Lettvin, McCulloch e Pitts esponevano i dati raccolti sul sistema ottico delle rane, sostenendo che il mondo percepito dalla rana fosse profondamente diverso da quello cui ha accesso la mosca. Ad esempio la rana identifica una mosca come possibile preda solo se questa è in movimento e, viceversa, qualsiasi cosa che si muovesse come una mosca sarebbe una mosca per la rana. Dunque, il sistema ottico della rana, così come quello di ogni essere vivente, vincola la sua visione del mondo. Ora, se nel caso della rana questo vincolo è probabilmente esaustivo di ciò che per lei è il mondo, lo stesso non si può dire per gli organismi dotati di un retroterra culturale, linguistico, sociale, ecc: quanto più il mondo culturale è ricco, tanto più le risorse percettive sono riorientabili. “L’intuizione centrale di quest’orientamento non oggettivista è la concezione secondo la quale la conoscenza sarebbe il risultato di un’incessante interpretazione che emerge dalle nostre capacità di comprensione. Queste capacità sono radicate nelle strutture della nostra corporeità biologica, ma sono vissute e sperimentate in un ambito di azione consensuale e di storia culturale”12. Il riconoscimento dei colori, ad esempio, sembra coinvolgere operazioni di diversa natura: in particolare, mentre alcune categorie (rosso, giallo, blu, verde, nero e bianco) sono interamente determinate da schemi emergenti di attività neuronale nel sistema visivo, altre (arancione, porpora, marrone e rosa) richiedono operazioni cognitive di due tipi: universale per la nostra specie e cultura-specifica13. Lo studio sulla categorizzazione dei colori ci permette di affermare che:

“I colori non sono ‘là fuori’, indipendentemente dalle nostre capacità percettive e cognitive, e che essi non sono neppure ‘qui dentro’, indipendentemente dal mondo biologico e culturale che ci circonda. Contrariamente alla concezione oggettivista, le categorie dei colori sono esperenziali; contrariamente a quella soggettivista, esse appartengono al nostro mondo biologico e culturale condiviso”14. Abbandonando la concezione rappresentazionalista e ponendo l’accento sul mutuo forgiarsi di organismo e ambiente, peraltro già messo in luce da Merleau-Ponty, la via di mezzo della conoscenza si colloca al livello dell’interfaccia tra mente, società e cultura.

La scienza cognitiva enattiva trova la sua principale applicazione nell’ambito della robotica enattiva di Rodney Brooks. Lo scopo di Brooks è quello di costruire un robot completamente autonomo che interagisca liberamente con l’ambiente reale:

“L’idea è quella di costruire dapprima un sistema autonomo completo molto semplice, e nel metterlo alla prova nel mondo reale. Il nostro esempio preferito di tale sistema è una Creatura, in realtà un robot mobile, che eviti di urtare gli oggetti. Esso avverte la presenza degli oggetti nelle sue immediate vicinanze e si allontana da essi, fermandosi se percepisce qualcosa sul suo cammino. Anche se per costruire questo sistema è ancora necessaria la sua scomposizione in parti, tuttavia non è necessaria alcuna netta distinzione tra un ‘sottosistema percettivo’, un ‘sistema centrale’, e un ‘sistema dell’azione’. In realtà potrebbero benissimo esserci due canali indipendenti che mettano in connessione la percezione e l’azione, in modo che non ci sia un unico sito a livello del quale la percezione produca una rappresentazione del mondo nel senso tradizionale”15 . Varela, Thompson e Rosch fanno notare quanto, in continuità con l’approccio enattivo, Brooks concentri l’attenzione sui problemi dell’interazione senso-motoria dell’agente con l’ambiente e l’assenza di rappresentazioni esplicite nei vari livelli dell’architettura. La robotica alla Brooks ha incontrato, però, delle serie difficoltà allorché ha tentato di sviluppare le capacità dei robots da un livello meramente reattivo a un livello cognitivo più complesso , difficoltà di cui i sostenitori dell’approccio enattivo non fanno menzione. In particolare, più si riducono le restrizioni sull’ambiente, più i robots perdono l’abilità di affrontare i compiti che prima affrontavano con successo. In un articolo più recente, Brooks, descrivendo Cog, un’altra creatura robotica, afferma:

“L’accoppiamento fisico diretto tra azione e percezione riduce la necessità di una rappresentazione intermediaria. Per un sistema dotato di un corpo le rappresentazioni possono, in ultima analisi essere fondate nelle interazioni senso-motorie con il mondo. I nostri sistemi sono fisicamente accoppiati con l’ambiente e operano direttamente nell’ambiente stesso senza nessuna esplicita rappresentazione di esso. Ci sono rappresentazioni, o accumuli di stati, ma queste si riferiscono soltanto ai processi interni del sistema e sono prive di significato senza interazione con l’ambiente esterno”16.

Dunque, nonostante le dichiarazioni d’intenti, sembra che le rappresentazioni, anche se solo come modelli parziali del mondo relativi allo svolgimento di certi compiti, non siano del tutto assenti (tant’è che Brooks stesso ha proposto un nuovo slogan: non più ‘intelligenza senza rappresentazione’, bensì ‘intelligenza senza ragione’ in polemica con il razionalismo dell’I.A.). In realtà, questo non vale solo per gli sviluppi più recenti della robotica di Brooks (behavior based) ma anche per i suoi primi robots; Allen, per esempio, era munito di un sonar per rilevare gli ostacoli lungo il proprio percorso: la ricezione dei segnali di ritorno funzionava come “rappresentazione interna” degli oggetti che il robot doveva evitare. Una tale rappresentazione ha carattere analogico e distribuito (in un modello connessionista essa corrisponde a un certo valore di attivazione). Stabilire se essa sia anche simbolica è questione controversa. Criticando la robotica behavior-based, Vera e Simon ritengono che l’interazione senso-motoria di un agente con l’ambiente non può che essere considerata se non come manipolazione simbolica (le rappresentazioni di Allen sono per loro pienamente simboliche). L’informazione sensoriale captata dal robot sarebbe convertita in simboli, i quali sarebbero manipolati al fine di determinare gli appropriati simboli motori che evocano o modificano un certo comportamento. Nell’interazione con l’ambiente, un agente ha un’attività rappresentazionale che è data dalle caratteristiche specifiche del suo apparato fisico di codifica-elaborazione-decodifica di simboli. Non parlare di rappresentazioni interne e limitarsi a dire che un agente intrattiene “certe relazioni causali con il mondo, non spiega come queste relazioni vengono mantenute. E’ del tutto ragionevole sostenere che un agente mantiene un orientamento verso un oggetto tramite una relazione causale con esso e che tale relazione è un pattern di interazione, ma non ha senso pensare che tale pattern venga prodotto per magia, senza un corrispondente cambiamento di stato rappresentazionale dell’agente, ovvero che esso possa aver luogo senza una rappresentazione interna fosse pur minima”17.

Per Vera e Simon un sistema fisico simbolico (PSSH) interagisce con l’ambiente in due modi; da un lato riceve stimoli sensoriali e li converte in strutture di simboli (rappresentazioni interne), dall’altro agisce nell’ambiente in modi che sono determinati dai simboli motori che esso stesso ha prodotto. L’informazione sensoriale viene perciò convertita in simboli che, a loro volta, vengono processati e valutati al fine di determinare i simboli motori appropriati a dar vita al comportamento. Questa visione si scontra con un primo ordine di problemi messi in luce da Nolfi:

“Purtroppo, estrarre dal mondo attraverso dei sensori fisici una descrizione simbolica dell’ambiente esterno è tutt’altro che ovvio e può rivelarsi un’impresa impossibile se ci si aspetta una rappresentazione esatta e completa dell’ambiente esterno. Ciò è dovuto a una serie di difficoltà: i sensori sono in grado di misurare informazioni quantitative non simboliche; i valori misurati dai sensori sono un’indicazione molto indiretta e rumorosa delle quantità misurate; il mondo reale è pieno di ambiguità e spesso in continuo cambiamento”18.

Un secondo ordine di problemi riguarda proprio la nozione di simbolo: la funzione di denotazione è quella che dà al simbolo la sua capacità rappresentazionale: un simbolo è un pattern19 che denota un altro simbolo, ma può anche denotare il pattern di uno stimolo sensoriale o un’azione motoria.

Nella loro risposta a Vera e Simon, Touretzky e Pomerleau affermano:

“Il primo errore nell’argomento di Vera e Simon è di confondere ‘segnale’ con ‘simbolo’:’chiamiamo patterns i simboli quando possono designare o denotare’(p.9). Questo non lascia nessuna possibilità alle rappresentazioni non simboliche. Secondo questo punto di vista, i patterns di attività neuronale nella retina, e presumibilmente anche le convenzioni segnaletiche elementari dei campanelli o dei distributori automatici sono elevati a sistemi simbolici, rendendo il concetto di ‘simbolo’ privo di significato”20.

Tourketzky e Pomerleau tracciano una distinzione tra “segnali” e “simboli”, basata su una definizione di Hanard, secondo la quale: 1) i simboli hanno forme arbitrarie prive di correlazione con i loro significati, 2) le strutture di simboli possono essere composte in rappresentazioni, secondo regole ricorsive. Dunque, diversamente da Vera e Simon, secondo i quali qualsiasi cosa in grado di denotare è un simbolo, una rappresentazione è un simbolo solo se è capace di designazione arbitraria e di potere combinatorio.

Vera e Simon sottolineano anche che, troppo spesso, il carattere simbolico delle rappresentazioni mentali viene misconosciuto perché confuso con il loro statuto non conscio:

“Il fatto che molti processi mentali siano senza dubbio inconsci o subconsci non dice niente sulla questione se siano o meno simbolici. Inoltre, “simbolico” non è sinonimo di “verbale”: le strutture simboliche possono designare parole, immagini mentali o diagrammi, così come altre rappresentazioni di informazione”21.

Mentre la prima parte del loro discorso, relativa ai rapporti tra simbolicità e coscienza, incontra il favore di Tourketzy e Pomerleau, la seconda appare molto più controversa: accomunando sotto il marchio del ‘simbolico’ parole, immagini mentali e diagrammi Vera e Simon parlano in maniera indifferenziata di cose piuttosto eterogenee. In particolare, esiste una sostanziale differenza tra rappresentazioni simboliche come le parole e rappresentazioni analogiche come i diagrammi. Le parole sono genuinamente simboliche (nel senso specificato da Tourketzy e Pomerleau) in quanto le relazioni che intrattengono con i loro significati sono arbitrarie (convenzionali) e in quanto possono essere combinate secondo regole ricorsive per creare strutture linguistiche più complesse; le rappresentazioni analogiche, al contrario, non denotano oggetti arbitrariamente ma in virtù della loro somiglianza con essi (si può pensare, per esempio, all’omomorfismo tra i livelli di voltaggio di un termostato e i valori della temperatura in una stanza). Per quanto riguarda le immagini mentali, sembra particolarmente di rilievo, ai fini di questa discussione, capirne la natura.

Vera e Simon affermano che: “ La ricezione di certi patterns relativi ad uno stimolo sensoriale (dire GATTO) può causare la creazione nella memoria del simbolo che designa un gatto (non la parola “gatto” ma l’animale)”22. Il simbolo in questione, quello che si viene a creare nella mente di chi sente la parola”gatto”, è appunto un’immagine mentale. Per Vera e Simon essa ha carattere simbolico in quanto denota un oggetto del mondo ma, argomentano Tourketzy e Pomerleau, “ i concetti nelle nostre teste, come “ragazzo” o “dare”, difficilmente sono atomici. Essi sono complesse reti di riferimento ad altri concetti e impressioni sensoriali, aventi forme lontane dall’arbitrarietà”23.

Già Hanard, affrontando la questione del symbol grounding nelle reti neurali artificiali, aveva messo in luce che il fondamento dei simboli nei predicati analogici facenti riferimento all’esperienza sensoria è una caratteristica fondamentale dell’intelligenza umana che influenza anche le nostre più astratte concettualizzazioni. Come ipotizzano Tourketzy e Pomerleau, l’evoluzione potrebbe aver “favorito” l’assimilazione da parte delle nostre rappresentazioni mentali di proprietà del mondo rilevanti ai fini della sopravvivenza; “ad esempio, i simboli LEONE e TIGRE potrebbero avere realizzazioni neurali simili se la Natura lo trovasse utile al fine di implementare un comportamento intelligente in tempo reale”24. Se questo fosse vero avremmo una concatenazione di livelli ascendenti in cui le rappresentazioni non simboliche (iconiche) del livello inferiore fondano quelle simboliche del livello superiore.

Ciò che emerge da un confronto critico tra le posizioni di Vera e Simon da un lato e Touretzy e Pomerleau dall’altro, è un sostanziale accordo riguardo alla necessità di reintrodurre, a un qualche livello della cognizione, quelle rappresentazioni di cui Brooks voleva fare a meno, ma una altrettanto sostanziale divergenza nel modo di caratterizzare queste rappresentazioni: per i primi le rappresentazioni sono modelli semplificati di una situazione reale che è troppo complessa per permettere ad un agente di coglierla nella sua integrità allo scopo di generare un comportamento efficace in tempo reale; sostenendo la necessità di un processo simbolico intermediario tra percezione e azione, essi assumono implicitamente che la percezione diretta debba necessariamente cogliere tutti gli aspetti di una situazione, di una scena o semplicemente di un oggetto percepito. Ci sono però buone ragioni per ritenere che questo non sia vero: Ballard, ad esempio, ha mostrato che gli agenti umani non costruiscono un modello interno dell’intera scena visibile con la quale sono chiamati ad interagire, ma si rappresentano solo ciò che è immediatamente rilevante. In soggetti ai quali era stato chiesto di eseguire un compito complesso come quello di costruire una copia di un’immagine contenente la dislocazione di certi blocchi, si è notato che, cambiando l’immagine a loro insaputa, questi notavano soltanto il cambiamento più drastico. Sembrerebbe allora superfluo ricorrere alla manipolazione di strutture simboliche quando è la percezione stessa a selezionare l’informazione rilevante per la costruzione di una rappresentazione analogica di una scena visiva. Riferendosi alla posizione di Vera e Simon, Greeno and Moore affermano:

“Essi sostengono che i modelli che ipotizzano processi simbolici siano sufficienti a render conto dei fenomeni complessi in un ambiente che cambia dinamicamente. Secondo noi, la questione non dovrebbe essere se un sistema che usa processi simbolici è sufficiente, ma se i processi simbolici ipotizzati sono necessari”25.

Il dibattito tra l’approccio simbolico e quello ibrido (in parte simbolico, in parte subsimbolico) si fa particolarmente serrato e significativo intorno al sistema robotico di guida Navlab (Pomerleau, Gowdy, Thorpe, 1991).

Navlab ha molte componenti: un sistema di percezione, uno di attuazione e uno di decisione reciprocamente indipendenti che sono in grado di determinare la posizione del veicolo, la meta che vuole raggiungere e il modo di raggiungerla. L’informazione estratta da ogni modulo viene poi integrata per dar vita ad un’azione in tempo reale. Concentriamo l’attenzione su due componenti fondamentali del sistema: la sua rete neurale che gestisce le manovre di guida e la sua mappa interna che contiene informazioni sulla disposizione delle strade, sui punti di riferimento presenti nell’area che il veicolo deve attraversare e sulla posizione del veicolo stesso. Nella fase di apprendimento, un conducente umano guida il veicolo attraversando una strada uguale a quella che attraverserà il robot più tardi e i pesi vengono corretti con backpropagation usando come input l’immagine proveniente da uno schermo su cui è proiettata la strada e come output desiderato la posizione del volante. Per Vera e Simon Navlab, compresa la sua rete neurale, è un sistema simbolico. Riferendosi alla situazione di guida, essi scrivono:

“Questa azione situata non può durare a lungo senza una rappresentazione interna. La sua rappresentazione è il risultato di una complessa traduzione in termini funzionali di una situazione fisica il cui significato funzionale è implicito”26.
Fare riferimento al linguaggio funzionale significa appellarsi a regole del tipo:”Se la curva è a sinistra, allora gira a sinistra”. Il vantaggio di queste regole consisterebbe, secondo i due autori, nella loro immediata applicabilità; esse consentirebbero di generare un’azione in tempo reale, senza bisogno di evocare i livelli più bassi della cognizione aventi a che fare con l’elaborazione di piani e strategie di soluzione che intervengono nelle fase di apprendimento (quando si impara ad affrontare le curve).

“Insomma in questa interpretazione di Simon e Vera l’interazione in tempo reale dell’agente con l’ambiente è data non dal fatto di essere non simbolica e di non poter essere modellizzata mediante regole di produzione, ma dal fatto di non dover accedere, per dare la riposta corretta, alla complessità delle procedure di elaborazione simbolica dei livelli soggiacenti a quello “alto”27.

Nella loro analisi di Navlab, Greeno e Moore distinguono invece processi simbolici e processi non simbolici. In particolare essi ritengono che le attivazioni della rete che connettono gli inputs sensoriali con i cambiamenti nella posizione del volante non possano essere caratterizzati come processi simbolici:

“C’è una relazione causale tra le proprietà dell’ambiente fisico e i patterns di attivazione nella rete, ma non c’è un processo di interpretazione semantica con il quale sia conferito un significato referenziale a questi patterns”28.

Ciò che per loro contraddistingue i simboli è il fatto che siano semanticamente interpretabili; sulla base di questo criterio, essi ritengono che il processo di riconoscimento di punti di riferimento che corrispondono a simboli nella mappa di Navlab sia simbolico, così come il processo di determinazione della posizione del veicolo. In entrambi i casi, infatti, abbiamo a che fare con simboli sulla mappa e con un processo di accoppiamento referenziale tra questi simboli e gli oggetti per cui essi stanno. Questo sembra essere il pomo della discordia: Touretzky e Pomerleau obiettano:

“La distinzione cruciale tra la rete neurale di Navlab e le componenti simboliche della mappa è che in queste ultime le relazioni tra i patterns e i loro referenti sono arbitrarie. La mappa richiede un’interpretazione che connetta i suoi simboli formali e arbitrari alle caratteristiche dell’ambiente che essi designano. Ma ALVINN29 non è capace di designazione arbitraria; i suoi patterns di attivazione sono correlati analogicamente a specifici stati del mondo. ALVINN è un esempio di percezione diretta che non richiede interpretazione; i suoi simboli hanno significato intrinseco, non referenziale”30.

Quest’ultima interpretazione appare molto più coerente col modo di funzionare di una rete neurale; è vero che i simboli di cui si sta parlando occorrono nella mappa (e non nella rete) ma, in ultima analisi, chi dovrebbe interpretarli? Da dove dovrebbe scaturire la semantica? Se la loro designazione fosse completamente arbitraria, come la nozione di simbolo richiederebbe, né una rete neurale, né un computer seriale sarebbe in grado di associare ad essi oggetti del mondo. O la semantica non c’è, come accade nei calcolatori tradizionali in cui è il fruitore a dover attribuire un significato ai simboli, o essa viene introdotta come nei sistemi esperti ma è limitata a domini di competenza molto ristretti, o, infine, essa è incorporata come accade nei modelli connessionisti in cui le rappresentazioni analogiche si traducono in spazi di somiglianza che fondano dal basso le rappresentazioni simboliche necessarie nei processi ‘alti’della cognizione (linguaggio, categorizzazione, interazione ambientale e sociale, ecc..).

Tourektzy e Pomerleau concludono:

“Siamo guidati da un modello della cognizione nel quale la manipolazione simbolica conscia e deliberata si colloca al livello più alto, i processi simbolici subconsci costituiscono il livello intermedio e specializzati moduli non simbolici appaiono al livello più basso”31.

Nonostante la divergenza sull’interpretazione della mappa di ALVINN, anche Greeno e Moore sembrano trarre una conclusione simile:

“Crediamo che la struttura del processamento simbolico dovrebbe essere sussunta da una teoria nella quale i processi simbolici sono considerati come un tipo di attività cognitiva”32.

Da questa analisi dovrebbe essere emersa la necessità di reintrodurre le rappresentazioni nella conoscenza, ma anche il fatto che parlare di rappresentazioni non significa esclusivamente parlare di manipolazione formale di simboli. L’approccio che meglio risponde ad entrambe queste esigenze sembra essere quello ibrido che ammette la complementarietà dei processi simbolici e subsimbolici. Se da un lato, la concezione enattiva di Varela giustamente rivendicava il ruolo centrale dell’interazione individuo-ambiente ma riabilitava il soggetto dalla passività con cui l’approccio ecologico lo aveva descritto, dall’altro, essa abbracciava progetti radicali come quelli della robotica enattiva che implicitamente negavano proprio quella riabilitazione, privilegiando la conoscenza tramite percezione diretta a discapito del paradigma rappresentazionale. Riconoscere l’indispensabilità di quest’ultimo, d’altra parte, non deve tradursi nel vedere simboli ovunque, ossia nell’adesione a un modello come quello di Vera e Simon, in cui la cognizione è interamente ed indiscriminatamente simbolica. Mi pare, piuttosto, che la via di mezzo della conoscenza, tracciata nelle sue direttive teoriche da Varela, Thompson e Rosch, sarebbe veramente tale solo se sposasse visioni ibride della cognizione come quelle di Touretzky e Pomerleau o di Greeno e Moore nel fondamentale riconoscimento che i modelli connessionisti sono in grado di implementarle grazie al processo del symbol grounding.

NOTE:

1. Aleksander, Come si costruisce una mente, Einaudi, Torino, 2001, p.178
2. Le tre leggi sono: prossimità (oggetti vicini tendono ad essere raggruppati), simmetria (regioni chiuse e simmetriche tendono a corrispondere ad oggetti più di regioni asimetriche), buona continuazione (minimizzazione delle interruzioni e delle discontinuità).
3. Peruzzi, Il significato inesistente: Lezioni sulla semantica, University Press, Firenze, 2004, p.483
4. Aleksander, op. cit., p.188
5. Varela, Thompson, Rosch, La via di mezzo della conoscenza, Feltrinelli, Milano 1992, p.170
6. ivi , p.206
7. Peruzzi, op. cit, p.523
8. Varela, Thompson, Rosch, op. cit., p.240. Con l’espressione “accoppiamento strutturale” gli autori si riferiscono all’interazione individuo-ambiente.
9. Una non trascurabile differenza allontana però Varela da Piaget. Lo stesso Varela fa notare che “Piaget, tuttavia, come teorico non sembrò mai dubitare dell’esistenza di un mondo prestabilito e di un soggetto conoscente indipendente con una meta logica prestabilita per lo sviluppo cognitivo. Le leggi di tale sviluppo, anche allo stadio sensomotorio, consistono in un’assimilazione di quel mondo prestabilito e in un accomodamento nei suoi confronti” (Varela, Thompson, Rosch, op. cit, p.210).
10. Un esempio di guida percettiva dell’azione ci è offerto dagli studi di Held e Hein, i quali allevarono dei gattini al buio e li esposero alla luce solo in condizioni controllate. Ad un primo gruppo di animali fu consentito di muoversi normalmente ma ciascuno di essi trainava un carrello su cui si trovava un animale del secondo gruppo. I due gruppi condividevano la stessa esperienza visiva ma il secondo era completamente passivo. Quando gli animali furono liberati, quelli del secondo gruppo si comportarono come se fossero stati ciechi, urtando contro gli oggetti e cadendo. Questo esperimento avvalora la concezione enattiva secondo cui gli oggetti non vengono visti tramite l’estrazione di caratteristiche da parte del sistema visivo ma piuttosto attraverso la guida visiva dell’azione.
11. Merleau-Ponty, La struttura del comportamento, Bompiani 1973, p.37
12. Varela, Thompson, Rosch, op. cit., p.180
13. Le operazioni del primo tipo sono operazioni di intersezione tra insiemi sfumati, ossia insiemi che ammettono diversi gradi di appartenenza. Il grado di appartenenza è specificato da una funzione che assegna a ciascun membro dell’insieme un valore compreso tra 0 e 1. Il secondo tipo di operazioni dipende dalla cultura e dalla lingua di appartenenza. Ad esempio, secondo uno studio di MacLaury, il porpora è a volte situato nella gamma dei colori freddi, altre volte al confine tra i colori freddi e il rosso, mentre il marrone viene collocato talvolta nella categoria del giallo, talvolta in quella del nero.
14. Varela, Thompson, Rosch, op. cit., p. 205
15. Brooks, Intelligence without representation, MIT AI Report, 1987, cit. in Varela, Thompson, Rosch, op. cit., p.247
16. Brooks, Braezeal, Marjanovic, Scassellati, Williamson, The Cog project: Building an Humanoid Robot, MIT AI, 1998, trad. mia
17. Vera, Simon, Situated action: a symbolic interpretation,in Cognitive Science, n. 17, 1993, trad. mia
18. Nolfi, Pianificazione e robotica, in Burattini , Cordeschi, L’Intelligenza Artificiale, Carocci, Roma 2001
19. Per pattern si intende una struttura fisica, biologica o inorganica (sistema nervoso, computer) che può essere oggetto di procesi computazionali quali codifica, decodifica, registrazione, cancellazione, cambiamento, confronto.
20. Touretzky, Pomerleau, Reconstructing Phisical Systems, in Cognitive Science, n. 18, p.345
21. Vera, Simon, op. cit., p.10, trad. mia.
22. ivi. p.9 , trad. mia
23. Touretzy, Pomerleau, op. cit., p.350, trad. mia
24. ivi. p.349
25. Greeno, Moore, Situativity and Symbols: Response to Vera and Simon, in Cognitive Science, n.17, 1993, p.56, trad. mia
26. Vera, Simon, op. cit., p.14, trad. mia
27. Cordeschi, Vecchi problemi filosofici per la nuova Intelligenza Artificiale, http://lgxserve.ciseca.uniba.it, p.19
28. Greeno, Moore, op. cit., p.54, trad. mia
29. Alvinn è il nome dell’intero sistema robotico, mentre Navlab è il nome della sua componente connessionista
30. Tourektzy e Pomerleau, op. cit., p. 349, trad. mia
31. vi, p.351, trad mia
32. Greeno, Moore, op. cit., p.57, trad. mia

OPERE DI RIFERIMENTO:

Aleksander, Come si costruisce una mente, Einaudi, Torino, 2001

Brooks, Braezeal, Marjanovic, Scassellati, Williamson, The Cog project: building an humanoid robot, MIT press, 1998

Cordeschi, Vecchi problemi filosofici per la nuova Intelligemza Artificiale, http.//lgxserve.uniba.it, 2001

Greco, Cangelosi, Riga, Il fondamento dei simboli attraverso l’esperienza con il mondo: u approccio connessionista, in Sistemi Intelligenti, n.1, Il Mulino, Bologna, 2004

Greeno, Moore, Situativity and Symbols: Response to Vera and Simon, in Cognitive Science, n.17, 1993

Nolfi, Pianificazione Robotic, in Burattini, Cordeschi, L’intelligenza Artificiale, Carocci, Roma, 2001

Peruzzi, Il significato inesistente:lezioni sulla semantica, University Press, Firenze, 2004

Touretztky, Pomerleau, Reconstructing Phisical Systems, in Cognitive Science, n.18, 1993

---

Ilaria Mavilla (email) svolge la sua attività presso il Dipartimento di Filosofia dell'Università di Firenze.

Autori: 

Ilaria Mavilla

Categoria: