RSS Saggi RSS Commenti 101 Saggi presenti in Archivio

Archive for the 'Intelligenza Artificiale' Category

“La Tecnoscienza è Democratica ?” di Giuseppe Longo

Attualmente in Italia il legislatore – attraverso lo strumento della circolare ministeriale – ha deciso di autorizzare la clonazione animale. Resta (per ora) quello sulla clonazione umana: ma chi pronosticasse la sua prossima abolizione sarebbe facile profeta.

La tecnoscienza non si ferma: all’insegna del motto “tutto ciò che si può fare si fa”, essa travolge ogni ostacolo. Incapace di darsi limitazioni interne, l’attività tecnoscientifica trova anche all’esterno argini sempre più labili. La velocità dell’innovazione e la necessità di sostenere un sistema di produzione e consumo che si regge sullo squilibrio crescente indeboliscono la politica, riducono il tempo della riflessione e modificano senza sosta i parametri etici. Inoltre l’interesse dei potentati economici impone ormai di finanziare solo ricerche che promettano applicazioni immediate.

In passato l’instabilità intrinseca del cervello umano si travasava solo nelle parole e nei libri, con esigue conseguenze sul mondo. Poi gli uomini accesero i fuochi sotto le caldaie e misero in moto le macchine: allora, grazie al braccio armato della tecnica, il potere trasformativo e destabilizzante del pensiero, specie del pensiero scientifico, traboccò all’esterno.

Da sempre l’uomo nutre l’ambizione smisurata di imitare l’atto divino della creazione. Questa impresa, in cui s’intrecciano la vertigine del creatore e il timore per la creatura che, come il mostro di Frankenstein, potrebbe ribellarsi al suo demiurgo, oggi sembra sul punto di riuscire. La tecnologia informatica e soprattutto le biotecnologie offrono la possibilità di imprimere una svolta decisiva all’evoluzione della vita e dell’uomo.

Ma la svolta, che pure coinvolgerebbe il futuro di tutti, è animata da un finalismo che persegue obiettivi precisi e limitati, spesso inquinati da pesanti interessi economici. Questo carattere mirato, che nel breve periodo si propone fini nobili, come la cura di certe patologie o la moltiplicazione dei pani e dei pesci (ovviamente transgenici), potrebbe alla lunga non solo espropriare gli agricoltori dei loro mezzi di produzione, ma anche sottrarre all’evoluzione la flessibilità che le deriva dai lenti e collaudati meccanismi di mutazione e selezione. L’evoluzione artificiale, proprio perché finalizzata, potrebbe essere incapace di adattarsi a mutate condizioni ambientali.

Di fronte all’immensità di queste prospettive allettanti e rischiose, siamo incerti tra progresso e conservazione. Ci sentiamo più padroni del nostro destino perché ai ciechi meccanismi dell’evoluzione biologica abbiamo affiancato quelli consapevoli della razionalità. Ma questa autonomia ci sgomenta e ci fa a volte rimpiangere i tempi in cui le regole erano emanate da un’autorità esterna e non erano faticosamente conquistate per essere di continuo trasgredite.

La moltiplicazione delle scelte possibili dovrebbe portare a una maggiore sensibilità etica. Invece gli specialisti, che vorrebbero dalla società una delega in bianco, ostentano sicurezze perentorie quanto discutibili e non accettano alcuna responsabilità per le conseguenze delle loro ricerche. L’accesso sempre più facile e diffuso alle notizie genera in ciascuno di noi il desiderio di contribuire alle decisioni importanti: ma la tecnoscienza, pretendendo l’esclusiva della competenza e delle decisioni, tende a limitare questa partecipazione e, di conseguenza, si oppone alla democrazia.

“Intelligenza Artificiale: il computer è intelligente ?” di Giuseppe Longo

Nell’aprile 1836 il Southern Literary Journal di Richmond, in Virginia, pubblicò un lungo articolo in cui Edgar Allan Poe sottoponeva ad esame analitico un automa straordinario che giocava a scacchi senza intervento palese dell’uomo. “Molti uomini di genio e di grande acutezza, scriveva Poe, non hanno esitato a definire questo automa una pura macchina. Se così fosse, si tratterebbe dell’invenzione più straordinaria del genere umano.”

Il sogno di costruire un meccanismo capace di giocare a scacchi sembrò attuarsi nel 1769, quando il barone e ingegnere ungherese Wolfgang von Kempelen presentò alla corte di Maria Teresa d’Austria un “automa scacchista”. Vestito alla turca, capace di giocare (e vincere) movendo i pezzi con il braccio sinistro, il Turco di von Kempelen si esibì in Russia, a Parigi e a Londra, suscitando stupore ed entusiasmo. Acquistato dopo la morte del barone da Johann Maelzel, continuò la sua tournée in tutta Europa e, nel 1825, sbarcò negli Stati Uniti. Il Turco stava seduto dietro una specie di canterano che lo nascondeva dalla vita in giù. Prima dell’esibizione, Maelzel apriva gli sportelli anteriori e posteriori del canterano per dissipare il dubbio che vi si celasse una persona. Ma Poe analizzò la successione delle aperture e chiusure, dimostrando che un uomo avrebbe potuto nascondersi nel mobile.

Lo scrittore americano esaminò poi come l’automa muoveva il braccio, roteava gli occhi e spostava i pezzi, e concluse che di fatto nell’armadio si celava uno scacchista provetto. In seguito, pieno di debiti, Maelzel fu costretto a vendere l’automa a un certo Mr. Ohl, che a sua volta lo cedette al museo di Filadelfia. Il Turco fu distrutto dall’incendio che devastò la città il 5 luglio 1854. Che cosa c’insegna questa storia? Diciamo che un computer è “intelligente” se sul suo schermo compaiono segni che giudicheremmo intelligenti se fossero opera di un essere umano. Ma dietro lo schermo c’è una macchina o un uomo? Da una parte ci sono gli entusiasti dell’intelligenza artificiale (Poe li definirebbe creduloni), convinti che la macchina si comporti in modo autonomo: il Turco (o il suo discendente Deep Blue, che ha sconfitto Kasparov) gioca davvero a scacchi senza intervento umano e, siccome non si tratta di un gioco deterministico come un’operazione aritmetica, manifesta iniziativa e capacità di decisione. Insomma il computer è intelligente.

Dall’altra parte ci sono gli scettici, per i quali la macchina non fa altro che eseguire un programma che le è stato assegnato dall’uomo. Per costoro è come se all’interno del calcolatore si nascondesse un essere umano, o almeno il suo fantasma sotto forma di algoritmo. La macchina sarebbe solo un prolungamento della nostra mente: il senso delle sue operazioni starebbe sempre nell’uomo.

In questa seconda prospettiva, che condivido, uomo e macchina non si possono separare. Essi costituiscono un simbionte cognitivo, dotato di proprietà inedite: senza il computer l’uomo è menomato, ma senza l’uomo il computer è inerte. Chi sostiene l’autonomia delle macchine, invece, tende ad assimilare il computer all’uomo (e l’uomo al computer).

“I Robot e i sentimenti umani” di Giuseppe Longo

C’è un famoso film di Spielberg, “A. I.” (”Intelligenza Artificiale”), in cui si affrontano i delicati problemi che nascerebbero se i ricercatori riuscissero a riprodurre sentimenti umani nelle creature artificiali.

Da secoli tentiamo di imitare l’atto divino della creazione, e la storia é piena di tentativi goffi e curiosi: gli automi, dispositivi spesso zoomorfi o antropomorfi che, mossi da meccanismi nascosti al loro interno, riproducevano alcuni comportamenti degli esseri viventi.

Questi congegni erano ovviamente lontanissimi dai loro modelli, cui si avvicinavano per la forma esteriore, ma non certo per la somiglianza strutturale e funzionale. Le cose subirono una svolta verso la metà del Novecento, quando furono costruiti i primi calcolatori elettronici. Si capì ben presto che il computer non era solo una macchina per far di conto, ma possedeva immense capacità nell’ambito del mondo simbolico della mente.

A questo punto l’obiettivo dei costruttori mutò: non si cercò più, ingenuamente, di costruire una creatura simile all’uomo nel suo complesso, bensì di riprodurne o simularne con precisione una sola parte, quella ritenuta più importante: la mente. A quei tempi c’era (e in parte c’é ancora) una forte tendenza a identificare l’intelligenza con i suoi aspetti logici e razionali e questa identificazione, cui contribuì potentemente il computer, rafforzò a sua volta la convinzione che l’informatica fosse la tecnologia giusta per costruire un modello corretto della mente. Nel 1956 queste ricerche si costituirono in una nuova disciplina: l’intelligenza artificiale.

Essa si proponeva di descrivere le funzioni della mente tramite algoritmi, o programmi, e di trasferirli poi in un computer. Eseguendo tali programmi, il computer si sarebbe comportato come una mente, anzi sarebbe diventato una mente.

Ma oggi si va oltre e si tenta di riprodurre nei computer non solo l’intelligenza astratta, bensì anche i sentimenti, le emozioni e quella sfuggente entità che si chiama coscienza.

Se questi tentativi dovessero riuscire e nascessero i robot coscienti, si aprirebbero orizzonti inauditi e problematici. Perchè questi esseri potrebbero, come noi, essere soggetti al dolore. Allora perchè suscitare dal nulla creature tanto simili a noi da essere capaci di soffrire? La loro sofferenza, che potrebbe derivare per esempio dalla consapevolezza di non essere del tutto assimilabili agli uomini (pensiamo ai replicanti di “Blade Runner”), sarebbe un triste corollario della nostra abilità creatrice.

La psicologia degli automi, degli androidi e dei ciborg é oggi uno dei temi più interessanti della fantascienza e forse sarà uno dei problemi più ardui di un futuro già a portata di mano. E noi, come dovremmo comportarci verso esseri tanto sensibili e delicati? Riusciremmo ad avere nei loro confronti un atteggiamento più “umano” di quello che abbiamo spesso verso gli animali? Il rapporto uomo-macchina, già’ complesso oggi in un mondo dove le macchine sono “solo” macchine, si complicherebbe ulteriormente.

E se, col nostro aiuto, queste macchine diventassero tanto simili all’uomo da rendere incerto il confine tra noi e loro, che cosa dovremmo concluderne? Che l’uomo in fondo é una macchina? O che é dotato di una virtù creatrice divina? Per il momento si tratta di speculazioni, ma sappiamo bene che la realtà finisce spesso col superare le fantasie più sfrenate.

“Ingegneria genetica: imitazione e controllo della Natura” di Ermanno De Fazi e Roberto Villa

Natura diversifica e imita:
artificio imita e diversifica

Blaise Pascal

 

Dati gli elementi di un insieme, implicano diversità tutte quelle relazioni che un elemento non sviluppa con se stesso. Nel contesto delle scienze biologiche, l’ambiente può essere definito come “il dominio delle relazioni che implicano diversità”. Ogni essere vivente si differenzia nell’ambiente, senza rinunciare all’omologia con la specie d’origine. Tuttavia, l’uniformità esiste e si manifesta nella sostanziale somiglianza dei fenomeni vitali. Le teorie sull’evoluzione, indipendentemente dalla loro ragione storico-filosofica e scientifica, hanno avuto il compito di riconciliare questi due concetti. Come suggerito dal filosofo francese, l’artificiosità dell’opera umana, di per sé ispirata all’uniformità presente in natura, si diversifica per effetto della conoscenza scientifica. Al di là della giustificazione etica, questo non è sufficiente a determinare la liceità di tutte le scelte socio-politiche ed economiche fondate sull’utilizzo della ingegneria genetica. La scienza della complessità [1] divide i problemi tecnologici in due classi principali: a) quelli che possono essere risolti facilmente; b) quelli di cui è possibile soltanto controllare la soluzione proposta. Gli OGM (organismi geneticamente modificati) rappresentano l’esempio tipico di quest’ultima classe. Dato che la complessità poggia su fondamenta ragionevoli, ma non dimostrate, il principio di precauzione [2] fornisce gli orientamenti per stabilire il corretto equilibrio tra poteri politici, organi scientifici ed operatori economici nella protezione della salute umana.
Il Consiglio Europeo ritiene indispensabile disporre di un contesto di ricerca appropriato, nell’ambito del quale la valutazione del rischio biologico “…deve essere svolta in modo pluridisciplinare, contraddittorio, indipendente e trasparente” (punto 9 del testo citato).
Il focus dell’informazione sull’inquinamento genetico, quindi, dovrebbe abbandonare tanto l’area delle intuizioni soggettive, quanto quella dei dati statistici. Infatti, per far sì che la contaminazione ambientale sia minima, a tal punto da attribuirgli un ruolo semplicemente “ideologico”, si deve mettere l’opinione pubblica nelle condizioni di comprendere la reale capacità di controllo della scienza. Tullio Regge, del quale abbiamo condiviso sia la cautela che le perplessità espresse sull’applicazione del principio di precauzione [3], ha illustrato la necessità di arginare l’inferenza della statistica [4]. In effetti, ad uno strumento in grado di descrivere, misurare e controllare, ma che utilizza regole precodificate, dovrebbe sostituirsi un metodo analitico, dove siano gli stessi dati a far evolvere la messa a punto del modello. Ci riferiamo ai sistemi dinamici adattivi (ad esempio le reti neurali), per i quali l’errore è un fattore fondamentale e decisivo per accrescere la propria conoscenza. Il fisico Freeman Dyson scrive [5]: ”La progettazione dei genomi sarà una nuova forma d’arte, creativa quanto la pittura e la scultura”. L’ingegneria genetica tende a sostituirsi all’evoluzione biologica, come motore del cambiamento, riproponendo quel trasferimento genico orizzontale che aveva caratterizzato la fase evolutiva pre-darwiniana. Quest’ultima mostra una similitudine rispetto all’evoluzione culturale, iniziata 10 mila anni fa con l’Homo Sapiens e basata sullo scambio orizzontale di idee. Dato il declino della biologia riduzionista, dobbiamo attenderci che lo sviluppo della biodiversità, nella fauna e nella flora, sarà in futuro garantito soprattutto dall’omogeneità tra le varie forme di evoluzione, piuttosto che dalla varietà delle creazioni!

 

Ermanno De Fazi, medico, è Docente di Patologia generale (MED/04) – Anno Accademico 2004/’05 – Corso di Laurea in Tecnica della Riabilitazione psichiatrica – II Facoltà di Medicina e Chirurgia, Università degli Studi di Roma “La Sapienza”.

 

Roberto Villa, ingegnere, è Docente di Informatica (INF/01) – Anno Accademico 2004/’05 – Corso di Laurea in Tecnica della Riabilitazione psichiatrica – II Facoltà di Medicina e Chirurgia, Università degli Studi di Roma “La Sapienza”.

 

BIBLIOGRAFIA

 

[1] P. Zellini. Il calcolo e la scoperta della complessità. In: Caos e complessità. Ed. CUEN s.r.l. Napoli (1996)
[2] Bollettino UE, Allegato III: Risoluzione del Consiglio sul Principio di Precauzione (12 – 2000).
[3] T. Regge. I paraocchi sull’ambiente. La Repubblica (12 aprile 2002).
[4] T. Regge. “L’opinione” in: Le Scienze, n.421. Le Scienze S.p.A., Roma (2003).
[5] F. Dyson. L’interludio darwiniano. Tecnology Review (Edizione Italiana). Tech.Rev. Srl, anno XVII, n°3, Roma (2005).

“Il Ruolo delle Rappresentazioni nella Robotica Enattiva” di Ilaria Mavilla

Negli anni 90 la costruzione di Magnus ha contribuito ad alimentare entusiasmi e polemiche circa la controversa possibilità di dar vita a un sistema artificiale umanoide.
Magnus è una struttura neurale a molti automi, (realizzata da Aleksander nel 1992), che riceve come input immagini visive di un mondo virtuale bidimensionale immagazzinato in un computer. Magnus è in grado di formarsi delle rappresentazioni interne (gli automi) delle immagini che vede e che corrispondono, nello spazio dei pesi della sua rete neurale, a degli avvallamenti, cioè a un punto o un insieme di punti attrattori. Una delle capacità più sofisticate del sistema è la visualizzazione guidata dalle parole; nella fase di addestramento Magnus impara ad associare i nomi degli oggetti alle immagini di questi ultimi, grazie alla presentazione simultanea dei due stimoli. Nella fase successiva egli è in grado, dato il nome di un oggetto, di immaginarlo senza disporre dell’input visivo corrispondente (ciò che Magnus immagina appare su uno schermo collegato alla sua rete neurale). Inoltre, se gli viene fornito il nome di un altro oggetto, i suoi pensieri mostrano la giusta traiettoria nello spazio: se vi sono oggetti tra il primo e il secondo, il sistema li immagina. Il suo costruttore spiega quale sia il risultato principale ottenuto con Magnus: ”Seguendo attentamente la conoscenza dell’anatomia del sistema visivo, riuscii a dimostrare che potrebbe esistere un’area neurale che rappresenta coerentemente il mondo dal punto di vista dell’osservatore. E’ un’area che riceve segnali sia attraverso i canali visivi sia dalle attività muscolari del sistema e questo le conferisce la capacità di ricostruire un oggetto così com’è nel mondo, ma visto dalla prospettiva dell’osservatore. Si chiama ‘rappresentazione del mondo centrata sull’ego’ e si contrappone alle immagini che cadono sulla retina dell’occhio ed esistono nella corteccia visiva primaria. Tali rappresentazioni sono ‘centrate sull’occhio’e sono incoerenti l’una con l’altra al passare del tempo. L’area centrata sull’ego rappresenta il mondo come apparente estensione di se stessi, più che come viene colto dagli occhi. Siamo anche riusciti a dimostrare che quest’area può ricostruire ‘immagini mentali’ partendo da semplici espressioni costituite da un sostantivo e un aggettivo (un cerchio blu, un triangolo giallo). Questo sistema è effettivamente in grado di immaginare ‘una banana blu a pallini rossi’ anche se tale oggetto non ha mai fatto parte della sua esperienza di apprendimento. In breve, il processo è il seguente: le parole stimolano aree specializzate centrate sui sensori le quali rappresentano la ‘bluità’, la ‘bananità’ e così via, mentre l’area per il mondo centrato sull’ego fa il resto. E’ questa capacità di creare le rappresentazioni centrate sull’ego che a mio avviso conferma qual è la proprietà ingegneristica essenziale di cui ha bisogno un sistema neurale al fine di diventare visivamente consapevole”1.
Per chiarire l’idea che gli stati interni del sistema siano centrati sull’ego, analizziamo il meccanismo della ‘centratura sull’ego’ nel sistema visivo. Il compito che il sistema visivo svolge è quello di separare le caratteristiche delle scariche della retina (colore, intensità, bordi, movimento); questo avviene al livello della corteccia visiva primaria. Ma, in base ad esperimenti su soggetti con lesioni, è emerso che la nostra consapevolezza visiva scaturisce da aree più profonde del sistema visivo, quelle frontali, dove i neuroni ricevono informazioni sulle scariche dei neuroni muscolari che controllano la posizione degli occhi e della testa. In queste aree si vengono a creare mappe delle informazioni relative alla forma e al colore dell’immagine visualizzata che incorporano una compensazione della posizione degli occhi e della testa. In sostanza, la parte centrale della retina (fovea) “dipinge” un’immagine neurale integrando l’informazione proveniente dai segnali muscolari, mentre il resto della retina serve ad attirare la posizione dell’occhio verso cose del mondo il cui contenuto è importante per l’organismo. Queste superfici “dipinte” sono il luogo dove si creano le rappresentazioni centrate sull’ego e si realizza la consapevolezza visiva.
Tutto ciò suggerisce che il modo in cui un organismo percepisce un’immagine visiva sia sottoposto a fattori autoctoni di organizzazione dipendenti dal funzionamento dei processi percettivi (e non da credenze e condizionamenti culturali, generatori di un’attività inferenziale inconscia). Se le leggi della psicologia della Gestalt2, esposte da Wertheimer nel 1912, non sono indotte dall’esperienza percettiva ma ne sono costitutive, allora non possiamo scegliere cosa percepire ma l’organizzazione percettiva ci s’impone e la centratura sull’ego delle nostre rappresentazioni dipende semplicemente dalla centratura sull’ego delle nostre percezioni e questa, a sua volta, non è che un meccanismo percettivo non troppo dissimile dalle leggi della Gestalt, una sorta di modalità organizzativa del materiale sensibile. Queste idee ricordano fortemente i risultati ottenuti da Rosch nei suoi esperimenti sulla percezione dei colori e in particolare il fatto che la determinazione dei prototipi all’interno delle categorie naturali non ha natura inferenziale, né tanto meno linguistica.
“Insomma, i risultati dei gestaltisti e quelli sulle categorie basiche orientano verso soluzioni antitetiche agli esiti olistici della filosofia analitica e alla loro riproposizione da parte dei cognitivisti, suffragando una non totale indeterminatezza della traduzione (processi percettivi e processi interpretativi sono separabili o, quanto meno, i primi non sono plasmabili a piacere dai secondi), una non totale inscrutabilità del riferimento (veridicità delle percezioni, loro univocità sul piano fenomenologico e loro autonomia dai sistemi di credenze) e un non globale olismo”3.
Se finora la centratura sull’ego è parsa un meccanismo intrinseco al processo dell’organizzazione percettiva, simile alle operazioni di integrazione dell’immagine dei gestaltisti e indipendente dai processi interpretativi di tipo inferenziale (radicati a loro volta nella cultura, in un sistema di credenze, nel linguaggio, ecc), tale impressione sembra essere messa in crisi da queste parole diAleksander:”Oltre a ricreare quadri nella testa, le rappresentazioni centrate sull’ego fanno molto altro. Possono semplicemente ricreare quadri, però codificano qualsiasi cosa che sia attinente ai generatori di tali immagini del mondo e alla relazione tra l’organismo e tali oggetti. La parola ‘tazza’ non crea soltanto rappresentazioni neurali di un’immagine della tazza: la sua centratura sull’ego può comprendere rappresentazioni in aree motorie di come potrei afferrarla, riempirla, bervi e di come si potrebbe rompere se la lasciassi cadere. In altre parole, le rappresentazioni centrate sull’ego codificano tutta la mia esperienza di che cosa significa ‘tazza’ per me”4.
Sembra dunque che in questo caso la centratura sull’ego sia qualcosa di più di un meccanismo percettivo, qualcosa che richiede di richiamare alla memoria schemi d’azione fondati sull’esperienza precedente, l’ambiente con il quale si è interagito, le proprietà degli oggetti in esso incontrati e, non ultimo, il ruolo del “sé” nell’interazione con l’ambiente e con gli oggetti: in breve, un insieme di conoscenze sul mondo insieme alla consapevolezza che “io ne faccio parte”. Tutto questo mi pare abbia a che fare con il radicamento del soggetto in un contesto socio-culturale e linguistico che Aleksander omette di sottolineare. La mia rappresentazione di ‘tazza’dipenderà, oltre che dalla mia personale esperienza, dagli usi che nella società a cui appartengo se ne fanno e dalle credenze ad essi associate. Sembra allora che l’impostazione delineata dalla Gestalt necessiti di essere integrata con un modello della percezione e della cognizione che tenga in maggior conto l’interazione tra l’individuo e il suo contesto.
Capire la natura di ciò che Aleksander definisce “centratura sull’ego” significa capire le relazione intercorrente tra individuo e ambiente all’interno del dibattito tra soggettivisti e oggettivisti. Per questi ultimi, il mondo è come ci appare anche prima di essere conosciuto e la conoscenza non è altro che rispecchiamento di una realtà data. Nel caso della visione, ad esempio, ne deriva che i colori sono attributi intrinseci delle superfici in quanto determinati da proprietà fisiche. Secondo questa impostazione, le azioni sono capaci di adattarsi al mondo in quanto le caratteristiche del mondo esterno corrispondono a rappresentazioni all’interno del sistema.
E’ noto che nel funzionalismo quest’idea viene riformulata in chiave informatica: un sistema cognitivo diventa un elaboratore di informazioni che opera su simboli formali attraverso l’applicazione di regole codificate nel sistema e la mente diventa il filtro attraverso cui passano gli input per essere trasformati in output. Nonostante qui, diversamente da quanto accadeva nel comportamentismo, si guardi ai processi interni del sistema (dentro ‘la scatola nera’), l’idea di fondo è ancora quella secondo cui l’esterno causa l’interno, l’ambiente produce dei cambiamenti nel sistema e il rapporto tra l’attività cognitiva e il mondo è spiegato ipotizzando l’esistenza di rappresentazioni mentali all’interno del sistema, rappresentazioni che ri-costruiscono aspetti ambientali estrinseci e indipendenti. Sul versante opposto del dibattito troviamo gli idealisti che pongono l’accento sul fatto che non possiamo avere accesso al mondo se non attraverso le nostre rappresentazioni. Poiché non possiamo uscire da noi stessi per vedere quanto le nostre rappresentazioni siano in accordo con il mondo, noi semplicemente non abbiamo idea di cosa il mondo sia: esso è il presunto oggetto delle nostre rappresentazioni, o in maniera più estrema, una rappresentazione di second’ordine. Dunque, venuta meno la possibilità di radicarci in un fondamento esterno, non ci resta che aggrapparci alle nostre rappresentazioni interne. Per superare questo empasse filosofico, sono sorte concezioni naturalizzate della cognizione: sulla linea di pensiero oggettivista, ma non su quella che identifica conoscenza e rappresentazione, si colloca, ad esempio, l’approccio “ecologico”, così definito non solo perché tiene in alta considerazione la relazione tra l’individuo e l’ambiente ma anche perché ritiene che il significato sia già tutto nell’ambiente. Uno dei suoi principali sostenitori è James Gibson (The ecological approach to visual perception, 1979) secondo il quale gli organismi sono fatti in modo tale da estrarre dall’ambiente in cui vivono l’informazione necessaria per agire con successo, senza bisogno di utilizzare costruzioni mentali, interpretazioni o conferimenti di senso. Per Gibson, la percezione è un sistema d’estrazione e ciò che si estrae sono informazioni che identificano le proprietà topologiche e metriche dello spazio e le proprietà invarianti degli oggetti. Qui si pongono almeno due problemi: il primo legato al fatto che la percezione, per quanto diretta (cioè non mediata da credenze e aspettative), non esaurisce la cognizione e dunque si dovrà andare alla ricerca di principi organizzativi che, a partire dall’informazione sensoriale, diano vita a strutture di pensiero; il secondo riguarda la costanza percettiva: il riconoscimento di qualcosa che resta invariato richiede una qualche elaborazione dell’informazione.
La critica più aspra è venuta da Fodor e Pylyshyn ed ha preso di mira la nozione di ‘affordance’, che, nella teoria di Gibson, indica l’insieme di potenzialità che un oggetto, azione o situazione ha relativamente a un organismo che si trova in rapporto con esso/a ( ad esempio, noi afferriamo cose che si prestano ad essere afferrate dalla mano umana, i cani mangiano cose che hanno l’affordance della commestibilità, ecc). Fodor e Pylyshyn obiettano che qualunque cosa può essere nelle circostanze adatte una affordance per un organismo e che dunque il significato della cosa in questione è per l’organismo completamene indeterminato. Se poi, per rispondere all’obiezione, ci si appella all’atteggiamento dell’individuo verso l’oggetto o la situazione (nel senso che è questo atteggiamento a decidere del significato) non si può fare a meno di notare che esso è intriso di credenze, aspettative, scopi. Sembra dunque che non esistano informazioni neutrali, completamente scevre di contributi soggettivi. Gibson sottolinea, a sua volta, che esistono dei vincoli che delimitano le affordances possibili; ad esempio, tutti noi possiamo vedere l’ellisse (in prospettiva) di una moneta, ma non possiamo vederla come un cubo; se fosse questione di elaborazione mentale potremmo vederla come ci pare. Dunque, tali vincoli sono inscritti nelle leggi della percezione che governano l’interfaccia organismo-ambiente.
Gli esseri umani non hanno bisogno di rappresentarsi l’ambiente per interagire efficacemente con esso, così come l’edera non ha bisogno di formarsi un concetto delle superfici a cui può attaccarsi. Questa concezione, sebbene abbia il merito di avvalorare la relazione individuo-ambiente, non costituisce un’autentica alternativa al realismo cognitivo.
In Autopoiesis and Cognition (1980), Maturana e Varela presentano un modello alternativo della cognizione in cui l’organismo e il suo ambiente non sono più descrivibili l’uno indipendentemente dall’altro e in cui il modello di un mondo esterno già dato viene sostituito da quello di una realtà costruita. Un sistema autopoietico è innanzitutto un sistema autonomo, cioè distinguibile rispetto all’ambiente in cui vive e caratterizzabile come unità composta (fatta di diverse parti). In quanto tale, esso gode di struttura e di organizzazione. Quest’ultima realizza l’insieme delle relazioni che devono restare invariate perché l’unità composta non cambi la sua identità o si disintegri mentre la struttura può, anzi, deve assumere diverse forme all’interno della stessa organizzazione per garantirne l’invarianza. Un sistema è autopoietico se è in grado di guidare i propri processi di riproduzione, ossia se è dotato di chiusura operazionale. Il concetto di chiusura operazionale è stato introdotto per la prima volta nell’ambito delle neuroscienze per descrivere l’attività di automodifica del cervello. Più in generale:
“Un sistema operazionalmente chiuso è tale che il risultato dei suoi processi coincida con quegli stessi processi. Il concetto di chiusura operazionale è pertanto un modo per specificare classi di processi che, nel loro funzionamento, si rinchiudono su se stessi a formare reti autonome. Tali reti non ricadono nella classe dei sistemi definiti da meccanismi di controllo esterni (eteronomi) ma al contrario in quella definita da meccanismi interni di auto-organizzazione (autonomi)”5.
Dunque tutti gli esseri viventi sono autopoietici nella misura in cui gli unici prodotti della loro organizzazione sono loro stessi. Quando un individuo autopoietico interagisce con un ambiente, i cambiamenti strutturali che subisce sono innescati dall’ambiente ma determinati da lui stesso. Contrariamente a quanto accadeva nell’approccio ecologico alla cognizione, qui l’ambiente è una fonte di perturbazioni ma non di istruzioni mentre è la struttura stessa dell’essere vivente a determinare il suo cambiamento in rapporto alla perturbazione. Su queste basi Varela, Thompson e Rosch delineano la ‘via di mezzo della conoscenza’ che si allontana tanto dall’oggettivismo quanto dal soggettivismo, tanto dal realismo quanto dall’idealismo. La conoscenza è una struttura auto-organizzata e non consiste in statici rapporti di rappresentazione: essa è piuttosto ‘azione incarnata’o enazione ( tra i cui significati c’è ‘produrre’, ‘promulgare’, ‘emanare’):
“La cognizione dipende dal tipo di esperienza derivante dal possedere un corpo con diverse capacità sensomotorie” e “tali capacità sensomotorie individuali sono esse stesse incluse in un contesto biologico, psicologico e culturale più ampio”6.
Di nuovo, emerge l’importanza per un sistema cognitivo di avere un corpo e di essere collocato in un contesto più ampio di quello individuale, fattori a cui l’Intelligenza Artificiale simbolica è rimasta insensibile.
“Il significato non nasce con le manipolazioni di simboli, non è automaticamente secreto da una miracolosa materia grigia, e neppure è dono esclusivo della cultura. Abita però tutti e tre gli ambienti. Avere un corpo non vuol dire partecipare di un sistema di credenze condivise che guidano i comportamenti sociali; le strutture della corporeità non dipendono da strutture sociali e da codici comunicativi; semmai sono la cornice per tutte le possibili variazioni culturali. Il significato emerge tanto dall’accoppiamento tra organismo e ambiente (incluso l’ambiente culturale) quanto dalla separabilità, seppur parziale e virtuale, dell’organismo dall’ambiente (incluso l’ambiente culturale). Insomma, il significato non scaturisce né dall’interno, né dall’esterno, bensì dall’interfaccia tra l’uno e l’altro”7.
La distanza da Gibson è notevole:
“Mentre Gibson dichiara che l’ambiente è indipendente, noi sosteniamo che esso è prodotto (da storie di accoppiamento). Gibson dichiara che la percezione è rilevamento diretto, noi invece sosteniamo che essa sia enazione sensomotoria. Perciò anche le strategie di ricerca risultanti sono fondamentalmente diverse: i gibsoniani interpretano la percezione in larga misura in termini ottici (anche se ecologici) e pertanto cercano di costruire la loro teoria della percezione quasi interamente a partire dall’ambiente. Il nostro approccio, invece, procede specificando gli schemi sensomotori che consentono all’azione di essere guidata percettivamente, e pertanto noi costruiamo la teoria della percezione a partire dall’accoppiamento strutturale dell’animale”8.
In linea con l’epistemologia genetica di Piaget che spiegava come l’intelligenza sensomotoria del bambino potesse svilupparsi fino all’elaborazione di una concezione del mondo fatto di oggetti permanentemente situati nello spazio e nel tempo, Varela sottolinea la centralità dell’attività percettiva nella formazione delle strutture cognitive9. La percezione consiste in un’azione a sua volta guidata dalla percezione, il che equivale a dire che i processi sensori e motori sono inscindibili e che le strutture cognitive emergono da schemi senso-motori ricorrenti10. Questo approccio alla percezione fu, come Varela sottolinea, una delle intuizioni fondamentali dell’analisi di Merleau-Ponty, secondo il quale la percezione non è semplicemente vincolata dal mondo esterno ma contribuisce anche alla sua produzione/enazione:
“E’ proprio l’organismo, secondo la natura dei propri recettori, secondo le soglie dei suoi centri nervosi, secondo i movimenti degli organi, che trasceglie nel mondo fisico gli stimoli ai quali sarà sensibile. L’ambiente si costituisce nel mondo secondo l’essere dell’organismo, restando inteso che un organismo può sussistere soltanto a patto di trovare nel mondo un ambiente adeguato”11.
Tuttavia, l’attività percettiva non esaurisce la cognizione ma si limita a porle dei vincoli, peraltro già messi in luce dall’articolo:”What the frog’s eye tells the frog’s brain”(1959) in cui Maturana, Lettvin, McCulloch e Pitts esponevano i dati raccolti sul sistema ottico delle rane, sostenendo che il mondo percepito dalla rana fosse profondamente diverso da quello cui ha accesso la mosca. Ad esempio la rana identifica una mosca come possibile preda solo se questa è in movimento e, viceversa, qualsiasi cosa che si muovesse come una mosca sarebbe una mosca per la rana. Dunque, il sistema ottico della rana, così come quello di ogni essere vivente, vincola la sua visione del mondo. Ora, se nel caso della rana questo vincolo è probabilmente esaustivo di ciò che per lei è il mondo, lo stesso non si può dire per gli organismi dotati di un retroterra culturale, linguistico, sociale, ecc: quanto più il mondo culturale è ricco, tanto più le risorse percettive sono riorientabili. “L’intuizione centrale di quest’orientamento non oggettivista è la concezione secondo la quale la conoscenza sarebbe il risultato di un’incessante interpretazione che emerge dalle nostre capacità di comprensione. Queste capacità sono radicate nelle strutture della nostra corporeità biologica, ma sono vissute e sperimentate in un ambito di azione consensuale e di storia culturale”12. Il riconoscimento dei colori, ad esempio, sembra coinvolgere operazioni di diversa natura: in particolare, mentre alcune categorie (rosso, giallo, blu, verde, nero e bianco) sono interamente determinate da schemi emergenti di attività neuronale nel sistema visivo, altre (arancione, porpora, marrone e rosa) richiedono operazioni cognitive di due tipi: universale per la nostra specie e cultura-specifica13. Lo studio sulla categorizzazione dei colori ci permette di affermare che:
“I colori non sono ‘là fuori’, indipendentemente dalle nostre capacità percettive e cognitive, e che essi non sono neppure ‘qui dentro’, indipendentemente dal mondo biologico e culturale che ci circonda. Contrariamente alla concezione oggettivista, le categorie dei colori sono esperenziali; contrariamente a quella soggettivista, esse appartengono al nostro mondo biologico e culturale condiviso”14. Abbandonando la concezione rappresentazionalista e ponendo l’accento sul mutuo forgiarsi di organismo e ambiente, peraltro già messo in luce da Merleau-Ponty, la via di mezzo della conoscenza si colloca al livello dell’interfaccia tra mente, società e cultura.

La scienza cognitiva enattiva trova la sua principale applicazione nell’ambito della robotica enattiva di Rodney Brooks. Lo scopo di Brooks è quello di costruire un robot completamente autonomo che interagisca liberamente con l’ambiente reale:
“L’idea è quella di costruire dapprima un sistema autonomo completo molto semplice, e nel metterlo alla prova nel mondo reale. Il nostro esempio preferito di tale sistema è una Creatura, in realtà un robot mobile, che eviti di urtare gli oggetti. Esso avverte la presenza degli oggetti nelle sue immediate vicinanze e si allontana da essi, fermandosi se percepisce qualcosa sul suo cammino. Anche se per costruire questo sistema è ancora necessaria la sua scomposizione in parti, tuttavia non è necessaria alcuna netta distinzione tra un ‘sottosistema percettivo’, un ‘sistema centrale’, e un ‘sistema dell’azione’. In realtà potrebbero benissimo esserci due canali indipendenti che mettano in connessione la percezione e l’azione, in modo che non ci sia un unico sito a livello del quale la percezione produca una rappresentazione del mondo nel senso tradizionale”15 . Varela, Thompson e Rosch fanno notare quanto, in continuità con l’approccio enattivo, Brooks concentri l’attenzione sui problemi dell’interazione senso-motoria dell’agente con l’ambiente e l’assenza di rappresentazioni esplicite nei vari livelli dell’architettura. La robotica alla Brooks ha incontrato, però, delle serie difficoltà allorché ha tentato di sviluppare le capacità dei robots da un livello meramente reattivo a un livello cognitivo più complesso , difficoltà di cui i sostenitori dell’approccio enattivo non fanno menzione. In particolare, più si riducono le restrizioni sull’ambiente, più i robots perdono l’abilità di affrontare i compiti che prima affrontavano con successo. In un articolo più recente, Brooks, descrivendo Cog, un’altra creatura robotica, afferma:
“L’accoppiamento fisico diretto tra azione e percezione riduce la necessità di una rappresentazione intermediaria. Per un sistema dotato di un corpo le rappresentazioni possono, in ultima analisi essere fondate nelle interazioni senso-motorie con il mondo. I nostri sistemi sono fisicamente accoppiati con l’ambiente e operano direttamente nell’ambiente stesso senza nessuna esplicita rappresentazione di esso. Ci sono rappresentazioni, o accumuli di stati, ma queste si riferiscono soltanto ai processi interni del sistema e sono prive di significato senza interazione con l’ambiente esterno”16.
Dunque, nonostante le dichiarazioni d’intenti, sembra che le rappresentazioni, anche se solo come modelli parziali del mondo relativi allo svolgimento di certi compiti, non siano del tutto assenti (tant’è che Brooks stesso ha proposto un nuovo slogan: non più ‘intelligenza senza rappresentazione’, bensì ‘intelligenza senza ragione’ in polemica con il razionalismo dell’I.A.). In realtà, questo non vale solo per gli sviluppi più recenti della robotica di Brooks (behavior based) ma anche per i suoi primi robots; Allen, per esempio, era munito di un sonar per rilevare gli ostacoli lungo il proprio percorso: la ricezione dei segnali di ritorno funzionava come “rappresentazione interna” degli oggetti che il robot doveva evitare. Una tale rappresentazione ha carattere analogico e distribuito (in un modello connessionista essa corrisponde a un certo valore di attivazione). Stabilire se essa sia anche simbolica è questione controversa. Criticando la robotica behavior-based, Vera e Simon ritengono che l’interazione senso-motoria di un agente con l’ambiente non può che essere considerata se non come manipolazione simbolica (le rappresentazioni di Allen sono per loro pienamente simboliche). L’informazione sensoriale captata dal robot sarebbe convertita in simboli, i quali sarebbero manipolati al fine di determinare gli appropriati simboli motori che evocano o modificano un certo comportamento. Nell’interazione con l’ambiente, un agente ha un’attività rappresentazionale che è data dalle caratteristiche specifiche del suo apparato fisico di codifica-elaborazione-decodifica di simboli. Non parlare di rappresentazioni interne e limitarsi a dire che un agente intrattiene “certe relazioni causali con il mondo, non spiega come queste relazioni vengono mantenute. E’ del tutto ragionevole sostenere che un agente mantiene un orientamento verso un oggetto tramite una relazione causale con esso e che tale relazione è un pattern di interazione, ma non ha senso pensare che tale pattern venga prodotto per magia, senza un corrispondente cambiamento di stato rappresentazionale dell’agente, ovvero che esso possa aver luogo senza una rappresentazione interna fosse pur minima”17.
Per Vera e Simon un sistema fisico simbolico (PSSH) interagisce con l’ambiente in due modi; da un lato riceve stimoli sensoriali e li converte in strutture di simboli (rappresentazioni interne), dall’altro agisce nell’ambiente in modi che sono determinati dai simboli motori che esso stesso ha prodotto. L’informazione sensoriale viene perciò convertita in simboli che, a loro volta, vengono processati e valutati al fine di determinare i simboli motori appropriati a dar vita al comportamento. Questa visione si scontra con un primo ordine di problemi messi in luce da Nolfi:
“Purtroppo, estrarre dal mondo attraverso dei sensori fisici una descrizione simbolica dell’ambiente esterno è tutt’altro che ovvio e può rivelarsi un’impresa impossibile se ci si aspetta una rappresentazione esatta e completa dell’ambiente esterno. Ciò è dovuto a una serie di difficoltà: i sensori sono in grado di misurare informazioni quantitative non simboliche; i valori misurati dai sensori sono un’indicazione molto indiretta e rumorosa delle quantità misurate; il mondo reale è pieno di ambiguità e spesso in continuo cambiamento”18.
Un secondo ordine di problemi riguarda proprio la nozione di simbolo: la funzione di denotazione è quella che dà al simbolo la sua capacità rappresentazionale: un simbolo è un pattern19 che denota un altro simbolo, ma può anche denotare il pattern di uno stimolo sensoriale o un’azione motoria.
Nella loro risposta a Vera e Simon, Touretzky e Pomerleau affermano:
“Il primo errore nell’argomento di Vera e Simon è di confondere ‘segnale’ con ‘simbolo’:’chiamiamo patterns i simboli quando possono designare o denotare’(p.9). Questo non lascia nessuna possibilità alle rappresentazioni non simboliche. Secondo questo punto di vista, i patterns di attività neuronale nella retina, e presumibilmente anche le convenzioni segnaletiche elementari dei campanelli o dei distributori automatici sono elevati a sistemi simbolici, rendendo il concetto di ‘simbolo’ privo di significato”20.
Tourketzky e Pomerleau tracciano una distinzione tra “segnali” e “simboli”, basata su una definizione di Hanard, secondo la quale: 1) i simboli hanno forme arbitrarie prive di correlazione con i loro significati, 2) le strutture di simboli possono essere composte in rappresentazioni, secondo regole ricorsive. Dunque, diversamente da Vera e Simon, secondo i quali qualsiasi cosa in grado di denotare è un simbolo, una rappresentazione è un simbolo solo se è capace di designazione arbitraria e di potere combinatorio.
Vera e Simon sottolineano anche che, troppo spesso, il carattere simbolico delle rappresentazioni mentali viene misconosciuto perché confuso con il loro statuto non conscio:
“Il fatto che molti processi mentali siano senza dubbio inconsci o subconsci non dice niente sulla questione se siano o meno simbolici. Inoltre, “simbolico” non è sinonimo di “verbale”: le strutture simboliche possono designare parole, immagini mentali o diagrammi, così come altre rappresentazioni di informazione”21.
Mentre la prima parte del loro discorso, relativa ai rapporti tra simbolicità e coscienza, incontra il favore di Tourketzy e Pomerleau, la seconda appare molto più controversa: accomunando sotto il marchio del ‘simbolico’ parole, immagini mentali e diagrammi Vera e Simon parlano in maniera indifferenziata di cose piuttosto eterogenee. In particolare, esiste una sostanziale differenza tra rappresentazioni simboliche come le parole e rappresentazioni analogiche come i diagrammi. Le parole sono genuinamente simboliche (nel senso specificato da Tourketzy e Pomerleau) in quanto le relazioni che intrattengono con i loro significati sono arbitrarie (convenzionali) e in quanto possono essere combinate secondo regole ricorsive per creare strutture linguistiche più complesse; le rappresentazioni analogiche, al contrario, non denotano oggetti arbitrariamente ma in virtù della loro somiglianza con essi (si può pensare, per esempio, all’omomorfismo tra i livelli di voltaggio di un termostato e i valori della temperatura in una stanza). Per quanto riguarda le immagini mentali, sembra particolarmente di rilievo, ai fini di questa discussione, capirne la natura.
Vera e Simon affermano che: “ La ricezione di certi patterns relativi ad uno stimolo sensoriale (dire GATTO) può causare la creazione nella memoria del simbolo che designa un gatto (non la parola “gatto” ma l’animale)”22. Il simbolo in questione, quello che si viene a creare nella mente di chi sente la parola”gatto”, è appunto un’immagine mentale. Per Vera e Simon essa ha carattere simbolico in quanto denota un oggetto del mondo ma, argomentano Tourketzy e Pomerleau, “ i concetti nelle nostre teste, come “ragazzo” o “dare”, difficilmente sono atomici. Essi sono complesse reti di riferimento ad altri concetti e impressioni sensoriali, aventi forme lontane dall’arbitrarietà”23.
Già Hanard, affrontando la questione del symbol grounding nelle reti neurali artificiali, aveva messo in luce che il fondamento dei simboli nei predicati analogici facenti riferimento all’esperienza sensoria è una caratteristica fondamentale dell’intelligenza umana che influenza anche le nostre più astratte concettualizzazioni. Come ipotizzano Tourketzy e Pomerleau, l’evoluzione potrebbe aver “favorito” l’assimilazione da parte delle nostre rappresentazioni mentali di proprietà del mondo rilevanti ai fini della sopravvivenza; “ad esempio, i simboli LEONE e TIGRE potrebbero avere realizzazioni neurali simili se la Natura lo trovasse utile al fine di implementare un comportamento intelligente in tempo reale”24. Se questo fosse vero avremmo una concatenazione di livelli ascendenti in cui le rappresentazioni non simboliche (iconiche) del livello inferiore fondano quelle simboliche del livello superiore.
Ciò che emerge da un confronto critico tra le posizioni di Vera e Simon da un lato e Touretzy e Pomerleau dall’altro, è un sostanziale accordo riguardo alla necessità di reintrodurre, a un qualche livello della cognizione, quelle rappresentazioni di cui Brooks voleva fare a meno, ma una altrettanto sostanziale divergenza nel modo di caratterizzare queste rappresentazioni: per i primi le rappresentazioni sono modelli semplificati di una situazione reale che è troppo complessa per permettere ad un agente di coglierla nella sua integrità allo scopo di generare un comportamento efficace in tempo reale; sostenendo la necessità di un processo simbolico intermediario tra percezione e azione, essi assumono implicitamente che la percezione diretta debba necessariamente cogliere tutti gli aspetti di una situazione, di una scena o semplicemente di un oggetto percepito. Ci sono però buone ragioni per ritenere che questo non sia vero: Ballard, ad esempio, ha mostrato che gli agenti umani non costruiscono un modello interno dell’intera scena visibile con la quale sono chiamati ad interagire, ma si rappresentano solo ciò che è immediatamente rilevante. In soggetti ai quali era stato chiesto di eseguire un compito complesso come quello di costruire una copia di un’immagine contenente la dislocazione di certi blocchi, si è notato che, cambiando l’immagine a loro insaputa, questi notavano soltanto il cambiamento più drastico. Sembrerebbe allora superfluo ricorrere alla manipolazione di strutture simboliche quando è la percezione stessa a selezionare l’informazione rilevante per la costruzione di una rappresentazione analogica di una scena visiva. Riferendosi alla posizione di Vera e Simon, Greeno and Moore affermano:
“Essi sostengono che i modelli che ipotizzano processi simbolici siano sufficienti a render conto dei fenomeni complessi in un ambiente che cambia dinamicamente. Secondo noi, la questione non dovrebbe essere se un sistema che usa processi simbolici è sufficiente, ma se i processi simbolici ipotizzati sono necessari”25.

Il dibattito tra l’approccio simbolico e quello ibrido (in parte simbolico, in parte subsimbolico) si fa particolarmente serrato e significativo intorno al sistema robotico di guida Navlab (Pomerleau, Gowdy, Thorpe, 1991).
Navlab ha molte componenti: un sistema di percezione, uno di attuazione e uno di decisione reciprocamente indipendenti che sono in grado di determinare la posizione del veicolo, la meta che vuole raggiungere e il modo di raggiungerla. L’informazione estratta da ogni modulo viene poi integrata per dar vita ad un’azione in tempo reale. Concentriamo l’attenzione su due componenti fondamentali del sistema: la sua rete neurale che gestisce le manovre di guida e la sua mappa interna che contiene informazioni sulla disposizione delle strade, sui punti di riferimento presenti nell’area che il veicolo deve attraversare e sulla posizione del veicolo stesso. Nella fase di apprendimento, un conducente umano guida il veicolo attraversando una strada uguale a quella che attraverserà il robot più tardi e i pesi vengono corretti con backpropagation usando come input l’immagine proveniente da uno schermo su cui è proiettata la strada e come output desiderato la posizione del volante. Per Vera e Simon Navlab, compresa la sua rete neurale, è un sistema simbolico. Riferendosi alla situazione di guida, essi scrivono:
“Questa azione situata non può durare a lungo senza una rappresentazione interna. La sua rappresentazione è il risultato di una complessa traduzione in termini funzionali di una situazione fisica il cui significato funzionale è implicito”26.
Fare riferimento al linguaggio funzionale significa appellarsi a regole del tipo:”Se la curva è a sinistra, allora gira a sinistra”. Il vantaggio di queste regole consisterebbe, secondo i due autori, nella loro immediata applicabilità; esse consentirebbero di generare un’azione in tempo reale, senza bisogno di evocare i livelli più bassi della cognizione aventi a che fare con l’elaborazione di piani e strategie di soluzione che intervengono nelle fase di apprendimento (quando si impara ad affrontare le curve).
“Insomma in questa interpretazione di Simon e Vera l’interazione in tempo reale dell’agente con l’ambiente è data non dal fatto di essere non simbolica e di non poter essere modellizzata mediante regole di produzione, ma dal fatto di non dover accedere, per dare la riposta corretta, alla complessità delle procedure di elaborazione simbolica dei livelli soggiacenti a quello “alto”27.
Nella loro analisi di Navlab, Greeno e Moore distinguono invece processi simbolici e processi non simbolici. In particolare essi ritengono che le attivazioni della rete che connettono gli inputs sensoriali con i cambiamenti nella posizione del volante non possano essere caratterizzati come processi simbolici:
“C’è una relazione causale tra le proprietà dell’ambiente fisico e i patterns di attivazione nella rete, ma non c’è un processo di interpretazione semantica con il quale sia conferito un significato referenziale a questi patterns”28.
Ciò che per loro contraddistingue i simboli è il fatto che siano semanticamente interpretabili; sulla base di questo criterio, essi ritengono che il processo di riconoscimento di punti di riferimento che corrispondono a simboli nella mappa di Navlab sia simbolico, così come il processo di determinazione della posizione del veicolo. In entrambi i casi, infatti, abbiamo a che fare con simboli sulla mappa e con un processo di accoppiamento referenziale tra questi simboli e gli oggetti per cui essi stanno. Questo sembra essere il pomo della discordia: Touretzky e Pomerleau obiettano:
“La distinzione cruciale tra la rete neurale di Navlab e le componenti simboliche della mappa è che in queste ultime le relazioni tra i patterns e i loro referenti sono arbitrarie. La mappa richiede un’interpretazione che connetta i suoi simboli formali e arbitrari alle caratteristiche dell’ambiente che essi designano. Ma ALVINN29 non è capace di designazione arbitraria; i suoi patterns di attivazione sono correlati analogicamente a specifici stati del mondo. ALVINN è un esempio di percezione diretta che non richiede interpretazione; i suoi simboli hanno significato intrinseco, non referenziale”30.
Quest’ultima interpretazione appare molto più coerente col modo di funzionare di una rete neurale; è vero che i simboli di cui si sta parlando occorrono nella mappa (e non nella rete) ma, in ultima analisi, chi dovrebbe interpretarli? Da dove dovrebbe scaturire la semantica? Se la loro designazione fosse completamente arbitraria, come la nozione di simbolo richiederebbe, né una rete neurale, né un computer seriale sarebbe in grado di associare ad essi oggetti del mondo. O la semantica non c’è, come accade nei calcolatori tradizionali in cui è il fruitore a dover attribuire un significato ai simboli, o essa viene introdotta come nei sistemi esperti ma è limitata a domini di competenza molto ristretti, o, infine, essa è incorporata come accade nei modelli connessionisti in cui le rappresentazioni analogiche si traducono in spazi di somiglianza che fondano dal basso le rappresentazioni simboliche necessarie nei processi ‘alti’della cognizione (linguaggio, categorizzazione, interazione ambientale e sociale, ecc..).
Tourektzy e Pomerleau concludono:
“Siamo guidati da un modello della cognizione nel quale la manipolazione simbolica conscia e deliberata si colloca al livello più alto, i processi simbolici subconsci costituiscono il livello intermedio e specializzati moduli non simbolici appaiono al livello più basso”31.
Nonostante la divergenza sull’interpretazione della mappa di ALVINN, anche Greeno e Moore sembrano trarre una conclusione simile:
“Crediamo che la struttura del processamento simbolico dovrebbe essere sussunta da una teoria nella quale i processi simbolici sono considerati come un tipo di attività cognitiva”32.
Da questa analisi dovrebbe essere emersa la necessità di reintrodurre le rappresentazioni nella conoscenza, ma anche il fatto che parlare di rappresentazioni non significa esclusivamente parlare di manipolazione formale di simboli. L’approccio che meglio risponde ad entrambe queste esigenze sembra essere quello ibrido che ammette la complementarietà dei processi simbolici e subsimbolici. Se da un lato, la concezione enattiva di Varela giustamente rivendicava il ruolo centrale dell’interazione individuo-ambiente ma riabilitava il soggetto dalla passività con cui l’approccio ecologico lo aveva descritto, dall’altro, essa abbracciava progetti radicali come quelli della robotica enattiva che implicitamente negavano proprio quella riabilitazione, privilegiando la conoscenza tramite percezione diretta a discapito del paradigma rappresentazionale. Riconoscere l’indispensabilità di quest’ultimo, d’altra parte, non deve tradursi nel vedere simboli ovunque, ossia nell’adesione a un modello come quello di Vera e Simon, in cui la cognizione è interamente ed indiscriminatamente simbolica. Mi pare, piuttosto, che la via di mezzo della conoscenza, tracciata nelle sue direttive teoriche da Varela, Thompson e Rosch, sarebbe veramente tale solo se sposasse visioni ibride della cognizione come quelle di Touretzky e Pomerleau o di Greeno e Moore nel fondamentale riconoscimento che i modelli connessionisti sono in grado di implementarle grazie al processo del symbol grounding.

NOTE:

1. Aleksander, Come si costruisce una mente, Einaudi, Torino, 2001, p.178
2. Le tre leggi sono: prossimità (oggetti vicini tendono ad essere raggruppati), simmetria (regioni chiuse e simmetriche tendono a corrispondere ad oggetti più di regioni asimetriche), buona continuazione (minimizzazione delle interruzioni e delle discontinuità).
3. Peruzzi, Il significato inesistente: Lezioni sulla semantica, University Press, Firenze, 2004, p.483
4. Aleksander, op. cit., p.188
5. Varela, Thompson, Rosch, La via di mezzo della conoscenza, Feltrinelli, Milano 1992, p.170
6. ivi , p.206
7. Peruzzi, op. cit, p.523
8. Varela, Thompson, Rosch, op. cit., p.240. Con l’espressione “accoppiamento strutturale” gli autori si riferiscono all’interazione individuo-ambiente.
9. Una non trascurabile differenza allontana però Varela da Piaget. Lo stesso Varela fa notare che “Piaget, tuttavia, come teorico non sembrò mai dubitare dell’esistenza di un mondo prestabilito e di un soggetto conoscente indipendente con una meta logica prestabilita per lo sviluppo cognitivo. Le leggi di tale sviluppo, anche allo stadio sensomotorio, consistono in un’assimilazione di quel mondo prestabilito e in un accomodamento nei suoi confronti” (Varela, Thompson, Rosch, op. cit, p.210).
10. Un esempio di guida percettiva dell’azione ci è offerto dagli studi di Held e Hein, i quali allevarono dei gattini al buio e li esposero alla luce solo in condizioni controllate. Ad un primo gruppo di animali fu consentito di muoversi normalmente ma ciascuno di essi trainava un carrello su cui si trovava un animale del secondo gruppo. I due gruppi condividevano la stessa esperienza visiva ma il secondo era completamente passivo. Quando gli animali furono liberati, quelli del secondo gruppo si comportarono come se fossero stati ciechi, urtando contro gli oggetti e cadendo. Questo esperimento avvalora la concezione enattiva secondo cui gli oggetti non vengono visti tramite l’estrazione di caratteristiche da parte del sistema visivo ma piuttosto attraverso la guida visiva dell’azione.
11. Merleau-Ponty, La struttura del comportamento, Bompiani 1973, p.37
12. Varela, Thompson, Rosch, op. cit., p.180
13. Le operazioni del primo tipo sono operazioni di intersezione tra insiemi sfumati, ossia insiemi che ammettono diversi gradi di appartenenza. Il grado di appartenenza è specificato da una funzione che assegna a ciascun membro dell’insieme un valore compreso tra 0 e 1. Il secondo tipo di operazioni dipende dalla cultura e dalla lingua di appartenenza. Ad esempio, secondo uno studio di MacLaury, il porpora è a volte situato nella gamma dei colori freddi, altre volte al confine tra i colori freddi e il rosso, mentre il marrone viene collocato talvolta nella categoria del giallo, talvolta in quella del nero.
14. Varela, Thompson, Rosch, op. cit., p. 205
15. Brooks, Intelligence without representation, MIT AI Report, 1987, cit. in Varela, Thompson, Rosch, op. cit., p.247
16. Brooks, Braezeal, Marjanovic, Scassellati, Williamson, The Cog project: Building an Humanoid Robot, MIT AI, 1998, trad. mia
17. Vera, Simon, Situated action: a symbolic interpretation,in Cognitive Science, n. 17, 1993, trad. mia
18. Nolfi, Pianificazione e robotica, in Burattini , Cordeschi, L’Intelligenza Artificiale, Carocci, Roma 2001
19. Per pattern si intende una struttura fisica, biologica o inorganica (sistema nervoso, computer) che può essere oggetto di procesi computazionali quali codifica, decodifica, registrazione, cancellazione, cambiamento, confronto.
20. Touretzky, Pomerleau, Reconstructing Phisical Systems, in Cognitive Science, n. 18, p.345
21. Vera, Simon, op. cit., p.10, trad. mia.
22. ivi. p.9 , trad. mia
23. Touretzy, Pomerleau, op. cit., p.350, trad. mia
24. ivi. p.349
25. Greeno, Moore, Situativity and Symbols: Response to Vera and Simon, in Cognitive Science, n.17, 1993, p.56, trad. mia
26. Vera, Simon, op. cit., p.14, trad. mia
27. Cordeschi, Vecchi problemi filosofici per la nuova Intelligenza Artificiale, http://lgxserve.ciseca.uniba.it, p.19
28. Greeno, Moore, op. cit., p.54, trad. mia
29. Alvinn è il nome dell’intero sistema robotico, mentre Navlab è il nome della sua componente connessionista
30. Tourektzy e Pomerleau, op. cit., p. 349, trad. mia
31. vi, p.351, trad mia
32. Greeno, Moore, op. cit., p.57, trad. mia

OPERE DI RIFERIMENTO:

Aleksander, Come si costruisce una mente, Einaudi, Torino, 2001

Brooks, Braezeal, Marjanovic, Scassellati, Williamson, The Cog project: building an humanoid robot, MIT press, 1998

Cordeschi, Vecchi problemi filosofici per la nuova Intelligemza Artificiale, http.//lgxserve.uniba.it, 2001

Greco, Cangelosi, Riga, Il fondamento dei simboli attraverso l’esperienza con il mondo: u approccio connessionista, in Sistemi Intelligenti, n.1, Il Mulino, Bologna, 2004

Greeno, Moore, Situativity and Symbols: Response to Vera and Simon, in Cognitive Science, n.17, 1993

Nolfi, Pianificazione Robotic, in Burattini, Cordeschi, L’intelligenza Artificiale, Carocci, Roma, 2001

Peruzzi, Il significato inesistente:lezioni sulla semantica, University Press, Firenze, 2004

Touretztky, Pomerleau, Reconstructing Phisical Systems, in Cognitive Science, n.18, 1993

Ilaria Mavilla (email) svolge la sua attività presso il Dipartimento di Filosofia dell’Università di Firenze.

“Se il laboratorio e’ nel computer le scienze hanno un’arma in piu’” di Domenico Parisi

Le simulazioni sono teorie interpretative dei fenomeni della realta’ formulate come un programma che gira in un computer. Le teorie della scienza mirano a identificare i meccanismi, i processi, i fattori che stanno dietro ai fenomeni e che spiegano i fenomeni, ce li fanno capire. Adottare il metodo della simulazione significa tradurre una teoria in un programma di computer, far girare il programma nel computer e verificare se il programma, cioe’ la simulazione, riproduce i fenomeni che la teoria intende spiegare. Le simulazioni sono il terzo strumento della scienza, uno strumento che si e’ aggiunto abbastanza di recente, cioe’ da quando computer veloci e potenti sono divenuti accessibili a qualunque scienzato, ai due strumenti di ricerca tradizionali: le teorie e gli esperimenti di laboratorio. In che senso le simulazioni sono un nuovo strumento della ricerca scientifica?

Nelle scienze piu’ mature e consolidate, cioe’ nelle scienze della natura (fisica, chimica e biologia), teorie e dati sperimentali interagiscono costantemente e in modo ravvicinato. Lo scienziato formula la sua teoria, deriva dalla teoria determinate predizioni empiriche e verifica in laboratorio se queste predizioni empiriche sono corrette oppure no. Se non lo sono, modifica la teoria. La verifica mediante gli esperimenti di laboratorio e’ in genere piu’ robusta e dettagliata di quella offerta dall’osservazione dei fenomeni cosi’ come si verificano spontaneamente nella realta’. Intanto i fenomeni osservati in laboratorio dallo scienziato avvengono in condizioni che sono sotto il controllo dello scienziato, e questo permette allo scienziato di escludere tutta una serie di fattori come cause dei fenomeni. In secondo luogo, in laboratorio lo scienziato manipola, modifica alcuni aspetti dei fenomeni (le variabili indipendenti), e poi osserva le conseguenze di queste sue manipolazioni su altri aspetti dei fenomeni (le variabili dipendenti). In questo modo puo’ giungere a conclusioni piu’ stringenti su quali sono i meccanismi, i processi e i fattori responsabili del verificarsi dei fenomeni.

Le simulazioni sono uno strumento nuovo di indagine scientifica perche’ hanno alcune delle caratteristiche delle teorie, alcune caratteristiche degli esperimenti, e alcune caratteristiche completamente nuove. Le teorie come sono formulate tradizionalmente nella scienza stanno dentro la testa dello scienziato, oppure nei suoi discorsi (ai convegni scientifici) o nei suoi libri. I dati empirici stanno nella realta’, dentro o fuori il laboratorio. Con le simulazioni sia le teorie che i dati empirici stanno dentro al computer. Le teorie sono incorporate nel programma del computer e i dati empirici emergono quando il programma gira nel computer. Una simulazione funziona come un laboratorio sperimentale virtuale, nel quale lo scienziato, come nel laboratorio reale, osserva i fenomeni (simulati) in condizioni controllate, manipola le variabili e osserva gli effetti delle sue manipolazioni.

Ovviamente, la verifica ultima di una simulazione e’ che i dati empirici cosi’ come emergono nella simulazione corrispondono ai dati empirici cosi’ come si osservano nella realta’. Ma intanto le simulazioni offrono una serie di vantaggi, e sono questi vantaggi che spiegano perche’ le simulazioni stanno diventando uno strumento di ricerca sempre piu’ usato in tutte le discipline scientifiche, dalle scienze naturali alle scienze cognitive, dalle scienze sociali a quelle storiche.

Quali sono questi vantaggi?

Il primo vantaggio e’ che esprimere una teoria come un programma di computer costringe a formulare la teoria in modi necessariamente chiari, espliciti, univoci, senza “buchi” e contraddizioni nascoste. La ragione e’ che se non e’ formulata in questo modo, una teoria non puo’ essere tradotta in un programma di computer oppure il programma non gira nel computer.

Questo e’ un vantaggio specialmente importante per quelle discipline, come le scienze dell’uomo (le scienze cognitive, sociali e storiche), che spesso non riescono a formulare le loro teorie in modo chiaro, esplicito e univoco. I concetti teorici delle scienze dell’uomo non sono in genere concetti quantitativi, matematici, i quali sono per definizione chiari, espliciti e univoci, e inoltre non si connettono in modo diretto con la realta’ osservabile con i sensi. Quando uno storico dell’antichita’ parla di “citta’” o di “stato”, non esprime qualcosa di quantitativo e neppure qualcosa che sia direttamente osservabile nei “documenti” empirici, cioe’ nei resti archeologici o nei testi scritti. Il risultato e’ che i concetti teorici delle scienze dell’uomo spesso significano cose diverse per scienziati diversi e tendono al nominalismo e all’essenzialismo, cioe’ trasformano le discussioni scientifiche in discussioni sulle parole piuttosto che sui fenomeni della realta’ e assumono implicitamente ma erroneamente che, come le parole, anche i fenomeni della realta’ abbiano confini ben definiti, siano uniformi e immutabili.

Le simulazioni cambiano tutto cio’. Se una teoria interpretativa si presenta come una simulazione, i suoi concetti non possono non essere chiari, espliciti e univoci. Il significato dei concetti e’ tradotto interamente nei termini operativi della simulazione. Non c’e’ una “citta’”, ma un insediamento di determinate dimensioni, con determinate caratteristiche costruttive, che funziona in un determinato modo, situato in una certa zona geografica, e cosi’ via. Quello che uno scienziato intende veramente con il concetto di “citta’” viene fuori esplicitamente e chiaramente dalla simulazione e il rischio che scienziati diversi usino le stesse parole con significati diversi diminuisce. Quando si discute, si discute non del concetto di “citta’” ma di quali siano le cause e gli effetti delle dimensioni dell’insediamento, delle sue caratteristiche costruttive, del suo modo di funzionare, dell’essere situato in una certa zona geografica invece che in un’altra. Non esiste piu’ una essenza platonica chiamata “citta’”, ma esistono vari insediamenti in varie zone del mondo, ciascuno diverso dagli altri, ciascuno che cambia continuamente nel tempo.

Il secondo vantaggio delle simulazioni e’ che esse permettono un tipo di verifica completamente nuovo delle teorie. Con gli strumenti tradizionali della scienza, una teoria puo’ essere verificata, come abbiamo visto, traendo da essa delle predizioni empiriche e verificando queste predizioni. Le simulazioni si inseriscono a mezza strada tra teorie e dati empirici della realta’. Una simulazione permette di verificare se le predizioni che lo scienziato trae dalla sua teoria discendono effettivamente dalla teoria oppure no. Una teoria, per lo scienziato che la formula, pretende di spiegare certi fatti. Le simulazioni permettono di verificare prima di tutto se effettivamente la teoria spiega tali fatti. Poniamo che con la sua teoria uno scienziato pretenda di spiegare perche’ e in quali condizioni emergono insediamenti umani con certe caratteristiche (quelli che, volendo, possiamo chiamare “citta’”). Lo scienziato identifica meccanismi, processi e fattori che a suo avviso portano (a parita’ di altre condizioni) all’emergere delle “citta’”. Se la teoria rimane, come avviene tradizionalmente, una fomulazione puramente verbale, non c’e’ molto modo di verificare se effettivamente i meccanismi, processi e fattori indicati dallo scienzato portino alla comparsa delle “citta’”. In genere i dati empirici sono insufficienti a stabilire questo in modo sufficientemente sicuro. Ma poniamo che la teoria dello scienziato sia formulata come una simulazione. I meccanismi, processi e fattori postulati dallo scienziato sono incorporati nel programma della simulazione. Facendo girare la simulazione, si puo’ verificare se effettivamente, sotto l’azione di quei meccanismi, processi e fattori (che peraltro nella simulazione dovranno essere definiti in modo piu’ chiaro, esplicito e univoco di quanto normalmente non accada nella formulazione verbale della teoria), emergono le “citta’”.

Il terzo vantaggio delle simulazioni e’ che, come abbiamo gia’ detto, le simulazioni sono laboratori sperimentali. Se una teoria, espressa come una simulazione, non produce i risultati aspettati, e’ possibile variare i valori delle variabili oppure cambiare le stesse variabili scelte e cercare di ottenere cosi’ i risultati desiderati cambiando la teoria. Si realizza cosi’ quello stesso scambio e “circolo virtuoso” tra teoria e dati empirici che, come abbiamo visto, e’ alla base delle scienze mature e consolidate. Anzi i “gradi di liberta’” dello scienziato nella manipolazione delle variabili tendono ad essere molto maggiori in una simulazione che nel laboratorio reale. Inoltre le simulazioni possono mettere lo scienziato di fronte a fatti empirici (simulati) non previsti, cosi’ come fanno gli esperimenti di laboratorio. Una verifica attraverso una simulazione non ci permette soltanto di scoprire se certe conseguenze previste effettivamente conseguono dalle nostre teorie, ma anche di scoprire conseguenze delle nostre teorie che non avevamo previsto.

Il quarto e ultimo vantaggio delle simulazioni e’ che esser permettono di simulare tutto, mentre in laboratorio si possono studiare solo alcuni fenomeni, e in condizioni cosi’ artificiali che, per certe discipline, l’utilita’ degli esperimenti di laboratorio e’ inevitabilmente limitata. In effetti, l’impossibilita’ per le scienze dell’uomo di usare il laboratorio sperimentale cosi’ come fanno le scienze della natura e’ l’altra causa della loro debolezza e della loro immaturita’ rispetto alle scienze della natura, accanto al carattere poco chiaro, preciso e univoco dei loro concetti teorici che abbiamo gia’ sottolineato piu’ sopra. Ma anche nelle scienze della natura il laboratorio sperimentale ha dei limiti di utilita’. In genere si possono studiare in laboratorio i fenomeni che costituiscono “sistemi semplici”, cioe’ effetti lineari di poche variabili, ma non i fenomeni che costituiscono “sistemi complessi”, cioe’ effetti altamente nonlineari di moltissime variabili. In laboratorio si manipola una variabile, si fa una predizione sugli effetti di tale manipolazione e si verifica la predizione. Questo funziona per i “sistemi semplici”, che sono prevedibili e che cambiano in modo prevedibile, molto meno per i “sistemi complessi”, che hanno caratteristiche difficilmente prevedibili sulla base di una conoscenza dei loro elementi e dei fattori che agiscono su di loro. Se per studiare i “sistemi semplici” il laboratorio sperimentale appare lo strumento ideale, per studiare i “sistemi complessi” lo strumento appropriato sono le simulazioni. In una simulazione si possono simulare moltissime entita’, ciascuna con le sue caratteristiche, stabilire le “regole di interazione” locali tra entita’, e osservare (senza essere in grado di prevedere) gli effetti globali di queste interazioni.

“Sistemi complessi” sono quasi tutti i fenomeni di cui si occupano le scienze dell’uomo – e questa e’ un’altra ragione per pensare che le simulazioni faranno una grande differenza soprattutto per queste scienze – ma anche le scienze della natura stanno accorgendosi che molti dei fenomeni a cui esse sono interessate sono “sistemi complessi”. In effetti le scienze della natura riescono (molto bene) a studiare in laboratorio i processi elementari che sono alla base di molti fenomeni naturali ma per studiare questi fenomeni naturali cosi’ come realmente avvengono (il funzionamento e la storia del cosmo, il funzionamento degli oceani, il tempo meteorologico, il risultato dell’azione di 100 miliardi di neuroni in un sistema nervoso umano) il laboratorio e’ scarsamente utile. Servono le simulazioni.

Ma le simulazioni possono essere usate per studiare molti fenomeni che non possono essere studiati nel laboratorio sperimentale anche per ragioni piu’ ovvie. In un laboratorio, ma anche con metodi di osservazione sul campo, non possono essere studiati fenomeni e entita’ troppo grandi o che durano troppo nel tempo o che sono successi in passato e ora non sono piu’ (come tutti gli eventi e le entita’ storiche) o che non si possono manipolare a piacere per ragioni etiche. Tutti questi fenomeni invece possono essere simulati.

Le simulazioni quindi offrono molti vantaggi alla ricerca scientifica, specie a quella delle scienze dell’uomo. Prima di concludere discutiamo due altri aspetti di questo nuovo metodo della ricerca.

Le simulazioni tendono ad avere una verifica a due livelli. Il primo livello e’ quello in cui si verifica se la teoria incorporata nella simulazione effettivamente produce i risultati previsti. In questa prima verifica si assumono certi dati empirici, considerati pero’ in modo un po’ globale e gia’ noti, e si verifica se la simulazione li riproduce. Ma in realta’ quello che si verifica in questo primo livello e’ la coerenze interna della teoria, la chiarezza, esplicitezza, e univocita’ dei suoi concetti, la sua completezza e capacita’ di riprodurre effettivamente determinate predizioni empiriche. Il secondo livello di verifica di una simulazione e’ quello della verifica empirica reale. Ora bisogna accertare se i risultati della simulazione corrispondono con i fatti della realta’, cioe’ se la simulazione riesce a riprodurre nel dettaglio i dati empirici e se riesce a fare predizioni su fatti empirici ancora non noti.

Spesso nelle scienze dell’uomo, in particolare nel campo oggi molto attivo della simulazione di fenomeni sociali e economici, le simulazioni si fermano al primo tipo di verifica. Le simulazioni hanno come oggetto “organismi artificiali”, “ecologie artificiali”, “societa’ artificiali”, “mercati artificiali”, tutti molto idealizzati, astratti, astorici. Questo tipo di simulazioni hanno una loro utilita’ come strumenti di verifica interna delle teorie e della sufficienza dei concetti messi in campo per dar conto di certi fenomeni. Tuttavia la ricerca non puo’ fermarsi a questo tipo di simulazioni. E’ necessario procedere a fare anche le simulazioni che si confrontano in modo piu’ puntuale con i dettagli dei fenomeni empirici e storici e cosi’ facendo individuano nuove domande a cui la ricerca empirica, non simulativa, deve cercare di rispondere. E’ in questo modo che le simulazioni potranno integrarsi meglio con la ricerca tradizionale della scienza.

Il problema, come si e’ detto, esiste soprattutto nel campo delle scienze dell’uomo (ma anche nel nuovo campo di studi chiamato Vita Artificiale), per la semplice ragione che nelle scienze dell’uomo, rispetto alle scienze della natura, i dati empirici sono di meno facile identificazione, sono meno quantitativi, e “parlano” meno direttamente alle teorie. Ma c’e’ il rischio che limitandosi a simulazioni la cui verifica e’ soprattutto interna e che servono soprattutto a mostrare che certi fenomeni ben noti si possono riprodurre, le scienze dell’uomo continuino a somigliare troppo alla filosofia, dalla quale sono riuscite fino ad oggi ad autonomizzarsi meno delle scienze della natura. La filosofia e’ soprattutto analisi concettuale, esame interno dei nostri concetti e dei nostri modelli mentali della realta’, mentre la scienza ha in piu’, rispetto alla filosofia, l’interesse per la realta’ empirica, per i dati e i fatti della realta’ da studiare in tutto il loro dettaglio, e con cui confrontare i nostri “pensieri” (teorie) sbattendo eventualmente la faccia contro di essi. Galileo, a cui le scienze della natura debbono in buona parte il fatto di essere diventate autonome dalla filosofia, diceva di stimare di piu’ “il trovare un vero, benche’ di cosa leggiera, ch’il disputar lungamente delle massime questioni senza conseguir verita’ nissuna”. Se le scienze dell’uomo debbono affrancarsi dalla filosofia come hanno fatto le scienze della natura e se questa e’ una condizione, probabilmente necessaria, perche’ essi diventino scienze mature e consolidate come le scienze della natura, le simulazioni potranno esprimere tutti i loro grandi potenziali vantaggi per queste discipline soltanto se esse saranno non soltanto un nuovo strumento di lavoro intellettuale per lo scienziato ma anche uno strumento di interazione stretta tra teorie e dati della realta’.

L’ultimo aspetto che vogliamo discutere delle simulazioni come nuovo strumento di ricerca e’ una questione apparentemente piu’ strettamente tecnica. Esistono due tipi di simulazioni che si distinguono in funzione del modo scelto per presentare al ricercatore i risultati della simulazione. Il primo tipo di simulazione presenta i risultati al ricercatore sotto la forma di formule, grafici, tabelli. Questa forma e’ simbolica e riassuntiva, e corrisponde ai modi tradizionale di presentare le analisi e i risultati nella ricerca scientifica, specie nelle scienze della natura. Il secondo tipo di simulazione e’ piu’ innovativo. Per capire bene questo secondo tipo di simulazioni bisogna riflettere sul computer come strumento per fare le simulazioni.

Il computer non e’ solo uno strumento che puo’ incorporare una teoria scientifica nel programma che gira dentro di esso, e in questo modo simulare la teoria, cioe’ riprodurre i meccanismi, processi e fattori postulati dalla teoria per dar conto di certi fenomeni empirici. E’ anche uno strumento capace di simulare, cioe’ di riprodurre i fenomeni empirici spiegati dalla teoria. Il metodo della simulazione dispiega tutte le sue grandi potenzialita’ quando riproduce i fenomeni non riassumendoli nella forma simbolica di formule, grafici e tabelle, ma facendo vedere, alla lettera, i fenomeni risultanti dalla simulazione. Questo puo’ sembrare ovvio quando i fenomeni in questione sono gia’ di per se’ qualcosa di visibile nella realta’: un oggetto, un organismo, un artefatto tecnologico, un’area geografica di piccole dimensioni. Ma le tecniche di visualizzazione oggi in pieno sviluppo (tecniche sia in senso informatico sia in senso cognitivo e comunicativo) permettono e sempre piu’ permetteranno in futuro di rendere visibile anche quello che nella realta’ non lo e’: entita’ troppo grandi e processi che durano troppo a lungo per essere percepibili da un essere umano, fenomeni troppo complicati e anche fenomeni astratti.

Questo apre nuove interessanti prospettive per la ricerca scientifica perche’ lo scienziato non e’ piu’ costretto a interagire con un set limitato di fenomeni empirici direttamente percepibili e poi con una grande quantita’ di espressioni simboliche che riassumono i dati empirici ma sono solo arbitrariamente connesse con la realta’ empirica: parole, simboli matematici, formule, grafici, tabelle. Con le visualizzazioni che sono spesso associate alle simulazioni lo scienziato puo’ “vedere” molto di piu’ della realta’ di quanto non possa fare con la realta’ “reale” e puo’ sviluppare una comprensione intuitiva, perche’ senso-motoria e non simbolica, della realta’ che finora gli era preclusa.

“Artificial Life and the simulation of culture” di Domenico Parisi

1. Culture

Humans are unlike other animals in that most of their behavior has a social origin. Nonhuman animals behave in ways that are mostly genetically inherited or are learned in the course of an individual’s interactions with the nonsocial environment. In contrast, most of what an individual human being does, knows, or wants has been learned from other individuals or from the artifacts made by other individuals.

Behavior which is learned from others is called cultural behavior (Boyd and Richerson, 1985; Boesch, 1996). If a group of people live in such conditions that they tend to learn their behaviors from each other, these people will share the same behaviors. A set of behaviors shared by a group of people because these people have learned the behaviors from each other is called a culture. When the conditions for learning from each other are not met, for example because groups of people live far from each other and without contacts, each group of people will have its own culture which will be different from the culture of the other groups.

A behavior which individual A learns from individual B can be said to be transmitted from B to A. Cultural transmission has some analogies with biological transmission. In biological transmission genetic information is encoded in the DNA and is acquired by individual A from individual B as a result of biological reproduction. In cultural transmission individual A acquires some behavior from individual B because A imitates B or is taught or persuaded by B or interacts with artifacts made by B. The analogy between biology and culture goes beyond transmission and it extends to evolution, that is, to change over time in genetic or cultural information. In fact, biology and culture appear to be both instances of a more abstract and general process of evolution which results from the selective transmission of variants in a population of variants and the constant addition of new variants (Dennett, 1996). The parallels are as follows. In biological evolution the population of variants is the set of individual genotypes together with the set of phenotypes that result from these genotypes through the process of individual development. In cultural evolution the population of variants is the set of different behaviors exibited by a group of individuals and learned from each other. Selective transmission in biology consists in the fact that some individuals have more offspring than other individuals so that some individual genotypes leave more copies and become more frequent in the population than other individual genotypes. In culture some behaviors are learned or reproduced by more individuals than other behaviors and therefore become more frequent in the culture. In biological evolution new variants are added to the genetic pool of a species through genetic mutations, which are chance modifications of the inherited genetic material, and through sexual recombination, which creates new genotypes that are new combinations of portions of the genotype of one parent with portions of the genotype of the other parent. In cultural evolution new variants are added to the cultural pool of a culture because of “errors” of transmission analogous to genetic mutations, because new behaviors are created or invented by recombining in new ways some aspects of already existing behaviors, and because of imports from other cultures. The selective reproduction of variants and the constant addition of new variants are what causes both biological evolution and cultural evolution.

Given the analogies between biological and cultural evolution it seems to be appropriate and fruitful to use the same theoretical framework to model both types of evolution. However, biological and cultural evolution have both commonalities and differences. Therefore, one should be careful not to look for traits that belong only to biological evolution in cultural evolution, and viceversa. A different issue is the study of interactions that may exist between biological and cultural evolution as empirical processes which are both found in humans and which may influence each other, now or in the past. For example, if one asks why is it that humans are the only animals that have culture (at least in a well developed form), a possibile answer is that humans have a species-specific biologically evolved genetic basis for culture. Then, an important research goal is to describe this genetic basis for culture.

Before we proceed we would like to somewhat extend our definition of culture. We have defined culture as the set of behaviors exibited by a group of people that have learned such behaviors from each other. However, people learn from each other not only behaviors but also ideas, knowledge, and goals. Therefore, a more complete definition of culture is the set of behaviors, ideas, knowledge, and goals that a group of people learn from each other. Another extension concerns the transmission mechanism. People acquire behaviors, ideas, etc., from other individuals in a number of different ways. They learn from others by spontaneously imitating other individuals or by being explicitly taught by other individuals. They learn both verbally and nonverbally. They learn by interacting directly with other people and they learn by interacting with the artifacts produced by other people. Furthermore, much human behavior has a social origin and is culturally transmitted simply because we are influenced by other people through persuasion, propaganda, and advertising. A third extension of our definition of culture concerns artifacts. Humans are unique in the animal world not only because of the social origin of most of what they do, know, and want, but also because they create artifacts. Artifacts are modifications of the external environment that tend to make the external environment more favourable to one’s survival and well-being. That both culture and artifacts characterize humans is no coincidence because one could argue that the same genetic basis underlying cultural behavior in humans also underlies the creation of artifacts by humans and because artifacts are culturally transmitted and are a means of cultural transmission. Artifacts are culturally transmitted because the behaviors, ideas, and knowledge that allow humans to create artifacts are culturally transmitted. They are a means of cultural transmission because behaviors, ideas, and knowledge can be culturally acquired by an individual as the individual interacts with the artifacts and not directly with other humans beings. Hence, our definition of culture should be extended to artifacts. Culture is the set of behaviors, ideas, knowledge, goals, and artifacts that are socially transmitted in a group of human beings. Being a part of culture, artifacts evolve like behaviors, ideas, knowledge, and goals by being selectively reproduced (copied, bought, used) and by the constant addition of new artifacts.

2. How to model culture

Notwithstanding its importance for understanding human behavior and human societies and the many efforts of a number of disciplines including anthropology, sociology, primatology, archeology, palethnology, historical linguistics, and history itself, we still do not have a mature and scientifically respectable science of culture. A mature and scientifically respectable science of culture would be a science with well-articulated theories that identify the important entities, mechanisms, and processes underlying and explaining cultural phenomena, their origins and evolution, and that make specific predictions that can be tested using the empirical evidence. No such a science exists. The disciplines that in one way or another concern themselves with culture tend to be nontheoretical, that is, to be purely descriptive and/or narrative, or to limit themselves to questions of typology, definition of cultural and societal stages, or periodization. Moreover, the disciplinary fragmentation is an obstacle to the identification of relationships and cross-field explanations that are critical for a mature science. (Cf. the natural sciences where chemical facts are explained in terms of physics and biological facts in terms of chemistry.)

Some progress has been done recently with the development of quantitative and formal models of cultural phenomena (Cavalli-Sforza and Feldmann, 1981; Boyd and Richerson, 1985). Many of these models are extensions to culture of quantitative and formal models used in genetics and population biology. They tend to be mathematical models that specify how an aggregate variable is quantitatively related to one or more other aggregated variables or how an aggregated variable changes with time. These quantitative models, although important, have three limitations. One limitation is that they tend to apply only to a restricted range of phenomena that have to do with culture, while many important phenomena seem to be difficult or impossible to deal with using this type of models. Quantitative/formal models apply to popolational or social/collective phenomena but they tend to ignore the individual at both the neural and the behavioral level. A second limitation is that one ends up with a series of distinct models of different aspects of culture but it is more difficult, using the quantitative/formal approach, to link up the different phenomena with one other in order to arrive at an integrated picture of the entire range of cultural phenomenon and of their causes and consequences. The third limitation is the most serious one. In this field as in other scientific fields, models that try to capture the quantitative relationships among aggregate variables and to determine how aggregate variables change with time can be said to remain at the surface of the phenomena. What is required to understand the phenomena more deeply are models that try to identify the entities, mechanisms, and processes that underly the observed phenomena and explain them by allowing us to see how the phenomena are dynamically generated by these entities, mechanisms, and processes. If successful, these models will then explain why two or more aggregated variables are related in the way described by the purely quantitative models and why some particular aggregate variable changes with time in the way described by these quantitative models.

In this paper we adopt a different approach to modeling culture: Artificial Life. Artificial Life is an approach to the study of all the phenomena of the living world that attempts to understand these phenomena by reproducing them in a computer. Therefore, Artificial Life models are not expressed verbally or as mathematical formulae but they are expressed as computer programs. They are simulations. Artificial Life models are not restricted to biological phenomena. The living world exhibits both phenomena that are properly studied by the biological sciences and, in the case of humans, also phenomena that are studied by the cognitive and social sciences. The latter phenomena include the phenomena of culture: what makes (or made) culture possible, how culture is transmitted, what varieties of “things” are culturally transmitted, what mechanisms are responsible for the selective nature of cultural transmission, what mechanisms are responsible for the addition to new variants to the cultural pool of a human group and, more generally, for the cultural evolution in human groups.

Artificial Life models are agent-based models, that is, models that assume a set of “agents” (e.g., individual organisms) that interact with each other and with the rest of the environment in such a way that from their interactions global phenomena emerge that cannot generally be predicted or deduced from a knowledge of the “agents” and of the “rules” that govern their interactions. If the “agents” are individual (human) organisms, the biological orientation of Artificial Life induces to model their behavior as governed by a nervous system physically contained in a body which in turn is contained in a physical environment, where each individual organism is a member of a biologically and culturally evolving population of organisms.

An Artificial Life approach to culture has advantages with respect to both the traditional approaches and the more recent quantitative/formal models. Since Artificial Life models are expressed as computer programs, they force the researcher to formulate explicit and quantitative theories that make specific predictions about empirical phenomena since the results of a simulation are the empirical predictions drawn from the theory incorporated in the simulation. Furthermore, once a simulation has been constructed the simulation functions as a virtual experimental laboratory in which the researcher can observe the (simulated) phenomena in controlled conditions and can manipulate these conditions to observe the consequences of his/her manipulations as in a real experimental laboratory. This allows the study of culture to go beyond the purely descriptive/narrative work or the vague “theories” of the traditional disciplines and to have access to a powerful experimental instrument that can compensate for the lack of the real experimental laboratory. But Artificial Life models of culture can also overcome the limitations of the quantitative/formal models derived from population genetics. Artificial Life models can apply to a wider range of cultural phenomena and to the interactions among the different kinds of phenomena relevant for culture at the genetic, neural, behavioral, social, and environmental level. Furthermore, they can identify the entities, mechanisms, and processes that underlie the observed relationships among aggregated variables described by the quantitative models.

3. Some simulations of cultural transmission and evolution

3.1 Basic model of cultural tramission and evolution

Our basic definition of culture is behavior which is learned from others. In this section we describe a simple model of learning from others and of the evolutionary emergence of culturally transmitted behaviors. The behavior of an individual is governed by a neural network and the neural network learns using the backpropagation procedure (Rumelhart and McClelland, 1986). The evolutionary emergence of culture is modeled using a genetic algorithm (Holland, 1975; Mitchell, 1998).

A population of individuals lives in an environment that contains a certain number of resource elements. (The simulations described in this and the following paragraph were done with Daniele Denaro. Cf. Denaro and Parisi, 1996.) The behavior of each individual is controlled by a neural network with input units encoding the location of the nearest resource element and the output units encoding motor behavior that allows the individual to move in the environment. When an individuals reaches a resource element, it captures the resource element. At the beginning of the simulation the individuals’ neural networks are assigned random connection weights. Therefore, the behavior of the individuals of the initial generation is rather inefficient from the point of view of resource procurement. These individuals tend to move randomly or stereotypically and, therefore, they are able to capture a very limited number of resource elements. However, for purely random reasons some individuals happen to have better connection weights than other individuals and these connection weights allow them to behave more efficiently, that is, to capture more resource elements than their less lucky conspecifics.

Just before the individuals of the first generation die (length of life is identical for all individuals and all individuals die at the same time), a second generation of individuals is created. These individuals are born with random connection weights like the individuals of the first generation but, at the beginning of their life, they are given a chance to learn to procure the resources by imitating the behavior of the individuals of the first generation (Figure 1).

Figure 1. A simple model of learning by imitating another individual. Both the “learner” neural network (left) and the“model” neural network are exposed to the same input and each responds by generating some output. The “learner” neural network learns by using the output of the “model” network (right) as teaching input in the backpropagation procedure. The teaching input tells the “learner” network how to modify its connection weights in such a way that after a certain number of learning cycles the “learner” network responds to the input in the same way as the “model” network.

The best individuals of the first generation are selected as “models” of the individuals of the second generation and, furthermore, when an individual of the second generation learns the behavior of resource procurement by imitating its “model”, some noise is added to the transmission process by slightly (randomly) modifying the teaching input. This noise has the consequence that in most cases a “learner” turns out to be less good at procuring the resources than its “model” but in a few cases a “learner” can outperform its “model”. Of course, the individuals that happen to perform better than their “models” are more likely to be selected at the end of their life as the “models” of the individuals of the next generation.

The process is repeated for a certain number of generations. The capacity to procure the resources tends to increase with each successive generation and after a certain number of generations it reaches a steady state level which is clearly much better than the initial level (Figure 2).

Figure 2. Evolutionary increase in the ability to procure the resources present in the environment in a population in which the ability is culturally transmitted and it evolves purely culturally. Top: best individual; Middle: average individual; Bottom: worst individual in each generation.

3.2 Interactions between cultural and biological evolution

In the simulation just described it was the researcher who selected the best individuals of each generation as the “models” of the next generation. In a second simulation the individuals themselves evolve an ability to identify the best individuals of the preceding generation in order to adopt them as “models”. This ability to select the best individuals of the preceding generation as “models” is genetically inherited. The ability is encoded in the genotype of each individual as a number that measures the individual’s level of ability in selecting good “models”. An individual transmits this ability to its offspring. Biological reproduction is selective in that the individuals that are better at procuring resources (an ability culturally learned from “models”) are more likely to have offspring than less able individuals. When an individual generates an offspring, the offspring inherits the same level of ability of its single parent (reproduction is nonsexual), with the addition of a random genetic mutation that can either slightly increase or decrease the offspring’s level of ability to select good “models” compared with its parent’s level.

At the beginning of the simulation all individuals are assigned a random genotype, which means that the ability to select good “models” is not well developed in the initial population. Therefore, in the early generations not much is learned from the “models” since the “models” are not selected appropriately. However, because of the selective biological reproduction and the constant addition of random genetic mutations to the inherited genotypes the average ability to select good “models” progressively increases and at the end of the simulation it is much more developed than it was in the initial population.

The simulation we have just described is an example of cooperation between cultural evolution and biological evolution. The ability of resource procurement is culturally transmitted (i.e., learned from “models”) whereas the ability to select good “models” is genetically transmitted (i.e., it is encoded in the inherited genetic material). The two types of evolution are in a reciprocal causal relation. The biological evolution of the ability to select good “models” is made possible by the cultural evolution of the ability of resource procurement. If there were no cultural transmission/evolution of the ability to procure resources, there would be no selective pressure for the evolutionary emergence of the genetically transmitted ability to select good “models”. In fact, individuals that are born with a higher level of the ability to select good “models” are not, by this fact alone, more likely to reproduce. Being a good judge of the quality of potential “models” is of importance only because it allows an individual to learn more, that is, from better “models”. On the other side, if there were no genetic transmission of the ability to select good “models”, the culturally transmitted ability to procure resources would not emerge evolutionarily because individuals would not learn much from “models” because they would be unable to identify good “models”. Hence, biological evolution causes cultural evolution or at least makes it possible.

Another example of an interaction (reciprocal causality) between cultural and biological evolution is contained in the following simulation. Imagine that in order to learn by imitating another individual (the “model”), it is necessary for the “learner” to be physically near the “model” - in order to be able to observe the behavior to be imitated. In this third simulation each individual has two distinct neural networks, not just one as in the two preceding simulations. The first network is the network that allows the individual to find the resource elements distributed in the environment. As in the preceding simulations the connection weights of this network are randomly assigned at birth and the weights are gradually modified as the individual learns by imitating a “model”. The second network also allows the individual to move in the environment but the input units of this second network encode the location of “models” rather then the location of resource elements. The connection weights of the second network are encoded in the inherited genotype. As in the previous simulation the individuals that collect more resources are more likely to have offspring and random mutations are added to the connection weights of the second neural network which are encoded in the genotype these individuals transmit to their offspring.

At the beginning of the simulation the connection weights of the second network are randomly assigned to all individuals. Hence, initially, the individuals are unable to move in the environment in such a way that they remain in proximity to “models”. The members of the initial generations tend to wander in the environment and to remain at a distance from potential “models”. Since in order to learn they must be physically near a “model”, this implies that they cannot learn by imitating the “models” and therefore they are not very good at procuring the resources. However, the connection weights of the second network are progressively changed by the selective biological evolutionary process and by the genetic mutations and, after a certain number of generations, the members of the population can be seen on the computer’s screen to have a tendency to approach and remain in proximity to “models” (Figure 3).

Figure 3. Spatial distribution of a population of individuals at the beginning of evolution (a) and after a certain number of generations (b). In (b) the individuals tend to aggregate around “models” in order to be able to learn from them.

In this simulation, too, there is cooperation between cultural and biological evolution. The ability to approach and remain in proximity to a “model” does evolve genetically but not because approaching and remaining in proximity to a “model” by themselves increase an individual’s reproductive chances. The ability evolves genetically because of the pressure of cultural evolution. Approaching and remaining in proximity to a “model” makes it possibile for an individual to learn the capacity to procure resources by imitating the “model”. Hence, genetic evolution is dependent on cultural evolution. However, cultural evolution also is dependent on genetic evolution in that the culturally transmitted ability to procure resources would not evolve if individuals would not possess a genetically transmitted and evolved ability to approach and remain in proximity to “models”

3.3 Darwinian and Lamarckian evolution

In the simulations described sofar a purely Darwinian model of cultural evolution was adopted. A purely Darwinian model of evolution assumes that what is transmitted does not change after transmission has taken place. Evolution is due to changes that occur as part of the transmission process: genetic mutations and sexual recombination in biological evolution and random noise added to “model-to-learner” transmission in cultural evolution. (We discuss other mechanisms for adding new variants to a cultural pool below.) After the transmission process is completed there is no further change in what is transmitted. Hence, the individuals of one generation transmit to the individuals of the next generation exactly what has been transmitted to them by the individuals of the preceding generation. A Lamarckian model of evolution, on the other hand, assumes that there is change in what has been transmitted after transmission has taken place. What is transmitted to an individual is changed - possibly improved on - by the individual before it is transmitted to another individual.

While biological evolution is accurately modeled by a purely Darwinian model, cultural evolution tends to be Lamarckian. After an individual has learned some particular behavior from its “model”, the individual can modify the behavior, possibly making it better, so that any other individual that will learn the behavior from the individual will learn a new version of the behavior which is different and possibly better than the originary version.

Unlike the preceding simulations, the new simulation adopts a Lamarckian model of cultural evolution. (These simulations, using a somewhat different model of the individual organisms, were done with Gianluca Baldassarre. Cf. Baldassarre and Parisi, 1999.) Each generation of a population of individuals learns to capture the resources present in the environment by imitating the individuals of the preceding generation. This is like the preceding simulations. But in the new simulation by interacting with the natural rather than with the social environment the individuals can also learn during the course of their entire life to improve what they have learned from their “models”. In this way they can generate better versions of the behavior of seeking resources they have learned from their “models”.

We use a reinforcement learning algorithm to model individual learning. As in the preceding simulations an individual is born with random connection weights and the individual learns to procure the resources by imitating a “model”. After this cultural learning is completed, the individual starts learning individually. In each input/output cycle of its life the individual is provided with a reinforcement signal that tells the individual how good its output is given the input. The neural network controlling the individual’s behavior uses these reinforcement signals to modify its connection weights in such a way that the performance of the individual in capturing the resources present in the environment gradually becomes better than it was after completion of cultural learning. At the end of life, if the individual is selected as a “model” by some “learner” of the next generation, the behavior it offers to the “learner” as a model to be imitated tends to be different, and better, than the originary behavior the individual has learned at the beginning of its life from its “model” of the preceding generation.

We have compared various conditions. In one condition, which replicates the simulations described in the preceding paragraphs, there is selection of “models”, noise during the transmission process, and no individual learning during life. In a second condition there is no selection of “models” (all the individuals of one generation function as “models” of the individuals of the next generation), no noise during the transmission process, and the individuals learn nonsocially during their life. In a third condition there is both selection of “models” and individual learning but no noise is added to the transmission process. The results show that all three conditions lead to an evolutionary improvement in the capacity to capture the resource elements. (The results of the second condition are shown in Figure 4.) The best results are those obtained in the first condition and the results obtained in the third condition are slightly better than those obtained in the second condition. These differences seem to indicate that noise in the transmission process is critical for cultural evolution. In fact, transmission using our imitation learning model without noise (and without individual learning) leads to the progressive loss (dissipation) of the ability which is transmitted (Denaro and Parisi, 1996). (For some discussion of the differences among the various conditions, see Baldassarre and Parisi, 1999.) In any case we expect that if there is individual learning during life whose results are transmitted to the next generation (Lamarckian evolution) in addition to cultural transmission with both selection of “models” and transmission noise, the results will be better than if there is no such learning (purely Darwinian evolution).

Figure 4. Cultural evolution of the ability to find the resource elements when the ability is culturally transmitted without selection of “models” and without noise in the transmission process but there is individual learning during an individual’s life which causes an improvement in the ability which will be transmitted to the next generation. The figure shows the decrease in time needed to reach a resource element by the average individual across 100 generations.

3.4 Cultural transmission of reinforcement signals (values)

In the simulations described sofar what is culturally transmitted are directly behaviors. However, much cultural learning consists in learning from others not directly behaviors but reinforcement signals (values) that then can be used to learn behaviors. Baldassarre (2000) has extended the model of imitation learning of Figure 1 to the cultural transmission of reinforcement signals. The “learner” learns to assign the appropriate reinforcement value to environmental inputs by using the reinf