https://frosthead.com

I computer possono decifrare una lingua di 5.000 anni fa?

La civiltà dell'Indo, che fiorì per gran parte del terzo millennio a.C., fu la società più estesa del suo tempo. Al suo apice, comprendeva un'area di oltre mezzo milione di miglia quadrate centrata su quello che oggi è il confine India-Pakistan. Resti dell'Indo sono stati trovati fino a nord dell'Himalaya e fino a sud di Mumbai. Era la prima cultura urbana conosciuta del subcontinente e vantava due grandi città, una ad Harappa e una a Mohenjo-daro. Eppure, nonostante le sue dimensioni e la sua longevità, e nonostante quasi un secolo di indagini archeologiche, molto sull'Indo rimane avvolto nel mistero.

Quello che poco sappiamo è venuto dagli scavi archeologici iniziati negli anni '20 e che continuano ancora oggi. Nel corso dei decenni, gli archeologi hanno scoperto numerosi manufatti, tra cui sigilli, amuleti e piccole compresse. Molti di questi manufatti portano quelli che sembrano esemplari di scrittura: figure incise che ricordano, tra le altre cose, ferri di cavallo alati, ruote a raggi e pesci dritti. Ciò che esattamente potrebbero significare questi simboli, tuttavia, rimane uno dei più famosi enigmi irrisolti nella borsa di studio delle antiche civiltà.

Ci sono stati altri codici difficili da decifrare nella storia. Gli egittologi, perplessi, colsero una pausa fortunata con la scoperta della famosa pietra di Rosetta nel 1799, che conteneva testo sia in egiziano che in greco. Lo studio dei geroglifici Maya ha languito fino a quando un linguista russo di nome Yury Knorozov ha fatto un uso intelligente del Maya parlato contemporaneo negli anni '50. Ma non esiste una pietra Rosetta dell'Indo e gli studiosi non sanno quali lingue, eventualmente, potrebbero essere discese da quelle parlate dagli indù.

Circa 22 anni fa, a Hyderabad, in India, uno studente di terza media di nome Rajesh Rao ha girato la pagina di un libro di storia e ha appreso per la prima volta questa affascinante civiltà e la sua misteriosa sceneggiatura. Negli anni che seguirono, la scuola e la professione di Rao lo portarono in una direzione diversa - finì per seguire l'informatica, che insegna oggi all'Università di Washington a Seattle - ma monitorò attentamente la borsa di studio dell'Indo, tenendo sotto controllo le dozzine di falliti tenta di dare un senso alla sceneggiatura. Mentre studiava l'intelligenza artificiale e la robotica, Rao ha accumulato una piccola biblioteca di libri e monografie sulla sceneggiatura dell'Indo, circa 30 di loro. Su uno scaffale vicino, conservò anche il caro libro di storia di terza media che lo presentò all'Indo.

"È stato incredibile vedere il numero di idee diverse suggerite dalla gente", afferma. Alcuni studiosi hanno affermato che la scrittura era una sorta di scrittura sumera; altri lo situarono nella famiglia dravidica; altri ancora pensavano che fosse legato a una lingua dell'isola di Pasqua. Rao ha capito che questo era "probabilmente uno dei problemi più difficili in termini di storia antica".

Poiché un tentativo dopo l'altro non è riuscito a decifrare la sceneggiatura, alcuni esperti hanno iniziato a perdere la speranza che potesse essere decodificato. Nel 2004, tre studiosi hanno sostenuto in un controverso documento che i simboli dell'Indo non avevano alcun contenuto linguistico. Invece, i simboli potrebbero essere stati poco più che pittogrammi che rappresentano figure politiche o religiose. Gli autori sono arrivati ​​al punto di suggerire che l'Indo non era affatto una civiltà letterata. Per alcuni sul campo, l'intera ricerca di cercare un linguaggio dietro quelle incisioni dell'Indo cominciò a somigliare a un esercizio di futilità.

Alcuni anni dopo, Rao entrò nella mischia. Fino ad allora, le persone che studiavano la sceneggiatura erano archeologi, storici, linguisti o criptologi. Ma Rao ha deciso di convincere i segreti della sceneggiatura dell'Indo usando lo strumento che conosceva meglio: l'informatica.

Affascinato dalla civiltà dell'Indo sin dall'ottavo anno, Rajesh Rao utilizza l'informatica e un concetto chiamato "entropia condizionale" per aiutare a decodificare la sceneggiatura dell'Indo. (Per gentile concessione di David Zax) Nel corso dei decenni, gli archeologi hanno scoperto numerosi manufatti della civiltà dell'Indo, tra cui sigilli, amuleti e tavolette. (Robert Harding / Robert Harding World Imagery / Corbis) Rao e i suoi collaboratori hanno pubblicato i loro risultati sulla rivista Science a maggio. Non hanno decifrato la lingua ma le loro scoperte ne hanno affinato la comprensione. (Robert Harding / Robert Harding World Imagery / Corbis) Rao e i suoi colleghi stanno ora esaminando stringhe di caratteri più lunghe di quelle analizzate nel documento di Science . La ricerca di schemi aiuterebbe a sua volta a determinare a quali famiglie linguistiche potrebbe appartenere lo script. (Per gentile concessione di David Zax)

In una giornata estiva a Seattle, Rao mi ha dato il benvenuto nel suo ufficio per mostrarmi come lui e i suoi colleghi hanno affrontato il problema. Ha creato una raccolta di repliche di impressioni di foche di argilla che gli archeologi hanno raccolto dai siti dell'Indo. Sono piccoli, come piccoli cioccolatini quadrati, e la maggior parte di essi presenta l'immagine di un animale sotto una serie di simboli dell'Indo. La maggior parte dei campioni della sceneggiatura dell'Indo sono miniature come queste, con solo pochi personaggi; non sono stati scoperti grandi monoliti. Gli studiosi non sono sicuri della funzione dei piccoli sigilli, mi ha detto Rao, ma una teoria è che potrebbero essere stati usati per certificare la qualità dei beni scambiati. Un altro suggerisce che i sigilli avrebbero potuto essere un modo per garantire che i commercianti pagassero le tasse entrando o uscendo da una città: molti sigilli sono stati trovati tra le rovine delle case dei cancelli, che avrebbero potuto funzionare come antichi caselli.

Rao e i suoi colleghi non cercavano di fare miracoli - sapevano che non avevano abbastanza informazioni per decifrare la scrittura antica - ma hanno ipotizzato che usando metodi computazionali, avrebbero potuto almeno iniziare a stabilire che tipo di scrittura dell'Indo lo script era: codificava il linguaggio o no? Lo hanno fatto usando un concetto chiamato "entropia condizionale".

Nonostante il nome imponente, l'entropia condizionale è un concetto abbastanza semplice: è una misura della quantità di casualità in una sequenza. Considera il nostro alfabeto. Se dovessi prendere le tessere Scrabble e gettarle in aria, potresti trovare una vecchia lettera che compare dopo l'altra. Ma nelle parole inglesi attuali, è più probabile che alcune lettere si verifichino dopo altre. Una q in inglese è quasi sempre seguita da una u . A t può essere seguito da una r o e, ma è meno probabile che sia seguito da una n o una b .

Rao e i suoi collaboratori - un gruppo internazionale composto da scienziati informatici, astrofisici e matematici - hanno usato un programma per computer per misurare l'entropia condizionale della sceneggiatura dell'Indo. Quindi hanno misurato l'entropia condizionale di altri tipi di sistemi: linguaggi naturali (sumero, tamil, sanscrito e inglese), un linguaggio artificiale (il linguaggio di programmazione informatica Fortran) e sistemi non linguistici (sequenze di DNA umano, sequenze di proteine ​​batteriche e due set di dati artificiali che rappresentano estremi alti e bassi di entropia condizionale). Quando hanno confrontato la quantità di casualità nella sceneggiatura dell'Indo con quella degli altri sistemi, hanno scoperto che assomigliava molto di più alle percentuali trovate nelle lingue naturali. Hanno pubblicato le loro scoperte a maggio sulla rivista Science .

Se sembra una lingua e si comporta come una lingua, allora probabilmente è una lingua, suggerisce il loro documento. Le scoperte, ovviamente, non decifrano la sceneggiatura, ma ne acuiscono la comprensione e hanno dato rassicurazione a quegli archeologi che avevano lavorato supponendo che la sceneggiatura dell'Indo codifichi il linguaggio.

Dopo aver pubblicato il giornale, Rao ebbe una sorpresa. La domanda a quale famiglia linguistica appartiene la sceneggiatura, risulta, è delicata: a causa dell'età e del significato della civiltà dell'Indo, molti gruppi contemporanei in India vorrebbero rivendicarlo come un antenato diretto. Ad esempio, gli indiani di lingua tamil del sud preferirebbero apprendere che la scrittura dell'Indo era una specie di proto-dravidico, poiché il tamil discende dal proto-dravidico. Chi parla hindi nel nord preferirebbe che fosse una vecchia forma di sanscrito, un antenato dell'hindi. Il documento di Rao non conclude a quale famiglia linguistica appartiene la sceneggiatura, sebbene noti che l'entropia condizionale è simile all'antico Tamil, facendo sì che alcuni critici "ci accusino sommariamente di essere nazionalisti dravidici", afferma Rao. "La ferocia delle accuse e degli attacchi è stata del tutto inaspettata".

Rao a volte prende sollievo nel tornare al mondo meno ferocemente contestato di neuroscienze e robotica. Ma il richiamo della sceneggiatura dell'Indo rimane allettante e "quello che era un hobby ora monopolizza più di un terzo del mio tempo", dice. Rao e i suoi colleghi stanno ora esaminando stringhe di caratteri più lunghe di quelle analizzate nel documento di Science . "Se ci sono schemi", dice Rao, "potremmo trovare delle regole grammaticali. Ciò a sua volta darebbe dei vincoli a quali tipi di famiglie linguistiche ”la sceneggiatura potrebbe appartenere.

Spera che le sue scoperte future parleranno da sole, incitando meno rancore agli avversari che tifano per una regione dell'India rispetto a un'altra. Da parte sua, quando Rao parla di ciò che la sceneggiatura dell'Indo significa per lui, tende a parlare in termini di India nel suo insieme. "L'eredità dell'India sarebbe notevolmente arricchita se fossimo in grado di comprendere la civiltà dell'Indo", dice. Rao e i suoi collaboratori ci stanno lavorando, una riga di codice sorgente alla volta.

I computer possono decifrare una lingua di 5.000 anni fa?