Robotica e AI

L’Intelligenza Artificiale che svela i testi segreti del Vaticano

28 June 2018 | Scritto da La redazione

Si chiama In Codice Ratio il progetto che vuole sfruttare gli ultimi ritrovati in fatto di Intelligenza Artificiale per leggere e trascrivere i documenti conservati nell’Archivio segreto vaticano e renderli disponibili per la ricerca. Anche grazie all’aiuto di un gruppo di liceali.

 

 

Ottantacinque chilometri di scaffali che contengono la storia degli ultimi dodici secoli: attraversandoli, ci si può trovare la bolla papale di scomunica di Martin Lutero, la richiesta d’aiuto che Maria Stuarda inviò a Papa Sisto V prima di essere giustiziata, e perfino una richiesta di annullamento di matrimonio di Enrico VIII. L’Archivio segreto vaticano è un tesoro inestimabile che rischia, però, di restare appannaggio di pochi.

Degli svariati chilometri che compongono l’Archivio, infatti, solo una piccolissima parte è stata scansionata e resa fruibile in formato digitale, e ancora meno materiale è stato trascritto in testo informatico e messo a disposizione della ricerca. Sostanzialmente, per consultare questi documenti è necessario viaggiare fino a Roma, accedere all’Archivio segreto vaticano e sfogliare ogni singola pagina manualmente.

Presto però una soluzione potrebbe essere offerta da un’iniziativa che – non vi inganni il nome latino – affonda le radici nel cuore dell’innovazione tecnologica: In Codice Ratio. Il progetto è stato creato in collaborazione con un gruppo di ricercatori dell’Università di Roma Tre e, se dovesse andare in porto, potrebbe essere la soluzione per la trascrizione e la fruibilità di molti altri documenti presenti negli archivi storici di tutto il mondo. In Codice Ratio, infatti, vuole usare l’intelligenza artificiale, sposando tecniche di analisi delle immagini digitali con i già esistenti software di riconoscimento ottico dei caratteri (ocr), per trascrivere i testi dell’Archivio segreto vaticano, spesso molto complessi e di difficile lettura.

L’ocr, da anni utilizzato per scansionare libri e altri materiali stampati, infatti, non è in grado di effettuare la stessa operazione sui i testi scritti a mano, come la maggior parte delle opere contenute nell’Archivio segreto vaticano.

I cinque ricercatori che coordinano In Codice RatioPaolo Merialdo, Donatella Firmani, Elena Nieddu, Serena Ammirati dell’Università di Roma Tre e Marco Maiorino dell’Archivio segreto vaticano – sono riusciti ad aggirare questo problema grazie a un’invenzione chiamata “scomposizione a mosaico”. Il team di ricercatori ha spiegato che questo sistema non separa le parole in lettere ma in segmenti più simili a singoli tratti di penna, permettendo quindi di scomporre i testi in porzioni limitate, come, appunto, le tessere di un mosaico.

Insolito quanto efficace il metodo usato dall’équipe per “addestrare” il sistema a interpretare le suddette porzioni di testo: è stato infatti chiesto l’aiuto degli studenti di 24 scuole italiane, che nei mesi scorsi hanno aiutato i ricercatori a costruire una base di dati contenente migliaia di esempi di caratteri estrapolati dai manoscritti. Attraverso un’applicazione online, e il supporto di un gruppo di paleografi esperti, i ragazzi coinvolti hanno insegnato al software la forma di ciascuno dei caratteri dell’alfabeto latino medievale. “Inizialmente l’idea di coinvolgere dei liceali è stata considerata assurda – ha spiegato Merialdo, il responsabile del progetto In Codice Ratio, in un’intervista a The Atlantic – Ma ora la macchina sta imparando grazie ai loro sforzi. Mi piace osservare come un piccolo impegno di molte persone possa contribuire alla soluzione di un problema complesso”.

Perché il software risultasse in grado di trascrivere i testi, oltre a saper leggere le “tessere di mosaico”, ovvero le singole lettere che compongono le parole, al sistema è stato insegnato anche un po’ di intelligenza pratica, o di buon senso, grazie all’”ingestione” di oltre 1,5 milioni di tomi latini.

Alla fatidica prova del nove, che consisteva in questo caso nella trascrizione di alcuni documenti dei registri vaticani, tra cui una sottosezione di oltre 18mila pagine dell’Archivio segreto vaticano composta da lettere a sovrani europei, sentenze su questioni legali e altre corrispondenze, il sistema ha retto bene: anche se circa un terzo delle parole trascritte conteneva refusi, il software è riuscito a indovinare il 96% delle lettere manoscritte.

Un risultato promettente che, però, come spiega la storica della filosofia e paleografa Rega Wood, ha i suoi limiti: “I problemi sorgeranno per i manoscritti che non sono scritti in maniera professionale ma copiati da non professionisti”; inoltre nei casi in cui esistono solo dei campioni limitati di materiale con cui lavorare “è, non solo più preciso, ma anche altrettanto veloce effettuare trascrizioni senza ricorrere a una simile tecnologia”.

È certo, in ogni caso, che come per ogni intelligenza artificiale che si rispetti i margini di miglioramento sono molto ampi e In Codice Ratio avrà l’occasione di migliorare nel tempo. Nel frattempo, gli esperti concordano nel dire che la tecnologia messa a disposizione dal sistema, ovvero la frammentazione a mosaico unita a un addestramento del software tramite crowdsourcing, si potrà facilmente adattare alla lettura di testi in altre lingue e altre scritture.

Non ci resta che aspettare e vedere quali segreti In Codice Ratio sarà in grado di svelare.

La redazione
La redazione

leggi tutto