Big Data

Ho la musica nel DNA

27 April 2018 | Scritto da Andrea Geremicca

Presto potremmo salvare musica, foto, file word, la copia del passaporto e tantissimi altri dati direttamente sul DNA

Negli ultimi due anni abbiamo prodotto una quantità di dati talmente elevata da far sorgere un grosso problema: adesso dove li archiviamo? Da uno studio di IBM emerge un dato incredibile: Il 90% dei dati prodotti (e archiviati) nell’intera storia dell’umanità è stato creato negli ultimi due anni. In questo momento fabbrichiamo circa 2,5 quintilioni (2,5 miliardi di triliardi, ovvero 2,5 X 10 elevato a 30) di byte di dati ogni giorno e secondo IBM questo è solo l’inizio, nei prossimi anni la crescita sarà ancora più elevata, grazie al così detto IoT (internet of things).
I nostri Hard Disk, sebbene sempre più capienti, non avranno vita facile in futuro. La velocità con cui creiamo dati e quella con cui miglioriamo le tecnologie in grado di archiviarli (Hard Disk), infatti, viaggiano, al momento, a velocità nettamente diverse. È quindi più che plausibile pensare che in futuro non salveremo più le nostre foto su un normale Hard Disk ma dovremo trovare un archivio alternativo. Questo archivio potrebbe esistere già, si tratta del DNA. Sì esatto, proprio quel DNA.

Già nel 2012 alcuni ricercatori di Harvard avevano iniziato a studiare il DNA come possibile strumento di archiviazione dati, salvando 52.000 libri in un singolo frammento di DNA. Il metodo era concettualmente semplice, bisognava trasformare il codice della vita (il codice del DNA è costituito da un’alternanza di basi azotate: Adenina, Guanina, Timina e Citosina) in 0 e 1, il codice binario di cui si nutrono i computer. Il successo di questo esperimento fu però parziale. Il metodo utilizzato, infatti, rivelò alcune limiti, sia per la limitata capacità di archiviazione raggiungibile, sia dal punto di vista della completezza delle informazioni. Ma infondo era solo l’inizio. Questa scoperta generò molte riflessioni, soprattutto di carattere medico. I ricercatori immaginavano, infatti, che in futuro, grazie a questa tecnologia, saremmo stati in grado di osservare la crescita, lo sviluppo e la morte di una cellula, come se questa fosse dotata di una sorta di “scatola nera degli aerei”. Molte altre aziende, come per esempio Microsoft, videro invece nel DNA qualcosa di diverso dallo scopo medico e cominciarono a valutare le diverse opportunità di business, tra cui, appunto, quella dell’hard disk del futuro.

Nel 2016, alcuni ricercatori di Harvard riuscirono a salvare una GIF nel DNA di un organismo vivente e successivamente trasferirla in un batterio. Utilizzando la tecnologia CRISPR – CAS9 ogni pixel dell’immagine è stato convertito in nucleotidi (i nucleotidi sono unità ripetitive del DNA e dell’RNA) e salvato nel DNA. Da lì la molecola a doppia elica è stata trasportata in un altro batterio e sequenziata nuovamente: le due immagini erano uguali al 90%. In pratica avevano salvato una GIF in una cartella del DNA, portato quella cartella da un’altra parte (in un batterio E.Coli) e da lì hanno riaperto la stessa GIF, trovandola uguale all’originale al 90%.

Qualche giorno fa è uscita una notizia che chiarisce ulteriormente come non si tratti di fantascienza ma di qualcosa di concreto: I Massive Attack, storico gruppo britannico, hanno deciso, in occasione del ventesimo anniversario del loro storico album Mezzanine, di renderlo immortale salvandolo nel DNA. L’intero album è stato ottimizzato con un algoritmo particolare e pesa quindi solo 15MB, non molto per un lettore MP3, ma tantissimo per quanto fatto fino a oggi con il DNA. Si tratterebbe, infatti, del secondo file per grandezza mai salvato nella molecola a doppia elica.

A questo punto la domanda sorge spontanea, quanto siamo lontani dall’utilizzare il DNA come una chiavetta USB? Difficile dirlo con esattezza, molto dipenderà da quanti investimenti saranno fatti in questa direzione e dal prezzo di sequenziamento del DNA, ma con questo tasso di accelerazione tecnologica potrebbe succedere molto presto.

Grazie a una nuova tecnica, chiamata DNA Fountain, siamo oggi in grado di sfruttare quasi al massimo (circa l’85%) la teorica capacità totale di archiviazione del DNA e soprattutto senza nessun errore. Infatti, riusciamo a salvare circa 215 milioni di Gigabyte in un solo grammo di DNA, con ovvi vantaggi: dimensioni ridotte e una vita utile dei nostri dati che si aggira intorno a centinaia di migliaia di anni (un’infinità, soprattutto se pensiamo alle foto salvate su CD, che dopo due graffi erano perse per sempre).
Al momento il costo per sintetizzare 2MB di dati si aggira intorno ai 7000 dollari e almeno altri 2000 ne servono per leggere poi quello che abbiamo sintetizzato. Ma se osserviamo quanto è calato il prezzo per il sequenziamento del DNA dal 2001 (100 Milioni di dollari) a oggi (700 dollari), non è difficile pensare che questi prezzi siano destinati a scendere rapidamente in futuro. Il codice della mia generazione è fatto di 0 e 1, quello dei miei figli potrebbe essere fatto di basi azotate e zuccheri.

Andrea Geremicca
Andrea Geremicca

Contributor

Dal 2014 fa parte dell’Organizing team del TEDx Roma ed è visiting professor e Mentor presso la John Cabot University. Andrea studia e racconta nei suoi articoli gli impatti delle tecnologie esponenziali sulla nostra società.

leggi tutto