Immaginate di aprire un libro, intitolato «DNA», scritto con soli quattro caratteri ripetuti miliardi di volte: ACATTTGCT... Incomprensibile, vero? Proviamo a leggere il sequel invece, «Proteine», che è la sua traduzione con venti simboli diversi: inizia con MFASDTNCVHL...Sembrano dei codici segreti, un po’ come quelli che usavamo sui bigliettini che ci scambiavamo tra i banchi di scuola. In realtà, è proprio il codice della vita: sono le sequenze di nucleotidi e di amminoacidi che compongono le biomolecole fondamentali degli esseri viventi. Ma come mai dovrebbe interessarci cosa c’è scritto nel nostro DNA? Cosa cambierebbe una singola variazione in una successione così grande?
Il protagonista assoluto di oggi è il genoma, ovvero l’insieme del materiale genetico di un organismo: tutto il susseguirsi di geni, segmenti specifici che codificano per proteine o regolano altre attività, costituiti a loro volta da successioni di nucleotidi che tra esseri umani condividiamo al 99%, con piccole variazioni e mutazioni. In quel mancante 1% risiede la nostra unicità.
Oggi la possibilità di sequenziare il proprio genoma, cioè determinare la precisa successione dei nucleotidi che lo compongono, è quasi alla portata di tutti. Negli ultimi anni è stato possibile ridurreconsiderevolmente prezzi e tempistiche per questo processo che negli anni ’50, quando Frederick Sanger propose il primo sequenziamento manuale, avrebbe impiegato molto più tempo. Da lì sono stati raccolte enormi quantità di dati genetici e sviluppati centinaia di strumenti per arrivare alle tecnologie attuali. La reale svolta avvenne quando si capì che le lunghissime sequenze di nucleotidi potevano essere studiate, confrontate e interpretate come stringhe di caratteri da algoritmi automatizzati. E qui nacque quella scienza di cui Margaret Oakley Dayhoff viene considerata “madre e padre”: la bioinformatica.
Che cos’è la bioinformatica?
Spesso chiamata anche «biologia computazionale», è un punto d’incontro tra il naturale e l’artificiale: è un’area di ricerca interdisciplinare e trasversale in cui vengono sfruttati sofisticati modelli e algoritmi matematici, statistici e informatici per sviluppare nuove metodologie e software peranalizzare e comprendere entità e problematiche biologiche e, soprattutto, le informazioni genetiche da DNA, RNA e proteine. Non solo trattandole singolarmente, ma studiando le loro interazioni nei metabolismi e nei sistemi, nelle relazioni evolutive e nell’ereditarietà, comparando più sequenze e permettendo di predire le possibili conformazioni delle biomolecole.
Il motivo dell’espressione trasversale della bioinformatica nella ricerca biologica è la diversità all’origine della vita stessa: dal machine learning all’etica, dalla biologia strutturale alla genetica. Si è resa fondamentale negli anni per via della grande quantità e complessità di dati che gli scienziati trattano: per ottenere una comprensione completa di un fenomeno biologico è necessario poter integrare questi dati per facilitare la loro interpretazione e trovare tra essi schemi che, altrimenti, rimarrebbero nascosti.
La genomica è una delle discipline High Throughput (ad alto rendimento) che ha rivoluzionato l’approccio alla ricerca grazie alla possibilità di manipolare contemporaneamente enormi quantità di dati in modo interoperabile per capire come le diverse parti del genoma interagiscono tra loro. Consentì lo sviluppo del« Progetto Genoma Umano », che nel 2003 permise di diffondere il primo sequenziamento e mappatura (identificazione e disposizione delle sequenze di DNA) del genoma, completato definitivamente solo nel 2022. Ciò permise di avere una base per la comprensione dell’evoluzione e delle basi genetiche delle malattie e aprì le porte per la medicina personalizzata.Grazie allo sviluppo della genomica ora si parla di editing genomico come potenziale futuro sviluppo della medicina, grazie al quale si potranno individuare e correggere gli errori genetici del DNA al fine di curare un’ampia serie di patologie neurodegenerative, cardiovascolari, metaboliche e tumorali.
Medicina e ricerca
A settembre è stato pubblicato un articolo su iScience che riportava i risultati del progetto «Origin», uno studio condotto nella nostra Val Seriana dall’Istituto Mario Negri sulla correlazione tra patrimonio genetico e una maggiore severità nella patologia di Covid-19. Sono stati raccolti i dati di quasi 10mila bergamaschi, e con analisi bioinformatiche complesse sono state confrontate le sequenze genomiche dei partecipanti allo studio, sottolineando le differenze tra i pazienti sani e quelli che hanno contratto le forme più severe della patologia. In questo modo sono state individuate delle varianti su geni particolari ereditate da Neanderthal che contribuivano significativamente al peggioramento delle condizioni di salute. Il valore aggiunto di questo studio è che i risultati sono estensibili anche al di là della nostra provincia.
In eSwatini è stato avviato dal gruppo di ricerca della professoressa Elisabetta Tanzi dell’Università degli Studi di Milano un progetto che, con la conduzione di campagne di screening moderne, riesce a diagnosticare infezioni da diversi ceppi di HPV nelle donne dai 12 ai 49 anni a partire da una semplice raccolta di campioni di urina: è un metodo più economico e ugualmente efficace rispetto ai Pap-test che vengono usati nei Paesi più ricchi per la diagnosi del cancro alla cervice uterina, e utili metodi bioinformatici accelerano le analisi abbattendo le tempistiche.
L’associazione della bioinformatica con la farmacologia porterà alla personalizzazione delle cure mediche per ogni individuo anche in base a ereditarietà, fattori di rischio individuali e storia familiare delle patologie, ottimizzando i dosaggi di terapie invasive, evitando interferenze tra farmaci per malattie croniche e diminuendo possibili effetti collaterali. Grazie alla biologia dei sistemi, potremo studiare gli organismi viventi e la loro capacità di evolvere nel tempo e di interagire con l’ambiente, capendo come quest’ultimo interagisce con geni e metabolismi e come i nostri stili di vita influenzano la suscettibilità alle malattie (e giocare d’anticipo). E ancora, potremo comprendere come sfruttare alcune caratteristiche dei microrganismi per la produzione di biogas, biomateriali e composti bioattivi per integratori, cosmetici e farmaci.
Una delle sfide attuali è ideare delle strumentazioni e delle metodologie di studio che possano gestire la massiva quantità di dati che viene quotidianamente raccolta. Si potrebbero mappare completamente tutti i genomi di tutti gli organismi viventi per scoprire profonde e antiche relazioni evolutive, le correlazioni tra le informazioni nel DNA e l’estinzione di una data specie, ma anche gli effetti del cambiamento climatico sulla conservazione della stessa.
La tecnologia al servizio della società
Quando ho scoperto l’ambito della bioinformatica mi hanno da subito affascinata l’interdisciplinarietà delle conoscenze, il ruolo trasversale che avrei potuto avere un domani, ma anche i potenziali sviluppi futuri. Da vera e propria data scientist del genoma potrò seguire i progetti di ricerca sin dalle prime fasi di design, e sarà fondamentale per me far tesoro di tutte le mie conoscenze biomolecolari e tecnologiche per poter trattare e analizzare al meglio i dati raccolti, interfacciarmi alle sfide proposte e alle personalità coinvolte dialogando a più livelli e in diversi ambiti e tempistiche.
Questi ambiti così ampi e complessi sono la prova dell’impatto che l’avanzamento delle tecnologie può portare alla nostra società. Sfruttandone la potenza, potremmo capire dalla natura stessa le soluzioni per creare un futuro sostenibile, rivoluzionando la nostra comprensione della vita e della salute. È un mondo in continua evoluzione, in cui si intrecciano diversi ambiti STEM per interpretare un libro tanto complesso quanto affascinante.