Dopo AlphaFold, il modello di Intelligenza Artificiale in grado di decifrare la struttura 3D delle proteine che è valso il Premio Nobel per la Chimica 2024 a John Jumper, David Baker e Damis Hassabis, l'azienda Google DeepMind presenta un nuovo modello di IA chiamato AlphaGenome. E' progettato per leggere la cosiddetta 'materia oscura' del Dna, ossia l'insieme delle sequenze genetiche che non codificano per proteine ma che ne influenzano l'attività. Bollate a torto e per molto tempo come 'Dna spazzatura, queste sequenze misteriose costituiscono la stragrande maggioranza del Dna umano, ben il 98%.
Il modello AlphaGenome è descritto in un articolo non ancora passato al vaglio della comunità scientifica.
"La parte codificante del nostro genoma, formata da circa 20mila geni, è ormai ben nota", dice all'ANSA Giuseppe Novelli, genetista dell'Università di Roma Tor Vergata. "Il resto, invece, è estremamente eterogeneo: una parte è costituita da Dna ripetitivo, un'altra è formata da elementi mobili che possono modificare la loro posizione. Si tratta comunque sempre di geni, stimati in 60-63mila, che però codificano per Rna (la molecola a singola elica parente del Dna). Vista la loro quantità enorme - sottolinea Novelli - è molto importante avere uno strumento come questo, che può indicare almeno a quale famiglia appartengano".
AlphaGenome può leggere lunghe sequenze di Dna, fino a 1 milione di lettere, e fare migliaia di previsioni su loro ruolo e sui possibili effetti di eventuali mutazioni. In un esempio, i ricercatori guidati da Žiga Avsec hanno testato il modello con alcune mutazioni identificate in persone affette da leucemia e AlphaGenome è riuscito a prevedere con precisione che le mutazioni avrebbero attivato indirettamente un gene vicino considerato una delle cause più comuni di questo tipo di tumore.
La nuova IA, tuttavia, è ancora limitata perchè è stata addestrata solo su dati provenienti da esseri umani e topi e fa fatica nel caso le mutazioni alterino geni situati molto lontano.
"Visto il grande sviluppo che stanno avendo e che vedranno anche in futuro i farmaci basati sull'Rna - aggiunge Novelli - avere uno strumento che permetta di prevedere che ruolo svolgono queste molecole potrebbe servire anche per individuare più velocemente possibili bersagli per futuri farmaci".
Riproduzione riservata © Copyright ANSA