Analizzare milioni di genomi in pochissimo tempo, evidenziando dettagli finora sfuggenti e soprattutto comprimendoli in pochissimo spazio diventa possibile grazie all’innovativa tecnica di compressione messa a punto sotto la guida di Yatish Turakhia, dell'Università della California a San Diego, e pubblicata sulla rivista Nature Genetics.
Sebbene i progressi nelle tecnologie di sequenziamento del genoma abbiano ridotto i costi e aumentato la velocità, gli strumenti di analisi necessari per studiare e rappresentare graficamente le relazioni tra milioni di genomi sequenziati rimangono una sfida. Mettere a confronto miliardi di dati richiede infatti l’uso di supercomputer, con alti consumi di energia e di tempo, occorrono importanti competenze tecniche e tenere memoria dei genomi è molto complesso. A rivoluzionare il settore potrebbe essere ora il nuovo formato per la strutturazione dei dati chiamto Pangenome Mutation-Annotated Network, o Panman, che non solo fornisce una compressione senza pari per i pangenomi, ossia i cataloghi di milioni di genomi relativi a una singola specie, ma aumenta significativamente le possibilità di fornire dati utili, diventa facile ad esempio identificare famiglie di mutazioni o analizzarne la loro evoluzione nel tempo.
"La nostra tecnica di compressione con Panman permette di fare di più con meno, migliorando notevolmente la scala e la portata dell'attuale analisi pangenomica", ha detto Turakhia. Un formato che è stato messo alla prova con una serie di specie microbiche, ad esempio per costruire il pangenoma del Sars-CoV-2 sulla base di oltre 8 milioni di genomi separati del virus che sono stati compressi in appena 366 MB di spazio di archiviazione, ovvero circa 3.000 volte inferiore a quanto possibile finora. "Estendere la pangenomica compressiva ai genomi umani – ha concluso Turakhia – può trasformare radicalmente il modo in cui archiviamo, analizziamo e condividiamo dati genetici umani su larga scala”.
Riproduzione riservata © Copyright ANSA

2 ore fa
1



