Big data e microbioma: due nuove banche dati per migliorare la ricerca

Big data e microbioma: due nuove banche dati per migliorare la ricerca

• Creazione della collezione di batteri gastrointestinali
• Potenzialità di HGG
• Analisi di diversità batterica
• Analisi di funzionalità batterica

Stato dell’arte
Per capire le funzioni del microbioma intestinale è necessario disporre di sequenze genomiche di riferimento. Fino a oggi, il database creato dallo “Human Microbiome Project” (HMP) è stato un punto di riferimento in questo senso.

Cosa aggiunge questa ricerca
Applicando tecniche di indagine avanzate, è stato sviluppato un database più completo di ceppi batterici intestinali, la “Human Gastrointestinal Bacteria Culture Collection” (HBC), abbinato a una banca dati per la loro caratterizzazione funzionale, la “Human Gastrointestinal Bacteria Genome Collection” (HGG).

Conclusioni
L’HBC ha permesso di identificare il 37% in più di genomi batterici rispetto all’HMP (105 nuove specie). l’HGG ha aumentato del 61% il potere di classificazione a livello tassonomico.

Per le ricerche e l’interpretazione dei dati relativi al microbioma intestinale umano, il database di riferimento fino a oggi è stato quello messo a punto dallo “Human Microbiome Project” (HMP) che, pur essendo esteso, si basa su tecniche di indagine ormai superate. Per questo Samuel C. Forster e i colleghi del Wellcome Sanger Institute, nel Regno Unito, lo hanno integrato sfruttando la metagenomica e creando sia una collezione di genomi batterici utile per la loro identificazione qualitativa, la “Human Gastrointestinal Bacteria Culture Collection” (HBC), sia una banca dati per la loro caratterizzazione funzionale, la “Human Gastrointestinal Bacteria Genome Collection” (HGG).

Il lavoro, pubblicato su Nature Biotechnology, riporta notevoli progressi sia in termini di identificazione di ceppi batterici (37% in più, 105 dei quali nuove specie) sia nella loro classificazione tassonomica (+61%). Di seguito sono descritti i passaggi principali che hanno portato i ricercatori a ottenere questi risultati.

Creazione della collezione di batteri gastrointestinali

Al fine di ottenere un panorama batterico intestinale rappresentativo, sono stati messi in cultura e purificati oltre 10mila isolati batterici estratti da campioni fecali di 20 volontari adulti (8 inglesi, 12 nord americani).  

Con i 234 isolati batterici già classificati tassonomicamente nel precedente HMP, sono stati raggiunti i 737 nel nuovo HBC. Questa collezione rappresenta quindi 273 specie, 105 delle quali di nuova identificazione, derivanti da 31 famiglie dei phyla Actinobacteria (53 genomi, 16 specie), Bacteroidetes (143 genomi, 40 specie), Firmicutes (496 genomi, 203 specie) e Proteobacteria (45 genomi, 14 specie).

I genomi inclusi in HBC sono stati poi appaiati ai 617 già disponibili per creare la “Human Gastrointestinal Bacteria Genome Collection” (HGG), per un totale di 1354 genomi batterici. Analizzando nel dettaglio questo nuovo database è emerso che:

  • il 53% delle specie incluse sono da attribuire al HBC, le restanti (tipicamente assenti in soggetti sani del mondo occidentale) a Fusobacteria, Proteobacteria e Synergistetes
  • i 1354 genomi rappresentano 530 specie di 57 famiglie all’interno dei phyla Actinobacteria (129 genomi, 55 specie), Bacteroidetes (231 genomi; 69 specie), Firmicutes (772 genomi; 339 specie), Fusobacteria (26 genomi; 9 specie), Proteobacteria (194 genomi; 56 specie) and Synergistetes (2 genomi; 2 specie)
  • il phylum Firmicutes, classi Clostridia, Erysipelotrichia e Negativicutes in particolare, ha dimostrato la maggiore diversità filogenetica

Potenzialità di HGG

È stata valutata l’efficienza nel nuovo HGG che, rispetto all’HMP, ha dimostrato una maggiore completezza in termini di identificazione genomica a livello del singolo ceppo, espressa dal 52.3% in più di isolati batterici e dal 61.1% di incremento del potere classificante complessivo.

Ulteriori test computazionali hanno poi dimostrato come i nuovi database (HBC e HGG) richiedano un tempo di processamento dati notevolmente inferiore rispetto ai sistemi precedenti (7.3 minuti vs 12.19 ore medie).

Ma non basta. Per la sua messa a punto, i ricercatori hanno considerato anche i possibili fattori confondenti associati al trasferimento genico orizzontale raggruppando tutti gli elementi mobili, sequenze di inserzione e plasmidi in un’apposita lista. Ciò permetterà quindi di raggiungere anche un elevato livello di risoluzione e qualità dei risultati sperimentali basati su questo database.  

Analisi di diversità batterica

Volendo testare l’HGG “nella pratica”, l’attenzione si è spostata sull’identificazione delle specie batteriche più abbondanti a livello gastrointestinale. Per farlo sono state analizzate tutte le 13.490 sequenze riscontrate nei campioni fecali dei volontari.

Considerando solo le specie presenti per almeno lo 0.01% in ogni campione, ne sono state selezionate 165, espresse in più di due campioni prelevati da individui diversi. Di queste, Bacteroidetes (n=41), Firmicutes (n=82), Proteobacteria (n=27) e Actinobacteria (n=15) sono le più abbondanti. Nel dettaglio:

  • otto delle principali 20 specie sono membri del genere Bacteroidetes (Bacteroides vulgatus, Bacteroides uniformis, Bacteroides cellulosilyticus, Bacteroides ovatus, Bacteroides xylanisolvens, Bacteroides thetaiotaomicron, Bacteroides caccae e Bacteroides dorei)
  • dei Firmicutes, solo 6 specie sono risultate abbondanti nella maggior parte dei campioni (Fecalibacterium prausnitzii, Blautia obeum, Fusicatenibacter saccharivorans, Anaerostipes hadrus, Roseburia faecis e Dorea longicatena)
  • Escherichia coli è il solo membro dei Proteobacteria a essere presente in tutti i campioni, nessuna rappresentanza “universale” invece per Fusobacteria o Synergistetes
  • sono stati identificati 173 nuovi genomi da specie batteriche mai isolate nel tratto gastrointestinale umano

Analisi di funzionalità batterica

Oltre a identificare e codificare i genomi batterici, HGG permette di valutarne la funzionalità biologica. Per esempio:

  • tra i phyla più abbondanti, Actinobacteria ha mostrato l’arricchimento del minor numero di funzioni metaboliche (n=8) primariamente associate alla trasformazione di lipidi e carboidrati. Di contro, 389 sono le funzioni aumentate tra i Proteobacteria (glucochinasi, trasporto del ferro, metabolismo fruttosio), 152 tra i Firmicutes (formazione di spore, trasporto di tiamina e riboflavina ecc.) e 122 tra i Bacteroidetes (trasporto di sodio, zolfo, ferro ecc.)
  • considerando i 173 nuovi genomi, sono emerse 45 nuove funzionalità batteriche (41 delle quali attribuite a Firmicutes), controllate soprattutto da proteine non ancora caratterizzate

In conclusione, i database HMB e HGG, aumentando la mappatura genomica e funzionale, offrono un panorama molto più completo e accurato del microbioma intestinale umano, risultando perciò utili strumenti per studi sempre più approfonditi e conclusivi.