L’analisi pangenomica, associata a quella genomica, sembrerebbe essere un valido supporto nella scoperta di nuovi metaboliti associati a cluster di geni implicati in determinati quadri patologici.
Lo conclude lo studio di Omkar S. Mohite e colleghi della Technical University of Denmark (Danimarca), da poco pubblicato su Synthetic and Systems Biotechnology.
Metaboliti secondari con proprietà terapeutiche
I metaboliti secondari sono prodotti da molti microrganismi e dimostrano importanti proprietà farmacologiche, industriali e di mediazione tra i batteri stessi e l’ospite.
La loro sintesi è da ricondurre ad ampi clusters di geni biosintetici (BGCs). Capire le interazioni tra la loro sintesi e le altre funzioni codificate dal genoma al di fuori del cluster rimane però ancora difficile.
Recentemente, numerosi genomi della stessa specie sono diventati noti permettendo analisi più generali (pangenomiche) con, di conseguenza, la scoperta di diversità intra-specie, produzione metabolica inclusa.
Un cluster BGC è quindi confrontato con altri mirando a completare le informazioni tra il metabolismo secondario e altre funzionalità.
Tra tutti, Escherichia coli o altri enterobatteri, hanno ad oggi la maggiore disponibilità in termini di sequenze genomiche, database e supporti bioinformatici.
Gli Enterobacteria sono infatti noti per produrre metaboliti secondari che includono la genotossina cancro-correlata colibactina, chelatori di metalli, altiomicina (antibiotico) ecc. rappresentando quindi i candidati ideali per questo tipo di analisi.
Unire genomica e pangenomica
I ricercatori hanno quindi combinato analisi genomiche e pangenomiche per valutare il potenziale di enterobatteri nel produrre metaboliti secondari e le loro associazioni. Di seguito quanto emerso.
Da 3.889 genomi selezionati dal database PATRIC , di cui 60 con BCG di interesse per l’analisi pangenomica:
- 57 sono i principali generi, la maggior parte appartenenti a Escherichia, Salmonella, e Klebsiella
- 13.266 BGCs sono stati identificati tra i vari genomi definendo il dataset finale
- Per analisi genere-specifiche sono stati considerati i generi principali (n=15) in base al numero di cluster per genere o “altri” (n=72)
- 50 genomi sono stati poi selezionati tra diversi generi con diversi tipi di BCG per la costruzione di un albero filogenetico
- Photorhabdus, Xenorhabdus e Serratia sono tra i generi con una maggiore ricchezza di BGCs e in grado di produrre metaboliti secondari
Un’analisi basata sulla similitudine di sequenza tra diversi clusters ha portato alla scoperta di 584 famiglie di BGCs in Enterobacteria non precedentemente caratterizzate. Inoltre:
- Il contenuto di BGCs negli Enterobacteria, in media, sembrerebbe essere non così elevato e diversificato come i più noti produttori di metaboliti secondari quali bacilli, Actinobacteria o Myxobacteria
- l’approccio pangenomico ha permesso di rivelare un set di geni potenzialmente associati alla presenza del cluster PKS-NRPS codificante per la genotissina colibactina
- geni associati con la presenza di colibactina BCG sono comuni in tutto il genoma e codificanti per svariate funzioni biologiche (metabolismo aminoacidi, sistemi di adesione o secrezione) non direttamente correlati con la biosintesi della genotossina ma, potenzialmente, al suo rilascio nelle cellule dell’ospite
Conclusioni
Per riassumere quindi, in questo studio è stato dimostrato il valore aggiunto di un’analisi pangenomica ad esempio nel caso della genotossina colibactina per la quale è importante conoscerne le vie di attività e i meccanismi d’azione.
In generale, l’approccio descritto dagli autori rappresenta uno strumento per produrre alternative e nuove ipotesi per l’associazione di BGC ponendo le basi per ulteriori e più dettagliati studi.