Projektnews World Community Grid: Research update from the Microbiome Immunity Project team (May 2023)

Aktuelle Forschungsergebnisse des Microbiome Immunity Project Teams (Mai 2023)

Das Team des Microbiome Immunity Project hat einen neuen Artikel über die Struktur und Funktion von Proteinen des menschlichen Mikrobioms veröffentlicht.

Projekt: Mikrobiom-Immunitätsprojekt

Veröffentlicht am: 5. Mai 2023

Hintergrund

Während Bakterien im Allgemeinen für den Menschen schädlich sein können, da sie Krankheiten wie Lungenentzündung, Meningitis, Streptokokken und Lebensmittelvergiftungen (Escherichia coli und Salmonellen) verursachen können, haben Bakterien im menschlichen Darm auch Schutzfunktionen. Seit vielen Jahren erforschen Wissenschaftler die verschiedenen Arten von Bakterien im menschlichen Körper und charakterisieren diejenigen, die schädlich oder nützlich sein könnten, aber die große Mehrheit ist nach wie vor schlecht charakterisiert. Bei schätzungsweise 3 Millionen bekannten einzigartigen Bakteriengenen ist es eine komplexe Aufgabe, alle daraus resultierenden Proteine zu untersuchen und ihre Funktion zu bestimmen.

Das Microbiome Immunity Project startete im August 2017 mit dem Ziel, die Erforschung von Proteinmolekülen dank der Leistungsfähigkeit von Grid-Computing zu beschleunigen. Bis zum Abschluss der Berechnungen im Dezember 2021 haben Freiwillige des World Community Grid fast 146.000 CPU-Jahre für das MIP bereitgestellt. Dadurch konnte das Team die Struktur von fast 200 000 Proteinen vorhersagen, über 150 neue Proteinformen (Falten) entdecken, mehrere bisher unbekannte Funktionen von Proteinstrukturen beschreiben und die Zahl der annotierten Proteine im menschlichen Darmmikrobiom nahezu verdoppeln.

Protein-Universum-Papier

Das MIP-Team hat vor kurzem einen Artikel in Nature Communications mit dem Titel Sequence-structure-function relationships in the microbial protein universe[1] veröffentlicht. In diesem Artikel wird der Gedanke untersucht, dass Proteine mit ähnlichen Sequenzen nicht notwendigerweise ähnliche Strukturen bilden, die dieselben Funktionen erfüllen, was einer lang gehegten Annahme der Wissenschaftler widerspricht. Anhand der MIP-Datenbank, an deren Erstellung Freiwillige der WCG mitgewirkt haben, werden in dem Artikel Beispiele untersucht, in denen Proteine mit ähnlicher Sequenz unterschiedliche Funktionen erfüllen.

Das MIP-Team analysierte 2 Millionen Proteinsequenzen, deren Struktur in keiner anderen Datenbank bekannt war. Anschließend verwendeten sie Rosetta- und DMPFold-Methoden, um die Proteinstrukturen in einem dreistufigen Prozess vorherzusagen. Um Vorhersagen von geringer Qualität herauszufiltern, legten sie zunächst einen Schwellenwert für die Anzahl der Coil-Reste (die Helices bilden) fest, ab dem die Strukturen nicht mehr zuverlässig waren. Zweitens wurde die Qualität der Vorhersagen anhand von Vertrauens- und Qualitätsbewertungswerten bestimmt[2]. Drittens wurde den Modellen der Vorzug gegeben, die mit den beiden Methoden übereinstimmten. Am Ende wurden etwa 200 000 Modelle identifiziert und charakterisiert.

wcg_hybrid_figure1.png


Abbildung 1. Flussdiagramm des Prozesses zur Ermittlung von ~200.000 de novo-Proteinmodellen, die einen vielfältigen Sequenzraum abdecken[1]. Wiederverwendet aus Koehler et al., Nature Communications, 2023, mit Genehmigung, unter der Creative Common Lizenz CCBY3.0.
Diese neue Datenbank bietet einen einzigartigen Einblick in das Mikrobiom des Darms, da sie sich in Bezug auf Umfang und Reichweite von früheren Bemühungen unterscheidet. Die Forscher verglichen die 200.000 Modelle mit der PDB90-Datenbank der Protein Data Bank und anderen Proteinstrukturdatenbanken, um festzustellen, dass die vorhergesagten Strukturen neu sind. Ein Faktor, der sich auf den Unterschied zwischen den beiden Datenbanken auswirkt, ist das Vorhandensein von Proteinen aus Archaeen und Bakterien in der MIP-Datenbank, einer Spezies, die in anderen Datenbanken kaum vertreten ist. Darüber hinaus ist die analysierte Sequenzgröße kleiner als in anderen Datenbanken (die vorhergesagten Proteinstrukturen hatten eine Größe von 40-200 Resten) und weniger voreingenommen gegenüber den Proteinen von Interesse, wie es bei PDB90 der Fall ist (die Proteine enthält, die für die Strukturbestimmung anfälliger sind und mögliche pharmazeutische Ziele darstellen, was zu mehreren engen Varianten derselben Strukturen führt). Dies macht MIP komplementär zu anderen Datenbanken.

Um zu prüfen, ob sich dies auf die Sequenz-Struktur-Funktions-Beziehung auswirkt, analysierten sie die strukturellen und funktionellen Ähnlichkeiten von 5.000 Strukturen aus dem MIP und 1.000 Basisstrukturen aus den PDB-Datenbanken. Bei der Korrelation von struktureller und funktioneller Ähnlichkeit zeigte die Mehrzahl der Paare das erwartete Verhalten (d. h. unterschiedliche Struktur, unterschiedliche Funktion oder gleiche Struktur, gleiche Funktion), aber eine beachtliche Anzahl von Paaren verhielt sich entgegen den Erwartungen. Bei der Analyse der nicht übereinstimmenden Paare stellten die Autoren fest, dass allgemeinere Funktionen von mehreren Arten von Strukturen ausgeführt werden können, während sehr spezifische Mechanismen nur von einzigartigen Strukturen ausgeführt werden.

wcg_hybrid_figure2.png

Abbildung 2. Heatmaps, die die funktionelle Ähnlichkeit zwischen Paaren von Proteinclustern zeigen. Die Cluster 158 und 153 (oben links und rechts) umfassen Proteine mit ähnlichen Strukturen (unten links und rechts) und divergierenden Funktionen[1]. Wiederverwendet aus Koehler et al., Nature Communications, 2023 mit Genehmigung, unter der Creative Common Lizenz CCBY3.0.

Diese Studie ebnet den Weg für die Entwicklung von Instrumenten zur Erforschung und Vorhersage ortsspezifischer Proteinfunktionen auch für andere Organismen, um die Rolle spezifischer Strukturen und Funktionen im Zusammenhang mit biologischen Funktionen besser zu verstehen.

"Bisher haben wir über das Mikrobiom in der gleichen Sprache gesprochen, mit der man die Artenvielfalt eines Regenwaldes beschreiben würde", sagt Dr. Tomasz Kosciolek, Mitglied des MIP-Forschungsteams. "Wir hoffen, dass wir anfangen können, über das Mikrobiom mit mechanistischeren Begriffen zu sprechen, etwa darüber, welche Moleküle bestimmte biologische Prozesse verstärken, hemmen oder verändern können.

Vielen Dank an das Team des Microbiome Immunity Project für die Bereitstellung dieses Updates. Wenn Sie Kommentare oder Fragen haben, hinterlassen Sie diese bitte in diesem Thread, damit wir sie beantworten können. Vielen Dank für Ihre kontinuierliche Unterstützung, die die wissenschaftliche Forschung im großen Maßstab zum Wohle der Menschheit beschleunigt.

WCG-Team

Referenzen:

  1. Koehler Leman, J., Szczerbiak, P., Renfrew, P.D. et al. Sequence-structure-function relationships in the microbial protein universe. Nature Communications 14, 2351 (2023). https://doi.org/10.1038/s41467-023-37896-w.
  2. Zhang Y, Skolnick J. Scoring function for automated assessment of protein structure template quality. Proteins. 2004 Dec 1;57(4):702-10. doi: 10.1002/prot.20264. Erratum in: Proteins. 2007 Sep 1;68(4):1020. PMID: 15476259.

Übersetzt mit www.DeepL.com/Translator (kostenlose Version)
 
Zurück
Oben Unten