Sequenzanalyse, Annotation und Stoffwechselrekonstruktion der biotechnologisch relevanten Hefen Wickerhamomyces ciferrii und Wickerhamomyces anomalus mit der RAPYD-Plattform (Dr. Jessica Schneider)

Die fortschreitende Entwicklung der Sequenziertechnologien ermöglicht die Genomsequenzierung niederer Eukaryoten, wie die von biotechnologisch relevanten Hefen der Gattung Wickerhamomyces. Zur Analyse von Genomen sequenzierter Hefen wurde die Annotationsplattform RAPYD entwickelt, die zusätzlich Module zur genombasierten Stoffwechselrekonstruktion und komparativen Genomik umfasst.

Die Plattform stellt eine regionale und funktionale Annotationspipeline zur Vorhersage von proteinkodierenden Sequenzen und anderen genomischen Elementen bereit. Basierend auf den annotierten EC-Nummern eines Organismus können Gene in Stoffwechselnetzwerken in einen funktionalen Kontext gesetzt werden. Dies ermöglicht einen zügigen Überblick über das metabolische Repertoire eines Organismus, wie auch über spezifische Eigenschaften einer Hefe. Die Komponente zur Stoffwechselrekonstruktion in RAPYD leitet sich von dem Programm CARMEN ab. CARMEN dient der In-silico-Rekonstruktion von metabolischen Netzwerken verschiedener Mikroorganismen. Die Rekonstruktion von Stoffwechselwegen basiert zum einen auf KGML-Dateien der KEGG-Datenbank und zum anderen auf existierenden SBML-Dateien, die auf nah verwandte Arten übertragen werden können. Die Ergebnisse werden in organismusspezifischen Dateien in standardisiertem SBML-Format gespeichert. Neben der  Stoffwechselrekonstruktion können komparative Analysen zum Aufdecken von Gemeinsamkeiten und Unterschieden verwandter Hefen innerhalb der RAPYD-Plattform genutzt und taxonomische Beziehungen visualisiert werden. Ein erstes Anwendungsbeispiel für RAPYD stellt Komagataella pastoris CBS 7435 dar. RAPYD und CARMEN stehen über benutzerfreundliche Webseiten zur Verfügung.
RAPYD wurde zur Annotation und Analyse der Draft-Genomsequenzen von Wickerhamomyces ciferrii (Pichia ciferrii) und Wickerhamomyces anomalus (Pichia anomala) verwendet, die jeweils über Pyrosequenzierung entschlüsselt und mit Hilfe des GS de novo Assemblers assembliert wurden. Die Genomsequenz des sphingolipidproduzierenden Stamms W. ciferrii NRRL Y-1031 wurde hinsichtlich seiner metabolischen Fähigkeiten zur Synthese von Sphingolipiden untersucht. Die Annotation der 15,901 Mbp langen Genomsequenz ergab die Vorhersage von 6.702 proteinkodierenden Genen, von denen 4.254 eine potentielle Funktion zugeordnet werden konnte. Eine genombasierte Rekonstruktion des Zentralmetabolismus, der Fettsäurebiosynthese und des Sphingolipidmetabolismus ergab vollständig abgedeckte metabolische Routen. Die Draft-Genomsequenz der Hefe W. anomalus DSM 6766, die insbesondere für ihre antimikrobiellen Eigenschaften bekannt ist, umfasst eine Länge von 25,466 Mbp. Mittels RAPYD konnten 11.512 proteinkodierende Gene vorhergesagt werden, 7.444 von ihnen mit funktionalen Beschreibungen. Basierend auf der automatischen Annotation und orthologen Proteinen zu W. ciferrii NRRL Y-1031 wurde der Zentralstoffwechsel vollständig rekonstruiert. Über HMM-basierte Suchen wurden neue Kandidatenproteine identifiziert, die mit den antimikrobiellen Eigenschaften von W. anomalus DSM 6766 in Verbindung stehen. Abschließend wurden komparative Analysen von Hefen der Ordnung Saccharomycetales durchgeführt. Sie unterstützen durch ein großes gemeinsames Kerngenom und einen isolierten Ast der Wickerhamomyces-Hefen im phylogenetischen
Baum die nahe Verwandtschaft von W. ciferrii NRRL Y-1031 und W. anomalus DSM 6766.