Christelle Reynes, Leslie Regad, Robert Sabatier und Anne-Claude Camproux
Die Vorhersage bestimmter Strukturmotive, die mit biologischen Funktionen oder Strukturen in Zusammenhang stehen, ist von größter Bedeutung. Angesichts der zunehmenden Verfügbarkeit von Primärsequenzen ohne Strukturinformationen sind Vorhersagen auf Basis von Aminosäuresequenzen (AA) unverzichtbar. Die vorgeschlagene Methode zur Vorhersage von Strukturmotiven ist ein zweistufiger Ansatz, der auf einem Strukturalphabet basiert. Dieses Alphabet ermöglicht die Kodierung beliebiger 3D-Strukturen in eine 1D-Sequenz aus Strukturbuchstaben (SL). Zunächst werden durch genetische Programmierung grundlegende Korrespondenzregeln zwischen AA und SL erlernt. Anschließend wird für jedes zuvor identifizierte Motiv von Interesse ein Hidden-Markov-Modell erlernt. Abschließend wird die Wahrscheinlichkeit ermittelt, mit der eine beliebige Aminosäuresequenz einem bestimmten 3D-Motiv entspricht. Die Methode wird auf ATP-Bindungsstellen angewendet, um die Effizienz unserer Methode mit anderen Methoden für eine klassische Funktion zu vergleichen. Anschließend wird die Fähigkeit der Methode veranschaulicht, Motive zu erlernen, die seltener vorhergesagten Funktionen oder anderen Motivtypen entsprechen.