next up previous contents
Next: Networking und Multimedia Up: Bioinformatik Previous: Ausblick

Analyse von Proteinsequenzen für die Strukturvorhersage von Proteinen

Proteine stehen im Mittelpunkt jedes biologischen Prozesses. Sie katalysieren als Enzyme einen komplexen Ablauf biochemischer Reaktionen, die in ihrer Gesamtheit ,, das Leben`` ausmachen. Um die molekularen Mechanismen der enzymkatalysierten Reaktionen zu verstehen und z.B. in der Medikamentenentwicklung (drug design) in sie eingreifen zu können, ist es notwendig die 3D-Struktur der beteiligten Proteine zu kennen.

Die experimentelle Bestimmung der Struktur ist allerdings wesentlich zeitaufwendiger und teurer als die Bestimmung von Proteinsequenzen: Dies wird sichtbar durch die exponentiell wachsende Menge an bekannten Sequenzen im Vergleich zu der wesentlich langsamer wachsenden Anzahl an aufgeklärten Strukturen. Daher ist die Vorhersage der räumlichen Struktur ausgehend von einer Sequenz eines der zentralen Probleme der Bioinformatik.

Die Strukturvorhersage funktioniert derzeit nur zufriedenstellend, wenn man die Struktur eines homologen Proteins, d.h. eines Proteins mit gleicher Abstammung, kennt. Dann kann man davon ausgehen, daß eine ähnliche 3D-Struktur vorliegt und die bekannte Struktur kann als Vorlage (Template) benutzt werden, um mittels Homology Modelling ein Modell für die 3D-Struktur des anderen Proteins zu erstellen.

Im Rahmen einer gemeinsam von der Arbeitsgruppe Schomburg, Institut für Biochemie, und der Arbeitsgruppe Bachem/Schrader, ZAIK, betreuten Diplomarbeit wird daher versucht, das Auffinden entfernt homologer Proteine zu verbessern. Das Prinzip des Ansatzes beruht auf der akzeptierten Annahme, daß zwei Sequenzen mit ausreichend hoher Sequenzähnlichkeit eine ähnliche Struktur besitzen. Für die Qualität der Sequenz-Struktur-Zuordnung ist die Sequenzidentität ein entscheidendes Maß. Aber auch bei geringer Sequenzähnlichkeit können zwei Proteine homolog sein. Eine Eigenschaft der Homologie ist, daß sie transitiv ist: wenn A und B sowie B und C sich aus dem gleichen Vorfahren ableiten, muß A auch einen Vorfahren mit C gemeinsam haben. Die Transitivität der Homologie wird in diesem Projekt genutzt, um auch entfernt homologe Proteine mit niedriger Sequenzidentität zu finden.

Hierzu werden auf einem großen Datensatz an Proteinsequenzen qualitativ hochwertige Alignments berechnet. Die Ergebnisse werden als Eingabe für ein Graphen-basiertes Cluster-Verfahren benutzt. Ziel der Arbeit ist es zu zeigen, ob sich mittels der resultierenden Cluster tatsächlich mehr entfernt homologe Sequenzen auffinden lassen als bisher. Dies wird durch den Vergleich mit bestehenden Strukturdatensätzen untersucht.


next up previous contents
Next: Networking und Multimedia Up: Bioinformatik Previous: Ausblick
Webmaster<www@zpr.uni-koeln.de>
1999-07-28