Übungen Molekulare Bioinformatik (3)
3.1) SRS (Sequence Retrieval System)
Erstellen Sie mithilfe des Sequence-Retrieval-Systems (SRS: http://www.expasy.ch/srs5/
) einen Datensatz, der
3.1 a) alle als Insulin gekennnzeichneten Eintrage der SwissProt-Datenbank
enthält.
3.1 b) dieselben Einträge, jedoch ohne ohne Prepeptid und Propeptid,
speichern Sie diesen Datensatz im FASTA-Format auf der Festplatte.
3.1 c) nur für Säugetiere , wiederum ohne Precursor-Proteine
(Organism: mammalian), speichern Sie diesen Datensatz im FASTA-Format
auf der Festplatte.
3.1 d) Durchsuchen Sie die beiden Dateien nach auffälligen Sequenzen.
-
Achtung: das SRS-tool hat verschiedene Fehler, z.B. merkt es sich oft die
Datenbank nicht wenn man sie nur anklickt (entweder ein zweites mal
markieren oder via "Top Page" die Datenbank einstellen)
-
Verwenden Sie bevorzugt die "alternative query form", separate multiple
values by & (and), |(or),!(not)
Lösung in lsg_3.1
3.2) Clustal zum kennenlernen
3.2 a) Berechnen Sie mithilfe des Clustal-Servers in Japan (http://www.clustalw.genome.ad.jp/
) ein multiples Alignment und einen Stammbaum für die Sequenzen.
Verwenden Sie beim Alignment die default-Parameter.
>s1
armerhase
>s2
hasenbraten
>s3
arsenbraten
>s4
arsenhase
>s5
rasennase
3.2 a) Wie heisst das hier verwendete Datenformat
3.2 b) Welche sind die beiden im Sinne des Scoring-Wertes am engsten
verwandten Sequenzen?
3.2 c) Wie kann man einen Eintrag aus den Daten auskommentieren (->
help
).
3.2 d) Ist das Alignment lokal oder global?
3.2 e) Nehmen Sie die Sequenz
>s6
armerdummerhase
hinzu, warum wird das Alignment
s1
------AR-MER-HASE-
s6
ARMERDUM-MER-HASE-
einem Alignment
s1
ARMER--------HASE-
s6
ARMERDUM-MER-HASE-
(das auch nicht so schlecht aussieht) vorgezogen?
3.2. f) wie sind die beiden Ausgaben
(
(s1:0.19444,s4:0.02778):0.11111,
(
s2:0.09091,s3:0.09091):0.24242,
s5:0.22222);
und
(
(
(
s1:0.06987,
s6:0.15236)
:0.14205,
s4:0.08018)
:0.05871,
(
s2:0.09091,
s3:0.09091)
:0.24558,
s5:0.21907);
zu interpretieren und wie heisst dieses Datenformat?
Lösung in lsg_3.2
3.3) Konstruktion eines multiplen Alignments von Protein-Daten
a) Konstruieren sie mit dem in Übung 3.1 (c) gefundenen Datensatz
ein multiples Alignment. Verwenden Sie dabei die Standard (default) Optionen.
b) Interpretieren sie den zugehörigen Stammbaum. Plotten Sie den
Stammbaum mit dem unter tree2image
zu findenden Tool.
c) Mit welchem Verfahren wurde dieser Baum konstruiert?
d) Fügen Sie Alligator-Insulin als Outgroup in das Alignment
ein.
Lösung in lsg_3.3