Übungen Molekulare Bioinformatik (3)

3.1) SRS (Sequence Retrieval System)

Erstellen Sie mithilfe des Sequence-Retrieval-Systems (SRS: http://www.expasy.ch/srs5/ )  einen Datensatz, der
3.1 a) alle als Insulin gekennnzeichneten Eintrage der SwissProt-Datenbank enthält.
3.1 b) dieselben Einträge, jedoch ohne ohne Prepeptid und Propeptid, speichern Sie diesen Datensatz im FASTA-Format auf der Festplatte.
3.1 c) nur für Säugetiere , wiederum ohne Precursor-Proteine (Organism: mammalian), speichern Sie diesen Datensatz im FASTA-Format auf der Festplatte.
3.1 d) Durchsuchen Sie die beiden Dateien nach auffälligen Sequenzen. Lösung in lsg_3.1

3.2) Clustal zum kennenlernen

3.2 a) Berechnen Sie mithilfe des Clustal-Servers in Japan (http://www.clustalw.genome.ad.jp/ ) ein multiples Alignment und einen Stammbaum für die Sequenzen.   Verwenden Sie beim Alignment die default-Parameter.
 

>s1
armerhase
>s2
hasenbraten
>s3
arsenbraten
>s4
arsenhase
>s5
rasennase
 

3.2 a) Wie  heisst das hier verwendete Datenformat

3.2 b) Welche sind die beiden im Sinne des Scoring-Wertes am engsten verwandten Sequenzen?

3.2 c) Wie kann man einen Eintrag aus den Daten auskommentieren (-> help ).

3.2 d) Ist das Alignment lokal oder global?

3.2 e) Nehmen Sie die Sequenz

>s6
armerdummerhase

hinzu, warum wird das Alignment
s1              ------AR-MER-HASE-
s6              ARMERDUM-MER-HASE-
einem Alignment
s1              ARMER--------HASE-
s6              ARMERDUM-MER-HASE-
(das auch nicht so schlecht aussieht) vorgezogen?
 

3.2. f)  wie sind die beiden Ausgaben
(
(s1:0.19444,s4:0.02778):0.11111,
(
s2:0.09091,s3:0.09091):0.24242,
s5:0.22222);

und
(
(
(
s1:0.06987,
s6:0.15236)
:0.14205,
s4:0.08018)
:0.05871,
(
s2:0.09091,
s3:0.09091)
:0.24558,
s5:0.21907);

zu interpretieren und wie heisst dieses Datenformat?

Lösung in lsg_3.2

3.3) Konstruktion eines multiplen Alignments von Protein-Daten

a) Konstruieren sie mit dem in Übung 3.1 (c) gefundenen Datensatz ein multiples Alignment. Verwenden Sie dabei die Standard (default) Optionen.
b) Interpretieren sie den zugehörigen Stammbaum. Plotten Sie den Stammbaum mit dem unter  tree2image zu findenden Tool.
c) Mit welchem Verfahren  wurde dieser Baum konstruiert?
d) Fügen Sie  Alligator-Insulin als Outgroup in das Alignment ein.
 
  Lösung in lsg_3.3