Lösung 3.1

Zu a)

  • schauen Sie sich als nächstes die Liste an, die man mit (Description=>insulin) findet. Das sind 90 Einträge, wenn man die "append wildcard" - Option ausschaltet.
  • Verwenden Sie zur weiteren Einschränkung der Liste  (ID => ins*). Es bleiben 64 Einträge. Was soll der Stern?
  • Weiteren Einschränkung der Liste  mit (Description=>insulin !receptor).Es bleiben 60 Einträge, die alle Insuline sind.

  • Zu b)
  • Schliessen Sie die unvollständig prozessierten Proteine mit (Description=>insulin!receptor !precursor) aus. Es bleibt eine  ( Liste:Insulin )von 34 Einträgen übrig.
  • Verwenden Sie die Optionen: (Sequence Format => fasta) und (Use view => FastaSeqs).

  • Zu c) Verwenden Sie (Organism => mammal*). Es bleiben 12 der Sequenzen übrig ( Liste: Insulin, Mammal ).
    Zu d) Zwei der Sequenzen sind etwas länger als die anderen (INS_HYDCO, INS_PETMA).

    Zurück zur Übung 3.1
    Weiter zur Übung 3.2

    Lösung 3.2

    Zu 3.2. a)
    Aus dem help:
    FASTA and NBRF/PIR formats are recognised by having a ">" as the first
    character in the file. (Anm: auch Pearson-Format)
    Resultat des Alignments:
    s1              ARMER-HASE-
    s4              ARSEN-HASE-
    s5              RASEN-NASE-
    s2              HASENBRATEN
    s3              ARSENBRATEN

    Zu 3.2 b) Die Paarweisen Scoring-Werte werden in der Ausgabedatei angegeben, den höchsten Wert hat dabei das Paar: Sequences (2:3) Aligned. Score:  81.

    Zu 3.2. c)  im Hilfe Menu: search(Alt f) "comment" => Kommentarzeichen ist  #.

    Zu 3.2. d) Siehe dazu im  Auszug aus der help-Datei

    Zu 3.2. e) Resultat des erweiterten Alignments:

    s1              ------AR-MER-HASE-
    s6              ARMERDUM-MER-HASE-
    s4              ------AR-SEN-HASE-
    s5              -------RASEN-NASE-
    s2              ------HA-SENBRATEN
    s3              -------ARSENBRATEN

                              *. .*:*
    Da terminale Lücken nicht bestraft werden ist die Version mit der zentralen Lücke teurer, obwohl sie weniger Treffer hat.

    Zu 3.2.f) Phylip format output.
    This format is the New Hampshire format, used by many phylogenetic analysis
    packages.  It consists of a series of nested parentheses, describing the
    branching order, with the sequence names and branch lengths.  It can
    be used by the RETREE, DRAWGRAM and DRAWTREE programs of the PHYLIP
    package to see the trees graphically.  This is the same foormat used during
    multiple alignment for the guide trees.
    Some other packages that can read and display New Hampshire format are
    TreeTool, TreeView, Phylowin and NJPlot.

    Was muss man tun, um einen Ausgabebaum zu kriegen, den man mit Phylip weiterverarbeiten kann?

    -OUTPUTTREE=nj OR phylip OR dist

    Hinweis:
    Das Neighbour-Joining Verfahren von Saitou und Nei liefert einen wurzellosen Baum (unrooted tree).
    Die Klammern geben an, welche Knoten zusammengefasst werden.  Die Zahlen geben die Laenge des Astes an.

    Zurück zur Übung 3.2
    Weiter zur Übung 3.3

    Lösung 3.3

    Zu a)

  • Kopieren Sie den in 3.1 c. erstellten Datensatz in das Sequenzfenster des Clustalservers.
  • Das resultierende Alignment ist

  • INS_CAMDR       FANQHLCGSHLVEALYLVCGERGFFYTPKAGIVEQCCASVCSLYQLENYCN-
    INS_FELCA       FVNQHLCGSHLVEALYLVCGERGFFYTPKAGIVEQCCASVCSLYQLEHYCN-
    INS_BALBO       FVNQHLCGSHLVEALYLVCGERGFFYTPKAGIVEQCCASTCSLYQLENYCN-
    INS_CAPHI       FVNQHLCGSHLVEALYLVCGERGFFYTPKAGIVEQCCAGVCSLYQLENYCN-
    INS_ELEMA       FVNQHLCGSHLVEALYLVCGERGFFYTPKTGIVEQCCTGVCSLYQLENYCN-
    INS_DIDMA       LVNQHLCGSHLVEALYLVCGERGFFYTPKAGIVEQCCNSICSLYQLETYCN-
    INS_BALPH       FVNQHLCGSHLVEALYLVCGERGFFYTPKAGIVEQCCTSICSLYQLENYCN-
    INS_ACOCA       FVBQHLCGSHLVEALYLVCGERGFFYTPKSGIVDQCCTSICSLYQLENYCN-
    INS_HYSCR       FVNQHLCGSHLVEALYLVCGNDGFFYRPKAGIVDQCCTGVCSLYQLQNYCN-
    INS_CHIBR       FVNKHLCGSHLVDALYLVCGDRGFFYTPMAGIVDQCCTSICTLYQLENYCN-
    INS_MYOCO       YVSQRLCGSQLVDTLYSVCRHRG-FYRPNDGIVDQCCTNICSRNQLMSYCND
    INS_PROGU       YVGQRLCGSQLVDTLYSVCKHRG-FYRPSEGIVDQCCTNICSRNQLLTYCN-
                     . ::****:**::** ** . * ** *  ***:*** . *:  **  ***
    die übrigen Resultate de Alignments sind in  Ausgabe ClustalW  zu sehen.
    Zu b)
  • Das Datenformat des Baumes ist im help-Menu beschrieben

  • Zu c) Neighbour-Joining-Verfahren von Saitou.
    Zu d) In den 34 Insulin-Eintragen aus 3.1.b befindet sich der Eintrag:

    >sp|P09476|INS_LEPSP INSULIN - LEPISOSTEUS SPATULA (ALLIGATOR GAR) (ATRACTOSTEUS SPATULA).
    AANQHLCGSHLVEALYLVCGEKGFFYNPNKVGIVEQCCHKPCTIYELENYCN

    und das neue Alignment ist in outgroup ClustalW abgespeichert. Der Ast, der zum Alligator führt ist wie erwartet der Längste.

    Zurück zur Übung 3.3