1. Laden Sie das TPI Gen (Triose Phosphate Isomerase) von Caenorhabditis
elegans aus der Gen Bank (ACCESSION U23081)!
Link zu Nucleotid Suche in der GenBank:  http://www.ncbi.nlm.nih.gov/Entrez/nucleotide.html.
Speichern Sie die Daten sowohl mitAnnotation (gbk-Format), als auch ohne Annotation (Fasta-Format).

Im Notfall verwenden Sie die Daten aus TPI_celegans_fasta und TPI_celegans_gbk .
 

2. Wieviel Basenpaare enthält der Eintrag ? Wie ist der C+G Gehalt ?
Wieviel Exons besitzt das Gen ? Wieviel Aminosäuren sind kodiert ?

3. Wie lautet das Startkodon und welcher Aminosäure entspricht es ?
Was bedeuted CDS? Welches Stopkodon wird verwandt ? Suche innerhalb des ersten Exons ein weiteres Kodon, das als Startkodon in Frage käme! Suche die beiden Donoren und Akzeptoren in den Introns ! Wann tritt im Leserahmen des ersten Exons das nächste Stopkodon auf, welches das offene Leseraster beendet ? Gibt es davor eine Donorsequenz ?

Eine Tabelle zum genetischen Code liegt zum Beispiel am "Virtual Genome Center".

4. Lassen Sie über verschiedene WWW-Server die Exon-Struktur des TPI-Gens von C.elegans bestimmen !

Eine Liste mit mehreren Servern liegt unter http://www.cs.jhu.edu/~salzberg/appendixa.html .

(a) GENSCAN
Vergleichen Sie die gefundenen Exons mit der dokumentierten Lage der
Exons ? Warum ist das Ende des ersten Exons falsch ?
Vergleichen Sie mit Aufgabe 3 (Stop-Kodon, ``falsche Donorsequenz'') ! 

Ein GenScan Server in Heidelberg: http://genome.dkfz-heidelberg.de/cgi-bin/GENSCAN/genscan.cgi

(b) GRAIL 2

Grail Server  http://compbio.ornl.gov/Grail-bin/EmptyGrailForm .

(c) GenMark
Variieren Sie die Trainingsparameter (C.elegans, Drosophila, Human, A. thaliana, Hefe)!

GenMark Server am EMBL: http://www2.ebi.ac.uk/genemark/
GenMark Server am Georgia Institute of Technology  http://genemark.biology.gatech.edu/GeneMark/webgenemark.html

5. Zusatzaufgabe: Man suche weitere Genidentifikationsprogramme und analysiere TPI (z.B. mit BCM, GENIE)!

Einige Listen mit mehreren Servern liegt unter

http://www.cs.jhu.edu/~salzberg/appendixa.html.
http://linkage.rockefeller.edu/wli/gene/programs.html

6. Zusatzaufgabe : Man lade Myosin Heavy Chain Gene (z:B. M74000 des
Wurms Brugia malayi (WURM_gbk und  WURM_fasta) mit 15 Exons und vergleiche die Vorhersagen von GENSCAN mit den dokumentierten Exon-Strukturen!

Lösungen:

 2. 2387 bp; 37% C+G; 3 exons; 318 bp + 102 bp + 324 bp = 744 bp;  247 aa

 3. ATG  entspricht Methionin (Met, M); TAA; ATG an Position 406 (13. Aminosäure ist Met); GT bei 688 und 1013; AG bei 908 und 1921; TGA bei 781; ja, bei  692, 775 , 777

4. (unterstrichene Exongrenzen sind korrekt)

(a)  370 - 774, 911 - 1012, 1923 - 2246;
       Exon 1 ist zu lang (774 statt 687), da der Donor bei 775 gewählt wurde, denn das nächste Stopkodon ist erst bei 781.

(b, c)  Trotz Variation verschiedener Parameter ist es uns nicht gelungen, die drei Exons korrekt zu bestimmen. Gelingt es Ihnen ?