Übungen Molekulare Bioinformatik (2)

2.1)  Alignment im WWW

Verwenden Sie das  SIM alignment tool aus den Alignment Tools auf dem  Expasy-Server, um ein lokales Alignment der Sequenzen  ARMERHASE und HASENBRATEN durchzuführen.
a) Verwenden Sie die PAM40 Bewertungsmatrix und die Gap-Penalties GOP=10 und GEP=3.
b) Wie ändern sich der Scoring-Wert und das zweitbeste Subalignment, wenn bei  GOP=10 und GEP=3 die Bewertungs-Matrix von PAM40 nach PAM250 geändert wird?
 
Loesung in lsg_2.1

2.2) Exact Matching-Search

a) Wieviele Einträge  für SEVERAL und für NEIN findet man in der PIR-Datenbank?
b) Gibt es einen Ionenkanal, der die Sequenz CHANNEL oder KANAL enthält (oder
wenigstens eine membranständiges Protein)?

zu a) Gehen Sie zur PIR-Datenbank (http://www-nbrf.georgetown.edu/pir/searchdb.html)
Verwenden Sie die Option "pattern/peptide match" (http://www-nbrf.georgetown.edu/nbrf/scan.html)
zu b) Suchen Sie mit ALT F nach geeigneten Stichworten (etwa receptor)

Loesung in lsg_2.2

2.3) BLAST-Search

a)Bei einer Sequenzierungsarbeit wird die Basenfolge

CCTTTGGTGCGGACCTCCAAAGTAAAAAATGAAGTTGCTAGTTTCAAGCAGGCGTTGAGCAA

ermittelt. Woher könnte die Sequenz stammen?

Gehen Sie zum NCBU/NIH  (http://www.ncbi.nlm.nih.gov/), starten Sie eine Basic-BLAST-Sequenzsuche (http://www.ncbi.nlm.nih.gov/BLAST/).
Kopieren Sie die Sequenz in das Fenster (http://www.ncbi.nlm.nih.gov/cgi-bin/BLAST/nph-newblast?Jform=0)

Wie interpretieren Sie den E-Value und den Score, die im zu jedem Treffer (Hit) angegeben werden?
Was bedeutet tblastn? (http://www.ncbi.nlm.nih.gov/BLAST/blast_program.html)
 

b) Bei einer Sequenzierungsarbeit wird die Basenfolge

AATATTTTCTTTTGTGTAATTTCGAATTTAATTGTAGTTGTTGACAATAATTATTCTTTTA

ermittelt, es sind allerdings in der Region 18-39 wahrscheinlich fehlerhafte Basen.

Wie führt man die Suche sinnvollerweise durch?  (Ersetze die fragwürdige Region durch unbekannt (N))
Was passiert, wenn man die ursprüngliche Sequenz verwendet?
Was für ein Tier ist ein garden snapdragon und wie sieht ein garden snapdragon aus?
Wie wird der garden snapdragon taxonomisch klassifiziert?

Anmerkung zu b)
Die originale Sequenz stammt aus Borrelia burgdorferi:

AATATTTTCTTTTGTGTCATCAGCAACAATTACTCCGTTGTTGACAATAATTATTCTTTTA

Es wurde eine Variante mit einer "random" Substitution erzeugt

original  AATATTTTCTTTTGTGTAATTTCGAATTTAATTGTAGTTGTTGACAATAATTATTCTTTTA
variation AATATTTTCTTTTGTGTCAGTACGATTTGCATACGAATTGTTGACAATAATTATTCTTTTA

In die Sequenz wurde ein Stück aus garden snapdragon(1178-1162)
eingespleißt, die neue Hybrid-Sequenz heißt:

AATATTTTCTTTTGTGTAATTTCGAATTTAATTGTAGTTGTTGACAATAATTATTCTTTTA

Sequenz mit Deletion

AATATTTTCTTTTGTGTNNNNNNNNNNNNNNNNNNNNNTGTTGACAATAATTATTCTTTTA

Achtung: das Stück aus dem Snapdragon ist im inversen reading frame gelesen!!

original snap: actacaatta aattcgaaat tacacaaaag aaaatattac
inverse snap:  GTAATATTTTCTTTTGTGTAATTTCGAATTTAATTGTAGT
 
Loesung in lsg_2.3

2.4) FASTA-Search

Suchen Sie mit dem FASTA3 (http://www2.ebi.ac.uk/fasta3/)-Tool auf dem Xpasy-Server nach Homologen zur Eschericia coli Endonuclease (ID: T2E1_ECOLI) . (alternativ: Der BCM Server)

Der  SwissProt Eintrag auf dem Expasy-server hat den Accession Code (AC P00642).
Die  Sequenz im FASTA-Format ist

>ecori
SNKKQSNRLTEQHKLSQGVIGIFGDYAKAHDLAVGEVSKLVKKALSNEYP
QLSFRYRDSIKKTEINEALKKIDPDLGGTLFVSNSSIKPDGGIVEVKDDY
GEWRVVLVAEAKHQGKDIINIRNGLLVGKRGDQDLMAAGNAIERSHKNIS
EIANFMLSESHFPYVLFLEGSNFLTENISITRPDGRVVNLEYNSGILNRL
DRLTAANYGMPINSNLCINKFVNHKDKSIMLQAASIYTQGDGREWDSKIM
FEIMFDISTTSLRVLGRDLFEQLTSK

Die Sequenz hat eine Länge von 276 Aminosäuren und soll mit FASTA aligned werden:
a) gegen die "SwissProt" Datenbank.
b) gegen die "SwissProtAll" Datenbank.
 
Loesung in lsg_2.4

2.5) Informationen der IUPAC, IUBMB

a) Welche Organisation ist für die Nomenklaturfragen in der Chemie und wer in der Biochemie zuständig?  (http://www.chem.qmw.ac.uk/iupac/jcbn/)
b) Was ist das Consensus-Motiv für Eco R1 Endonuklease? ###(http://alpha.qmw.ac.uk/~ugca000/iupac.html/misc/naseq.html)
c) Was repräsentiert die Buchstaben B, W, X, Y, Z  in der IUB-Einbuchstaben-Kodierung für Aminosäuren? (One letter code)
 

 2.6) Medline Search

In den letzten Jahren gibt es vermehrt Hinweise auf eine erbliche Veranlagung zur Alkoholabhängigkeit. Studien zu dieser Frage wurden vor allem in Asien mehrfach durchgeführt.
Finden sie durch eine Medline-Suche  (Sichworte "alcohol risk asia genetic") (http://www.ncbi.nlm.nih.gov/PubMed/) heraus, welche Auffälligkeiten (Korrelationen) man bisher gefunden hat (negative risk factor). Welche Enzyme scheinen vor allem involviert zu sein?
 (http://www.ncbi.nlm.nih.gov/htbin-post/Entrez/query?uid=9581663&form=6&db=m&Dopt=b)