Ein Übung in Ähnlichkeit
Beitrag des Monats: August 2005
von B. Richardson
Betreff: | Re: Anfrage Datum: | 4. August 2005 Message-ID: | NailedIt@demKBykoL
John Harshman schrieb:
> > Ich werde die Sequenzen in diesem Thread veröffentlichen, fünf Beiträge, jeweils eine Reihe von
> > Nukleotiden pro Beitrag. Ich lasse die Betreffzeile unverändert. Die
> > erste Zeile jedes Beitrags sollte SAMPLE A1, SAMPLE A2, ....
> > SAMPLE A5 lauten. Eine leere Zeile folgt, dann die Nukleotide, es
> > sollte in den Beiträgen nichts anderes sein. Ich habe auch die Nummerierung
> > auf der linken Seite gekürzt, ich hatte Angst, sie könnte in einigen
> > Newsreadern umbrechen. Es gibt jeweils eines von
> >
> > Homo sapiens
> > Pan troglodytes
> > Gorilla gorilla
> > Pongo pygmaeus
> > Hylobates klossii
> >
> > Die sequenzielle Anordnung A1, A2, A3, A4, A5 hat keine Bedeutung und
> > ich habe sie absichtlich durcheinandergemischt, damit dies nicht der Fall ist.
> >
> OK, hier sind meine Identifikationen:
>
> A3 = Hylobates
Richtig.
> A5 = Pongo
Richtig.
> A1 = Gorilla
Richtig.
> A2, A4 = Homo und Pan
A2 ist Homo, A4 ist Pan.
Ich hatte auch Pan paniscus, ich denke, Sie hätten mit absoluter Sicherheit zwei Pan-Repräsentanten festlegen können, wenn ich es zur Mischung hinzugefügt hätte, aber natürlich wäre es unmöglich gewesen, zwischen Pan troglodytes und Pan paniscus zu unterscheiden.
Vielen Dank für die Bemühung, ich finde dies eine beachtliche Übung.
> Wie ich schon sagte, sind die ersten beiden einfach, das dritte weniger klar. Und die letzten beiden sind austauschbar; es gibt keinen möglichen Weg, sie nur anhand der Form des Baumes zu unterscheiden.
>
> So habe ich das gemacht:
>
> Zuerst musste ich es leicht anpassen, um es in eine analysierbare Form zu bringen, indem ich das Programm PAUP benutzte. Ich legte alle Sequenzen in eine einzige Textdatei. Ich setzte ein _ zwischen SAMPLE und A1 usw., weil PAUP Namen als alles vor dem ersten Leerzeichen erkennt. Ich fügte dies am Anfang der Datei hinzu:
>
> #NEXUS
>
> BEGIN DATA;
> DIMENSIONS NTAX=5 NCHAR=1002;
> FORMAT DATATYPE=DNA ;
>
> MATRIX
>
> Die erste Zeile versichert PAUP, dass die Datei im Standardformat liegt.
> Die nächsten Zeilen identifizieren einen NEXUS-Datenblock, geben dem Programm die Anzahl der Arten und Merkmale an und informieren es darüber, dass die Daten DNA sind. Die letzte Zeile teilt ihm mit, dass die eigentlichen Daten beginnen.
>
> Dann fügte ich dies am Ende hinzu:
>
> ;
> end;
>
> Diese beiden Zeilen teilen dem Programm mit, dass die Daten enden und dass der DATA-Block endet.
>
> Dann führte ich die Datei in PAUP aus, was bedeutet, dass ich die Daten in den Programmspeicher geladen und dann eine der einfachsten Analysen durchgeführt habe, das Neighbor-Joining. Andere Methoden gaben mir denselben Baum. Hier ist der Baum:
>
> Neighbor-Joining-Baum:
>
> /------- SAMPLE A1 > | /--------------------------- SAMPLE A2 > | /--+------------- SAMPLE A4 > \-+ /--------------------[...]------------------- SAMPLE A3 > \--------------+------------------------- SAMPLE A5> I had to shorten the branch to A3 so it would fit on this page; that's
> what the [...] means. OK, I pick the longest branch, A3 as Hylobates.
> Strictly speaking, this only works if there's a uniform rate of
> evolution, which is a bad assumption. But usually it will be close
> enough to make me confident in my pick. Of course, we will usually have
> a designated outgroup in the data, so I wouldn't have to make such a
> guess. All else follows from that. The first branch from A3 leads to A5,
> so that's Pongo. The next branch leads to A1, so that is suggested to be
> Gorilla. Note, however, that the branch separating A1 from A2-A4 is very
> short, so it's not very reliable. If A1 is Gorilla, then A2 and A4 are
> Homo and Pan, though we can't say which is which.
>
> Anyway, I had only one choice to make, and that was which one is
> Hylobates. All else follows from the shape of the tree. Picking
> Hylobates requires the single additional assumption that the rate of
> evolution doesn't vary too extremely from one species to another.
>
> So, are these more mitochondrial sequences?
Nein, ein Geschmacksrezeptor-Gen. Beachten Sie, dass der Homo-Eintrag „candidate taste receptor TAS2R38" lautet, während alle anderen „taste receptor type 2 member 38" sagen.
Homo sapiens
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=AF494231
http://tinyurl.com/6s48vns
Gorilla gorilla
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549380
http://tinyurl.com/adc6p
Hylobates klossii
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549384
http://tinyurl.com/drecx
Pongo pygmaeus
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549382
http://tinyurl.com/9bnpu
Pan troglodytes
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549378
http://tinyurl.com/7nxco
Pan paniscus
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549376
http://tinyurl.com/a6wzw
[Zurück zu den Beiträgen des Monats 2005]