Um Exercício em Semelhança
Post do Mês: Agosto de 2005
por B. Richardson
Assunto: | Re: Solicitação Data: | 4 de agosto de 2005 Message-ID: | NailedIt@demKBykoL
John Harshman escreveu:
> > Vou publicar as sequências neste tópico, em cinco postagens, um conjunto de
> > nucleotídeos por postagem. Deixarei a linha do assunto inalterada. A
> > primeira linha de cada postagem deve ler AMOSTRA A1, AMOSTRA A2, ....
> > AMOSTRA A5. Seguir-se-á uma linha em branco, em seguida os nucleotídeos, não
> > deve haver nada mais nas postagens. Também removi a numeração
> > no lado esquerdo, tinha medo de que estivesse perto de quebrar em
> > alguns leitores de notícias. Há um de cada
> >
> > Homo sapiens
> > Pan troglodytes
> > Gorilla gorilla
> > Pongo pygmaeus
> > Hylobates klossii
> >
> > Não há significado no esquema sequencial A1, A2, A3, A4, A5 e
> > intencionalmente os misturei para que não houvesse.
> >
> OK, aqui estão minhas identificações:
>
> A3 = Hylobates
Correto.
> A5 = Pongo
Correto.
> A1 = Gorila
Correto.
> A2, A4 = Homo e Pan
A2 é Homo, A4 é Pan.
Eu também tinha Pan paniscus, acho que você teria travado dois representantes de Pan com certeza absoluta se eu tivesse adicionado ao conjunto, mas, é claro, não haveria maneira de distinguir entre Pan troglodytes e Pan paniscus.
Obrigado pelo esforço, considero este um exercício notável.
> Como eu disse, os dois primeiros são fáceis, o terceiro é menos claro. E os
> dois últimos são intercambiáveis; não há maneira possível de distingui-los
> apenas pela forma da árvore.
>
> Aqui está como eu fiz isso:
>
> Primeiro, eu precisei fazer alguns ajustes para colocá-lo em uma forma
> analisável usando o programa PAUP. Coloquei todas as sequências em um
> único arquivo de texto. Coloquei um _ entre SAMPLE e A1, etc., porque o
> PAUP reconhece nomes como tudo antes do primeiro espaço. Adicionei isso
> no início do arquivo:
>
> #NEXUS
>
> BEGIN DATA;
> DIMENSIONS NTAX=5 NCHAR=1002;
> FORMAT DATATYPE=DNA ;
>
> MATRIX
>
> A primeira linha assegura ao PAUP que o arquivo está em seu formato padrão.
> As linhas seguintes identificam um bloco de dados NEXUS, informam ao programa
> o número de espécies e caracteres e avisam que os dados são de DNA. A última
> linha indica que os dados reais estão começando.
>
> Em seguida, adicionei isso ao final:
>
> ;
> end;
>
> Essas duas linhas informam ao programa que os dados estão terminando e que
> o bloco DATA está finalizando.
>
> Em seguida, executei o arquivo no PAUP, o que significa que carreguei os
> dados na memória do programa e realizei uma das análises mais simples,
> o agrupamento por vizinhos (neighbor joining). Outros métodos me deram a mesma árvore. Aqui está a árvore:
>
> Árvore de agrupamento por vizinhos:
>
> /------- SAMPLE A1 > | /--------------------------- SAMPLE A2 > | /--+------------- SAMPLE A4 > \-+ /--------------------[...]------------------- SAMPLE A3 > \--------------+------------------------- SAMPLE A5> I had to shorten the branch to A3 so it would fit on this page; that's
> what the [...] means. OK, I pick the longest branch, A3 as Hylobates.
> Strictly speaking, this only works if there's a uniform rate of
> evolution, which is a bad assumption. But usually it will be close
> enough to make me confident in my pick. Of course, we will usually have
> a designated outgroup in the data, so I wouldn't have to make such a
> guess. All else follows from that. The first branch from A3 leads to A5,
> so that's Pongo. The next branch leads to A1, so that is suggested to be
> Gorilla. Note, however, that the branch separating A1 from A2-A4 is very
> short, so it's not very reliable. If A1 is Gorilla, then A2 and A4 are
> Homo and Pan, though we can't say which is which.
>
> Anyway, I had only one choice to make, and that was which one is
> Hylobates. All else follows from the shape of the tree. Picking
> Hylobates requires the single additional assumption that the rate of
> evolution doesn't vary too extremely from one species to another.
>
> So, are these more mitochondrial sequences?
Não, é um gene receptor de sabor. Observe que a entrada Homo diz "candidato receptor de sabor TAS2R38", enquanto todas as outras dizem "membro 38 do tipo 2 de receptor de sabor".
Homo sapiens
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=AF494231
http://tinyurl.com/6s48vns
Gorilla gorilla
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549380
http://tinyurl.com/adc6p
Hylobates klossii
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549384
http://tinyurl.com/drecx
Pongo pygmaeus
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549382
http://tinyurl.com/9bnpu
Pan troglodytes
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549378
http://tinyurl.com/7nxco
Pan paniscus
http://www.ncbi.nlm.nih.gov/entrez/viewer.fcgi?db=nucleotide&val=45549376
http://tinyurl.com/a6wzw
[Retornar às Postagens do Mês de 2005]