"Obtivemos estimativas da diferenciação genética entre humanos e grandes símios que não excedem, digamos, aquelas observadas entre espécies irmãs fisicamente indistinguíveis de moscas-da-fruta."
Elizabeth J. Bruce e Francisco J. Ayala
"Humanos e Símios São Geneticamente Muito Semelhantes,"
Nature 276:264, 16 de novembro de 1978
As evidências da sequência molecular fornecem a prova mais impressionante e irrefutável da parentesco genealógico de toda a vida. A natureza das sequências moleculares permite cálculos de probabilidade extremamente impressionantes que demonstram o quão bem as previsões da descendência comum com modificação correspondem à observação empírica. A descendência comum é uma dedução que segue diretamente de premissas baseadas em evidências moleculares observadas empiricamente. Além disso, o conhecimento dos mecanismos e estruturas moleculares biológicos, combinado com a teoria da macroevolução, tem fornecido previsões biomoleculares muito específicas, novas e testáveis.
Esboço da Parte 4
- Redundância funcional de proteínas
- Redundância funcional de DNA
- Transposons
- Pseudogenes redundantes
- Retrovírus endógenos
Predição 4.1: Redundância funcional de proteínas
O suporte para a descendência comum fornecido por estudos de sequências moleculares pode ser formulado como um argumento dedutivo. Este argumento é único neste FAQ, pois é o único caso em que podemos concluir diretamente que a semelhança implica parentesco. Esta conclusão depende da semelhança de estruturas biológicas dentro de um contexto específico: a semelhança observada entre genes ubíquos de diferentes espécies.
A discussão a seguir é um pouco técnica, por isso é apresentada primeiro como um esboço de um argumento dedutivo, o que torna o fio lógico fácil de seguir. Aqui estão listados os pressupostos do argumento, seguidos da conclusão e de uma discussão adicional.
Resumo do argumento:
(P1) Genes ubíquos: Existem certos genes que todos os organismos vivos possuem porque desempenham funções vitais muito básicas; esses genes são chamados de genes ubíquos.
(P2) Genes ubíquos não estão correlacionados com fenótipos específicos de espécies: Genes ubíquos não têm relação com as funções específicas de diferentes espécies. Por exemplo, não importa se você é uma bactéria, um humano, um sapo, uma baleia, um beija-flor, um caracol, um fungo ou uma anêmona-do-mar - você possui esses genes ubíquos e eles todos desempenham a mesma função biológica básica, não importa o que você seja.
(P3) Sequências moleculares de genes ubíquos são funcionalmente redundantes: Qualquer proteína ubíqua dada possui um número extremamente grande de formas funcionalmente equivalentes diferentes (ou seja, sequências de proteínas que podem desempenhar a mesma função bioquímica).
(P4) Genes ubíquos específicos são desnecessários em qualquer espécie dada: Obviamente, não há razão a priori de que todos os organismos devam ter a mesma sequência ou mesmo sequências semelhantes. Nenhuma sequência específica é funcionalmente necessária em qualquer organismo - o que é necessário é uma das muitas formas funcionalmente equivalentes de um dado gene ou proteína ubíqua.
(P5) A herança correlaciona sequências, mesmo na ausência de necessidade funcional: Existe um, e apenas um, mecanismo observado que faz com que dois organismos diferentes tenham proteínas ubíquas com sequências semelhantes (além da extrema improbabilidade de puro acaso, é claro). Esse mecanismo é a herança.
(C) Portanto, genes ubíquos semelhantes indicam relação genealógica: Consequentemente, organismos que possuem sequências semelhantes para proteínas ubíquas estão geneticamente relacionados. Aproximadamente, quanto mais semelhantes forem as sequências, mais próxima será a relação genealógica.
Discussão:
As sequências de aminoácidos de proteínas são frequentemente utilizadas para estabelecer as relações filogenéticas entre espécies. Estudos de sequenciamento com genes funcionais têm se concentrado em genes de proteínas (ou RNAs) que são ubíquos (ou seja, todos os organismos os possuem). Isso é feito para garantir que as comparações sejam independentes do fenótipo geral da espécie.
Por exemplo, suponha que estamos comparando a sequência proteica de um chimpanzé e a de um humano. Ambos esses animais possuem muitos caracteres anatômicos e funções semelhantes, então poderíamos esperar que suas proteínas também fossem semelhantes, independentemente de estarem ou não relacionados genealogicamente. No entanto, podemos comparar as sequências de genes muito básicos que são utilizados por todos os organismos vivos, como o gene da citocromo c, que não têm influência sobre características específicas de chimpanzés ou humanos.
A citocromo c é uma proteína essencial e ubíqua encontrada em todos os organismos, incluindo eucariotos e bactérias (Voet e Voet 1995, p. 24). As mitocôndrias das células contêm citocromo c, onde transporta elétrons no processo metabólico fundamental da fosforilação oxidativa. O oxigênio que respiramos é utilizado para gerar energia neste processo (Voet e Voet 1995, pp. 577-582).
Usando um gene ubíquo como o citocromo c, não há razão para assumir que dois organismos diferentes devam ter a mesma sequência proteica ou até mesmo sequências proteicas semelhantes, a menos que os dois organismos estejam relacionados genealogicamente. Isso deve-se em parte à redundância funcional das sequências e estruturas proteicas. Aqui, "redundância funcional" indica que muitas sequências proteicas diferentes formam a mesma estrutura geral e desempenham a mesma função biológica geral. O citocromo c é uma proteína extremamente funcionalmente redundante, porque muitas sequências dissimilares formam todas proteínas de transporte de elétrons do citocromo c. A redundância funcional não precisa ser exata em termos de desempenho; algumas sequências funcionais de citocromo c podem ser ligeiramente melhores no transporte de elétrons do que outras.
Décadas de evidências bioquímicas mostraram que muitas mutações de aminoácidos, especialmente de resíduos superficiais, têm apenas pequenos efeitos na função proteica e na estrutura proteica (Branden e Tooze 1999, Cap. 3; Harris et al. 1956; Lesk 2001, Capítulos 5 e 6, pp. 165-228; Li 1997, p. 2; Matthews 1996). Um exemplo marcante é o dos citocromos do tipo c de várias bactérias, que têm virtualmente nenhuma similaridade de sequência. No entanto, todos se dobram na mesma estrutura tridimensional e desempenham a mesma função biológica (Moore e Pettigrew 1990, pp. 161-223; Ptitsyn 1998).
Mesmo dentro de uma mesma espécie, a maioria das mutações de aminoácidos é funcionalmente silenciosa. Por exemplo, existem pelo menos 250 mutações de aminoácidos diferentes conhecidas na hemoglobina humana, carregadas por mais de 3% da população mundial, que não apresentam manifestação clínica em indivíduos heterozigóticos ou homozigóticos (Bunn e Forget 1986; Voet e Voet 1995, p. 235). O fenômeno de redundância funcional de proteínas é muito geral e é observado em todas as proteínas e genes conhecidos.
Tendo isso em mente, considere novamente as sequências moleculares da citocromo c. A citocromo c é absolutamente essencial para a vida — organismos que não a possuem não podem viver. Demonstrou-se que a proteína citocromo c humana funciona em levedura (um organismo unicelular) que teve seu próprio gene nativo de citocromo c deletado, mesmo que a citocromo c da levedura difira da citocromo c humana em mais de 40% da proteína (Tanaka et al. 1988a; Tanaka et al. 1988b; Wallace e Tanaka 1994). De fato, os genes de citocromo c de atum (peixe), pomba (ave), cavalo (mamífero), Drosophila (inseto) e rato (mamífero) todos funcionam em levedura que carece de sua própria citocromo c nativa de levedura (Clements et al. 1989; Hickey et al. 1991; Koshy et al. 1992; Scarpulla e Nye 1986). Além disso, análises genéticas extensas da citocromo c demonstraram que a maioria da sequência proteica é desnecessária para sua função in vivo (Hampsey et al. 1986; Hampsey et al. 1988). Apenas cerca de um terço dos 100 aminoácidos na citocromo c são necessários para especificar sua função. A maioria dos aminoácidos na citocromo c é hipervariável (ou seja, podem ser substituídos por um grande número de aminoácidos funcionalmente semelhantes) (Dickerson e Timkovich 1975). Importante, Hubert Yockey realizou um estudo cuidadoso no qual ele calculou que há um mínimo de 2,3 x 1093 sequências proteicas de citocromo c funcionais possíveis, com base nessas análises de mutação genética (Hampsey et al. 1986; Hampsey et al. 1988; Yockey 1992, Cap. 6, p. 254). Para perspectiva, o número 1093 é cerca de um bilhão de vezes maior que o número de átomos no universo visível. Assim, as sequências funcionais de citocromo c são virtualmente ilimitadas em número, e não há razão a priori para duas espécies diferentes terem as mesmas, ou mesmo levemente semelhantes, sequências proteicas de citocromo c.
Em termos de uma análise estatística científica, a "hipótese nula" é que a identidade dos aminoácidos não essenciais nas proteínas citocromo c de humanos e chimpanzés deve ser aleatória em relação uns aos outros. No entanto, a partir da teoria da descendência comum e da nossa árvore filogenética padrão, sabemos que humanos e chimpanzés estão bastante relacionados. Portanto, preveemos, apesar das probabilidades, que as sequências de citocromo c de humanos e chimpanzés devem ser muito mais semelhantes do que, por exemplo, as de humanos e levedura citocromo c - simplesmente devido à herança.
Confirmação:
Humanos e chimpanzés possuem a mesma sequência exata da proteína citocromo c. A "hipótese nula" apresentada acima é falsa. Na ausência de descendência comum, a probabilidade de tal ocorrência é conservadoramente inferior a 10-93 (1 em 1093). Portanto, o alto grau de semelhança nessas proteínas é uma confirmação espetacular da teoria da descendência comum. Além disso, as proteínas de citocromo c humanas e de chimpanzés diferem em ~10 aminoácidos de todos os outros mamíferos. A probabilidade de isso ocorrer na ausência de um mecanismo hereditário é inferior a 10-29. A levedura Candida krusei é um dos organismos eucarióticos mais distantes dos humanos. A Candida apresenta 51 diferenças de aminoácidos em relação à sequência humana. Uma estimativa conservadora dessa probabilidade é inferior a 10-25.
Criticas:
Uma possível, embora improvável, objeção é que as pequenas diferenças no desempenho funcional entre os vários citocromos poderiam ser responsáveis por essa semelhança de sequência. Essa objeção é improvável devido ao número incrivelmente alto de sequências quase equivalentes que seriam fenotipicamente indistinguíveis para qualquer nível de desempenho necessário. Além disso, sequências quase semelhantes não necessariamente conferem níveis quase semelhantes de desempenho.
Não obstante, por argumentação, vamos supor que um citocromo c que transporte elétrons mais rapidamente seja necessário em organismos com metabolismo ativo ou com altas taxas de contração muscular. Se isso fosse verdade, poderíamos esperar observar um padrão de similaridade de sequência que correlacione com a similaridade do ambiente ou com a necessidade fisiológica. No entanto, isso não é observado. Por exemplo, o citocromo c do morcego é muito mais similar ao citocromo c humano do que ao citocromo c do beija-flor; o citocromo c do golfinho é muito mais similar ao citocromo c humano do que ao citocromo c do tubarão. Como afirmado anteriormente em previsão 1.3, a árvore filogenética construída a partir dos dados do citocromo c recapitula exatamente as relações dos principais táxons conforme determinadas pelos dados morfológicos completamente independentes (McLaughlin e Dayhoff 1973). Estes fatos apenas reforçam a ideia de que as sequências do citocromo c são independentes da função fenotípica (além da óbvia necessidade de um citocromo c funcional que transporte elétrons).
Resumo:
O ponto desta previsão é sutilmente diferente da previsão 1.3, "Convergência de filogenias independentes". As evidências apresentadas acima demonstram que para muitas proteínas funcionais ubíquas (como a citocromo c), existe um número enorme de sequências equivalentes que poderiam formar essa proteína em qualquer organismo dado. Sempre que descobrimos que dois organismos possuem as mesmas ou sequências muito similares para uma proteína ubíqua, sabemos que algo estranho está acontecendo. Por que esses dois organismos teriam proteínas ubíquas tão similares quando as chances são astronômicas contra isso? Sabemos de apenas uma razão pela qual dois organismos teriam duas sequências de proteínas similares na ausência de necessidade funcional: herança. Assim, nesses casos, podemos deduzir com confiança que os dois organismos estão genealogicamente relacionados. Neste sentido, a similaridade de sequências não é apenas um teste da teoria da descendência comum; a descendência comum é também uma dedução do princípio da herança e da observação de similaridade de sequências. Finalmente, a similaridade observada para a citocromo c não se limita a esta única proteína ubíqua; todos as proteínas ubíquas que foram comparadas entre chimpanzés e humanos são altamente similares, e houve muitas comparações.
Falsificação Potencial:
Sem assumir a teoria da descendência comum, o resultado mais provável é que as sequências de proteínas de citocromo c em todos esses organismos diferentes seriam muito diferentes entre si. Se fosse esse o caso, uma análise filogenética seria impossível, e isso forneceria evidências muito fortes para uma origem de espécies genealogicamente não relacionadas, talvez simultânea (Dickerson 1972; Yockey 1992; Li 1997).
Além disso, a própria base desse argumento poderia ser facilmente minada se pudesse ser demonstrado (1) que as proteínas citocromo c específicas de espécies funcionavam exclusivamente em seus respectivos organismos, ou (2) que nenhuma outra sequência de citocromo c pudesse funcionar em um organismo diferente do seu citocromo c nativo, ou (3) que um mecanismo observado além da herança possa correlacionar causalmente a sequência de uma proteína ubíqua com uma morfologia orgânica específica.
Predição 4.2: Redundância do código do DNA
Como a semelhança de sequências de proteínas, a semelhança de sequências de DNA de dois genes ubíquos também implica ancestralidade comum. É claro que comparações abrangentes de sequências de DNA de proteínas conservadas, como a citocromo c, também levam indiretamente em conta as sequências de aminoácidos, já que a sequência de DNA especifica a sequência de proteínas. No entanto, com sequências de DNA há um nível extra de redundância. O próprio código genético é redundante em termos de informação; em média, existem três códon diferentes (um códon é um triplo de bases de DNA) que podem especificar exatamente o mesmo aminoácido (Voet e Voet 1995, p. 966). Assim, para a citocromo c, existem aproximadamente 3104, ou mais de 1046, sequências de DNA diferentes (e, portanto, 1046 genes possíveis diferentes) que podem especificar exatamente a mesma sequência de proteína.
Aqui podemos ser bastante específicos em nossa previsão. Quaisquer diferenças de sequência entre dois genes funcionais de citocromo c são necessariamente neutras funcionalmente ou quase o são. A taxa de mutação de fundo em humanos (e na maioria dos outros mamíferos) foi medida em ~1-5 x 10-8 substituições de base por sítio por geração (Mohrenweiser 1994, pp. 128-129), e uma geração média de primatas é de aproximadamente 20 anos. A partir do registro fóssil, sabemos que humanos e chimpanzés divergiram de um ancestral comum há menos de 10 milhões de anos (uma estimativa conservadora - provavelmente menos de 6 milhões de anos) (Stewart e Disotell 1998). Portanto, se chimpanzés e humanos estão verdadeiramente relacionados genealogicamente, preveríamos que a diferença entre suas respectivas sequências de DNA do gene de citocromo c deve ser inferior a 3% - provavelmente muito menos, devido à função essencial do gene de citocromo c.
Confirmação:
Como mencionado acima, as proteínas citocromo c em chimpanzés e humanos são exatamente idênticas. O ponto decisivo é que as duas sequências de DNA que codificam o citocromo c em humanos e chimpanzés diferem por apenas quatro nucleotídeos (uma diferença de 1,2%), mesmo que existam 1049 sequências diferentes que poderiam codificar esta proteína.
Os efeitos combinados da redundância do código do DNA e da redundância da sequência de proteínas tornam as comparações de sequências de DNA duplamente redundantes; as sequências de DNA de proteínas ubíquas estão completamente não correlacionadas com as diferenças fenotípicas entre espécies, mas estão fortemente correlacionadas causalmente com a hereditariedade. É por isso que as filogenias baseadas em sequências de DNA são consideradas tão robustas.
Falsificação Potencial:
O resultado mais provável é que as sequências de DNA que codificam essas proteínas deveriam ser radicalmente diferentes. Isso seria uma refutação contundente da macroevolução e seria uma evidência muito forte de que chimpanzés e humanos não estão geneticamente relacionados de forma próxima. Naturalmente, as potenciais refutações para a predição 4.1 também se aplicam às sequências de DNA.
Predição 4.3: Evidência molecular - Transposons
De muitas maneiras, os transposons são muito semelhantes aos vírus. No entanto, eles carecem de genes para proteínas do envelope viral, não conseguem atravessar as fronteiras celulares e, portanto, replicam-se apenas no genoma do seu hospedeiro. Podem ser considerados parasitas intragenômicos. Exceto nas circunstâncias mais raras, o único modo de transmissão de um organismo metazoano para outro é diretamente por duplicação e herança de DNA (por exemplo, os seus transposons são transmitidos aos seus filhos) (Li 1997, pp. 338-345).
A replicação de um transposon significa copiar-se e inserir o DNA copiado aleatoriamente em outro lugar do genoma do hospedeiro. A replicação de transposons (também chamada de transposição) tem sido observada diretamente em muitos organismos, incluindo leveduras, milho, wallabies, humanos, bactérias e moscas, e recentemente os mecanismos tornaram-se bem compreendidos (Li 1997, pp. 335-338; Futuyma 1998, pp. 639-641). Casos observados específicos de retrotransposição são conhecidos por terem causado neurofibromatose e hemofilia em humanos (Kazazian et al. 1988; Wallace et al. 1991), e câncer, entre outras doenças (Deininger e Batzer 1999).
Esta seção sobre transposons, e as duas próximas seções abordando pseudogenes e retrovírus endógenos, estão todas relacionadas conceitualmente. As sequências de DNA em regiões intergênicas (regiões entre genes codificantes de proteínas em genomas) incluem muitos transposons (como LINEs e SINEs), retrovírus endógenos (como HERVs), pseudogenes e outras sequências relacionadas, como microsatélites. Muitos microsatélites estão estreitamente associados e gerados por retrotransposons como LINEs e SINEs (Arcot et al. 1995; Nadir et al. 1996; Wilder e Hollocher 2001; Yandava et al. 1997). Essas sequências intergênicas são responsáveis principalmente pelos padrões muito específicos observados em análises de "impressão digital de DNA", como as realizadas em testes de paternidade ou de irmãos. Como as impressões digitais, essas regiões intergênicas variam consideravelmente entre organismos individuais e os padrões são em grande parte arbitrários. Por exemplo, os elementos Alu, um tipo de retrotransposon SINE, transpõem-se para uma nova localização genômica a cada cerca de 200 nascimentos humanos (Deininger e Batzer 1999), e os Alus contribuem para uma fração significativa da diversidade genética humana (Batzer e Deininger 2002). No caso do transposon L1 humano, apenas um dos muitos elementos LINE humanos, uma nova retrotransposição é carregada por cerca de 1 em cada 20 indivíduos (Scaringe et al. 2001; Ostertag e Kazazian 2001). Esta é uma estimativa conservadora, dado que cada um de nós possui cerca de 50 LINEs L1 competentes para retrotransposição (Brouha et al. 2003). As regiões intergênicas do genoma, como todo o DNA, são hereditárias e existe uma correlação muito forte entre parentes. Quando são encontrados dois indivíduos que compartilham padrões intergênicos específicos muito acima do esperado apenas por acaso, isso é uma evidência muito forte de ancestralidade comum. Este é, de fato, a base científica por trás da impressão digital de DNA.
Como explicado acima, encontrar o mesmo transposon na mesma localização cromossômica em dois organismos diferentes é uma forte evidência direta de ancestralidade comum, uma vez que eles se inserem de forma bastante aleatória e geralmente não podem ser transmitidos exceto por herança. Além disso, uma vez postulado um ancestral comum que contenha uma certa transposição, todos os descendentes deste ancestral comum também devem conter a mesma transposição. Uma possível exceção é se esta transposição fosse removida devido a um raro evento de deleção; no entanto, as deleções nunca são limpas e geralmente parte da sequência do transposon permanece. Usando os mesmos princípios por trás da impressão digital de DNA, biólogos têm usado transposons, pseudogenes e retrovírus endógenos para demonstrar que muitas espécies estão geneticamente relacionadas, como humanos e outros primatas. Abaixo são dados alguns de muitos exemplos.
Confirmação:
Uma classe comum de transposon é o retroelemento SINE (Li 1997, pp. 349-352). Um importante transposon SINE é o elemento Alu de 300 bp. Todos os mamíferos contêm muitos elementos Alu, incluindo humanos, onde eles constituem 10% do genoma humano (ou seja, 60 milhões de bases de DNA repetitivo) (Smit 1996; Li 1997, pp. 354, 357). Transposições Alu humanas muito recentes têm sido usadas para elucidar migrações humanas históricas e pré-históricas, já que alguns indivíduos possuem inserções Alu mais recentes que outros indivíduos não possuem (Novick et al. 1993; Novick et al. 1995). De fato, transposições Alu comuns têm sido demonstradas como marcadores confiáveis de descendência comum em casos de paternidade e em forense criminal (Novick et al. 1993; Novick et al. 1995; Roy-Engel et al. 2001). Mais importante ainda, no cluster de α-globina humana, existem sete elementos Alu, e cada um deles é compartilhado com chimpanzés nas mesmas sete localizações exatas (Sawada et al. 1985).
Mais especificamente, três diferentes transposições de SINEs foram encontradas nas mesmas localizações cromossômicas de cetáceos (baleias), hipopótamos e ruminantes, todos os quais estão estreitamente relacionados de acordo com a árvore filogenética padrão. No entanto, todos os outros mamíferos, incluindo camelos e porcos, carecem dessas três transposições específicas (Shimamura 1997).
Mais detalhes e explicações sobre este tópico podem ser encontrados no FAQ "Plagiarized Errors and Molecular Genetics" de Edward Max, disponível em Plagiarized Errors and Molecular Genetics FAQ.
Falsificação Potencial:
Veja os dois abaixo, pois os mesmos princípios se aplicam aqui.
Predição 4.4: Evidência molecular - Pseudogenes redundantes
Outros exemplos moleculares que fornecem evidências de ancestralidade comum são sequências de DNA curiosas conhecidas como pseudogenes. Pseudogenes estão muito relacionados a genes funcionais, codificadores de proteínas. A semelhança envolve tanto a sequência primária de DNA quanto, frequentemente, a localização cromossômica específica dos genes. Os equivalentes funcionais dos pseudogenes são genes normais que são transcritos em mRNA, que por sua vez é ativamente traduzido em proteína funcional. Em contraste, pseudogenes possuem sequências regulatórias defeituosas que impedem o gene de ser transcrito em mRNA, ou possuem códon de parada interno que impede a produção da proteína funcional. Neste sentido, pseudogenes são exemplos moleculares de estruturas vestigiais.
No entanto, os pseudogenes são incluídos aqui sob uma previsão separada porque muitos pseudogenes são incomuns de uma maneira adicional. Os vestígios morfológicos perderam sua função original, e o organismo que carrega o vestígio também perdeu essa função. Em contraste, os pseudogenes perderam sua função original, mas o próprio organismo pode ainda reter essa função se carregar o contraparte funcional desses pseudogenes. Os pseudogenes que são vestigiais no sentido morfológico, como o pseudogene de síntese de vitamina C, são considerados na previsão 2.3. O restante tipo de pseudogene, no qual um organismo carrega tanto um gene funcional quanto um ou mais pseudogenes contraparte, é daqui em diante denominado "pseudogene redundante".
A maioria dos pseudogenes é em grande parte não funcional. Existem várias linhas de evidências que sustentam esta conclusão. Primeiro, a presença ou ausência da maioria dos pseudogenes específicos não tem efeito mensurável no fenótipo do organismo. Segundo, existem bons argumentos mecanísticos e genéticos indicando que os pseudogenes têm pouco, se é que têm, alguma função. Os pseudogenes possuem sequências complexas altamente semelhantes ou idênticas às necessárias para o funcionamento adequado de outras proteínas enzimáticas ou estruturais. Estes genes normais são ativamente transcritos e traduzidos em proteínas, enquanto os pseudogenes não são traduzidos, não são transcritos, ou ambos. Assim, os pseudogenes não podem desempenhar as funções das proteínas que codificam. Se os pseudogenes tiverem uma função, devem desempenhar funções relativamente simples para as quais a proteína por eles codificada não foi desenhada.
Terceiro, se um pseudogene tem pouca ou nenhuma função, então a maioria das mutações no pseudogene terá apenas consequências funcionais menores, e muitas mutações não serão eliminadas pela seleção purificadora. Portanto, esperamos que pseudogenes verdadeiramente não funcionais acumulem mutações na taxa de fundo de mutação. Pseudogenes com funções menores acumularão mutações próximo à taxa de fundo. Como esperado, se os pseudogenes têm pouca, se é que têm, alguma função, a maioria dos pseudogenes acumula mutações na taxa mais rápida conhecida para qualquer região de DNA em genomas animais. Além disso, a taxa de mutação inferida para pseudogenes a partir de análise filogenética corresponde muito de perto às taxas medidas de mutações espontâneas. Para mais informações e referências, consulte Predição 5.8.
Quarto e finalmente, entendemos como pseudogenes redundantes são criados, e observamos a criação de novos pseudogenes redundantes em laboratório e na natureza. Pseudogenes redundantes originam-se por duplicação gênica e subsequente mutação. Muitos processos observados são conhecidos por duplicar genes, incluindo eventos de transposição, duplicação cromossômica e crossing over desigual de cromossomos.
Esses fatos oferecem forte apoio à conclusão de que a maioria dos pseudogenes tem pouca, se alguma, função. Como as transposições (veja previsão 4.3), a criação de novos pseudogenes redundantes por duplicação gênica é um evento raro e aleatório e, é claro, qualquer DNA duplicado é herdado. Assim, encontrar o mesmo pseudogene na mesma localização cromossômica em duas espécies é forte evidência de ancestralidade comum.
Confirmação:
Existem muitos exemplos de pseudogenes redundantes compartilhados entre primatas e humanos. Um deles é o gene ψ-globina, um pseudogene da hemoglobina. Ele é compartilhado apenas entre os primatas, na mesma localização cromossômica, com as mesmas mutações que destroem sua função como gene codificador de proteínas (Goodman et al. 1989). Outro exemplo é o gene da esteróide 21-hidroxilase. Os humanos possuem duas cópias do gene da esteróide 21-hidroxilase: uma funcional e um pseudogene não traduzido. A inativação do gene funcional leva à hiperplasia adrenal congênita (CAH, uma doença genética rara e grave), fornecendo evidência positiva de que o pseudogene da 21-hidroxilase carece de sua função adequada. Tanto chimpanzés quanto humanos compartilham a mesma deleção de oito pares de bases neste pseudogene, o que o torna incapaz de sua função normal (Kawaguchi et al. 1992).
Falsificação Potencial:
Como explicado acima, as duplicações gênicas observadas são eventos raros e aleatórios. Portanto, é altamente improvável que outros mamíferos possuíssem os mesmos pseudogenes redundantes nas mesmas localizações cromossômicas, com as mesmas mutações que inutilizam suas funções normais. Por exemplo, é essencialmente impossível que os ratos carreguem os pseudogenes da 21-hidroxilase, na mesma localização genômica, com a mesma deleção de oito pares de bases que destrói sua função enzimática.
Além disso, uma vez que um gene é duplicado e as mutações o tornam um pseudogene redundante, ele é herdado por todos os descendentes. Assim, uma vez que certos organismos são encontrados que carregam o mesmo pseudogene, a descendência comum exige que todos os organismos filogeneticamente intermediários também carreguem aquele pseudogene. Por exemplo, suponha que descobrimos que humanos e macacos do Velho Mundo compartilham um certo pseudogene redundante. De acordo com a descendência comum, todos os grandes símios (incluindo chimpanzés, gorilas, orangotangos e siamangs) devem necessariamente carregar o mesmo pseudogene redundante na mesma localização cromossômica. Esta conclusão repousa na premissa de que não existem mecanismos para remover pseudogenes dos genomas (ou que os mecanismos são muito ineficientes). Isto aparentemente é verdadeiro para vertebrados, mas alguns organismos com tempos de geração curtos, como bactérias, protistas e Drosophila, são conhecidos por possuírem mecanismos que removem o excesso de DNA.
Observe que essa confirmação e potencial refutação são independentes de um pseudogene específico ter uma função ou ser completamente não funcional, pelos mesmos motivos explicados na previsão sobre restos morfológicos. Como qualquer outro elemento genético ou estrutura orgânica, o oportunismo evolutivo pode aproveitar um pseudogene e pressioná-lo para uma nova e diferente função.
Predição 4.5: Evidências moleculares - Retrovírus endógenos
Figura 4.4.1. Inserções de retrovírus endógeno humano K (HERV-K) em locais cromossômicos idênticos em vários primatas (Reimpresso de Lebedev et al. 2000, © 2000, com permissão da Elsevier Science). |
Retrovírus endógenos fornecem mais um exemplo de evidência de sequência molecular para a descendência comum universal. Retrovírus endógenos são vestígios moleculares de uma antiga infecção viral parasitária. Ocasionalmente, cópias do genoma de um retrovírus são encontradas no genoma do seu hospedeiro, e essas cópias de genes retrovirais são chamadas de sequências retrovirais endógenas. Retrovírus (como o vírus da AIDS ou o HTLV1, que causa uma forma de leucemia) produzem uma cópia de DNA do seu próprio genoma viral e a inserem no genoma do seu hospedeiro. Se isso acontecer a uma célula da linhagem germinativa (ou seja, os espermatozoides ou óvulos), o DNA retroviral será herdado pelos descendentes do hospedeiro. Novamente, este processo é raro e bastante aleatório, de modo que encontrar retrogenes em posições cromossômicas idênticas em duas espécies diferentes indica ancestralidade comum.
Confirmação:
Em humanos, retrovírus endógenos ocupam cerca de 1% do genoma, constituindo no total ~30.000 retrovírus diferentes incorporados no DNA genômico de cada pessoa (Sverdlov 2000). Existem pelo menos sete casos conhecidos de inserções de retrogenes comuns entre chimpanzés e humanos, e esse número certamente crescerá à medida que os genomas de ambos os organismos forem sequenciados (Bonner et al. 1982; Dangel et al. 1995; Svensson et al. 1995; Kjellman et al. 1999; Lebedev et al. 2000; Sverdlov 2000). Figura 4.4.1 mostra uma árvore filogenética de vários primatas, incluindo humanos, de um estudo recente que identificou numerosos retrovírus endógenos compartilhados nos genomas desses primatas (Lebedev et al. 2000). As setas designam os tempos relativos de inserção do DNA viral no genoma do hospedeiro. Todos os ramos após o ponto de inserção (à direita) carregam esse DNA retroviral — um reflexo do fato de que, uma vez que um retrovírus se insere no DNA da linhagem germinativa de um determinado organismo, ele será herdado por todos os descendentes desse organismo.
Os Felídeos (ou seja, gatos) fornecem outro exemplo. A árvore filogenética padrão mostra que os gatos pequenos divergem mais tarde do que os gatos grandes. Os gatos pequenos (por exemplo, o gato-jungle, o gato selvagem europeu, o gato selvagem africano, o gato de patas pretas e o gato doméstico) compartilham uma inserção gênica retroviral específica. Em contraste, todos os outros carnívoros que foram testados carecem desse retrogene (Futuyma 1998, pp. 293-294; Todaro et al. 1975).
Falsificação Potencial:
Não faria sentido, do ponto de vista da macroevolução, se certos outros mamíferos (por exemplo, cães, vacas, ornitorrincos, etc.), possuíam os mesmos retrogenes nas mesmas localizações cromossômicas exatas. Por exemplo, seria incrivelmente improvável que os cães também carregassem as três inserções HERV-K que são únicas aos humanos, conforme mostrado no canto superior direito da Figura 4.4.1, já que nenhum dos outros primatas possui essas sequências retrovirais.
Referências
Arcot, S.S., Wang, Z., Weber, J.L., Deininger, P.L., e Batzer, M.A. (1995) "Repetições Alu: uma fonte para a gênese de microsatélites em primatas." Genomics. 29: 136-144. [PubMed]
Batzer, M. A., e Deininger, P. L. (2002) "Repetições Alu e diversidade genômica humana." Nat Rev Genet. 3: 370. [PubMed]
Bonner, T. I., C. O'Connell, et al. (1982) "Sequências de retrovírus endógenos clonadas do DNA humano." PNAS 79: 4709. [PubMed]
Branden, C. e Tooze, J. (1999) Introdução à Estrutura de Proteínas. Segunda Edição, Nova York, Garland Publishing. [Site do Editor]
Brouha, B., Schustak, J., Badge, R.M., Lutz-Prigge, S., Farley, A.H., Moran, J.V., Kazazian, H.H. (2003) "Hot L1s account for the bulk of retrotransposition in the human population." Proc Natl Acad Sci U S A. 100: 5280-5285. [PNAS texto completo gratuito]
Bunn, H. F., e Forget, E. G. (1986) Hemoglobina: Aspectos Moleculares, Genéticos e Clínicos. Saunders.
Clements, J. M., O'Connell, L. I., Tsunasawa, S., e Sherman, F. (1989) "Expressão e atividade de um gene que codifica citocromo c de rato na levedura Saccharomyces cerevisiae." Gene 83: 1-14. [PubMed]
Dangel, A. W., B. J. Baker, et al. (1995) "Intrão 9 do gene do componente complementar C4 como marcador filogenético para primatas: repetições terminais longas do retrovírus endógeno ERV-K(C4) são um relógio molecular da evolução." Immunogenetics 42: 41-52. [PubMed]
Deininger, P. L., e Batzer, M. A. (1999) "Repetições Alu e doenças humanas." Mol Genet Metab. 67: 183-193. [PubMed]
Dickerson, R. E. (1972) Scientific American. 226: 58-72.
Dickerson, R. E., e Timkovich, R. (1975) citocromo c. Os Enzimas. P. D. Boyer. Nova York, Academic Press. 11: 397-547.
Futuyma, D. (1998) Biologia Evolutiva. Terceira edição. Sunderland, MA, Sinauer Associates.
Goodman, M., B. F. Koop, et al. (1989) "Filogenia molecular da família de grandes símios e humanos." Genome 31(316-335). [PubMed]
Hampsey, D. M., Das, G., e Sherman F. (1986) "Substituições de aminoácidos na iso-1-citocromo c da levedura." Journal of Biological Chemistry 261: 3259-71. [PubMed]
Hampsey, D. M., Das, G., e Sherman F. (1988) "Yeast iso-1-cytochrome c: análise genética dos requisitos estruturais." FEBS Letters 231: 275-83. [PubMed]
Harris, J. I., F. Sanger, et al. (1956) "Diferenças de espécie na insulina." Archives of Biochemistry and Biophysics 65: 427-438.
Hickey, D. R., Jayaraman, K., Goodhue, C. T., Shah, J., Fingar, S. A., Clements, J. M., Hosokawa, Y., Tsunasawa, S., e Sherman, F. (1991) "Síntese e expressão de genes que codificam citocromos c de atum, pomba e cavalo na levedura Saccharomyces cerevisiae." Gene 105: 73-81. [PubMed]
Kawaguchi, H., C. O'hUigin, et al. (1992) "Origem evolutiva de mutações no gene citocromo P450c21 de primatas." American Journal of Human Genetics 50: 766-780. [PubMed]
Kazazian, H. H. (1999) "Uma estimativa da frequência de mutações insercionais endógenas em humanos." Nat Genet. 22: 130. [PubMed]
Kazazian, H. H., C. Wong, et al. (1988) "Hemofilia A resultante da inserção de novo de sequências L1 representa um mecanismo novo para mutação no homem." Nature 332: 164. [PubMed]
Kjellman, C., H. O. Sjogren, et al. (1999) "HERV-F, um novo grupo de sequências de retrovírus endógenos humanos." Journal of General Virology 80: 2383. http://vir.sgmjournals.org/cgi/content/full/80/9/2383
Koshy, T. I., Luntz, T. L., Garber, E. A., e Margoliash, E. (1992) "Expressão de citocromos recombinantes c de várias espécies em Saccharomyces cerevisiae: modificações pós-traducionais." Protein Expr. Purif. 3: 441-52. [PubMed]
Lebedev, Y. B., Belonovitch, O. S., Zybrova, N. V, Khil, P. P., Kurdyukov, S. G., Vinogradova, T. V., Hunsmann, G., e Sverdlov, E. D. (2000) "Diferenças nas inserções LTR de HERV-K em loci ortólogos de humanos e grandes símios." Gene 247: 265-277. [PubMed]
Lesk, Arthur M. (2001) Introdução à Arquitetura de Proteínas. Oxford, Oxford University Press. [Site do Editor]
Li, W.-H. (1997) Evolução Molecular. Sunderland, MA, Sinauer Associates.
Matthews, B. W. (1996) "Análise estrutural e genética do dobramento e da função da lisozima T4." FASEB J. 10: 35-41. [PubMed]
McLaughlin, P. J., e Dayhoff, M. O. (1973) "Evolução de eucariotos: uma visão baseada em dados de sequência de citocromo c." Journal of Molecular Evolution 2(99-116).
Mohrenweiser, H. (1994) "Impacto do espectro molecular de lesões mutacionais nas estimativas de taxas de mutação gênica germinativa." Mutation Research 304: 119-137. [PubMed]
Moore, G. R., e Pettigrew, G. W. (1990) Citocromos c: Aspectos Evolutivos, Estruturais e Físico-químicos. Berlim, Springer-Verlag.
Nadir, E., Margalit, H., Gallily, T., e Ben-Sasson, S. A. (1996) "Dispersão de microsatélites no genoma humano: mecanismos evolutivos e implicações estruturais." Proc Natl Acad Sci U S A. 93: 6470-6475. [PubMed]
Novick, G. E., Gonzalez, T., Garrison, J., Novick, C. C., Batzer, M. A., Deininger, P. L., Herrera, R. J. (1993) "O uso de inserções Alu polimórficas na impressão digital de DNA humano." EXS. 67: 283-291. [PubMed]
Novick, G. E., Novick, C. C., Yunis, J., Yunis, E., Martinez, K., Duncan, G. G., Troup, G. M., Deininger, P. L., Stoneking, M., Batzer, M. A., et al. (1995) "Inserções Alu polimórficas específicas humanas como marcadores para identificação humana." Electrophoresis 16: 1596-1601. [PubMed]
Ostertag, E. M., e Kazazian, H. H. (2001) "Biologia dos retrotransposons L1 de mamíferos." Annu Rev Genet. 35: 501-538. [PubMed]
Ptitsyn, O. B. (1998) "Dobramento de proteínas e evolução de proteínas: núcleo de dobramento comum em diferentes subfamílias de citocromos do tipo c." Journal of Molecular Biology 278: 655. [PubMed]
Roy-Engel, A. M., Carroll, M. L., Vogel, E., Garber, R. K., Nguyen, S. V., Salem, A. H., Batzer, M. A., e Deininger, P. L. (2001) "Polimorfismos de inserção Alu para o estudo da diversidade genômica humana." Genetics 159: 279-290. http://www.genetics.org/cgi/content/full/159/1/279
Sawada, I., C. Willard, et al. (1985) "Evolução de repetições da família Alu desde a divergência entre humanos e chimpanzés." Journal of Molecular Evolution 22(316). [PubMed]
Li, X., Scaringe, W. A., Hill, K. A., Roberts, S., Mengos, A., Careri, D., Pinto, M. T., Kasper, C. K., e Sommer, S. S. (2001) "Frequência de eventos recentes de retrotransposição no gene fator IX humano." Hum Mutat. 17: 511-519. [PubMed]
'Scarpulla, R. C., e Nye, S. H. (1986) "Expressão funcional de citocromo c de rato em Saccharomyces cerevisiae." Proc Natl Acad Sci 83: 6352-6. [PubMed]
Shimamura, M., et al. (1997) "Evidências moleculares de retrotransposons de que as baleias formam um clado dentro dos ungulados de casco par." Nature 388: 666. [PubMed]
Smit, A. F. A. (1996) "A origem de repetições dispersas no genoma humano." Current Opinion in Genetics and Development 6: 743-748. [PubMed]
Stewart, C. B. e Disotell, T. R. (1998) "Evolução de primatas - dentro e fora da África." Current Biology 8: R582-588. [PubMed]
Svensson, A. C., N. Setterblad, et al. (1995) "Os genes DRB de primatas dos haplótipos DR3 e DR8 contêm elementos LTR do ERV9 em posições idênticas." Immunogenetics 41: 74. [PubMed]
Sverdlov, E. D. (2000) "Retrovírus e evolução de primatas." BioEssays 22: 161-171. [PubMed]
Tanaka, Y., Ashikari, T., Shibano, Y., Amachi, T., Yoshizumi, H., e Matsubara, H. (1988a) "Estudos de substituição de aminoácidos da citocromo c humana por um sistema de complementação usando leveduras deficientes em CYC1." J Biochem (Tóquio) Set;104: 477-80. [PubMed]
Tanaka, Y., Ashikari, T., Shibano, Y., Amachi, T., Yoshizumi, H., e Matsubara, H. (1988b) "Construção de um gene de citocromo c humano e sua expressão funcional em Saccharomyces cerevisiae." J Biochem (Tokyo) 103: 954-61. [PubMed]
Todaro, G.J., Benveniste, R.E., Callahan, R., Lieber, M.M., e Sherr, C.J. (1975) "Vírus tipo C endógenos de primatas e felinos." Cold Spring Harb Symp Quant Biol. 39 Pt 2:1159-1168.[PubMed]
Voet, D., e Voet, J. (1995) Bioquímica. Nova York, John Wiley and Sons.
Wallace, C. J., e Tanaka, Y. (1994) "Melhorando a função da citocromo c por engenharia de proteínas?: estudos de mutantes dirigidos a sítios da proteína humana." J. Biochem. (Tokyo) 115: 693-700. [PubMed]
Wallace, M. R., L. B. Andersen, et al. (1991) "Uma inserção Alu de novo resulta em neurofibromatose tipo 1." Nature 353: 864-866. [PubMed]
Wilder, J., e Hollocher, H. (2001) "Elementos móveis e a gênese de microsatélites em dípteros." Mol Biol Evol. 18: 384-392. [PubMed]
Yandava, C. N., Gastier, J. M., Pulido, J. C., Brody, T., Sheffield, V., Murray, J., Buetow, K., e Duyk, G. M. (1997) "Caracterização de repetições Alu associadas a microsatélites de repetições trinucleotídicas e tetranucleotídicas." Genome Res. 7: 716-724.
Yockey, H. P. (1992) Teoria da Informação e Biologia Molecular. Nova York, Cambridge University Press.