"Hemos obtenido estimaciones de la diferenciación genética entre humanos y los grandes simios que no superan, digamos, las observadas entre especies hermanas físicamente indistinguibles de moscas de la fruta."
Elizabeth J. Bruce y Francisco J. Ayala
"Los Humanos y los Simios Son Genéticamente Muy Similares,"
Nature 276:264, 16 de noviembre de 1978
La evidencia de secuencias moleculares proporciona la prueba más impresionante e irrefutable de la parentesco genealógico de toda la vida. La naturaleza de las secuencias moleculares permite cálculos de probabilidad extremadamente impresionantes que demuestran qué tan bien las predicciones de la descendencia común con modificación coinciden con la observación empírica. La descendencia común es una deducción que sigue directamente de premisas basadas en evidencia molecular observada empíricamente. Además, el conocimiento de los mecanismos y estructuras moleculares biológicos, combinado con la teoría de la macroevolución, ha proporcionado predicciones biomoleculares muy específicas, novedosas y comprobables.
Esquema de la Parte 4
- Redundancia funcional de proteínas
- Redundancia funcional del ADN
- Transposones
- Pseudogenes redundantes
- Retrovirus endógenos
Predicción 4.1: Redundancia funcional de proteínas
El apoyo a la descendencia común proporcionado por los estudios de secuencias moleculares puede formularse como un argumento deductivo. Este argumento es único dentro de este FAQ, ya que es el único caso en el que podemos concluir directamente que la similitud implica parentesco. Esta conclusión depende de la similitud de las estructuras biológicas dentro de un contexto específico: la similitud observada entre genes ubicuos de diferentes especies.
La siguiente discusión es algo técnica, por lo que se presenta primero en forma de esquema de un argumento deductivo, lo que facilita seguir el hilo lógico. A continuación se listan las premisas del argumento seguidas de la conclusión y una discusión adicional.
La esencia del argumento:
(P1) Genes ubicuos: Existen ciertos genes que todos los organismos vivos poseen porque realizan funciones vitales muy básicas; estos genes se llaman genes ubicuos.
(P2) Los genes ubicuos no están correlacionados con fenotipos específicos de la especie: Los genes ubicuos no tienen relación con las funciones específicas de las diferentes especies. Por ejemplo, no importa si eres una bacteria, un humano, una rana, una ballena, un colibrí, un caracol, un hongo o una anémona de mar; posees estos genes ubicuos y todos realizan la misma función biológica básica, sin importar lo que seas.
(P3) Las secuencias moleculares de los genes ubicuos son funcionalmente redundantes: Cualquier proteína ubicua dada tiene un número extremadamente grande de formas funcionalmente equivalentes diferentes (es decir, secuencias de proteínas que pueden realizar la misma función bioquímica).
(P4) Los genes ubicuos específicos son innecesarios en cualquier especie dada: Obviamente, no hay razón a priori por la que cada organismo deba tener la misma secuencia o incluso secuencias similares. Ninguna secuencia específica es funcionalmente necesaria en ningún organismo; lo único necesario es una de las muchas formas funcionalmente equivalentes de un determinado gen o proteína ubicuo.
(P5) La herencia correlaciona secuencias, incluso en ausencia de necesidad funcional: Existe uno, y solo uno, mecanismo observado que causa que dos organismos diferentes tengan proteínas ubicuas con secuencias similares (aparte de la extrema improbabilidad del puro azar, por supuesto). Ese mecanismo es la herencia.
(C) Por lo tanto, los genes ubicuos similares indican relación genealógica: Se desprende de ello que los organismos que tienen secuencias similares para proteínas ubicuas están relacionados genealógicamente. Aproximadamente, cuanto más similares sean las secuencias, más cercana será la relación genealógica.
Discusión:
Las secuencias de aminoácidos de las proteínas se utilizan a menudo para establecer las relaciones filogenéticas de las especies. Los estudios de secuencias con genes funcionales se han centrado en genes de proteínas (o ARNs) que son ubicuos (es decir, todos los organismos los poseen). Esto se hace para asegurar que las comparaciones sean independientes del fenotipo general de la especie.
Por ejemplo, supongamos que estamos comparando la secuencia de proteínas de un chimpancé y la de un humano. Ambos animales tienen muchos caracteres anatómicos y funciones similares, por lo que podríamos esperar que sus proteínas también sean similares, independientemente de si están relacionados genealógicamente o no. Sin embargo, podemos comparar las secuencias de genes muy básicos que son utilizados por todos los organismos vivos, como el gen de la citocromo c, que no tienen influencia sobre características específicas de chimpancés o humanos.
La citocromo c es una proteína esencial y ubicua encontrada en todos los organismos, incluidos eucariotas y bacterias (Voet y Voet 1995, p. 24). Las mitocondrias de las células contienen citocromo c, donde transporta electrones en el proceso metabólico fundamental de la fosforilación oxidativa. El oxígeno que respiramos se utiliza para generar energía en este proceso (Voet y Voet 1995, pp. 577-582).
Utilizando un gen ubicuo como la citocromo c, no hay razón para asumir que dos organismos diferentes deberían tener la misma secuencia de proteínas o incluso secuencias de proteínas similares, a menos que los dos organismos estén relacionados genealógicamente. Esto se debe en parte a la redundancia funcional de las secuencias y estructuras de proteínas. Aquí, "redundancia funcional" indica que muchas secuencias de proteínas diferentes forman la misma estructura general y desempeñan la misma función biológica general. La citocromo c es una proteína extremadamente funcionalmente redundante, porque muchas secuencias disímiles forman todas proteínas de transporte de electrones de citocromo c. La redundancia funcional no necesita ser exacta en términos de rendimiento; algunas secuencias funcionales de citocromo c pueden ser ligeramente mejores en el transporte de electrones que otras.
Décadas de evidencia bioquímica han demostrado que muchas mutaciones de aminoácidos, especialmente de residuos superficiales, tienen solo pequeños efectos en la función de la proteína y en la estructura de la proteína (Branden y Tooze 1999, Cap. 3; Harris et al. 1956; Lesk 2001, Capítulos 5 y 6, pp. 165-228; Li 1997, p. 2; Matthews 1996). Un ejemplo llamativo es el de los citocromos de tipo c de diversas bacterias, que tienen prácticamente ninguna similitud en la secuencia. No obstante, todos se pliegan en la misma estructura tridimensional y todos desempeñan la misma función biológica (Moore y Pettigrew 1990, pp. 161-223; Ptitsyn 1998).
Incluso dentro de las especies, la mayoría de las mutaciones de aminoácidos son funcionalmente silenciosas. Por ejemplo, se conocen al menos 250 mutaciones de aminoácidos diferentes en la hemoglobina humana, portadas por más del 3% de la población mundial, que no tienen manifestación clínica en individuos heterocigotos o homocigotos (Bunn y Forget 1986; Voet y Voet 1995, p. 235). El fenómeno de redundancia funcional de proteínas es muy general y se observa en todas las proteínas y genes conocidos.
Teniendo esto en cuenta, considere nuevamente las secuencias moleculares de la citocromo c. La citocromo c es absolutamente esencial para la vida: los organismos que carecen de ella no pueden vivir. Se ha demostrado que la proteína de citocromo c humana funciona en levadura (un organismo unicelular) que ha tenido eliminado su propio gen nativo de citocromo c, a pesar de que la citocromo c de levadura difiere de la citocromo c humana en más del 40% de la proteína (Tanaka et al. 1988a; Tanaka et al. 1988b; Wallace y Tanaka 1994). De hecho, los genes de citocromo c del atún (pez), paloma (ave), caballo (mamífero), Drosophila (insecto) y rata (mamífero) todos funcionan en levadura que carece de su propia citocromo c nativa de levadura (Clements et al. 1989; Hickey et al. 1991; Koshy et al. 1992; Scarpulla y Nye 1986). Además, un análisis genético extenso de la citocromo c ha demostrado que la mayor parte de la secuencia de la proteína es innecesaria para su función in vivo (Hampsey et al. 1986; Hampsey et al. 1988). Solo aproximadamente un tercio de los 100 aminoácidos en la citocromo c son necesarios para especificar su función. La mayoría de los aminoácidos en la citocromo c son hipervariables (es decir, pueden ser reemplazados por un gran número de aminoácidos funcionalmente similares) (Dickerson y Timkovich 1975). Importante, Hubert Yockey ha realizado un estudio cuidadoso en el que calculó que hay un mínimo de 2.3 x 1093 secuencias de proteína de citocromo c funcionales posibles, basándose en estos análisis de mutaciones genéticas (Hampsey et al. 1986; Hampsey et al. 1988; Yockey 1992, Cap. 6, p. 254). Para ponerlo en perspectiva, el número 1093 es aproximadamente mil millones de veces más grande que el número de átomos en el universo visible. Por lo tanto, las secuencias funcionales de citocromo c son virtualmente ilimitadas en número, y no hay razón a priori para que dos especies diferentes tengan las mismas, o incluso ligeramente similares, secuencias de proteína de citocromo c.
En términos de un análisis estadístico científico, la "hipótesis nula" es que la identidad de los aminoácidos no esenciales en las proteínas de citocromo c de humanos y chimpancés debería ser aleatoria entre sí. Sin embargo, desde la teoría de la descendencia común y nuestro árbol filogenético estándar sabemos que los humanos y los chimpancés están muy estrechamente relacionados. Por lo tanto, predecimos, a pesar de las probabilidades, que las secuencias de citocromo c de humanos y chimpancés deberían ser mucho más similares que, por ejemplo, las de humanos y levadura de citocromo c - simplemente debido a la herencia.
Confirmación:
Los humanos y los chimpancés tienen exactamente la misma secuencia de proteína citocromo c. La "hipótesis nula" mencionada anteriormente es falsa. En ausencia de descendencia común, la probabilidad de que ocurra este evento es conservadoramente menor a 10-93 (1 entre 1093). Por lo tanto, el alto grado de similitud en estas proteínas es una corroboración espectacular de la teoría de la descendencia común. Además, las proteínas de citocromo c de humanos y chimpancés difieren en ~10 aminoácidos de todos los demás mamíferos. La probabilidad de que esto ocurra en ausencia de un mecanismo hereditario es menor a 10-29. La levadura Candida krusei es uno de los organismos eucariotas más distantes relacionados con los humanos. Candida tiene 51 diferencias de aminoácidos con la secuencia humana. Una estimación conservadora de esta probabilidad es menor a 10-25.
Criticisms:
Una posible, aunque improbable, objeción es que las ligeras diferencias en el rendimiento funcional entre los diversos citocromos podrían ser responsables de esta similitud en la secuencia. Esta objeción es improbable debido al increíblemente alto número de secuencias casi equivalentes que serían fenotípicamente indistinguibles para cualquier nivel de rendimiento requerido. Además, las secuencias casi similares no necesariamente confieren niveles casi similares de rendimiento.
No obstante, por el bien del argumento, supongamos que se requiere un citocromo c que transporte electrones más rápido en organismos con metabolismos activos o con altas tasas de contracción muscular. Si esto fuera cierto, podríamos esperar observar un patrón de similitud de secuencias que se correlacione con la similitud del entorno o con el requisito fisiológico. Sin embargo, esto no se observa. Por ejemplo, el citocromo c del murciélago es mucho más similar al citocromo c humano que al citocromo c del colibrí; el citocromo c del delfín es mucho más similar al citocromo c humano que al citocromo c del tiburón. Como se mencionó anteriormente en predicción 1.3, el árbol filogenético construido a partir de los datos del citocromo c recapitula exactamente las relaciones de los principales taxones según se determinó por los datos morfológicos completamente independientes (McLaughlin y Dayhoff 1973). Estos hechos solo apoyan aún más la idea de que las secuencias de citocromo c son independientes de la función fenotípica (salvo el obvio requisito de un citocromo c funcional que transporte electrones).
Resumen:
El punto de esta predicción es sutilmente diferente del predicción 1.3, "Convergencia de filogenias independientes". La evidencia presentada anteriormente demuestra que para muchas proteínas funcionales ubicuas (como la citocromo c), existe un número enorme de secuencias equivalentes que podrían formar esa proteína en cualquier organismo dado. Cada vez que encontramos que dos organismos tienen las mismas o muy similares secuencias para una proteína ubicua, sabemos que algo sospechoso está ocurriendo. ¿Por qué tendrían estos dos organismos proteínas ubicuas tan similares cuando las probabilidades son astronómicamente en su contra? Solo conocemos una razón por la cual dos organismos tendrían dos secuencias de proteínas similares en ausencia de necesidad funcional: la herencia. Por lo tanto, en tales casos podemos deducir con confianza que los dos organismos están relacionados genealógicamente. En este sentido, la similitud de secuencias no es solo una prueba de la teoría de la descendencia común; la descendencia común es también una deducción del principio de herencia y la observación de la similitud de secuencias. Finalmente, la similitud observada para la citocromo c no se limita a esta única proteína ubicua; todos las proteínas ubicuas que se han comparado entre chimpancés y humanos son altamente similares, y se han realizado muchas comparaciones.
Falsificación Potencial:
Sin asumir la teoría de la descendencia común, el resultado más probable es que las secuencias de proteínas de citocromo c en todos estos organismos diferentes serían muy distintas entre sí. Si fuera así, un análisis filogenético sería imposible, y esto proporcionaría una evidencia muy fuerte de un origen de especies no relacionado genealógicamente, quizás simultáneo (Dickerson 1972; Yockey 1992; Li 1997).
Además, la misma base de este argumento podría ser fácilmente socavada si se pudiera demostrar (1) que las proteínas citocromo c específicas de las especies funcionaban exclusivamente en sus respectivos organismos, o (2) que ninguna otra secuencia de citocromo c pudiera funcionar en un organismo distinto de su citocromo c nativo, o (3) que un mecanismo observado además de la herencia pueda correlacionar causalmente la secuencia de una proteína ubicua con una morfología orgánica específica.
Predicción 4.2: Redundancia del código de ADN
Al igual que la similitud en la secuencia de proteínas, la similitud en la secuencia de ADN de dos genes ubicuos también implica un ancestro común. Por supuesto, las comparaciones exhaustivas de secuencias de ADN de proteínas conservadas como la citocromo c también tienen en cuenta indirectamente las secuencias de aminoácidos, ya que la secuencia de ADN especifica la secuencia de proteínas. Sin embargo, con las secuencias de ADN existe un nivel adicional de redundancia. El código genético en sí mismo es redundante desde el punto de vista informativo; en promedio, hay tres codones diferentes (un codón es un trío de bases de ADN) que pueden especificar exactamente el mismo aminoácido (Voet y Voet 1995, p. 966). Por lo tanto, para la citocromo c existen aproximadamente 3104, o más de 1046, secuencias de ADN diferentes (y, por consiguiente, 1046 genes posibles diferentes) que pueden especificar exactamente la misma secuencia de proteínas.
Aquí podemos ser bastante específicos en nuestra predicción. Cualquier diferencia de secuencia entre dos genes funcionales de citocromo c es necesariamente funcionalmente neutra o casi lo es. La tasa de mutación de fondo en humanos (y en la mayoría de los otros mamíferos) se ha medido en ~1-5 x 10-8 sustituciones de bases por sitio por generación (Mohrenweiser 1994, pp. 128-129), y una generación promedio de primates es de unos 20 años. A partir del registro fósil, sabemos que los humanos y los chimpancés divergieron de un ancestro común hace menos de 10 millones de años (una estimación conservadora - probablemente menos de 6 millones de años) (Stewart y Disotell 1998). Por lo tanto, si los chimpancés y los humanos están verdaderamente relacionados genealógicamente, predijimos que la diferencia entre sus respectivas secuencias de ADN del gen de citocromo c debería ser menor del 3% - probablemente incluso mucho menos, debido a la función esencial del gen de citocromo c.
Confirmación:
Como se mencionó anteriormente, las proteínas citocromo c en chimpancés y humanos son exactamente idénticas. El dato definitivo es que las dos secuencias de ADN que codifican para el citocromo c en humanos y chimpancés difieren en solo cuatro nucleótidos (una diferencia del 1.2%), a pesar de que existen 1049 secuencias diferentes que podrían codificar para esta proteína.
Los efectos combinados de la redundancia del código de ADN y la redundancia de la secuencia de proteínas hacen que las comparaciones de secuencias de ADN sean doblemente redundantes; las secuencias de ADN de proteínas ubicuas no están correlacionadas en absoluto con las diferencias fenotípicas entre especies, pero están fuertemente correlacionadas causalmente con la herencia. Por esta razón, las filogenias basadas en secuencias de ADN se consideran tan robustas.
Falsificación Potencial:
El resultado más probable es que las secuencias de ADN que codifican estas proteínas deberían ser radicalmente diferentes. Esto sería una refutación contundente de la macroevolución y sería una evidencia muy fuerte de que los chimpancés y los humanos no están estrechamente relacionados genealógicamente. Por supuesto, las posibles refutaciones para la predicción 4.1 también se aplican a las secuencias de ADN.
Predicción 4.3: Evidencia molecular - Transposones
De muchas maneras, los transposones son muy similares a los virus. Sin embargo, carecen de genes para las proteínas de la cubierta viral, no pueden cruzar las fronteras celulares y, por lo tanto, se replican únicamente en el genoma de su huésped. Pueden considerarse parásitos intragenómicos. Excepto en las circunstancias más raras, el único modo de transmisión de un organismo metazoano a otro es directamente por duplicación y herencia del ADN (por ejemplo, tus transposones se transmiten a tus hijos) (Li 1997, pp. 338-345).
La replicación de un transposón significa copiarse a sí mismo e insertar el ADN copiado de forma aleatoria en otro lugar del genoma del hospedador. La replicación de transposones (también llamada transposición) ha sido observada directamente en muchos organismos, incluyendo levaduras, maíz, wallabies, humanos, bacterias y moscas, y recientemente los mecanismos se han comprendido bien (Li 1997, pp. 335-338; Futuyma 1998, pp. 639-641). Se conocen casos observados específicos de retrotransposición que han causado neurofibromatosis y hemofilia en humanos (Kazazian et al. 1988; Wallace et al. 1991), y cáncer, entre otras enfermedades (Deininger y Batzer 1999).
Esta sección sobre transposones, y las dos siguientes que cubren pseudogenes y retrovirus endógenos, están conceptualmente relacionadas. Las secuencias de ADN en regiones intergénicas (regiones entre genes codificadores de proteínas en genomas) incluyen muchos transposones (como LINEs y SINEs), retrovirus endógenos (como HERVs), pseudogenes y otras secuencias relacionadas como microsatélites. Muchos microsatélites están estrechamente asociados y generados por retrotransposones como LINEs y SINEs (Arcot et al. 1995; Nadir et al. 1996; Wilder y Hollocher 2001; Yandava et al. 1997). Estas secuencias intergénicas son principalmente responsables de los patrones muy específicos observados en análisis de "huellas dactilares de ADN", como los realizados en pruebas de paternidad o de hermanos. Al igual que las huellas dactilares, estas regiones intergénicas varían considerablemente entre organismos individuales y los patrones son en gran parte arbitrarios. Por ejemplo, los elementos Alu, un tipo de retrotransposón SINE, se transponen a una nueva ubicación genómica aproximadamente cada 200 nacimientos humanos (Deininger y Batzer 1999), y los Alus contribuyen a una fracción significativa de la diversidad genética humana (Batzer y Deininger 2002). En el caso del transposón L1 humano, solo uno de muchos elementos LINE humanos, una nueva retrotransposición, es albergado por alrededor de 1 de cada 20 individuos (Scaringe et al. 2001; Ostertag y Kazazian 2001). Esta es una estimación conservadora, dado que cada uno de nosotros tiene alrededor de 50 LINEs L1 competentes en retrotransposición (Brouha et al. 2003). Las regiones intergénicas del genoma, como todo el ADN, son hereditarias y existe una correlación muy fuerte entre parientes. Cuando se encuentran dos individuos que comparten patrones intergénicos específicos mucho más allá de lo esperado por el azar solo, es una evidencia muy fuerte de ascendencia común. De hecho, esta es la base científica misma detrás de las huellas dactilares de ADN.
Como se explicó anteriormente, encontrar el mismo transposón en la misma ubicación cromosómica en dos organismos diferentes es una evidencia directa fuerte de ascendencia común, ya que se insertan bastante aleatoriamente y generalmente no pueden transmitirse excepto por herencia. Además, una vez que se postula un ancestro común que contiene cierta transposición, todos los descendientes de este ancestro común también deberían contener la misma transposición. Una posible excepción es si esta transposición fuera eliminada debido a un evento de deleción raro; sin embargo, las deleciones nunca son limpias y usualmente parte de la secuencia del transposón permanece. Usando los mismos principios detrás de la huella dactilar de ADN, los biólogos han utilizado transposones, pseudogenes y retrovirus endógenos para demostrar que muchas especies están genéticamente relacionadas, como los humanos y otros primates. A continuación se dan algunos de muchos ejemplos.
Confirmación:
Una clase común de transposón es el retroelemento SINE (Li 1997, pp. 349-352). Un importante transposón SINE es el elemento Alu de 300 pb. Todos los mamíferos contienen muchos elementos Alu, incluidos los humanos, donde constituyen el 10% del genoma humano (es decir, 60 millones de bases de ADN repetitivo) (Smit 1996; Li 1997, pp. 354, 357). Las transposiciones Alu humanas muy recientes se han utilizado para elucidar migraciones humanas históricas y prehistóricas, ya que algunos individuos tienen inserciones Alu más recientes que otros individuos carecen de ellas (Novick et al. 1993; Novick et al. 1995). De hecho, se ha demostrado que las transposiciones Alu comunes son marcadores fiables de la descendencia común en casos de paternidad y en la forense criminal (Novick et al. 1993; Novick et al. 1995; Roy-Engel et al. 2001). Lo más importante es que, en el clúster de α-globina humana, hay siete elementos Alu, y cada uno de ellos se comparte con los chimpancés en exactamente las mismas siete ubicaciones (Sawada et al. 1985).
Más específicamente, se han encontrado tres transposiciones de SINEs distintas en las mismas ubicaciones cromosómicas de los cetáceos (ballenas), los hipopótamos y los rumiantes, todos los cuales están estrechamente relacionados según el árbol filogenético estándar. Sin embargo, todos los demás mamíferos, incluidos los camellos y los cerdos, carecen de estas tres transposiciones específicas (Shimamura 1997).
Más detalles y explicaciones sobre este tema pueden encontrarse en el FAQ de Errores Plagiados y Genética Molecular de Edward Max.
Falsificación Potencial:
Vea los dos de abajo, ya que los mismos principios se aplican aquí.
Predicción 4.4: Evidencia molecular - Pseudogenes redundantes
Otros ejemplos moleculares que proporcionan evidencia de la descendencia común son las curiosas secuencias de ADN conocidas como pseudogenes. Los pseudogenes están muy estrechamente relacionados con genes funcionales que codifican proteínas. La similitud involucra tanto la secuencia primaria de ADN como, a menudo, la ubicación cromosómica específica de los genes. Los contrapartes funcionales de los pseudogenes son genes normales que se transcriben en ARNm, el cual a su vez se traduce activamente en proteína funcional. En contraste, los pseudogenes tienen secuencias regulatorias defectuosas que impiden que el gen se transcriba en ARNm, o tienen codones de parada internos que evitan que se produzca la proteína funcional. En este sentido, los pseudogenes son ejemplos moleculares de estructuras vestigiales.
Sin embargo, los pseudogenes se incluyen aquí bajo una predicción separada porque muchos pseudogenes son inusuales de una manera adicional. Los vestigios morfológicos han perdido su función original, y el organismo que porta el vestigio también ha perdido esa función. En contraste, los pseudogenes han perdido su función original, pero el organismo en sí mismo puede seguir conservando esa función si porta el contraparte funcional de estos pseudogenes. Los pseudogenes que son vestigios en el sentido morfológico, como el pseudogén de síntesis de vitamina C, se consideran en predicción 2.3. El tipo restante de pseudogén, en el cual un organismo porta tanto un gen funcional como uno o más pseudogenes contraparte, se denomina a partir de ahora un "pseudogén redundante".
La mayoría de los pseudogenes son en gran medida no funcionales. Existen varias líneas de evidencia que apoyan esta conclusión. En primer lugar, la presencia o ausencia de la mayoría de los pseudogenes específicos no tiene un efecto medible en el fenotipo del organismo. En segundo lugar, existen buenos argumentos mecanísticos y genéticos que indican que los pseudogenes tienen poco, si es que tienen alguna, función. Los pseudogenes tienen secuencias complejas altamente similares o idénticas a las necesarias para la función adecuada de otras proteínas enzimáticas o estructurales. Estos genes normales se transcriben y traducen activamente en proteínas, mientras que los pseudogenes no se traducen, no se transcriben o ambas cosas. Por lo tanto, los pseudogenes no pueden realizar las funciones de las proteínas que codifican. Si los pseudogenes tienen una función, deben realizar funciones relativamente simples para las cuales la proteína que codifican no fue diseñada.
Tercero, si un pseudogén tiene poca o ninguna función, entonces la mayoría de las mutaciones en el pseudogén tendrán solo consecuencias funcionales menores, y muchas mutaciones no serán eliminadas por la selección purificadora. Por lo tanto, esperamos que los pseudogenes verdaderamente no funcionales acumulen mutaciones a la tasa de fondo de mutación. Los pseudogenes con funciones menores acumularán mutaciones cerca de la tasa de fondo. Como cabría esperar si los pseudogenes tienen poca, si es que tienen alguna, función, la mayoría de los pseudogenes acumulan mutaciones a la tasa más rápida conocida para cualquier región de ADN en genomas animales. Además, la tasa de mutación inferida para pseudogenes a partir del análisis filogenético coincide muy de cerca con las tasas medidas de mutaciones espontáneas. Para más información y referencias, consulte Predicción 5.8.
Cuarto y por último, entendemos cómo se crean pseudogenes redundantes y hemos observado la creación de nuevos pseudogenes redundantes en el laboratorio y en la naturaleza. Los pseudogenes redundantes se originan por duplicación génica y mutación subsiguiente. Muchos procesos observados son conocidos por duplicar genes, incluidos los eventos de transposición, la duplicación cromosómica y el entrecruzamiento desigual de cromosomas.
Estos hechos ofrecen un fuerte apoyo para la conclusión de que la mayoría de los pseudogenes tienen poca, si es que tienen alguna, función. Al igual que las transposiciones (véase predicción 4.3), la creación de nuevos pseudogenes redundantes por duplicación génica es un evento raro y aleatorio y, por supuesto, cualquier ADN duplicado se hereda. Por lo tanto, encontrar el mismo pseudogenio en la misma ubicación cromosómica en dos especies es una fuerte evidencia de ascendencia común.
Confirmación:
Hay muchos ejemplos de pseudogenes redundantes compartidos entre primates y humanos. Uno es el gen ψ-globina, un pseudogen de hemoglobina. Es compartido exclusivamente entre los primates, en la ubicación cromosómica exacta, con las mismas mutaciones que destruyen su función como gen codificador de proteínas (Goodman et al. 1989). Otro ejemplo es el gen de la 21-hidroxilasa de esteroides. Los humanos tienen dos copias del gen de la 21-hidroxilasa de esteroides: una funcional y un pseudogen no traducido. La inactivación del gen funcional conduce a la hiperplasia congénita de las glándulas suprarrenales (HCA, una enfermedad genética rara y grave), lo que proporciona evidencia positiva de que el pseudogen de la 21-hidroxilasa carece de su función adecuada. Tanto los chimpancés como los humanos comparten la misma delección de ocho pares de bases en este pseudogen, lo que lo hace incapaz de su función normal (Kawaguchi et al. 1992).
Falsificación Potencial:
Como se explicó anteriormente, las duplicaciones génicas observadas son eventos raros y aleatorios. Por lo tanto, es altamente improbable que otros mamíferos tengan los mismos pseudogenes redundantes en las mismas ubicaciones cromosómicas, con las mismas mutaciones que inutilizan sus funciones normales. Por ejemplo, es esencialmente imposible que los ratones porten los pseudogenes de la 21-hidroxilasa, en la misma ubicación genómica, con la misma delección de ocho pares de bases que destruye su función enzimática.
Además, una vez que un gen se duplica y las mutaciones lo convierten en un pseudogen redundante, este se hereda por todos los descendientes. Por lo tanto, una vez que se encuentran ciertos organismos que portan el mismo pseudogeno, la descendencia común exige que todos los organismos filogenéticamente intermedios también deban portar ese pseudogeno. Por ejemplo, supongamos que descubrimos que los humanos y los monos del Viejo Mundo comparten un cierto pseudogeno redundante. Según la descendencia común, todos los simios (incluidos los chimpancés, los gorilas, los orangutanes y los siamangs) necesariamente deben portar ese mismo pseudogeno redundante en la misma ubicación cromosómica. Esta conclusión se basa en la premisa de que no existen mecanismos para eliminar pseudogenes de los genomas (o que dichos mecanismos son muy ineficientes). Esto parece ser cierto para los vertebrados, pero se sabe que algunos organismos con tiempos de generación cortos, como bacterias, protistas y Drosophila, tienen mecanismos que eliminan el exceso de ADN.
Tenga en cuenta que esta confirmación y posible falsificación son independientes de si un pseudogén específico tiene una función o si es completamente no funcional, por las mismas razones explicadas en la predicción sobre vestigios morfológicos. Al igual que cualquier otro elemento genético o estructura orgánica, el oportunismo evolutivo puede tomar un pseudogén y presionarlo para que cumpla una nueva y diferente función.
Predicción 4.5: Evidencia molecular - Retrovirus endógenos
Los retrovirus endógenos proporcionan otro ejemplo de evidencia de secuencias moleculares para la descendencia común universal. Los retrovirus endógenos son restos moleculares de una infección viral parasitaria del pasado. Ocasionalmente, se encuentran copias del genoma de un retrovirus en el genoma de su hospedador, y estas copias de genes retrovirales se llaman secuencias retrovirales endógenas. Los retrovirus (como el virus del SIDA o el HTLV1, que causa una forma de leucemia) hacen una copia de ADN de su propio genoma viral y la insertan en el genoma de su hospedador. Si esto ocurre a una célula de la línea germinal (es decir, las células espermáticas o ovulares), el ADN retroviral será heredado por los descendientes del hospedador. De nuevo, este proceso es raro y bastante aleatorio, por lo que encontrar retrogenes en posiciones cromosómicas idénticas en dos especies diferentes indica un ancestro común.
Confirmación:
En los humanos, los retrovirus endógenos ocupan aproximadamente el 1% del genoma, constituyendo en total ~30.000 retrovirus diferentes incrustados en el ADN genómico de cada persona (Sverdlov 2000). Existen al menos siete casos conocidos de inserciones de retrogenes comunes entre chimpancés y humanos, y este número está seguro de crecer a medida que se secuencien los genomas de ambos organismos (Bonner et al. 1982; Dangel et al. 1995; Svensson et al. 1995; Kjellman et al. 1999; Lebedev et al. 2000; Sverdlov 2000). Figura 4.4.1 muestra un árbol filogenético de varios primates, incluidos los humanos, de un estudio reciente que identificó numerosos retrovirus endógenos compartidos en los genomas de estos primates (Lebedev et al. 2000). Las flechas designan los tiempos relativos de inserción del ADN viral en el genoma del huésped. Todos los ramificaciones después del punto de inserción (a la derecha) portan ese ADN retroviral, reflejando el hecho de que una vez que un retrovirus se ha insertado en el ADN de la línea germinal de un organismo dado, será heredado por todos los descendientes de ese organismo.
Los Felidae (es decir, los gatos) proporcionan otro ejemplo. El árbol filogenético estándar muestra que los gatos pequeños divergen más tarde que los gatos grandes. Los gatos pequeños (por ejemplo, el gato de jungla, el gato montés europeo, el gato montés africano, el gato de patas negras y el gato doméstico) comparten una inserción génica retroviral específica. En contraste, todos los demás carnívoros que han sido probados carecen de este retrogén (Futuyma 1998, pp. 293-294; Todaro et al. 1975).
Falsificación Potencial:
No tendría sentido, desde una perspectiva macroevolutiva, que ciertos otros mamíferos (por ejemplo, perros, vacas, ornitorrincos, etc.), tuvieran estos mismos retrogenes en las mismas ubicaciones cromosómicas. Por ejemplo, sería increíblemente improbable que los perros también portaran las tres inserciones HERV-K que son únicas de los humanos, como se muestra en la parte superior derecha de la Figura 4.4.1, ya que ninguno de los otros primates tiene estas secuencias retrovirales.
Referencias
Arcot, S.S., Wang, Z., Weber, J.L., Deininger, P.L., y Batzer, M.A. (1995) "Repeticiones Alu: una fuente para el origen de los microsatélites en primates." Genomics. 29: 136-144. [PubMed]
Batzer, M. A., y Deininger, P. L. (2002) "Repeticiones Alu y diversidad genómica humana." Nat Rev Genet. 3: 370. [PubMed]
Bonner, T. I., C. O'Connell, et al. (1982) "Secuencias de retrovirus endógenos clonadas del ADN humano." PNAS 79: 4709. [PubMed]
Branden, C. y Tooze, J. (1999) Introducción a la estructura de proteínas. Segunda Ed., Nueva York, Garland Publishing. [Sitio del editor]
Brouha, B., Schustak, J., Badge, R.M., Lutz-Prigge, S., Farley, A.H., Moran, J.V., Kazazian, H.H. (2003) "Los L1 calientes explican la mayor parte de la retrotransposición en la población humana." Proc Natl Acad Sci U S A. 100: 5280-5285. [Texto completo gratuito de PNAS]
Bunn, H. F., y Forget, E. G. (1986) Hemoglobina: Aspectos moleculares, genéticos y clínicos. Saunders.
Clements, J. M., O'Connell, L. I., Tsunasawa, S., y Sherman, F. (1989) "Expresión y actividad de un gen que codifica la citocromo c de rata en la levadura Saccharomyces cerevisiae." Gene 83: 1-14. [PubMed]
Dangel, A. W., B. J. Baker, et al. (1995) "El intrón 9 del gen del componente complementario C4 como marcador filogenético para primates: las repeticiones terminales largas del retrovirus endógeno ERV-K(C4) son un reloj molecular de la evolución." Immunogenetics 42: 41-52. [PubMed]
Deininger, P. L., y Batzer, M. A. (1999) "Repeticiones Alu y enfermedades humanas." Mol Genet Metab. 67: 183-193. [PubMed]
Dickerson, R. E. (1972) Scientific American. 226: 58-72.
Dickerson, R. E., y Timkovich, R. (1975) citocromo c. The Enzymes. P. D. Boyer. Nueva York, Academic Press. 11: 397-547.
Futuyma, D. (1998) Biología evolutiva. Tercera edición. Sunderland, MA, Sinauer Associates.
Goodman, M., B. F. Koop, et al. (1989) "Filogenia molecular de la familia de los simios y humanos." Genome 31(316-335). [PubMed]
Hampsey, D. M., Das, G., y Sherman F. (1986) "Sustituciones de aminoácidos en la iso-1-citocromo c de levadura." Journal of Biological Chemistry 261: 3259-71. [PubMed]
Hampsey, D. M., Das, G., y Sherman F. (1988) "Yeast iso-1-citocromo c: análisis genético de los requisitos estructurales." FEBS Letters 231: 275-83. [PubMed]
Harris, J. I., F. Sanger, et al. (1956) "Diferencias de especie en insulina." Archives of Biochemistry and Biophysics 65: 427-438.
Hickey, D. R., Jayaraman, K., Goodhue, C. T., Shah, J., Fingar, S. A., Clements, J. M., Hosokawa, Y., Tsunasawa, S., y Sherman, F. (1991) "Síntesis y expresión de genes que codifican citocromos c de atún, paloma y caballo en la levadura Saccharomyces cerevisiae." Gene 105: 73-81. [PubMed]
Kawaguchi, H., C. O'hUigin, et al. (1992) "Origen evolutivo de las mutaciones en el gen de citocromo P450c21 de los primates." American Journal of Human Genetics 50: 766-780. [PubMed]
Kazazian, H. H. (1999) "Una frecuencia estimada de mutaciones insertionales endógenas en humanos." Nat Genet. 22: 130. [PubMed]
Kazazian, H. H., C. Wong, et al. (1988) "La hemofilia A resultante de la inserción de novo de secuencias L1 representa un mecanismo novedoso para la mutación en el ser humano." Nature 332: 164. [PubMed]
Kjellman, C., H. O. Sjogren, et al. (1999) "HERV-F, un nuevo grupo de secuencias de retrovirus endógenos humanos." Journal of General Virology 80: 2383. http://vir.sgmjournals.org/cgi/content/full/80/9/2383
Koshy, T. I., Luntz, T. L., Garber, E. A., y Margoliash, E. (1992) "Expresión de citocromos c recombinantes de diversas especies en Saccharomyces cerevisiae: modificaciones postraduccionales." Protein Expr. Purif. 3: 441-52. [PubMed]
Lebedev, Y. B., Belonovitch, O. S., Zybrova, N. V, Khil, P. P., Kurdyukov, S. G., Vinogradova, T. V., Hunsmann, G., y Sverdlov, E. D. (2000) "Diferencias en inserciones de LTR de HERV-K en loci ortólogos de humanos y grandes simios." Gene 247: 265-277. [PubMed]
Lesk, Arthur M. (2001) Introducción a la arquitectura de proteínas. Oxford, Oxford University Press. [Sitio del editor]
Li, W.-H. (1997) Evolución molecular. Sunderland, MA, Sinauer Associates.
Matthews, B. W. (1996) "Análisis estructural y genético del plegamiento y la función de la lisozima T4." FASEB J. 10: 35-41. [PubMed]
McLaughlin, P. J., y Dayhoff, M. O. (1973) "Evolución de eucariotas: una perspectiva basada en datos de secuencia de citocromo c." Journal of Molecular Evolution 2(99-116).
Mohrenweiser, H. (1994) "Impacto del espectro molecular de lesiones mutacionales en las estimaciones de tasas de mutación génica germinal." Mutation Research 304: 119-137. [PubMed]
Moore, G. R., y Pettigrew, G. W. (1990) Citocromos c: Aspectos evolutivos, estructurales y fisicoquímicos. Berlín, Springer-Verlag.
Nadir, E., Margalit, H., Gallily, T., y Ben-Sasson, S. A. (1996) "Dispersión de microsatélites en el genoma humano: mecanismos evolutivos e implicaciones estructurales." Proc Natl Acad Sci U S A. 93: 6470-6475. [PubMed]
Novick, G. E., Gonzalez, T., Garrison, J., Novick, C. C., Batzer, M. A., Deininger, P. L., Herrera, R. J. (1993) "El uso de inserciones Alu polimórficas en la huella dactilar de ADN humano." EXS. 67: 283-291. [PubMed]
Novick, G. E., Novick, C. C., Yunis, J., Yunis, E., Martinez, K., Duncan, G. G., Troup, G. M., Deininger, P. L., Stoneking, M., Batzer, M. A., et al. (1995) "Inserciones Alu polimórficas específicas de humanos como marcadores para la identificación humana." Electrophoresis 16: 1596-1601. [PubMed]
Ostertag, E. M., y Kazazian, H. H. (2001) "Biología de los retrotransposones L1 de mamíferos." Annu Rev Genet. 35: 501-538. [PubMed]
Ptitsyn, O. B. (1998) "Plegamiento de proteínas y evolución de proteínas: núcleo de plegamiento común en diferentes subfamilias de citocromos c-tipo." Journal of Molecular Biology 278: 655. [PubMed]
Roy-Engel, A. M., Carroll, M. L., Vogel, E., Garber, R. K., Nguyen, S. V., Salem, A. H., Batzer, M. A., y Deininger, P. L. (2001) "Polimorfismos de inserción Alu para el estudio de la diversidad genómica humana." Genetics 159: 279-290. http://www.genetics.org/cgi/content/full/159/1/279
Sawada, I., C. Willard, et al. (1985) "Evolución de los repeticiones de la familia Alu desde la divergencia del humano y el chimpancé." Journal of Molecular Evolution 22(316). [PubMed]
Li, X., Scaringe, W. A., Hill, K. A., Roberts, S., Mengos, A., Careri, D., Pinto, M. T., Kasper, C. K., y Sommer, S. S. (2001) "Frecuencia de eventos recientes de retrotransposición en el gen del factor IX humano." Hum Mutat. 17: 511-519. [PubMed]
'Scarpulla, R. C., y Nye, S. H. (1986) "Expresión funcional de la citocromo c de rata en Saccharomyces cerevisiae." Proc Natl Acad Sci 83: 6352-6. [PubMed]
Shimamura, M., et al. (1997) "Evidencia molecular de retrotransposones que indica que las ballenas forman un clado dentro de los ungulados de pezuñas pares." Nature 388: 666. [PubMed]
Smit, A. F. A. (1996) "El origen de los repeticiones dispersas en el genoma humano." Current Opinion in Genetics and Development 6: 743-748. [PubMed]
Stewart, C. B. y Disotell, T. R. (1998) "Evolución de los primates: dentro y fuera de África." Current Biology 8: R582-588. [PubMed]
Svensson, A. C., N. Setterblad, et al. (1995) "Los genes DRB de primates de los haplotipos DR3 y DR8 contienen elementos LTR de ERV9 en posiciones idénticas." Immunogenetics 41: 74. [PubMed]
Sverdlov, E. D. (2000) "Retrovirus y evolución de los primates." BioEssays 22: 161-171. [PubMed]
Tanaka, Y., Ashikari, T., Shibano, Y., Amachi, T., Yoshizumi, H., y Matsubara, H. (1988a) "Estudios de sustitución de aminoácidos de la citocromo c humana mediante un sistema de complementación utilizando levadura deficiente en CYC1." J Biochem (Tokyo) Sep;104: 477-80. [PubMed]
Tanaka, Y., Ashikari, T., Shibano, Y., Amachi, T., Yoshizumi, H., y Matsubara, H. (1988b) "Construcción de un gen de citocromo c humano y su expresión funcional en Saccharomyces cerevisiae." J Biochem (Tokyo) 103: 954-61. [PubMed]
Todaro, G.J., Benveniste, R.E., Callahan, R., Lieber, M.M., y Sherr, C.J. (1975) "Virus tipo C endógenos de primates y felinos." Cold Spring Harb Symp Quant Biol. 39 Pt 2:1159-1168.[PubMed]
Voet, D., y Voet, J. (1995) Bioquímica. Nueva York, John Wiley and Sons.
Wallace, C. J., y Tanaka, Y. (1994) "Mejorar la función de la citocromo c mediante ingeniería de proteínas: estudios de mutantes dirigidos a sitios de la proteína humana." J. Biochem. (Tokyo) 115: 693-700. [PubMed]
Wallace, M. R., L. B. Andersen, et al. (1991) "Una inserción Alu de novo da lugar a la neurofibromatosis tipo 1." Nature 353: 864-866. [PubMed]
Wilder, J., y Hollocher, H. (2001) "Elementos móviles y el origen de los microsatélites en dípteros." Mol Biol Evol. 18: 384-392. [PubMed]
Yandava, C. N., Gastier, J. M., Pulido, J. C., Brody, T., Sheffield, V., Murray, J., Buetow, K., y Duyk, G. M. (1997) "Caracterización de repeticiones Alu asociadas con microsatélites de repeticiones trinucleótidas y tetranucleótidas." Genome Res. 7: 716-724.
Yockey, H. P. (1992) Teoría de la información y biología molecular. Nueva York, Cambridge University Press.