<--
Anterior
-->
Siguiente

Introducción a la filogenética

Introducción a la filogenética

La descendencia de un ancestro común implica un proceso de ramificación y divergencia, común a cualquier proceso genealógico. Las genealogías pueden ilustrarse gráficamente mediante diagramas de tipo árbol, y es por ello que los biólogos suelen referirse a la genealogía de las especies como el "árbol de la vida". En la teoría evolutiva, diagramas como estos se conocen como árboles filogenéticos o filogenias. Una de las predicciones más importantes, poderosas y básicas derivadas de la hipótesis de la descendencia común universal es la existencia de un árbol filogenético único, histórico y universal para las especies que se reproducen principalmente mediante mecanismos genéticos verticales (otro tipo de herencia, transferencia horizontal de genes, puede complicar las filogenias e incluso el concepto de especie, véase Cautelas a continuación). Un dominio cabal de la filogenética es necesario para comprender las deducciones macroevolutivas. El modelo de consenso que los biólogos evolutivos utilizan para representar las ramas bien soportadas del árbol universal de la vida lo referiré como el "árbol filogenético estándar". Figura 1 muestra un ejemplo simplificado de algunas de las ramas más familiares del árbol filogenético universal.

En la siguiente sección se presenta una breve descripción de los árboles filogenéticos y de cómo los biólogos los determinan. Esta descripción se vuelve cada vez más técnica a medida que avanza. El material hasta el encabezado de parsimonia máxima es esencial para comprender el resto de este FAQ. La discusión filogenética restante se incluye por completitud y para permitir al lector interesado la oportunidad de profundizar tanto como desee.

[Figura 1: Un Árbol Filogenético de Consenso de Toda la Vida]
Figura 1. El Árbol Filogenético de Consenso de Toda la Vida.

Los árboles filogenéticos representan las relaciones evolutivas

[Árboles con fines ilustrativos]
Figura 2: Las partes de un árbol filogenético. Los taxones en este árbol son "humano", "ratón" y "mosca" (todos los cuales han sido secuenciados sus genomas completos). Se indican varios nodos, como el nodo del taxón "mosca" y un nodo interno que representa al ancestro común de los ratones y los humanos. La raíz se indica a la izquierda, representando al ancestro común de los tres taxones listados.

La filogenética es la disciplina científica dedicada a describir y reconstruir los patrones de relaciones genéticas entre especies y entre taxones superiores. Los árboles filogenéticos son una forma conveniente de representar visualmente la historia evolutiva de la vida. Estos diagramas ilustran las relaciones inferidas entre los organismos y el orden de los eventos de especiación que condujeron desde ancestros comunes anteriores hasta sus descendientes diversificados.

Un árbol filogenético tiene varias partes, mostradas en la Figura 2. Los nodos representan unidades taxonómicas, como un organismo, una especie, una población, un ancestro común, o incluso un género entero u otro grupo taxonómico superior. Las ramas conectan los nodos de manera única y representan las relaciones genéticas. El patrón específico de ramificación determina la topología del árbol. Los árboles escalados tienen longitudes de ramas que son proporcionales a alguna propiedad biológica importante, como el número de cambios de aminoácidos entre nodos en una filogenia de proteínas (véase la Figura 3). Los árboles también pueden estar enraizados o sin enraizar. Los árboles enraizados tienen un nodo especial, conocido como la raíz, que representa un ancestro común de todos los taxones mostrados en el árbol. Los árboles enraizados son, por lo tanto, direccionales, ya que todos los taxones evolucionaron a partir de la raíz. Los árboles sin enraizar ilustran únicamente las relaciones, sin referencia a ancestros comunes.

[Árboles con fines ilustrativos]
Figura 3: Varias representaciones de un árbol filogenético de 5 taxones. Cada uno de estos árboles representa los mismos cinco taxones modernos: A, B, C, D y E. El árbol de la parte superior izquierda está enraizado y escalado según la distancia evolutiva. La raíz está a la izquierda. Los taxones C y E han experimentado ambos cambios relativamente grandes desde la divergencia de la raíz, en contraste con los taxones B y D. El árbol de la parte inferior izquierda está enraizado y no está escalado. Aquí, las longitudes de las ramas son indicadores relativos del tiempo transcurrido desde la divergencia. El árbol de la derecha está escalado pero no enraizado. En este árbol, aunque la raíz es desconocida, las relaciones entre los taxones son idénticas a las mostradas en los otros dos árboles.

Un error común es pensar que algunas especies modernas son ancestrales de otras especies modernas. Sin embargo, todas las especies modernas se encuentran en las puntas de las ramas del árbol, y una especie moderna es tan "evolucionada" como cualquier otra. Es decir, aunque se cree que los mamíferos evolucionaron desde algo que se asemejaba a los reptiles modernos, los reptiles modernos son tan "viejos" evolutivamente como los mamíferos modernos (Brooks 1991, p.68; Futuyma 1998, p.113).

Métodos para determinar árboles filogenéticos: Cladística y filogenética numérica

De toda ave limpia comeréis.
Pero estas son las que no comeréis:

El águila, y la gaviota, y la alca,
Y el milano, y el buitre, y el buitre después de su especie,
Y todo cuervo después de su especie,
Y la lechuza, y el búho, y el cuco, y el halcón después de su especie,
La lechuza pequeña, y la lechuza grande, y el cisne,
Y el pelícano, y el águila pescadora, y el cormorán,
Y el cigüeña, y la garza después de su especie, y el chotacabras,
y el murciélago
.

Deuteronomio 14:11-18, KJV

Si las especies modernas han descendido de especies ancestrales de esta manera arbolada y ramificada, debería ser posible inferir el árbol histórico verdadero que traza sus rutas de descendencia. Las filogenias han sido inferidas por biólogos desde que Darwin propuso por primera vez que la vida estaba unida por la descendencia común hace más de 140 años. Las metodologías algorítmicas rigurosas para inferir árboles filogenéticos han estado en uso durante más de los últimos 50 años.

En 1950, el taxónomo Willi Hennig propuso un método para determinar árboles filogenéticos basándose en la morfología, clasificando los organismos según sus caracteres derivados compartidos, que se denominan sinapomorfías (Hennig 1966). Este método, ahora llamado cladística, no asume parentesco genealógico a priori, ya que puede utilizarse para clasificar cualquier cosa en principio, incluso cosas como libros, coches o sillas que claramente no están relacionadas genealógicamente en un sentido biológico (Kitching et al. 1998, Cap. 1, p. 26; ). Sin embargo, utilizando firmes argumentos evolutivos, Hennig justificó este método como la técnica de clasificación más adecuada para estimar las relaciones evolutivas generadas por la descendencia lineal. De hecho, el método cladístico de Hennig no es más que una formalización de los métodos que los biólogos sistemáticos habían estado utilizando de forma intuitiva desde que Linneo escribió Systema Naturae. Los biólogos de hoy en día construyen sus árboles filogenéticos basándose en el método de Hennig, y debido a la cladística, estos árboles filogenéticos son reproducibles e independientemente comprobables (Brooks 1991, Cap. 2; Kitching et al. 1998).

Jerga Filogenética

apomorfía: Un carácter derivado de un grupo de organismos, no compartido con los ancestros de un grupo de organismos. Las apomorfías son únicas para el grupo y, por lo tanto, definen al grupo.

bootstrap: Un procedimiento estadístico técnico para estimar la variabilidad de una medición. En filogenética, el bootstrap implica la producción de un nuevo conjunto de datos pseudo mediante la extracción aleatoria de puntos de datos del conjunto de datos original. Para cada conjunto de datos pseudo, se infiere una nueva filogenia. Las rondas de esto proporcionan una estimación de las regiones bien y mal soportadas de la filogenia original.

carácter: Una característica observable de un organismo útil para distinguirlo de otro. Por ejemplo, un nucleótido en una secuencia de ADN, un aminoácido en una secuencia de proteínas, o caracteres morfológicos como el pelo, las plumas, o la presencia o ausencia de ciertos huesos.

cladística: Una clase de técnicas filogenéticas que construyen árboles (cladogramas) agrupando taxones en jerarquías anidadas según caracteres derivados compartidos (sinapomorfías). La cladística está estrechamente asociada con el criterio de parsimonia.

cladograma: Una clasificación jerárquica de taxones representada como un árbol. Los cladogramas formalmente son independientes de la teoría evolutiva, aunque en la práctica suelen interpretarse como filogenias.

carácter derivado: Véase apomorfía.

mínimos cuadrados: Un criterio de matriz de distancias filogenéticas. El mejor árbol es aquel con la menor diferencia al cuadrado entre las distancias observadas por pares y las distancias calculadas a partir del árbol inferido. Tiene una fuerte justificación estadística, ya que se basa en la técnica estadística común de mínimos cuadrados lineales. Los mínimos cuadrados están garantizados por el teorema de Gauss-Markov para converger en la respuesta correcta a medida que se incluye más datos en el análisis si se utiliza una métrica de distancia adecuada, es decir, los mínimos cuadrados son estadísticamente consistentes. Las versiones ponderadas corrigen la variabilidad aleatoria y el sesgo debido a longitudes de rama más largas.

máxima verosimilitud: Un criterio cladístico para inferir árboles con conflicto de caracteres. El mejor árbol y el modelo evolutivo maximizan la probabilidad de los datos observados. La máxima verosimilitud tiene una fuerte base estadística. Dado un modelo correcto de cambio evolutivo, está garantizado que sea estadísticamente consistente, es decir, convergerá en el árbol correcto a medida que se añaden más datos. La máxima verosimilitud generalmente realiza lo mejor de todos los métodos en simulaciones, pero es muy costosa computacionalmente. A diferencia de la parsimonia, se basa explícitamente en un modelo evolutivo específico.

evolución mínima: Un criterio de matriz de distancias filogenéticas. El mejor árbol es aquel en el que la suma de las longitudes de las ramas es la más pequeña.

unión de vecinos: Un algoritmo de matriz de distancias para inferir árboles. Es una aproximación a los métodos de mínimos cuadrados y evolución mínima.

nodo: Un punto en una filogenia donde se encuentran o terminan las ramas. Los nodos en la punta o extremo de una rama representan taxones. En árboles enraizados, los nodos internos representan ancestros comunes.

parsimonia: Un criterio filogenético para inferir árboles con conflicto de caracteres. La parsimonia requiere que el mejor árbol sea aquel con el menor conflicto de caracteres. Se sabe que produce la filogenia incorrecta en ciertos casos, como cuando las tasas evolutivas son altas o ciertas ramas son largas.

fenética: A veces conocida como taxonomía numérica, los métodos fenéticos clasifican y agrupan organismos basándose en la similitud general, usualmente sin referencia explícita a sus relaciones filogenéticas.

filogenia: Un diagrama ramificado, en forma de árbol, que representa las relaciones genealógicas entre taxones. Las filogenias enraizadas especifican ancestros comunes y tienen un eje temporal.

plesiomorfía: Un carácter primitivo, compartido con los ancestros de un grupo de organismos. Dado que es común a más que solo el grupo considerado, una plesiomorfía no define al grupo.

carácter primitivo: Véase plesiomorfía.

raíz: Un ancestro común de todos los taxones en una filogenia. Cronológicamente, la raíz es el nodo más antiguo.

sinapomorfía: Un carácter derivado que se comparte entre dos grupos de organismos.

UPGMA: Un método de agrupamiento basado en matriz de distancias para construir árboles. Rara vez utilizado, es muy rápido pero asume tasas evolutivas constantes a lo largo del árbol (una propiedad llamada ultrametricidad).

Los métodos cladísticos suelen contrastarse con los métodos "fenéticos". Los métodos fenéticos agrupan y clasifican las especies basándose en el número de caracteres idénticos que comparten, es decir, basándose en la similitud general. Tales métodos pueden encontrar dificultades con organismos como los delfines y los atunes, que presentan muchas similitudes superficiales. Estos organismos, sin embargo, no están estrechamente relacionados y no deberían clasificarse juntos si se espera que la clasificación refleje la filogenia.

Por el contrario, las filogenias basadas en la cladística agrupan los taxones en jerarquías anidadas, y se determinan utilizando únicamente caracteres derivados compartidos de los organismos, no caracteres primitivos compartidos (Brooks 1991, pp. 35-36; Kitching et al. 1998, Cap. 1; Maddison y Maddison 1992, p. 49). En el jerga técnica filogenética, los caracteres primitivos se llaman plesiomorfías, y los caracteres derivados se llaman apomorfías. En la cladística, las especies relacionadas se agrupan juntas porque comparten caracteres derivados (es decir, apomorfías) que surgieron en un ancestro común del grupo, pero que no estaban presentes en otros ancestros anteriores del grupo. Estos rasgos compartidos y derivados se llaman sinapomorfías. Primitivo y derivado son, por lo tanto, términos relativos, dependiendo del grupo específico que se esté considerando. Por ejemplo, las columnas vertebrales son caracteres primitivos de los vertebrados, mientras que el pelo es un carácter derivado particular de los vertebrados mamíferos. Sin embargo, al considerar solo a los mamíferos, el pelo es primitivo, mientras que un pulgar oponible es derivado.

En los análisis filogenéticos de la vida real, los caracteres derivados compartidos pueden estar en conflicto con otros caracteres derivados. Por lo tanto, se requieren métodos objetivos para resolver este conflicto de caracteres (Kitching et al. 1998, Cap. 1; Maddison y Maddison 1992, p. 49). Por ejemplo, las alas son un carácter derivado de los pájaros y de los murciélagos. Basándose únicamente en este carácter, el método cladístico agruparía a los murciélagos y a los pájaros juntos, que es cómo el autor de Deuteronomio los agrupó en la cita bíblica anterior. Sin embargo, otros caracteres derivados compartidos indican que los murciélagos deberían agruparse con los mamíferos alados, y que los pájaros deberían agruparse con los dinosaurios alados.

En los últimos 40 años, se han diseñado varios métodos algorítmicos para resolver tales casos de conflicto de caracteres e inferir árboles filogenéticos correctos (Felsenstein 2004, Cap. 10). Las siguientes secciones describen algunos de los métodos más exitosos de estos. Cada método intenta inferir una filogenia a partir de los datos existentes, y cada uno tiene sus respectivas fortalezas y debilidades. Años de pruebas empíricas y simulaciones han demostrado que, en general, estos algoritmos diferentes, cada uno con supuestos subyacentes muy distintos, convergen en árboles altamente similares cuando se juzgan estadísticamente (Li 1997, Capítulos 5 y 6; Nei y Kumar 2000, Capítulos 6, 7 y 8).

Parcimonia máxima

Uno de los métodos más antiguos, básicos y frecuentemente utilizados para la resolución de caracteres es el criterio de parsimonia máxima (MP) (Edwards y Cavalli-Sforza 1963; Kitching et al. 1998). El criterio de parsimonia establece que el mejor árbol que describe los datos es aquel que minimiza la cantidad de conflicto de caracteres. Por ejemplo, considere un conjunto de datos que contiene 10 caracteres derivados compartidos que agrupan a los murciélagos con los simios (en lugar de con las aves), y con un carácter que agrupa a los murciélagos con las aves (en lugar de los simios). Según el criterio de parsimonia, se debe preferir el árbol que da el primer agrupamiento.

Actualmente, la parsimonia es el método de elección para reconstruir árboles morfológicos (Kitching et al. 1998). Es muy rápida computacionalmente y puede ser robusta frente a diferencias en la tasa de evolución entre caracteres. Sin embargo, la máxima parsimonia encuentra consistentemente la filogenia correcta solo cuando esperamos que el conflicto de caracteres sea bajo o que la evolución proceda de manera parsimoniosa (Felsenstein 2004, Cap. 9; Kitching et al. 1998, p. 17). Si las tasas de evolución son lentas y las ramas son cortas, el conflicto de caracteres será bajo y la parsimonia funcionará bien (Felsenstein 2004, Cap. 9; Felsenstein 1981a; Li 1997, p. 128). Si el conflicto de caracteres es moderado o alto en la realidad, entonces es muy improbable que el árbol verdadero tenga la menor cantidad de conflicto de caracteres. Cuando las tasas de evolución son altas, o cuando algunas ramas son muy largas, o cuando el número de estados de caracteres posibles está limitado, el conflicto de caracteres puede ser común. Esto es a menudo cierto para las secuencias de nucleótidos, que tienen solo cuatro estados de caracteres posibles (A, C, T o G). En casos como estos, otros métodos filogenéticos pueden ser más precisos que la parsimonia.

Máxima verosimilitud

Otro criterio filogenético comúnmente utilizado es la máxima verosimilitud (ML), una técnica estadística efectiva y robusta ahora empleada en todos los campos científicos (Edwards y Cavalli-Sforza 1964; Felsenstein 1981b; Fisher 1912). Muchos estimadores estadísticos bien conocidos son en realidad estimadores de máxima verosimilitud. Por ejemplo, la media muestral común como estimación de la media de una distribución gaussiana y el ajuste de mínimos cuadrados de una línea a un conjunto de puntos son ambos estimadores de máxima verosimilitud. Utilizando ML, se pueden inferir tasas de evolución directamente de los datos y determinar el árbol que mejor describe esos datos dados las tasas inferidas. En otras palabras, ML encuentra el árbol y los parámetros evolutivos que producen los datos observados con la mayor probabilidad. A diferencia de la parsimonia, ML encuentra árboles con la cantidad esperada de conflicto de caracteres dados las tasas evolutivas inferidas de los datos, incluso si esas tasas son altas. ML es un método intensivo en cómputo que puede ser muy laborioso en términos de tiempo.

Métodos de distancia

Debido a su velocidad computacional, los métodos de matriz de distancias son algunos de los más populares para inferir filogenias (Nei y Kumar 2000, Cap. 6). Todos los métodos de distancia transforman los datos de caracteres en una matriz de distancias entre pares, una distancia para cada posible emparejamiento de los taxones bajo estudio. Los métodos de matriz de distancias no son cladísticos, ya que la información sobre caracteres derivados y primitivos se ha perdido durante esta transformación. Los métodos de distancia abordan la inferencia filogenética estrictamente como un problema estadístico, y se utilizan casi exclusivamente con datos moleculares. Aunque no son cladísticos, los métodos de distancia pueden considerarse aproximaciones a los métodos cladísticos, y varios de estos métodos están garantizados matemáticamente para converger en el árbol correcto a medida que se incluyen más datos.

La métrica de distancia más simple es simplemente el número de diferencias de caracteres entre dos taxones, como el número de diferencias de nucleótidos entre dos secuencias de ADN. Existen muchas otras formas de calcular distancias de secuencias moleculares, y la mayoría intenta corregir la posibilidad de múltiples cambios en un solo sitio durante la evolución. Los métodos para calcular distancias entre secuencias suelen nombrarse por sus autores, como los de dos parámetros de Kimura (K2P), Jukes-Cantor (JC), Tamura-Nei (TN), Hasegawa, Kishino y Yano (HKY), y Felsenstein 1984 (F84). Otras métricas de distancia importantes son General Time Reversible (GTR) y LogDet (Felsenstein 2004, pp. Capítulos 11 y 13; Nei y Kumar 2000, Capítulos 2 y 3; Li 1997, Capítulos 3 y 4).

Una vez que se dispone de una matriz de distancias para los taxones en cuestión, existen varios criterios y algoritmos basados en distancias que pueden utilizarse para estimar el árbol filogenético a partir de los datos (Felsenstein 2004, Cap. 11; Li 1997, Cap. 5). El criterio de evolución mínima (ME) encuentra el árbol en el que la suma de todas las longitudes de rama es la más pequeña. Los criterios de mínimos cuadrados ponderados y no ponderados calculan la discrepancia entre las distancias observadas por pares y las distancias por pares calculadas a partir de las longitudes de rama del árbol inferido. Los mínimos cuadrados luego encuentran el árbol que minimiza el cuadrado de esa discrepancia. Los métodos de mínimos cuadrados son algunos de los más estadísticamente justificados y convergerán hacia el árbol correcto a medida que se incluyan más datos en el análisis (dado un métrico de distancia matemáticamente adecuado). El algoritmo de unión de vecinos (NJ) es extremadamente rápido y es una aproximación de los métodos de mínimos cuadrados y evolución mínima. Si la matriz de distancias es una descripción exacta del árbol verdadero, entonces la unión de vecinos garantiza reconstruir el árbol correcto. El algoritmo de agrupamiento UPGMA (un acrónimo confuso) también es extremadamente rápido, pero se basa en la improbable suposición de que las tasas evolutivas son iguales en todos los linajes. El UPGMA rara vez se utiliza hoy en día, excepto como herramienta de enseñanza.

Soporte estadístico para la filogenia

Una filogenia es la mejor aproximación del árbol histórico correcto utilizando un método filogenético dado. Algunos análisis filogenéticos están fuertemente respaldados por los datos, otros están débilmente respaldados, y diferentes partes de un árbol pueden tener más soporte que otras. Al comparar dos filogenias determinadas independientemente, se debe tener en cuenta el soporte estadístico asignado a cada rama de las filogenias. Al igual que en todos los análisis científicos, los detalles de un árbol filogenético pueden cambiar a medida que se incorporan nueva información y datos (Maddison y Maddison 1992, pp. 112-123; Li 1997, pp. 36-146; Felsenstein 1985; Futuyma 1998, p. 99; Hillis y Bull 1993; Huelsenbeck et al. 2001; Swofford et al. 1996, pp. 504-509).

Bootstrapping es el método estadístico más popular para evaluar la fiabilidad de las ramas en un árbol filogenético (Felsenstein 1985). El bootstrapping es una técnica estadística para estimar empíricamente la variabilidad de un parámetro (Efron 1979; Efron y Gong 1983). En un análisis de bootstrapping, se crea un conjunto de datos ficticio mediante la muestreo aleatorio de datos del conjunto real hasta crear un nuevo conjunto de datos del mismo tamaño. Este proceso se realiza repetidamente (cientos o miles de veces), y el parámetro de interés se estima desde cada conjunto de datos ficticio. La variabilidad de estas estimaciones de bootstrapping es en sí misma una estimación de la variabilidad del parámetro de interés.

En filogenética, una nueva filogenia se infiere de cada conjunto de datos bootstrap (Felsenstein 1985). Estas filogenias bootstrap probablemente tendrán topologías diferentes. A partir de estos árboles bootstrap diferentes, se puede estimar la variabilidad en el árbol inferido. Las partes de los árboles bootstrap que son comunes se atribuye una alta confianza, mientras que las partes que varían extensamente se asignan una baja confianza. Los árboles construidos a partir de datos aleatorios no resultan en árboles o ramas de alta confianza cuando se realizan bootstrap. Por lo tanto, el bootstrap proporciona una forma de probar si un árbol filogenético es genuino.

¿La inferencia filogenética encuentra los árboles correctos?

Para establecer su validez en la determinación confiable de filogenias, los métodos filogenéticos han sido probados empíricamente en casos donde la verdadera filogenia es conocida con certeza, ya que la verdadera filogenia fue observada directamente.

  • El bacteriófago T7 se propagó y se dividió secuencialmente en presencia de un mutágeno, donde cada linaje fue rastreado. De los 135.135 árboles filogenéticos posibles, el árbol verdadero fue determinado correctamente por los métodos filogenéticos en un análisis a ciegas. Se utilizaron cinco métodos filogenéticos diferentes de forma independiente, y cada uno eligió el árbol correcto (Hillis et al.1992 ).

  • En otro estudio, se utilizaron 24 cepas de ratones en las que las relaciones genealógicas eran conocidas. El análisis cladístico reprodujo casi perfectamente la filogenia conocida de las 24 cepas (Atchely y Fitch 1991).

  • Bush et al. utilizaron el análisis filogenético para predecir retrospectivamente el árbol evolutivo correcto del virus de la influenza A humana el 83% de las veces para las temporadas de gripe que abarcaron de 1983 a 1994.

  • En 1998, los investigadores utilizaron 111 secuencias modernas de VIH-1 (virus del SIDA) en un análisis filogenético para predecir la secuencia de nucleótidos del ancestro viral del cual todos eran descendientes. La secuencia del ancestro predicha coincidió estrechamente, con una alta probabilidad estadística, con una secuencia ancestral real de VIH encontrada en una muestra de plasma africana seropositiva al VIH recolectada y archivada en el Congo Belga en 1959 (Zhu et al.1998 ).

  • En la última década, los análisis filogenéticos han desempeñado un papel significativo en condenas exitosas en varios casos penales (Albert et al. 1994; Arnold et al. 1995; Birch et al. 2000; Blanchard et al. 1998; Goujon et al. 2000; Holmes et al. 1993; Machuca et al. 2001; Ou et al. 1992; Veenstra et al. 1995; Vogel 1997; Yirrell et al. 1997), y las reconstrucciones filogenéticas ahora han sido admitidas como testimonio legal pericial en los Estados Unidos (97-KK- 2220 Estado de Luisiana v. Richard J. Schmidt [PDF]). La prueba legal en los EE. UU. para la admisibilidad del testimonio pericial son las directrices Daubert (Caso de la Corte Suprema de los EE. UU. Daubert v. Merrell Dow Pharmaceuticals, Inc., 509 U.S. 579, 587-89, 113 S. Ct. 2786, 2794, 125 L. Ed. 2d 469, 1993). Las directrices Daubert establecen que un tribunal de primera instancia debe considerar cinco factores al determinar "si la razón o metodología subyacente del testimonio es científicamente válida": (1) si la teoría o técnica en cuestión puede ser y ha sido sometida a prueba; (2) si ha sido sometida a revisión por pares y publicación; (3) su tasa de error conocida o potencial; (4) la existencia y mantenimiento de estándares que controlen su operación; y (5) si ha atraído una aceptación generalizada dentro de la comunidad científica relevante (citado casi textualmente). El análisis filogenético ha cumplido oficialmente con estos requisitos legales.

Precauciones con la inferencia filogenética

Al igual que con cualquier método científico investigativo, deben cumplirse ciertas condiciones para que los resultados sean fiables. Un premisa común de muchos métodos filogenéticos moleculares es que los genes se transmiten mediante herencia vertical y lineal, es decir, de progenitor a descendiente. Si esta premisa se viola, los árboles genéticos no recapitularán la filogenia orgánica o de especies. Esta suposición se viola en casos de transferencia horizontal, por ejemplo, en la transformación de una bacteria por un plásmido de ADN, o en la inserción de retrovirus en el genoma del hospedador. Durante la evolución temprana de la vida, antes del advenimiento de organismos multicelulares, la transferencia horizontal probablemente fue muy frecuente (como lo es hoy en la evolución observada de bacterias y otros organismos unicelulares). Por lo tanto, es cuestionable si los métodos filogenéticos moleculares son aplicables, incluso en principio, para resolver los patrones evolutivos de muchos microorganismos, incluida la evolución temprana cerca del ancestro común más reciente de todos los organismos vivos (Doolittle 1999; Doolittle 2000; Woese 1998).

La lista a continuación proporciona algunas de las advertencias más importantes que los científicos deben tener en cuenta al interpretar los resultados de un análisis filogenético (Swofford 1996, pp. 493-509). En general, la contribución de cada una de estas preocupaciones se "promediará" al incluir más caracteres independientes en el análisis filogenético, como más genes y secuencias más largas.

  • Caracteres correlacionados: cada carácter utilizado en el análisis debe ser genéticamente independiente. Los caracteres que están fuertemente correlacionados funcionalmente deben considerarse mejor como un único carácter. Existen pruebas estadísticas que pueden ayudar a controlar la correlación de caracteres no reconocida, como el bloque bootstrap y el jackknife.

  • Convergencia estructural verdadera: las estructuras que han experimentado evolución convergente pueden resultar artificialmente en topologías de árbol incorrectas. Incluir más caracteres en el análisis también ayuda a superar los efectos convergentes.

  • Inversiones de caracteres: los caracteres que regresan a un estado ancestral plantean un desafío similar a la convergencia. Dado que el ADN y el ARN solo tienen cuatro estados de carácter diferentes, son especialmente propensos a inversiones durante la evolución.

  • Caracteres perdidos: las linajes que han perdido caracteres (como las ballenas y sus extremidades posteriores) también pueden plantear problemas cladísticos. A menudo, si un análisis cladístico indica fuertemente que un cierto carácter se ha perdido durante la evolución, lo mejor es omitir este carácter en análisis de mayor resolución de dicho linaje.

  • Caracteres faltantes: los fósiles incompletos son problemáticos, ya que pueden carecer de caracteres importantes. Los mejores fósiles son la solución.

  • Número intratable de árboles filogenéticos posibles: por razones computacionales, este es uno de los desafíos filogenéticos más importantes que superar. El objetivo de una reconstrucción filogenética es determinar el mejor árbol que los datos apoyen. Para un análisis de solo cinco especies, hay 15 árboles posibles. Para un análisis de 50 especies, hay más de 1074 árboles posibles que deben ser buscados, lo cual es computacionalmente imposible. Este problema no es tan grave como parece a primera vista, ya que reducir el número de árboles razonables puede ser trivial en muchos casos (por ejemplo, utilizando el algoritmo branch and bound). Se han desarrollado varios métodos para resolver este problema con éxito, y en última instancia, los ordenadores más potentes son mejores.

  • Supuestos de Máxima Verosimilitud: el método de máxima verosimilitud hace supuestos explícitos sobre el patrón de sustituciones de nucleótidos basándose en un modelo dado de evolución de nucleótidos. Estos supuestos se basan en una sólida base estadística; sin embargo, la validez de los modelos debe considerarse al evaluar los resultados.

  • Atracción de ramas largas: los linajes que divergieron relativamente hace mucho tiempo tenderán a "agruparse" juntos en una reconstrucción filogenética bajo las condiciones apropiadas. Las razones matemáticas son algo complicadas, pero el uso de genes que evolucionan más lentamente (o regiones de genes) ayuda a superar el problema.

  • Variación de tasas entre linajes: las tasas de sustitución de nucleótidos pueden diferir entre linajes; esto puede contribuir a la atracción de ramas largas y resultar en topologías de árbol incorrectas. Sin embargo, los métodos de máxima verosimilitud y mínimos cuadrados son particularmente útiles aquí.

  • Variación de tasas dentro de un solo gen: las tasas de sustitución de nucleótidos pueden variar a lo largo de la longitud de un solo gen; esto también exacerba la atracción de ramas largas.

  • Los árboles de genes no son equivalentes a los árboles de especies: desde la genética mendeliana simple sabemos que los genes se segregan individualmente, y que a lo largo del tiempo los genes individuales no necesariamente siguen la genealogía de los organismos (Avise y Wollenberg 1997; Fitch 1970; Hudson 1992; Nichols 2001; Wu 1991). Un ejemplo obvio es el hecho de que aunque usted pueda tener ojos marrones, su hijo puede tener los genes para ojos azules, pero eso no significa que su hijo no sea su descendiente, ni que sus hijos de ojos marrones estén más estrechamente relacionados con usted que sus hijos de ojos azules. Incluir múltiples genes en el análisis es una solución a este enigma. Basándose en cálculos genéticos simples, un análisis de más de cinco genes es generalmente necesario para reconstruir con precisión una filogenia de especies (Wu 1991).

Para obtener más información sobre la cladística, puede consultar uno de varios excelentes recursos en línea sobre cladística, como la Introducción a la Filogenética de SASB, el Laboratorio de Filogenética de la Biología Integrativa de la UC Berkeley, o la excelente Introducción al Análisis Cladístico de Diana Lipscomb, disponible para descargar en formato PDF de Adobe Acrobat. Una buena y concisa descripción para el público general puede encontrarse en el Journal of Avocational Paleontology. Finalmente, puede leer la explicación de Charles Darwin en The Origin of Species sobre el "Árbol de la Vida", donde se introdujo por primera vez el concepto de árbol filogenético.

<--
Anterior
-->
Siguiente

Referencias

Albert, J., Wahlberg, J., Leitner, T., Escanilla, D. y Uhlen, M. (1994) "Análisis de un caso de violación mediante secuenciación directa de los genes pol y gag del virus de la inmunodeficiencia humana tipo 1." J Virol 68: 5918-24. [PubMed]

Arnold, C., Balfe, P. y Clewley, J. P. (1995) "Distancias entre secuencias de genes env del VIH-1 en individuos infectados a partir de la misma fuente: implicaciones para la investigación de posibles eventos de transmisión." Virology 211: 198-203. [PubMed]

Atchely, W. R., y Fitch, W. M. (1991) "Árboles genéticos y el origen de cepas endogámicas de ratones." Science 254: 554-558. [PubMed]

Avise, J. C., y Wollenberg, K. (1997) "Filogenia y el origen de las especies." PNAS 94: 7748-7755. http://www.pnas.org/cgi/ content/full/94/15/7748

Birch, C. J., McCaw, R. F., Bulach, D. M., Revill, P. A., Carter, J. T., Tomnay, J., Hatch, B., Middleton, T. V., Chibo, D., Catton, M. G., Pankhurst, J. L., Breschkin, A. M., Locarnini, S. A. y Bowden, D. S. (2000) "Análisis molecular de cepas del virus de la inmunodeficiencia humana asociadas a un caso de transmisión criminal del virus." J Infect Dis 182: 941-4. http://jid.oxfordjournals.org/content/182/3/941.long

Blanchard, A., Ferris, S., Chamaret, S., Guetard, D. y Montagnier, L. (1998) "Evidencia molecular para la transmisión nosocomial del virus de la inmunodeficiencia humana de un cirujano a uno de sus pacientes." J Virol 72: 4537-40. http://jvi.asm.org/cgi/content/full/72/5/4537?view=full&pmid=9557756

Brooks, D. R., y McLennan, D. A. (1991) Filogenia, ecología y comportamiento. Chicago: University of Chicago Press.

Bush, R. M., C. A. Bender, et al. (1999) "Prediciendo la evolución del virus de la influenza A en humanos." Science 286: 1921-1925. [PubMed]

Doolittle, W. F. (1999) "Clasificación filogenética y el árbol universal." Science 284: 2124. [PubMed]

Doolittle, W. F. (2000) "La naturaleza del ancestro universal y la evolución del proteoma." Current Opinion in Structural Biology 10: 355-358. [PubMed]

Edwards, A. W. F. y Cavalli-Sforza, L. L. (1963) "La reconstrucción de la evolución." Annals of Human Genetics 27: 105-106.

Efron, B. (1979) "Métodos Bootstrap: Otra mirada al jackknife." Annals of Statistics 7: 1-26.

Efron, B. y Gong, G. (1983) "Una mirada despreocupada al bootstrap, al jackknife y a la validación cruzada." American Statistician 37: 36-48.

Edwards, A. W. F. y Cavalli-Sforza, L. L. (1964) "Reconstrucción de árboles filogenéticos" en Clasificación fenética y filogenética. ed. Heywood, V. H. y McNeill. Londres: Systematics Assoc. Pub No. 6.

Felsenstein, J. (1981) "Un enfoque de verosimilitud para el ponderamiento de caracteres y lo que nos dice sobre la parsimonia y la compatibilidad." Biol J Linn Soc Lond 16: 183-196.

Felsenstein, J. (1981) "Árboles evolutivos a partir de secuencias de ADN: Un enfoque de máxima verosimilitud." J Mol Evol 17: 368-376. [PubMed]

Felsenstein, J. (1985) "Límites de confianza en filogenias: un enfoque usando el bootstrap." Evolution 39: 783-791.

Felsenstein, J. (2004) Infiriendo Filogenias. Sunderland, MA: Sinauer Associates.

Fisher, R. A. (1912) "Sobre un criterio absoluto para ajustar curvas de frecuencia." Messenger of Mathematics 41: 155-160.

Fitch, W. M. (1970) "Distinguir proteínas homólogas de análogas." Syst. Zool. 28: 132-163.

Futuyma, D. (1998) Biología evolutiva. Tercera edición. Sunderland, MA: Sinauer Associates.

Goujon, C. P., Schneider, V. M., Grofti, J., Montigny, J., Jeantils, V., Astagneau, P., Rozenbaum, W., Lot, F., Frocrain-Herchkovitch, C., Delphin, N., Le Gal, F., Nicolas, J. C., Milinkovitch, M. C. y Deny, P. (2000) "Los análisis filogenéticos indican una transmisión atípica de enfermera a paciente del virus de la inmunodeficiencia humana tipo 1." J Virol 74: 2525-32. http://jvi.asm.org/cgi/content/full/74/6/2525?view=full&pmid=10684266

Hennig, W. (1966) Sistemática filogenética. (Traducción al inglés). Urbana: University of Illinois Press.

Hillis, D. M., y Bull, J. J. (1993) "Una prueba empírica del bootstrapping como método para evaluar la confianza en el análisis filogenético." Syst. Biol. 42: 182-192.

Hillis, D. M., J. J. Bull, et al. (1992) "Filogenética experimental: Generación de una filogenia conocida." Science 255: 589-592. [PubMed]

Holmes, E. C., Zhang, L. Q., Simmonds, P., Rogers, A. S. y Brown, A. J. (1993) "Investigación molecular de la infección por el virus de la inmunodeficiencia humana (VIH) en un paciente de un cirujano infectado por el VIH." J Infect Dis 167: 1411-4. [PubMed]

Hudson, R. R. (1992) "Árboles genéticos, árboles de especies y la segregación de alelos ancestrales." Genetics 131: 509-513. [PubMed]

Huelsenbeck, J. P., Ronquist, F., Nielsen, R., y Bollback, J. P. (2001) "Inferencia bayesiana de la filogenia y su impacto en la biología evolutiva." Science 294: 2310-2314. [PubMed]

Kitching, I. J., Forey, P. L., Humphries, C. J., y Williams, D. M. (1998) Cladística: La teoría y la práctica del análisis de parcimonia. Segunda Edición. Publicación de la Asociación de Sistemática No. 11. Oxford: Oxford University Press.

Li, W.-H. (1997) Evolución molecular. Sunderland, MA: Sinauer Associates.

Machuca, R., Jorgensen, L. B., Theilade, P. y Nielsen, C. (2001) "Investigación molecular de la transmisión del virus de la inmunodeficiencia humana tipo 1 en un caso penal." Clin Diagn Lab Immunol 8: 884-90. [PubMed]

Maddison, W. P., y Maddison, D. R. (1992) MacClade. Sunderland, MA: Sinauer Associates.

Nei, M. y Kumar, S. (2000) Evolución molecular y filogenética. Nueva York, NY: Oxford University Press.

Nichols, R. (2001) "Los árboles genéticos y los árboles de especies no son lo mismo." Trends Ecol Evol. 16: 358-364. [PubMed]

Ou, C. Y., Ciesielski, C. A., Myers, G., Bandea, C. I., Luo, C. C., Korber, B. T., Mullins, J. I., Schochetman, G., Berkelman, R. L., Economou, A. N. y otros. (1992) "Epidemiología molecular de la transmisión del VIH en una clínica dental." Science 256: 1165-71. [PubMed]

Swofford, D. L., Olsen, G. J., Waddell, P. J., y Hillis, D. M. (1996) "Inferencia filogenética." En Sistemática molecular, pp 407-514. Hillis, D. M., Moritiz, C. y Mable, B. K. eds., Sunderland, Massachusetts: Sinauer.

Veenstra, J., Schuurman, R., Cornelissen, M., van't Wout, A. B., Boucher, C. A., Schuitemaker, H., Goudsmit, J. y Coutinho, R. A. (1995) "Transmisión de variantes del virus de la inmunodeficiencia humana tipo 1 resistentes a la zidovudina tras la inyección deliberada de sangre de un paciente con SIDA: características e historia natural del virus." Clin Infect Dis 21: 556-60. [PubMed]

Vogel, G. (1997) "Análisis filogenético: su día en el tribunal." Science 275: 1559-60. [PubMed]

Woese, C. (1998) "El ancestro universal." PNAS 95: 6854-6859. http://www.pnas.org/cgi/ content/full/95/12/6854

Wu, C. I. (1991) "Inferencias de la filogenia de especies en relación con la segregación de polimorfismos antiguos." Genetics 127: 429-435. [PubMed]

Yirrell, D. L., Robertson, P., Goldberg, D. J., McMenamin, J., Cameron, S. y Leigh Brown, A. J. (1997) "Investigación molecular sobre el brote de VIH en una prisión escocesa." Bmj 314: 1446-50. http://bmj.com/cgi/content/full/314/7092/1446?view=full&pmid=9167560

Zhu, T., B. Korber, et al. (1998) "Una secuencia de VIH-1 africana de 1959 e implicaciones para el origen de la epidemia." Nature 391: 594-597. [PubMed]

Referencias completas

Glosario

<--
Anterior
-->
Siguiente