¿La evolución sigue un camino tanto recto como ancho?

Publicación del mes: mayo de 2009

por
David T. F. Dryden

Asunto:    | explorando _todo_ el espacio de secuencias — ¿asunto resuelto?
Fecha:       | 2 de mayo de 2009
Message-ID: | 5841cf37-bf2f-494f-bdee-2095798523e3@s16g2000vbp.googlegroups.com

Notas del editor:
Este artículo fue escrito por el autor de un trabajo revisado por pares encontrado aquí.
Dos párrafos que se desvían del punto central del artículo pueden leerse en el original aquí.
Los puntos específicos planteados por el crítico creacionista principal, Sean Pitman, se abordan explícitamente al final.

Hola, soy David Dryden, el principal autor del trabajo que generó toda esta discusión. Steven Litvintchouk me pidió que comentara el análisis de mi trabajo realizado por Sean Pitman y esto se añade al final de este texto. Debo decir que estoy algo sorprendido por la cantidad de interés y discusión que ha surgido a partir del pequeño trabajo mío y de dos colegas. Sin embargo, me alegra que así haya sido y que mi decisión de publicarlo como un artículo de «acceso abierto» se haya visto justificada. Espero que dentro de 10 años toda la ciencia revisada por pares profesionalmente sea de libre acceso.
[párrafo eliminado]

Probablemente escribiré demasiado, pero si quiere la conclusión, es que Sean Pitman está completamente y totalmente equivocado en todo lo que dice en sus comentarios y muestra una gran ignorancia de las proteínas y de su estructura y función. Sin embargo, espero que siga leyendo.

Él no se dio cuenta de que queríamos establecer límites al alcance del espacio de secuencias explorado. Definir límites es un procedimiento científico estándar, aunque a menudo se olvida, y evita mucho desperdicio de tiempo siempre que no se restrinja innecesariamente la estimación al inicio. Por lo tanto, estos límites superior e inferior son lo más generosos posible en función del conocimiento actual. Puede que difieran en unas pocas potencias de diez, pero eso es insignificante y, a medida que avanza la investigación, esos límites probablemente se acercarán más entre sí, reduciendo el rango de posibilidades. En nuestro gráfico, sobrepusimos los límites sobre el número de secuencias diferentes posibles para un grupo dado de letras. Las letras pueden llegar a sumar 20, pero eso es solo un número. Si esas letras se consideran como aminoácidos, entonces podemos agrupar los 20 aminoácidos en un número menor de categorías relacionadas con sus propiedades físico-químicas. En cuanto se afirma que los símbolos que usa en el cálculo de estas grandes cantidades representan entidades físicas, no se pueden ignorar sus propiedades físicas. Ese tipo de agrupamientos es bien sabido que es válido en el laboratorio y son la base del análisis de secuencias asistido por computadora. Es desafortunado que ese análisis computacional haya sido llevado demasiado lejos por algunas personas, especialmente por aquellas que quieren impulsar la agenda de complejidad del diseño inteligente y que se ha perdido de vista el hecho de que las proteínas no existen en silico.
[párrafo eliminado]

En el mundo real de la estructura y función de proteínas, está bien establecido que muchos aminoácidos pueden cambiarse con poco o ningún efecto en su función (solo hay dos «funciones» de una proteína: unirse y controlar otro objeto o unirse a otro objeto y catalizar una reacción sobre ese objeto; esta última incluye el bombeo de protones para hacer girar un flagelo). Los mecanismos químicos catalíticos realizados por enzimas y ribozimas encajan solo en 6 categorías de reacciones químicas bien comprendidas (espacio de reacciones relativamente pequeño). Toda la bioquímica se construye sobre ellas. Esas mutaciones que sí cambian la función suelen definir un sitio activo (para la función) o una región de plegamiento crucial. Se sabe que las proteínas se construyen mediante el uso repetitivo de secuencias peptídicas más pequeñas unidas mediante duplicación y recombinación génicas en el código de ADN.

Existe un consenso general de que secuencias de aminoácidos de una longitud de unos 20 o 30 empiezan a resultar interesantes en términos de función, pero se proponen unidades de plegado más pequeñas como progenitores (véanse los trabajos, si es posible, de Edward N. Trifonov y también tenga en cuenta que incluso aminoácidos individuales pueden catalizar reacciones). La unión de estos 20-30mers (vía el gen), que se pliegan en unidades de estructura «supersecundaria», conduce rápidamente a un «dominio» plegado de 50 a 150 aminoácidos. Estos dominios son unidades pequeñas plegadas. El tamaño de este dominio es esencialmente universal. No se encuentran ejemplos de un dominio de 1000 aminoácidos; en su lugar consta de unas 10 unidades más pequeñas. Es muy importante notar que en muchos casos ese plegamiento no requiere especificar por completo la secuencia, sino solo mantener el patrón de categorías de aminoácidos (polar, no polar, etc.). Muchos dominios hacen cosas interesantes, pero un tema recurrente es reunir colecciones de dominios ya sea como subunidades separadas para formar la estructura cuaternaria o para ensamblarlos en una sola cadena mediante un único gen.

Este último proceso es cómo se hace una proteína de 1000 aminoácidos. La naturaleza toma los módulos de dominio y los une para crear estructuras y funciones novedosas. (Tenga en cuenta que muy pocas cadenas proteicas largas se encuentran, ya que su síntesis es complicada debido a la mayor probabilidad de errores en la replicación del ADN, transcripción o traducción. Francis Crick reconoció estos problemas, si mal no recuerdo, en la década de 1960. El tamaño medio de proteína es de alrededor de 500 aminoácidos.) El número de dominios con pliegues únicos parece limitado a unas 1000 a 10 000 (seguramente menos de un millón) y se hace cada vez más raro que la ciencia encuentre nuevos ejemplos. Esto significa que sea cual sea la secuencia que tenga, se encuentra uno de estos pliegues (pero tenga en cuenta que existe un descubrimiento relativamente reciente de proteínas «nativamente no plegadas» que permanecen desplegadas hasta unirse a su molécula diana y en ese momento se plegan. La fracción del espacio de secuencias ocupada por estas proteínas plenamente funcionales se desconoce).

El número de tipos de proteínas en cualquier organismo también parece estar muy limitado: desde varios cientos en bacterias con genomas muy pequeños hasta quizá del orden de 10 000 en organismos multicelulares. Estas proteínas todavía contienen los mismos dominios. Estos números limitados de proteínas realizan un número limitado de reacciones (de nuevo, cientos a miles de esas reacciones como se detalla en los manuales de bioquímica estándar). Lo importante para producir diferentes especies es cómo se controlan (en su mayoría) todas estas reacciones mediante proteínas, cada una construida usando los mismos principios estructurales ya detallados. Esta área de control suele denominarse parte de EvoDevo o desarrollo evolutivo, y ahí se desarrollan las discusiones reales sobre complejidad. Eso no es mi especialidad, así que regresaré ahora a las proteínas.

Esperemos que esté claro que tenemos un conocimiento considerable de la estructura proteica y de su funcionamiento y que no son tan complejas como para que no podamos explicarlas (y aun diseñarlas nosotros mismos). David S. Goodsell ha publicado un excelente libro sobre «Bionanotechnology» que muestra lo que la naturaleza ha conseguido y cómo nuestro conocimiento de ello nos permite diseñar nuevos experimentos. Podríamos, si quisiéramos, definir un espacio estructural y un espacio funcional de la misma manera que un espacio de secuencias. A partir de lo anterior, debería estar claro que ninguno de estos espacios es particularmente grande en comparación con el tamaño posible del espacio de secuencias.

Dadas las pequeñas dimensiones de los espacios de estructura de dominio, reactividad química y función bioquímica —o, si se prefiere, puede decirse que de sus «cajas de herramientas»—, no parece ser ni una gran suposición que el último ancestro común de toda la vida en la tierra hubiera estado equipado con todas esas cajas de herramientas. Por eso decidimos determinar los límites de uso de estas cajas de herramientas y calcular los límites superior e inferior desde tiempos muy antiguos. Las herramientas quizá no estaban completamente utilizadas o exploradas en ese momento (o incluso en las bacterias actuales), pero más tarde, cuando aparecieron los organismos multicelulares, esas herramientas estaban listas para usarse y hasta reconfigurarse.

Así volvemos al problema de cuán grande es el espacio de secuencias. No es 20 elevado a la potencia del número de aminoácidos en la secuencia, sino mucho menos, como discutimos en nuestro trabajo. No es necesario tener 20 tipos diferentes de aminoácidos, cada uno con propiedades únicas o longitudes de secuencia superiores a unos 100. Esto se debe a las similitudes físicas entre aminoácidos y el rango limitado de estructuras plegadas. Solo unos pocos aminoácidos en cualquier proteína son cruciales para su función. Cambiar esos puede a veces hacer casi nada a la función. Sin embargo, algunos cambiarán la función a algo nuevo manteniendo la estructura, y muy pocos cambiarán la estructura proteica (y por tanto su función original) por completo, aunque con gran probabilidad sigan otorgando una nueva función. Incluso si la estructura original se destruye por una mutación y la proteína no se pliega, la posibilidad de una nueva función no se pierde, como evidencian los descubrimientos de proteínas nativamente no plegadas que adquieren un pliegue y función al unirse a una diana.

El espacio de secuencias, cuando se propuso, fue reconocido rápidamente como una «paradoja» absurda por científicos de proteínas (aunque desgraciadamente no por otros científicos), al modo de la absurda «paradoja de Levinthal» del plegamiento de proteínas. El espacio de secuencias puede ser grande, pero eso no significa que sea complejo. Espero que el breve ensayo anterior sobre estructura y función proteicas sea útil incluso para Sean Pitman, que debe dejar de estar obsesionado con la numerología basada en computadoras y hacer algo de lectura y hablar con científicos de proteínas prácticos. También espero que se dé cuenta de que las proteínas no tienen relevancia para la religión y de que, junto con otros macromoléculas, no proporcionan en absoluto ninguna base para el diseño inteligente.

Algunas respuestas específicas y breves a críticas de Sean Pitman aquí
> Los autores argumentan que, dado que algunos tipos de proteínas funcionales son más pequeñas
> que 100 aa [aminoácidos], y porque algunos tipos de proteínas tienen requisitos de especificidad de > secuencia muy bajos, prácticamente todo el espacio de secuencias
> podría haberse explorado en solo unos pocos miles de millones de años.

> Lo que estos autores no se dan cuenta es que no todos los sistemas basados en proteínas son
> creados de la misma manera. Algunos sistemas sí requieren muy pocos bloques de construcción
> de aminoácidos y poca especificidad de secuencia. Estos, por supuesto, están en niveles
> muy bajos de complejidad funcional. Sin embargo, otros sistemas requieren mucho más
> que los sistemas de 100 aa discutidos por los autores, como mínimo. Y muchos de
> estos sistemas requieren un grado significativo de especificidad. Estos sistemas
> están en un nivel de complejidad funcional mucho más alto y, por tanto, ocupan
> espacios de secuencia mucho, mucho más grandes y también tienen relaciones exponencialmente
> más bajas de mutaciones potencialmente beneficiosas frente a no beneficiosas en esos niveles más altos.

Con casi 50 años de investigación biológica y química compartidos entre los autores, realmente sabemos que no todas las moléculas son iguales. No estamos diciendo que solo unos pocos aminoácidos especificados estén disponibles, sino que hay pocos tipos de aminoácidos: polar, no polar, negativo, positivo, etc. Por ejemplo, cualquiera de los polares podría servir en un sitio particular. Todo lo que se necesita especificar es la polaridad. Dado que ésta es la base completa para usar comparaciones de secuencia para agrupar proteínas en familias funcionales y estos métodos computacionales son usados por defensores del diseño inteligente, deberían saberlo. Las proteínas pequeñas no son necesariamente funcionalmente simples ni las proteínas grandes necesariamente complejas en función (de hecho, algunas son notablemente monótonas).

> Los autores de este trabajo ni siquiera abordan el concepto de diferentes
> niveles de complejidad funcional. Solo señalan lo obvio de que algunos
> tipos de sistemas funcionales son de un nivel muy, muy bajo. ¡Claro! ¿Qué
> pasa con aquellos sistemas que están en niveles mínimos de tamaño y/o exigencias
> de especificidad muchísimo más altos?...

Estos crecientes grados de complejidad funcional son un espejismo. Solo porque un flagelo gire y parezca sofisticado no significa que sea más complejo que algo más pequeño. Los equipos mucho más pequeños que intervienen en la manipulación del ADN, en la formación de paredes celulares o del citoesqueleto durante el ciclo vital de la célula hacen cosas mucho más complejas y variadas, incluso cambiar entre funciones. Incluso una pequeña serina proteasa tiene un trabajo mucho más difícil que el flagelo. El flagelo solo gira y gira y aburre...

Otra crítica de Sean Pitman originalmente publicada aquí.
> La evidencia muestra que las distancias [en el espacio de secuencias] entre secuencias beneficiosas de mayor y
> mayor nivel con funciones novedosas aumenta de forma lineal.

¿Qué evidencia? Y si la importancia de la función escala con la longitud de la secuencia y la escala es lineal, me temo que 20^100 es esencialmente idéntico a 2 x 20^100. Además, una función novedosa no es una función nueva, sino simplemente una que encontramos al hacer el trabajo duro en el laboratorio. Ha estado ahí desde hace mucho tiempo...

[Volver a las publicaciones del mes de 2009]