A evolução segue um caminho tanto reto quanto largo?

Postagem do Mês: Maio de 2009

por

David T. F. Dryden

Assunto:    | explorando _toda_ a paisagem de sequências -- já resolvido?
Data:       | 02 de maio de 2009
Message-ID: | 5841cf37-bf2f-494f-bdee-2095798523e3@s16g2000vbp.googlegroups.com

Notas dos editores:
Este post é do autor de um artigo revisado por pares encontrado aqui.
Dois parágrafos que se desviam do ponto central do post podem ser lidos no original aqui.
Pontos específicos feitos pelo principal crítico criacionista, Sean Pitman, são explicitamente abordados no final.

Olá, sou David Dryden, o principal autor do artigo que gerou toda esta discussão. Steven Litvintchouk pediu-me que comentasse sobre a análise do meu artigo realizada por Sean Pitman e este comentário está anexado ao final deste texto. Devo dizer que estou um pouco surpreendido com a quantidade de interesse e discussão que surgiu a partir do pequeno artigo escrito por mim e dois colegas. No entanto, estou satisfeito por ter ocorrido isso e por a minha decisão de pagar para que fosse um artigo de "acesso aberto" ter sido justificada. É a minha esperança que, dentro de 10 anos, toda a ciência profissional revista por pares esteja livremente disponível.
[parágrafo excluído]

Provavelmente vou escrever muito demais, mas se você quer a conclusão, é que Sean Pitman está completamente e totalmente errado em tudo o que diz em seus comentários e demonstra um grande desconhecimento sobre proteínas e sua estrutura e função. No entanto, espero que ele continue lendo.

Ele falhou em reconhecer que desejávamos estabelecer limites sobre a quantidade de espaço de sequência explorada. Definir limites é um procedimento científico padrão, embora frequentemente esquecido, e evita muito desperdício de tempo, desde que não se restrinja inicialmente o cálculo desnecessariamente. Portanto, esses limites superior e inferior são tão generosos quanto possível com base no conhecimento atual. Eles podem estar errados em algumas ordens de grandeza, mas isso é negligenciável e, à medida que a pesquisa avança, os limites provavelmente se aproximarão, estreitando o intervalo de possibilidades. Em nosso gráfico, sobreposimos os limites ao número de sequências diferentes possíveis para um determinado conjunto de letras. As letras podem somar até 20, mas é apenas um número. Se essas letras forem consideradas aminoácidos, então podemos agrupar os 20 aminoácidos em um número menor de categorias relacionadas às suas propriedades físico-químicas. Assim que você afirma que os símbolos que usa no cálculo desses grandes números representam entidades físicas, não pode ignorar suas propriedades físicas. Tais agrupamentos são bem conhecidos por serem válidos em experimentos e são a base para a análise de sequências impulsionada por computador. É lamentável que tal análise por computador tenha sido levada a um extremo por algumas pessoas, especialmente aquelas que desejam promover a agenda de complexidade do design inteligente, e que se perdeu a visão do fato de que as proteínas não existem in silico.
[parágrafo excluído]

No mundo real da estrutura e função das proteínas, está bem estabelecido que muitos aminoácidos podem ser alterados com pouco ou nenhum efeito na função (existem apenas duas "funções" para uma proteína: ligar-se e controlar outro objeto ou ligar-se a outro objeto e catalisar uma reação nesse objeto – e esta última inclui o bombeamento de prótons para rotacionar um flagelo). Os mecanismos químicos catalíticos realizados por enzimas e ribozimas enquadram-se em apenas 6 categorias de reações químicas bem compreendidas (um espaço de reações bastante pequeno). Toda a bioquímica é construída sobre elas. As mutações que alteram a função geralmente definem um sítio ativo (para a função) ou uma região de dobramento crucial. Sabe-se que as proteínas são construídas a partir do uso repetido de sequências peptídicas menores que são unidas por duplicação gênica e recombinação no código do DNA.

Um consenso geral parece ser que as sequências de aminoácidos de comprimento de cerca de 20 ou 30 começam realmente a se tornar interessantes em termos de função, mas até mesmo unidades de dobramento menores estão sendo propostas como progenitores (veja o trabalho, se possível, de Edward N. Trifonov e também note que mesmo aminoácidos únicos são capazes de catalisar reações). A união desses 20-30meros (via o gene), que se dobram em unidades de estrutura "supersecundária", leva rapidamente a uma dobra "domínio" de 50-150 aminoácidos. Estes domínios são pequenas unidades dobradas. Este tamanho de domínio é essencialmente universal. Você não encontra exemplos de um domínio de 1000 aminoácidos, mas ele será composto por cerca de 10 domínios menores. É muito importante notar que, em muitos casos, tal dobramento não requer especificação completa da sequência, mas apenas a manutenção do padrão de categorias de aminoácidos (polar, não polar, etc). Muitos domínios fazem coisas interessantes, mas um tema recorrente é então trazer coleções desses domínios juntos, seja como subunidades separadas para formar estrutura quaternária ou para encadena-los em uma única cadeia fazendo-os via um único gene.

Este último processo é como se faz uma proteína de 1000 aminoácidos. A natureza toma os módulos de domínio e os junta para criar estruturas e funções novas. (Note que muito poucas cadeias longas de proteínas são encontradas, pois sua síntese é complicada devido às crescentes chances de erros na replicação gênica, transcrição ou tradução. Estes problemas foram reconhecidos por Francis Crick, se não me engano, na década de 1960. O tamanho médio de uma proteína é de cerca de 500 aminoácidos.) O número de domínios com dobras únicas parece ser limitado a cerca de 1000 a 10.000 (certamente menos de um milhão) e está ficando raro para a ciência encontrar novos. Isso significa que, independentemente da sequência que você tem, você obtém uma dessas dobras (mas note que há uma descoberta relativamente recente de proteínas "nativamente-desdobradas" que estão desdobradas até que se liguem à sua molécula alvo, momento em que se dobram. Quanto do espaço de sequência é ocupado por proteínas totalmente funcionais como estas é desconhecido).

O número de tipos de proteínas em qualquer organismo também parece ser muito limitado, variando de algumas centenas em bactérias com genomas muito pequenos a talvez da ordem de 10.000 em organismos multicelulares. Essas proteínas ainda contêm os mesmos domínios. Esses números limitados de proteínas realizam um número limitado de reações (novamente totalizando centenas a milhares de tais reações, conforme detalhado em livros-texto de bioquímica padrão). O importante para produzir espécies diferentes é como todas essas reações são controladas (majoritariamente) por proteínas, cada uma construída usando os mesmos princípios estruturais já detalhados. Essa área de controle é frequentemente referida como parte da EvoDevo ou desenvolvimento evolutivo, e é onde as discussões reais sobre complexidade estão ocorrendo. Isso não é minha especialidade, então voltarei agora às proteínas.

Esperamos que fique claro que temos um entendimento considerável da estrutura proteica e de como elas funcionam, e que não são tão complexas que não possamos explicá-las (e até mesmo projetá-las nós mesmos. David S Goodsell publicou um excelente livro sobre "Bionanotecnologia" mostrando o que a Natureza alcançou e como nosso entendimento disso nos permite projetar novos experimentos). Poderíamos, se quiséssemos, definir um espaço estrutural e um espaço funcional da mesma maneira que um espaço de sequência. A partir do exposto, deve ficar claro que nenhum desses espaços é particularmente grande quando comparado ao tamanho possível do espaço de sequência.

Dado o pequeno tamanho dos espaços de estrutura de domínio, reatividade química e função bioquímica, ou talvez eu possa referi-los como caixas de ferramentas, não parece ser uma grande adivinhação que o último ancestral comum de toda a vida na Terra estaria equipado com todas essas caixas de ferramentas. É por isso que decidimos determinar os limites de uso dessas caixas de ferramentas e calcular os limites superior e inferior começando há muito tempo no passado. As ferramentas podem não ter sido totalmente utilizadas ou exploradas nessa etapa (ou mesmo pelas bactérias hoje), mas mais tarde, quando os organismos multicelulares apareceram, essas ferramentas estavam prontas para serem usadas e até mesmo reconfiguradas.

Portanto, voltamos ao problema de quão grande é o espaço de sequências? Não é 20 elevado à potência do número de aminoácidos na sequência, mas muito menos, como discutimos em nosso artigo. Não há necessidade de ter 20 tipos diferentes de aminoácidos, cada um com propriedades únicas, ou comprimentos de sequência maiores que cerca de 100. Isso se deve às semelhanças físicas entre os aminoácidos e à gama limitada de estruturas dobradas. Apenas alguns aminoácidos em qualquer proteína são cruciais para sua função. Alterar esses poucos às vezes não faz quase nada para a função. No entanto, alguns mudarão a função para algo novo, mantendo a estrutura, e muito poucos mudarão a estrutura da proteína (e, portanto, sua função original) completamente, mas, em todas as probabilidades, ainda conferirão uma nova função. Mesmo que a estrutura original seja destruída por uma mutação e a proteína não se dobre, a possibilidade de uma nova função não é perdida, como evidenciado pela descoberta de proteínas nativamente desdobradas que adquirem dobra e função ao se ligar a um alvo.

O espaço de sequências, quando proposto, foi rapidamente reconhecido como um "paradoxo" ridículo por cientistas de proteínas (embora, infelizmente, não por alguns outros cientistas), semelhante ao ridículo "paradoxo" de Levinthal sobre o dobramento de proteínas. O espaço de sequências pode ser grande, mas isso não significa que seja complexo. Espero que o breve ensaio acima sobre estrutura e função de proteínas seja útil até mesmo para Sean Pitman, que precisa deixar de se obsesionar com a numerologia baseada em computadores e fazer algumas leituras e conversar com alguns cientistas de proteínas práticos. Também espero que ele perceba que as proteínas não são relevantes para a religião e que elas, assim como outras macromoléculas, não fornecem absolutamente nenhuma base para o Design Inteligente.

Algumas respostas curtas e específicas a críticas de Sean Pitman aqui
> Os autores argumentam que, porque alguns tipos de proteínas funcionais são menores
> que 100aa [aminoácidos], e porque alguns tipos de proteínas têm requisitos muito baixos
> de especificidade de sequência, que praticamente todo o espaço de sequências
> poderia ter sido explorado em apenas alguns bilhões de anos.

> O que esses autores não percebem é que nem todos os sistemas baseados em proteínas são
> criados iguais. Alguns sistemas realmente requerem muito poucos blocos de construção de aminoácidos
> e pouca especificidade de sequência. Estes, é claro, estão em níveis muito baixos
> de complexidade funcional. Outros sistemas, no entanto, requerem muito mais
> do que os sistemas de 100aa discutidos pelos autores - no mínimo. E, muitos desses
> sistemas requerem um grau significativo de especificidade. Estes sistemas
> estão em um nível muito mais alto de complexidade funcional e, portanto, ocupam
> espaços de sequência muito, muito maiores e também têm razões exponencialmente menores de
> potencialmente benéficos vs. não-beneficiais nesses níveis mais altos.

Com quase 50 anos de pesquisa biológica e química compartilhados entre os autores, realmente entendemos que nem todas as moléculas são iguais. Não estamos dizendo que apenas alguns aminoácidos especificados estão disponíveis, mas sim alguns tipos de aminoácidos — polares, não polares, negativos, positivos e assim por diante. Por exemplo, qualquer um dos polares poderia funcionar em um determinado sítio. Tudo o que você precisa especificar é a polaridade. Como isso é a base inteira de usar comparações de sequências para agrupar proteínas em famílias funcionais e esses métodos computacionais são utilizados por defensores do design inteligente, eles deveriam saber disso. Pequenas proteínas não são necessariamente funcionalmente simples, nem grandes proteínas são necessariamente complexas em função (na verdade, algumas são notavelmente entediantes).

> Os autores deste artigo nem sequer abordam o conceito de diferentes
> níveis de complexidade funcional. Eles apenas apontam o óbvio de que alguns
> tipos de sistemas funcionais são sistemas de nível muito muito baixo. Bem, óbvio! E quanto
> a aqueles sistemas que estão em níveis muito muito mais altos de requisitos mínimos de
> tamanho e/ou especificidade?...

Esses graus crescentes de complexidade funcional são uma ilusão. Apenas porque um flagelo gira e parece sofisticado, isso não significa que seja mais complexo do que algo menor. As maravilhosas máquinas muito menores envolvidas na manipulação do DNA, na formação de paredes celulares ou do citoesqueleto durante o ciclo de vida da célula fazem coisas muito mais complexas e variadas, incluindo alternar entre funções. Até uma pequena serina protease tem um trabalho muito mais difícil do que o flagelo. O flagelo apenas gira e gira e boceja...

Outra crítica de Sean Pitman originalmente aqui.
> As evidências mostram que as distâncias [no espaço de sequência] entre sequências benéficas de nível superior e
> nível superior com funções novas aumentam de forma linear."

Que evidência? E se a importância da função escala com o comprimento da sequência e a escalação é linear, então temo que 20^100 é essencialmente idêntico a 2 x 20^100. Além disso, uma função nova não é uma função nova, mas apenas uma que encontramos ao realizar o trabalho árduo no laboratório. Ela estava lá há muito tempo...

[Retornar aos Posts do Mês de 2009]

Post do Arquivo Talk.Origins do Mês: Maio de 2009

A evolução segue um caminho tanto reto quanto largo?

Postagem do Mês: Maio de 2009