Outros Links:
|
Informação de acordo com William Dembski
- Introdução
- Informação Definida
- Complexidade
- Informação Especificada Complexa
- Design Inteligente
- Conservação da Informação
- Onde Dembski está errado
Introdução
As ideias de Dembski, um autor altamente prolixo, são destacadas em Design Inteligente como uma Teoria da Informação [4]. O objetivo do artigo é "(1) mostrar como a informação pode ser detectada e medida de forma confiável, e (2) formular uma lei de conservação que governa a origem e o fluxo de informação." Imediatamente percebe-se que Dembski está falando de algo bastante diferente de Shannon, Chaitin e Kolmogorov quando afirma no segundo parágrafo: "nem algoritmos nem leis naturais são capazes de produzir informação."
Informação Definida[Topo]
Dembski define a informação da seguinte forma:
Para que haja informação, deve haver uma multiplicidade de possibilidades distintas, qualquer uma das quais poderia ocorrer. Quando uma dessas possibilidades ocorre e as outras são descartadas, a informação se torna atualizada. De fato, a informação em seu sentido mais geral pode ser definida como a atualização de uma possibilidade à exclusão das outras (observe que esta definição abrange tanto a informação sintática quanto a semântica).
Em seguida, Dembski propõe -log 2 p como a medida de informação para um evento com probabilidade p, exatamente o mesmo uso de Shannon. No entanto, a definição de Dembski contrasta claramente com a consideração de Shannon sobre a informação média de uma fonte de informação resultante do ensemble estatístico de suas sequências de saída possíveis.
Complexidade[Topo]
Em seguida, Dembski descreve informação complexa e afirma que a medida -log2p é uma medida de complexidade.
A informação é uma noção da teoria da complexidade. De fato, como um objeto puramente formal, a medida de informação descrita aqui é uma medida de complexidade (cf. Dembski, 1998, cap. 4). Medidas de complexidade surgem sempre que atribuímos números a graus de complicação. Um conjunto de possibilidades frequentemente admite graus variados de complicação, variando do extremamente simples ao extremamente complicado. Medidas de complexidade atribuem números não negativos a essas possibilidades, de modo que 0 corresponde ao mais simples e _ [sic] ao mais complicado. Por exemplo, a complexidade computacional é sempre medida em termos de tempo (ou seja, número de passos computacionais) ou espaço (ou seja, tamanho da memória, geralmente medido em bits ou bytes) ou alguma combinação dos dois. Quanto mais difícil um problema computacional, mais tempo e espaço são necessários para executar o algoritmo que resolve o problema. Para medidas de informação, o grau de complicação é medido em bits. Dado um evento A de probabilidade P(A), I(A) = -log2P(A) mede o número de bits associados à probabilidade P(A). Portanto, falamos de "complexidade da informação" e dizemos que a complexidade da informação aumenta conforme I(A) aumenta (ou, correspondentemente, conforme P(A) diminui). Também falamos de informação "simples" e "complexa" dependendo de se I(A) indica poucos ou muitos bits de informação. Essa noção de complexidade é importante para a biologia, não apenas porque a origem da informação está em questão, mas também a origem da informação complexa.
Observe que, por alguma razão, Dembski menciona a complexidade computacional aqui, mas não a vincula especificamente a uma medida de informação, o que está bem, porque os dois conceitos não são os mesmos – mas a implicação é questionável.
Informação Especificada Complexa[Topo]
Dembski prossegue distinguindo entre informação complexa especificada e não especificada:
Agora, a informação que tende a interessar-nos como inquiridores racionais em geral, e cientistas em particular, não é a concretização de possibilidades arbitrárias que não correspondem a padrões, mas sim a concretização de possibilidades delimitadas que efetivamente correspondem a padrões. Há mais. A informação padronizada, embora seja um passo na direção certa, ainda não nos dá totalmente a informação especificada. O problema é que os padrões podem ser elaborados a posteriori, de modo que, em vez de ajudar a elucidar a informação, os padrões são meramente lidos a partir da informação já concretizada...
A informação especificada é sempre informação padronizada, mas a informação padronizada não é sempre informação especificada. Para a informação especificada, não basta qualquer padrão. Distinguímos, portanto, entre os padrões "bons" e os padrões "maus". Os padrões "bons" serão daqui em diante chamados especificações. As especificações são os padrões independentemente dados que não são simplesmente lidos a partir da informação. Em contraste, os padrões "maus" serão chamados fabricações. As fabricações são os padrões a posteriori que são simplesmente lidos a partir da informação já existente...
A distinção entre informação especificada e não especificada pode agora ser definida da seguinte forma: a concretização de uma possibilidade (ou seja, informação) é especificada se, independentemente da concretização da possibilidade, esta for identificável por meio de um padrão. Caso contrário, a informação é não especificada. Note que esta definição implica uma assimetria entre informação especificada e não especificada: a informação especificada não pode tornar-se informação não especificada, embora a informação não especificada possa tornar-se informação especificada. A informação não especificada não precisa permanecer não especificada, mas pode tornar-se especificada à medida que nosso conhecimento de fundo aumenta. Por exemplo, uma transmissão criptográfica cujo sistema criptográfico ainda não foi quebrado constituirá informação não especificada. No entanto, assim que quebrarmos o sistema criptográfico, a transmissão criptográfica torna-se informação especificada.
Para o tratamento matemático, o leitor é remetido ao livro de 1998 de Dembski, "The Design Inference."
Dembski propõe duas condições subsidiárias à condição de independência entre padrões e informação:
(1) uma condição de independência condicional estocástica entre a informação em questão e certo conhecimento de fundo relevante; e
(2) uma condição de tratabilidade pela qual o padrão em questão pode ser construído a partir do conhecimento de fundo mencionado anteriormente.
Ambos os quais ele observa que não são facilmente formalizados. Ele afirma, no entanto, que é fácil determinar na prática se um padrão é dado independentemente de uma possibilidade, "se o padrão é dado antes da possibilidade ser realizada". A vida, ele afirma, é um caso em que um padrão é dado após uma possibilidade ser realizada, embora ele afirme que ela também represente informação especificada complexa ou CSI.
Dembski atribui uma série de propriedades ao CSI:
É a CSI que, para Manfred Eigen, constitui o grande mistério da biologia, e que ele espera eventualmente desvendar em termos de algoritmos e leis naturais. É a CSI que, para cosmólogos, subjaz ao ajuste fino do universo, e que os diversos princípios antrópicos tentam compreender (cf. Barrow e Tipler, 1986). É a CSI que os potenciais quânticos de David Bohm estão extração quando buscam no micromundo o que Bohm chama de "informação ativa" (cf. Bohm, 1993, pp. 35-38). É a CSI que permite ao demônio de Maxwell enganar um sistema termodinâmico tendendo ao equilíbrio térmico (cf. Landauer, 1991, p. 26). É a CSI na qual David Chalmers espera basear uma teoria abrangente da consciência humana (cf. Chalmers, 1996, cap. 8). É a CSI que, dentro da teoria de informação algorítmica de Kolmogorov-Chaitin, assume a forma de sequências altamente compressíveis e não aleatórias de dígitos (cf. Kolmogorov, 1965; Chaitin, 1966).
Dembski prossegue argumentando que a causa inteligente ou o design são necessários para que o CSI surja. Ele argumenta que o design pode ser detectado:
A concretização de uma entre várias possibilidades concorrentes, a exclusão das demais e a especificação da possibilidade que foi concretizada encapsulam como reconhecemos causas inteligentes, ou equivalentemente, como detectamos o design.
Design Inteligente [Topo]
Dembski afirma que a CSI é um indicador de causalidade inteligente ou design inteligente. Ele argumenta que a CSI não pode resultar de uma combinação de acaso e necessidade, e que isso indica que um evento improvável foi, portanto, escolhido intencionalmente:
Se acaso e necessidade, deixados a si mesmos, não podem gerar CSI, é possível que acaso e necessidade trabalhando juntos possam gerar CSI? A resposta é Não. Sempre que acaso e necessidade trabalham juntos, as contribuições respectivas de acaso e necessidade podem ser organizadas sequencialmente. Mas ao organizar as contribuições respectivas de acaso e necessidade sequencialmente, torna-se claro que, em nenhum ponto da sequência, é gerado CSI. Considere o caso de tentativa e erro (tentativa corresponde à necessidade e erro ao acaso). Uma vez considerado um método grosseiro de resolução de problemas, a tentativa e erro ascendeu tanto na estimativa dos cientistas que agora é considerada a fonte última de sabedoria e criatividade na natureza. Os algoritmos probabilísticos da ciência da computação (por exemplo, algoritmos genéticos – veja Forrest, 1993) dependem todos da tentativa e erro. Da mesma forma, o mecanismo darwinista de mutação e seleção natural é uma combinação de tentativa e erro na qual a mutação fornece o erro e a seleção a tentativa. Um erro é cometido após o qual uma tentativa é feita. Mas, em nenhum ponto, é gerado CSI.
Dembski resume a CSI como um indicador de design:
Este argumento para demonstrar que a CSI é um indicador confiável de design pode agora ser resumido da seguinte forma: a CSI é um indicador confiável de design porque seu reconhecimento coincide com a forma como reconhecemos a causa inteligente em geral. Em geral, para reconhecer a causa inteligente, devemos estabelecer que uma das várias possibilidades concorrentes foi efetivada, determinar quais possibilidades foram excluídas e, em seguida, especificar a possibilidade que foi efetivada. Além disso, as possibilidades concorrentes que foram excluídas devem ser possibilidades vivas, suficientemente numerosas para que a especificação da possibilidade que foi efetivada não possa ser atribuída ao acaso. Em termos de probabilidade, isso significa que a possibilidade especificada é altamente improvável. Em termos de complexidade, isso significa que a possibilidade especificada é altamente complexa. Todos os elementos no esquema geral para reconhecer a causa inteligente (ou seja, Efetivação-Exclusão-Especificação) encontram seu correspondente na informação complexa especificada-CSI. A CSI aponta o que precisamos procurar quando detectamos design.
Conservação de Informação[Topo]
Finalmente, Dembski propõe uma Lei de Conservação da Informação:
Essa forte afirmação prescritiva, de que as causas naturais podem apenas transmitir CSI, mas nunca originá-la, eu chamo de Lei da Conservação da Informação
que ele sustenta tem as seguintes implicações:
(1) A CI (Complexidade da Informação) em um sistema fechado de causas naturais permanece constante ou diminui.
(2) A CI não pode ser gerada espontaneamente, originar-se endogenamente ou organizar-se (como esses termos são usados na pesquisa sobre a origem da vida).
(3) A CI em um sistema fechado de causas naturais ou já estava no sistema eternamente ou foi adicionada exogenamente em algum momento (implicando que o sistema, embora agora fechado, não era sempre fechado). >
(4) Em particular, qualquer sistema fechado de causas naturais que também tenha duração finita recebeu a CI que contém antes de se tornar um sistema fechado.
Onde Dembski Errou[Topo]
Em tentativa de definir informação complexa, Dembski confunde uma definição de informação de Teoria da Informação Clássica (probabilidade) com uma definição modificada de Teoria da Informação Algorítmica (comprimento computacional, ou complexidade de Kolmogorov). Lembre-se de que Dembski definiu informação como -log2 p, onde p representa a probabilidade de um evento. Isso é essencialmente o uso de Shannon na Teoria da Informação Clássica. Por outro lado, ele prossegue para afirmar que -log 2 p é uma medida de complexidade:
A informação é uma noção da teoria da complexidade. De fato, como um objeto puramente formal, a medida de informação descrita aqui é uma medida de complexidade... Dado um evento A com probabilidade P(A), I(A) = -log2P(A) mede o número de bits associados à probabilidade P(A). Portanto, falamos da "complexidade da informação" e dizemos que a complexidade da informação aumenta conforme I(A) aumenta (ou, correspondentemente, conforme P(A) diminui).
Até agora, Dembski aplicou a complexidade de Kolmogorov à informação de Shannon resultante de um único evento. Pelo menos, outras partes do artigo sugerem que ele se refere à complexidade de Kolmogorov, e ele não afirma o contrário neste parágrafo. Matematicamente, não há nada de errado com isso, embora a utilidade não seja muito clara de todo. No entanto, há um grande erro na segunda metade da última frase:
…a complexidade da informação aumenta à medida que I(A) aumenta (ou, correspondentemente, à medida que P(A) diminui)
Isso está errado. Em geral, não há qualquer relação entre a complexidade de Kolmogorov de uma string e sua probabilidade de ocorrência. A complexidade de Kolmogorov de uma string é o comprimento do programa mais curto em uma Máquina de Turing Universal de referência ou UTM (um tipo de computador generalizado) que produzirá essa string. Ela depende de duas coisas: (1) o conteúdo da string, e (2) o computador de referência, nenhum dos quais se relaciona com a probabilidade de ocorrência da string. Existem um número infinito de UTMs para escolher. Dada uma string finita arbitrária, podemos encontrar uma UTM na qual a complexidade de Kolmogorov da string seja arbitrariamente baixa ou arbitrariamente alta. A natureza não tem preferência por uma UTM sobre outra.
Além disso, se o conteúdo de uma string dependesse da sua probabilidade de ocorrência, a Teoria da Informação Clássica, que tornou possível toda sorte de telecomunicações modernas, não seria necessária. Um dos conceitos básicos na teoria de Shannon é que o uso de um canal de informação é maximizado ao recodificar as mensagens de modo que as mensagens mais prováveis sejam mais curtas e as menos prováveis sejam mais longas. Os códigos de Fano-Shannon são um exemplo disso. Se o número de bits em uma string fosse inerentemente relacionado à probabilidade, não precisaríamos recodificá-los e os códigos de Fano-Shannon seriam inúteis.
Dembski faz um salto fantástico ao assumir que uma métrica de informação derivada da probabilidade de um único evento (-log 2 p) e da brevidade do algoritmo mínimo necessário para representar o evento (Chaitin-Kolmogorov) estão necessariamente relacionadas. Não surpreendentemente, o rigor matemático que sustenta o caso de Dembski é ausente. De fato, não há razão para concluir que qualquer relação entre a probabilidade de um evento e a complexidade de Kolmogorov exista para uma fonte de informação arbitrária.
Como nota lateral, a complexidade de Kolmogorov tem a desvantagem de ser não computável e, portanto, constitui uma métrica inadequada.
É claro que Dembski é bastante vago sobre se ele realmente se refere à complexidade de Kolmogorov aqui. É possível que ele esteja simplesmente chamando a métrica de informação de Shannon de medida de complexidade, caso em que teríamos que nos perguntar por que ele está mudando a terminologia sem aviso prévio. Mesmo que este seja o que Dembski quer dizer, o problema sobre assumir a probabilidade de uma string está inerentemente relacionado ao seu conteúdo.
Outro grande erro é encontrado neste trecho:
É a CSI que, dentro da teoria de informação algorítmica de Kolmogorov-Chaitin, assume a forma de sequências altamente compressíveis e não aleatórias de dígitos
Dembski está invertendo as coisas. Na Teoria da Informação Algorítmica de Chaitin e Kolmogorov, strings altamente compressíveis têm baixa complexidade/conteúdo de informação, não alta complexidade/conteúdo de informação; e a complexidade aumenta com maior aleatoriedade algorítmica. Por exemplo, em um computador de propósito geral, esperamos que o programa "imprima 1 milhão de zeros" leve muito menos de 1 milhão de bits para descrever. Aqui está uma string altamente compressível com muito pouca complexidade e muito pouco conteúdo de informação. Por outro lado, é geralmente muito difícil comprimir ruído aleatório. Como matemático, Dembski deveria saber isso. Poderíamos, é claro, encontrar um computador grosseiramente ineficiente que, no entanto, seja Universal, no qual o programa "imprima 1 milhão de zeros" exija muitos mais do que 1 milhão de bits para codificar, o que é outra razão para evitar a complexidade de Kolmogorov ao analisar strings).
Aqui estão as raízes de outro grande erro:
Informação especificada é sempre informação padronizada, mas a informação padronizada não é sempre informação especificada. Para a informação especificada, não basta qualquer padrão. Portanto, distinguimos entre os padrões "bons" e os padrões "ruins". Os padrões "bons" serão daqui por diante chamados de especificações. As especificações são os padrões independentemente dados que não são simplesmente lidos da informação. Em contraste, os padrões "ruins" serão chamados de fabricações. As fabricações são os padrões post hoc que são simplesmente lidos da informação já existente...
A implicação é que, dado dois padrões, podemos de alguma forma saber qual padrão causou o outro. Ele continua:
A distinção entre informação especificada e não especificada pode agora ser definida da seguinte forma: a concretização de uma possibilidade (ou seja, informação) é especificada se, independentemente da concretização da possibilidade, esta for identificável por meio de um padrão. Caso contrário, a informação é não especificada.
Aqui temos mais um grande salto na premissa de Dembski de que, se um padrão existe antes de uma possibilidade ser realizada, ele deve ser causal. Qualquer pessoa treinada em estatística deve conhecer o perigo de fazer suposições de causalidade simplesmente porque uma correlação entre duas variáveis é observada. Correlações não implicam causalidade entre as variáveis correlacionadas. Por exemplo, a correlação entre a malária e as pântanos foi observada há muito tempo. A doença malária foi incorretamente atribuída ao mau (mal) ar (aria) perto das pântanos. A correlação foi corretamente notada, mas a suposição de causalidade estava falha. Embora um padrão correlacionado e uma possibilidade realizada possam ter uma causa relacionada, não se pode assumir que o padrão causou a possibilidade realizada. Portanto, esta proposta para detectar o design é altamente suspeita. Este é um erro crítico.
Para piorar a situação, Dembski baseia-se no conhecimento da probabilidade de um único evento ocorrer. Não é, em geral, possível conhecer a probabilidade associada a um único evento. É necessário ter conhecimento estatístico do processo a partir do qual o evento surgiu para conhecer sua probabilidade com certeza; ou um número suficientemente grande de amostras para estimá-la. Fingir que a probabilidade depende de alguma forma da complexidade de Kolmogorov do evento não ajuda.
Seu argumento de que a CSI não pode ser criada por uma combinação de acaso e necessidade (ou mutação e seleção natural) é um argumento de ignorância. Dembski afirma que não pode ser feito, mas falha em demonstrar por quê. Ele também implica que a CSI fornecerá informações sobre possibilidades excluídas, sem mostrar como.
Quanto mais Dembski avança, mais ele recorre a gestos vazios. Ele não fornece nenhuma evidência para apoiar sua suposta Lei de Conservação da Informação, que ele admite ser uma "forte afirmação prescritiva". Como se trata de uma afirmação e não de uma lei, qualquer argumento baseado nela pode e deve ser rejeitado como pseudociência.
É interessante contrastar o propósito declarado do artigo:
(1) mostrar como a informação pode ser detectada e medida de forma confiável, e (2) formular uma lei de conservação que rege a origem e o fluxo de informação
com suas afirmações mais adiante no artigo, quando ele chega ao cerne de seu argumento:
Este é um tema vasto cuja elucidação completa está além do escopo deste artigo (os detalhes podem ser encontrados em meu livro The Design Inference).
e
O objetivo desta última seção é esboçar brevemente a Lei da Conservação da Informação (um tratamento completo será fornecido em Uncommon Descent, um livro que estou coautorando com Stephen Meyer e Paul Nelson).
Em outras palavras, após ter preenchido um longo artigo com frases feitas e gestos vazios, carentes de detalhes, e depois de afirmar inicialmente que um princípio profundo e novo será formulado no artigo, Dembski direciona o leitor para seu próximo livro. No entanto, ele parece ter mudado de rumo. Ele editou um livro com título semelhante Uncommon Dissent: Intellectuals who find Darwinism Unconvincing, mas ele contém apenas uma introdução de Dembski. Sua "Lei da Conservação da Informação" é exposta em No Free Lunch. Para uma revisão crítica deste livro, consulte The No Free Lunch FAQ.
[Topo]