Información según William Dembski

Introducción

Las ideas de Dembski, un autor altamente prolífico, se destacan en Diseño Inteligente como una Teoría de la Información [4]. El propósito del artículo es "(1) mostrar cómo la información puede ser detectada y medida de manera confiable, y (2) formular una ley de conservación que gobierne el origen y el flujo de la información." Uno inmediatamente percibe que Dembski está hablando de algo bastante diferente a Shannon, Chaitin y Kolmogorov cuando afirma en el segundo párrafo: "ni los algoritmos ni las leyes naturales son capaces de producir información."

Información Definida[Inicio]

Dembski define la información de la siguiente manera:

Para que exista información, debe haber una multiplicidad de posibilidades distintas, cualquiera de las cuales podría ocurrir. Cuando una de estas posibilidades ocurre y las demás se descartan, la información se actualiza. De hecho, la información en su sentido más general puede definirse como la actualización de una posibilidad a la exclusión de otras (observe que esta definición abarca tanto la información sintáctica como la semántica).

Dembski luego propone -log 2 p como la medida de información para un evento con probabilidad p, exactamente el mismo uso que Shannon. Sin embargo, la definición de Dembski contrasta claramente con la consideración de Shannon sobre la información promedio de una fuente de información resultante del conjunto estadístico de sus posibles secuencias de salida.

Complejidad[Inicio]

A continuación, Dembski describe la información compleja y afirma que la medida -log2p es una medida de complejidad.

La información es una noción de la teoría de la complejidad. De hecho, como objeto puramente formal, la medida de la información descrita aquí es una medida de complejidad (cf. Dembski, 1998, cap. 4). Las medidas de complejidad surgen siempre que asignamos números a los grados de complicación. Un conjunto de posibilidades a menudo admite grados variables de complicación, que van desde extremadamente simples hasta extremadamente complicados. Las medidas de complejidad asignan números no negativos a estas posibilidades de tal manera que 0 corresponde a lo más simple y _ [sic] a lo más complicado. Por ejemplo, la complejidad computacional se mide siempre en términos de tiempo (es decir, número de pasos computacionales) o espacio (es decir, tamaño de la memoria, usualmente medido en bits o bytes) o alguna combinación de ambos. Cuanto más difícil sea un problema computacional, más tiempo y espacio se requieren para ejecutar el algoritmo que resuelve el problema. Para las medidas de información, el grado de complicación se mide en bits. Dado un evento A con probabilidad P(A), I(A) = -log2P(A) mide el número de bits asociados con la probabilidad P(A). Por lo tanto, hablamos de la "complejidad de la información" y decimos que la complejidad de la información aumenta a medida que I(A) aumenta (o, correspondientemente, a medida que P(A) disminuye). También hablamos de información "simple" y "compleja" según si I(A) significa pocos o muchos bits de información. Esta noción de complejidad es importante para la biología ya que no solo está en cuestión el origen de la información, sino el origen de la información compleja.

Observe que, por alguna razón, Dembski menciona la complejidad computacional aquí, pero no la vincula específicamente a una medida de información, lo cual está bien, porque los dos conceptos no son lo mismo – pero la implicación es cuestionable.

Información Especificada Compleja[Inicio]

Dembski continúa distinguiendo entre información compleja especificada y no especificada:

Ahora, la información que tiende a interesarnos como investigadores racionales en general, y científicos en particular, no es la actualización de posibilidades arbitrarias que no corresponden a ningún patrón, sino más bien la actualización de posibilidades circunscritas que sí corresponden a patrones. Hay más. La información con patrones, aunque sea un paso en la dirección correcta, aún no nos da completamente información especificada. El problema es que los patrones pueden ser elaborados a posteriori de tal manera que, en lugar de ayudar a elucidar la información, los patrones simplemente se leen de la información ya actualizada...

La información especificada es siempre información con patrones, pero la información con patrones no es siempre información especificada. Para la información especificada, no basta con cualquier patrón. Por lo tanto, distinguimos entre los patrones "buenos" y los patrones "malos". Los patrones "buenos" se llamarán a partir de ahora especificaciones. Las especificaciones son los patrones dados de forma independiente que no se leen simplemente de la información. Por el contrario, los patrones "malos" se llamarán fabricaciones. Las fabricaciones son los patrones a posteriori que simplemente se leen de la información ya existente...

La distinción entre información especificada y no especificada puede definirse ahora de la siguiente manera: la actualización de una posibilidad (es decir, información) es especificada si, independientemente de la actualización de la posibilidad, la posibilidad es identificable mediante un patrón. Si no es así, entonces la información es no especificada. Obsérvese que esta definición implica una asimetría entre la información especificada y la no especificada: la información especificada no puede convertirse en información no especificada, aunque la información no especificada pueda convertirse en información especificada. La información no especificada no necesita permanecer no especificada, sino que puede convertirse en información especificada a medida que aumenta nuestro conocimiento de fondo. Por ejemplo, una transmisión criptográfica cuyo sistema criptográfico aún no hemos logrado romper constituirá información no especificada. Sin embargo, apenas rompemos el sistema criptográfico, la transmisión criptográfica se convierte en información especificada.

Para el tratamiento matemático, se recomienda al lector consultar el libro de Dembski de 1998 "The Design Inference."

Dembski propone dos condiciones subsidiarias a la condición de independencia entre patrones e información:

(1) una condición de independencia condicional estocástica entre la información en cuestión y cierto conocimiento de fondo relevante; y

(2) una condición de manejabilidad mediante la cual el patrón en cuestión puede construirse a partir del mencionado conocimiento de fondo.

Ambos de los cuales él señala que no se formalizan fácilmente. Sin embargo, afirma que es fácil determinar en la práctica si un patrón se da de manera independiente a una posibilidad, "si el patrón se da antes de que la posibilidad se actualice". La vida, afirma, es un caso en el que un patrón se da después de que una posibilidad se ha actualizado, aunque él afirma que también representa información compleja especificada o CSI.

Dembski atribuye una serie de propiedades al DDI:

Es la CSI lo que para Manfred Eigen constituye el gran misterio de la biología, y uno que espera eventualmente desentrañar en términos de algoritmos y leyes naturales. Es la CSI lo que para los cosmólogos subyace al ajuste fino del universo, y que los diversos principios antrópicos intentan comprender (cf. Barrow y Tipler, 1986). Es la CSI que los potenciales cuánticos de David Bohm están extrayendo cuando examinan el micromundo en busca de lo que Bohm llama "información activa" (cf. Bohm, 1993, pp. 35-38). Es la CSI que permite al demonio de Maxwell engañar a un sistema termodinámico que tiende hacia el equilibrio térmico (cf. Landauer, 1991, p. 26). Es la CSI sobre la que David Chalmers espera basar una teoría integral de la conciencia humana (cf. Chalmers, 1996, cap. 8). Es la CSI que, dentro de la teoría de la información algorítmica de Kolmogorov-Chaitin, toma la forma de cadenas altamente comprimibles y no aleatorias de dígitos (cf. Kolmogorov, 1965; Chaitin, 1966).

Dembski continúa argumentando que la causación inteligente o el diseño son necesarios para que surja la CSI. Él argumenta que el diseño puede ser detectado:

La actualización de una entre varias posibilidades competidoras, la exclusión del resto y la especificación de la posibilidad que se actualizó encapsulan cómo reconocemos las causas inteligentes, o equivalentemente, cómo detectamos el diseño.

Diseño Inteligente [Inicio]

Dembski afirma que el Diseño Inteligente (DI) es un indicador de causalidad inteligente o diseño inteligente. Argumenta que el DI no puede resultar de una combinación de azar y necesidad, y que indica que un evento improbable fue, por lo tanto, elegido inteligentemente:

Si el azar y la necesidad, dejados por sí solos, no pueden generar ICD, ¿es posible que el azar y la necesidad trabajando juntos puedan generar ICD? La respuesta es No. Siempre que el azar y la necesidad trabajan juntos, las contribuciones respectivas del azar y la necesidad pueden disponerse secuencialmente. Pero al disponer las contribuciones respectivas del azar y la necesidad secuencialmente, se vuelve claro que en ningún punto de la secuencia se genera ICD. Consideremos el caso del ensayo y error (el ensayo corresponde a la necesidad y el error al azar). Una vez considerado un método rudimentario de resolución de problemas, el ensayo y error ha subido tanto en la estimación de los científicos que ahora se considera la fuente última de sabiduría y creatividad en la naturaleza. Los algoritmos probabilísticos de la informática (por ejemplo, algoritmos genéticos; véase Forrest, 1993) dependen todos del ensayo y error. Del mismo modo, el mecanismo darwiniano de mutación y selección natural es una combinación de ensayo y error en la que la mutación suministra el error y la selección el ensayo. Se comete un error después del cual se realiza un ensayo. Pero en ningún punto se genera ICD.

Dembski resume el CSI como un indicador de diseño:

Este argumento para demostrar que la información especificada compleja (CSI) es un indicador fiable del diseño puede ahora resumirse de la siguiente manera: la CSI es un indicador fiable del diseño porque su reconocimiento coincide con la forma en que reconocemos generalmente la causalidad inteligente. En general, para reconocer la causalidad inteligente debemos establecer que una de un rango de posibilidades competidoras se actualizó, determinar cuáles posibilidades fueron excluidas y luego especificar la posibilidad que se actualizó. Además, las posibilidades competidoras que fueron excluidas deben ser posibilidades vivas, lo suficientemente numerosas para que especificar la posibilidad que se actualizó no pueda atribuirse al azar. En términos de probabilidad, esto significa que la posibilidad que fue especificada es altamente improbable. En términos de complejidad, esto significa que la posibilidad que fue especificada es altamente compleja. Todos los elementos en el esquema general para reconocer la causalidad inteligente (es decir, Actualización-Exclusión-Especificación) encuentran su contrapartida en la información especificada compleja-CSI. La CSI señala lo que necesitamos estar buscando cuando detectamos el diseño.

Conservación de Información[Inicio]

Finalmente, Dembski propone una Ley de Conservación de la Información:

Esta fuerte afirmación prescriptiva, de que las causas naturales solo pueden transmitir CSI pero nunca originarla, la llamo la Ley de Conservación de la Información

que sostiene tiene las siguientes consecuencias:

(1) La CSI en un sistema cerrado de causas naturales permanece constante o disminuye.

(2) La CSI no puede generarse espontáneamente, originarse endógenamente, ni organizarse por sí misma (como se utilizan estos términos en la investigación sobre el origen de la vida).

(3) La CSI en un sistema cerrado de causas naturales ya ha estado en el sistema eternamente o fue añadida en algún momento exógenamente (lo que implica que el sistema, aunque ahora cerrado, no siempre lo fue). >

(4) En particular, cualquier sistema cerrado de causas naturales que también tenga una duración finita recibió la CSI que contiene antes de convertirse en un sistema cerrado.

Dónde Dembski se equivoca[Inicio]

Al intentar definir información compleja, Dembski confunde una definición de información de Teoría de la Información Clásica (probabilidad) con una definición modificada de Teoría de la Información Algorítmica (longitud computacional, o complejidad de Kolmogorov). Recuerde que Dembski definió la información como -log2 p, donde p representa la probabilidad de un evento. Esto es esencialmente el uso de Shannon en la Teoría de la Información Clásica. Por otro lado, continúa afirmando que -log 2 p es una medida de complejidad:

La información es una noción de la teoría de la complejidad. De hecho, como objeto puramente formal, la medida de la información descrita aquí es una medida de complejidad... Dado un evento A con probabilidad P(A), I(A) = -log2P(A) mide el número de bits asociados con la probabilidad P(A). Por lo tanto, hablamos de la "complejidad de la información" y decimos que la complejidad de la información aumenta a medida que I(A) aumenta (o, correspondientemente, a medida que P(A) disminuye).

Hasta ahora, Dembski ha aplicado la complejidad de Kolmogorov a la información de Shannon resultante de un solo evento. Al menos, otras partes del artículo implican que se refiere a la complejidad de Kolmogorov, y no lo aclara de otra manera en este párrafo. Matemáticamente, no hay nada incorrecto con esto, aunque la utilidad no es muy clara en absoluto. Sin embargo, hay un gran error en la segunda mitad de la última frase:

…la complejidad de la información aumenta a medida que I(A) aumenta (o, correspondientemente, a medida que P(A) disminuye)

Esto es incorrecto. En general, no existe ninguna relación entre la complejidad de Kolmogorov de una cadena y su probabilidad de ocurrencia. La complejidad de Kolmogorov de una cadena es la longitud del programa más corto en una Máquina de Turing Universal de referencia o UTM (un tipo de computadora generalizada) que producirá esa cadena. Depende de dos cosas: (1) el contenido de la cadena, y (2) la computadora de referencia, ninguna de las cuales se relaciona con la probabilidad de ocurrencia de la cadena. Existen un número infinito de UTMs de las cuales elegir. Dada una cadena finita arbitraria, podemos encontrar una UTM en la cual la complejidad de Kolmogorov de la cadena sea arbitrariamente baja o arbitrariamente alta. La naturaleza no tiene preferencia por una UTM sobre otra.

Además, si el contenido de una cadena dependiera de su probabilidad de ocurrencia, la Teoría de la Información Clásica, que ha hecho posible todo tipo de telecomunicaciones modernas, no sería necesaria. Uno de los conceptos básicos en la teoría de Shannon es que el uso de un canal de información se maximiza recodificando los mensajes de modo que los mensajes más probables sean más cortos y los menos probables más largos. Los códigos Fano-Shannon son un ejemplo de esto. Si el número de bits en una cadena estuviera inherentemente relacionado con la probabilidad, no necesitaríamos recodificarlos y los códigos Fano-Shannon serían inútiles.

Dembski da un salto fantástico al asumir que una métrica de información derivada de la probabilidad de un solo evento (-log 2 p) y la brevedad del algoritmo mínimo necesario para representar el evento (Chaitin-Kolmogorov) están necesariamente relacionadas. Sorprendentemente, el rigor matemático que respalda el caso de Dembski es insuficiente. De hecho, no hay razón para concluir que exista alguna relación entre la probabilidad de un evento y la complejidad de Kolmogorov para una fuente de información arbitraria.

Como nota al margen, la complejidad de Kolmogorov tiene la desventaja de ser no computable y, por lo tanto, constituye una métrica deficiente.

Por supuesto, Dembski es bastante vago sobre si realmente se refiere a la complejidad de Kolmogorov aquí. Es posible que simplemente esté llamando a la métrica de información de Shannon una medida de complejidad, en cuyo caso tendríamos que preguntarnos por qué está cambiando la terminología sin previo aviso. Incluso si esto es lo que Dembski quiere decir, el problema de asumir la probabilidad de una cadena está inherentemente relacionado con su contenido.

Otro gran error se encuentra en este pasaje:

Es la CSI la que, dentro de la teoría de Kolmogorov-Chaitin sobre la información algorítmica, toma la forma de cadenas altamente comprimibles y no aleatorias de dígitos

Dembski lo tiene al revés. En la Teoría de la Información Algorítmica de Chaitin y Kolmogorov, las cadenas altamente comprimibles tienen baja complejidad/contenido de información, no alta complejidad/contenido de información; y la complejidad aumenta con una mayor aleatoriedad algorítmica. Por ejemplo, en una computadora de propósito general, esperamos que el programa "imprimir un millón de ceros" requiera mucho menos de un millón de bits para describirse. Aquí hay una cadena altamente comprimible con muy poca complejidad y muy poco contenido de información. Por otro lado, generalmente es muy difícil comprimir ruido aleatorio. Como matemático, Dembski debería saber esto. Podríamos, por supuesto, encontrar una computadora bruta e ineficiente que, sin embargo, sea Universal, en la que el programa "imprimir un millón de ceros" requiera muchos más de un millón de bits para codificar, lo cual es otra razón para evitar la complejidad de Kolmogorov al analizar cadenas).

Las raíces de otro gran error están aquí:

La información especificada es siempre información estructurada, pero la información estructurada no siempre es información especificada. Para la información especificada, no basta con cualquier patrón. Por lo tanto, distinguimos entre los patrones "buenos" y los patrones "malos". Los patrones "buenos" se denominarán a partir de ahora especificaciones. Las especificaciones son los patrones dados de forma independiente que no se leen simplemente de la información. Por el contrario, los patrones "malos" se denominarán fabricaciones. Las fabricaciones son los patrones posteriores al hecho que se leen simplemente de la información ya existente...

La implicación es que, dados dos patrones, podemos de alguna manera saber cuál de ellos causó al otro. Él continúa:

La distinción entre información especificada y no especificada puede definirse de la siguiente manera: la realización de una posibilidad (es decir, información) está especificada si, independientemente de la realización de la posibilidad, esta es identificable mediante un patrón. Si no es así, entonces la información es no especificada.

Aquí tenemos otro gran salto en la suposición de Dembski de que, si un patrón existe antes de que una posibilidad se haga realidad, debe ser causal. Cualquier persona entrenada en estadística debe conocer el peligro de hacer suposiciones de causalidad simplemente porque se observa una correlación entre dos variables. Las correlaciones no implican causalidad entre las variables correlacionadas. Por ejemplo, la correlación entre la malaria y los pantanos fue observada hace mucho tiempo. La enfermedad malaria fue incorrectamente atribuida al aire malo (mal) (aria) cerca de los pantanos. La correlación fue correctamente notada, pero la suposición de causalidad fue defectuosa. Aunque un patrón correlacionado y una posibilidad actualizada pueden tener una causa relacionada, no se puede asumir que el patrón causó la posibilidad actualizada. En consecuencia, esta propuesta para detectar el diseño es altamente sospechosa. Este es un error crítico.

Para empeorar las cosas, Dembski se basa en conocer la probabilidad de que ocurra un solo evento. No es posible en general conocer la probabilidad asociada a un solo evento. Se debe tener conocimiento estadístico del proceso del cual surgió el evento para conocer su probabilidad con certeza; o un número suficientemente grande de muestras para estimarla. Pretender que la probabilidad depende de alguna manera de la complejidad de Kolmogorov del evento no ayuda.

Su argumento de que la CSI no puede ser creada por una combinación de azar y necesidad (o mutación y selección natural) es un argumento desde la ignorancia. Dembski afirma que no se puede hacer, pero falla en demostrar por qué. También implica que la CSI proporcionará información sobre posibilidades excluidas, sin mostrar cómo.

Cuanto más avanza Dembski, más recurre a gestos vacíos. No proporciona ninguna evidencia para respaldar su supuesta Ley de Conservación de la Información, que admite que es una "fuerte afirmación prescriptiva". Dado que se trata de una afirmación y no de una ley, cualquier argumento basado en ella puede y debe ser rechazado como pseudociencia.

Es interesante contrastar el propósito declarado del artículo:

(1) demostrar cómo la información puede detectarse y medirse de manera fiable, y (2) formular una ley de conservación que rija el origen y el flujo de la información

con sus declaraciones más adelante en el artículo cuando llega al núcleo de su argumento:

Este es un tema vasto cuya elucidación completa está más allá del alcance de este artículo (los detalles pueden encontrarse en mi monografía El Diseño Inferencial).

y

El objetivo de esta última sección es bosquejar brevemente la Ley de Conservación de la Información (un tratamiento completo se presentará en Uncommon Descent, un libro que estoy coautorizando con Stephen Meyer y Paul Nelson).

En otras palabras, después de haber cargado un artículo largo con gestos superficiales carentes de detalles, tras afirmar inicialmente que se formulará un principio profundo y nuevo en el artículo, Dembski dirige al lector a su próximo libro. Sin embargo, parece haber cambiado de rumbo. Ha editado un libro con un título similar Uncommon Dissent: Intellectuals who find Darwinism Unconvincing, pero solo contiene una introducción de Dembski. Su "Ley de Conservación de la Información" se expone en No Free Lunch. Para una reseña crítica de este libro, consulte The No Free Lunch FAQ.


[Inicio]