Not a Free Lunch — TalkOrigins Archive

DDDDDDDDDDDDDDDDDDDDDDRDDDDDDDDDDDDDDDDDD

La probabilidad de que ocurriera esta secuencia precisa, dado H, es extremadamente pequeña: (1/2)⁴¹ = 4.55 × 10^-13. Sin embargo, si esa secuencia en particular no hubiera sido predicha con antelación, no consideraríamos el resultado como excepcional en absoluto, a pesar de su baja probabilidad, ya que era muy probable que ocurriera alguna secuencia aleatoria similar. La secuencia histórica, por otro lado, contenía solo una R, y por lo tanto se veía algo así:

DRRDRDRRDDDRDRDDRDRRDRRDRRRDRRRDRDDDRDRDD

Supongamos que hubiéramos observado una secuencia típica de 41 extracciones, como la siguiente:

En su propio análisis de este suceso, Dembski llega a la misma probabilidad que el tribunal y explica el razonamiento detrás de su conclusión. La hipótesis de azar H que él considera es que Caputo realizó los sorteos de manera justa, con cada partido (D y R) teniendo una probabilidad de 1/2 de ser seleccionado para el primer lugar en cada ocasión.

Considera el ejemplo favorito de Dembski, el caso Caputo (pp. 55-58). Un político demócrata, Nicholas Caputo, era responsable de realizar extracciones aleatorias para determinar el orden en que aparecerían los dos partidos (Democrat y Republican) en las papeletas. Ocupar el primer puesto en la papeleta otorgaba al partido una ventaja en las elecciones, y se observó que en 40 de 41 extracciones Caputo sacó a un demócrata para ocupar esa posición privilegiada. En 1985 se alegó que Caputo había manipulado deliberadamente los sorteos para dar a su propio partido una ventaja injusta. El tribunal que consideró la acusación contra Caputo señaló que la probabilidad de sacar a su propio partido 40 de 51 veces era inferior a 1 entre 50 mil millones, y concluyó que “frente a estas probabilidades, pocas personas razonables aceptarán la explicación del puro azar”.⁸

Es importante notar que debemos combinar las probabilidades de todos los resultados en una región de rechazo apropiada, y no solo tomar la probabilidad del resultado particular observado, porque los resultados pueden individualmente tener probabilidades pequeñas sin que su aparición sea significativa. Una región de rechazo que sea apropiada para usarse de esta manera se dice que es desprendible del resultado observado, y la descripción de una región de rechazo desprendible se llama especificación (aunque Dembski suele usar los términos región de rechazo y especificación indistintamente).

La intuición fundamental detrás del método estadístico de Dembski es esta: hemos observado un suceso particular (resultado) E y queremos comprobar si una hipótesis de azar dada H ofrece una explicación razonable para este resultado.⁷ Seleccionamos una región de rechazo apropiada (un conjunto de resultados potenciales) R, donde E está en R, y calculamos la probabilidad de observar un resultado en esa región de rechazo asumiendo que H es verdadera, es decir, P(R|H). Si P(R|H) < α, donde α es un límite de probabilidad pequeño apropiado, consideramos implausible que pudiera haber ocurrido un suceso de tan pequeña probabilidad y, por lo tanto, rechazamos la hipótesis de azar H que dio lugar a esta pequeña probabilidad.

3.1 Método estadístico de Dembski

El método de eliminación de azar es eliminativo: se basa en rechazar hipótesis de azar. Dembski da dos procedimientos para eliminar hipótesis de azar: un método estadístico para eliminar hipótesis de azar individuales y generalizaciones proscriptivas, para eliminar categorías enteras de hipótesis de azar.

En el capítulo 2 de No Free Lunch, Dembski describe un método para inferir diseño basado en lo que llama el argumento de eliminación del azar genérico. Me referiré a este método como el método de eliminación de azar. Este método parte de que hemos observado un suceso y queremos determinar si en ese suceso participó algún diseño.

Ignorancia, señora, pura ignorancia.
Samuel Johnson (al ser preguntado por cómo llegó a definir incorrectamente una palabra en su diccionario)

3. El método de eliminación por azar

Dembski introduce el término hipótesis de azar para describir explicaciones propuestas que se basan enteramente en causas naturales. Esto incluye procesos que comprenden elementos de azar y necesidad (p.15), así como procesos puramente deterministas. Puede parecer extraño referirse a hipótesis puramente deterministas como hipótesis de azar, pero Dembski nos dice que “la necesidad puede verse como un caso especial de azar en el que la distribución de probabilidad que gobierna la necesidad colapsa todas las probabilidades a cero o uno” (p.71). Dado que Dembski define el diseño como el complemento del azar y la necesidad, se deduce que una hipótesis de azar también podría llamarse, igual de bien (y con mayor claridad), una hipótesis no diseñas. Y dado que él define las causas naturales como el complemento del diseño, también podemos referirnos a las hipótesis de azar como hipótesis naturales. El uso del término hipótesis de azar por parte de Dembski ha causado considerable confusión en el pasado, pues muchas personas han entendido el azar como puramente aleatorio, es decir, con todos los resultados igualmente probables. Aunque el uso de Dembski se ha aclarado en No Free Lunch, creo que todavía tiene potencial para confundir. Para ser coherente con el trabajo de Dembski, en general usaré el término hipótesis de azar, pero cambiaré al sinónimo hipótesis natural o hipótesis no diseñas cuando crea que esto aumentará la claridad.

Pero el naturalismo metodológico en el que la mayoría de los científicos insiste requiere solo el rechazo de explicaciones sobrenaturales, no de explicaciones que involucren agencia inteligente. De hecho, acabamos de ver que la ciencia contemporánea permite explicaciones que involucran diseñadores humanos y, sostengo, seres inteligentes extraterrestres. Quizá lo que Dembski realmente significa es que el naturalismo metodológico rechaza la invocación de un “diseñador incorpóreo” (para usar su término).⁶

De acuerdo con el naturalismo metodológico, para explicar cualquier fenómeno natural, las ciencias naturales pueden invocar solo causas naturales, en exclusión de causas inteligentes. [p. xvi]

La palabra natural ha sido la fuente de mucha confusión en el debate sobre el diseño inteligente. Tiene dos significados distintos: uno es el complemento de artificial, es decir, que involucra agencia inteligente; el otro es el complemento de sobrenatural. Dembski nos dice que usará la palabra en el primer sentido: “...estoy colocando causas naturales en contradicción con causas inteligentes” (p. xiii). Luego continúa diciendo que la ciencia contemporánea está comprometida con un principio de naturalismo metodológico:

Una interpretación alternativa de la afirmación de Dembski podría ser que la ciencia contemporánea rechaza el diseño como un modo de explicación legítimo al contabilizar el origen de organismos biológicos. Si esto es lo que quiere decir, rechazo tal afirmación. Si descubriéramos los restos de una antigua civilización alienígena con registros detallados de cómo esos alienígenas manipularon la evolución de organismos, entonces creo que la ciencia convencional tendría poca dificultad para aceptar esto como evidencia de diseño en los organismos biológicos.

Dembski afirma que la ciencia contemporánea rechaza el diseño como un modo legítimo de explicación (p. 3). Pero él mismo da ejemplos de científicos haciendo inferencias que implican agencia humana, como la inferencia de arqueólogos de que ciertas piedras son puntas de flecha hechas por humanos antiguos (p. 71), y llama a esas inferencias “inferencia de diseño”. ¿Está afirmando que esos arqueólogos son inconformistas que operan fuera de los límites de la ciencia convencional? Yo no lo creo. Creo que lo que Dembski realmente quiere decir aquí es que la ciencia contemporánea no permite explicaciones que involucren procesos no mecanicistas, y está proyectando su propia creencia de que el diseño es un proceso no mecanicista sobre la ciencia contemporánea. Pero incluso si fuera cierto que la ciencia no permite explicaciones con procesos no mecanicistas, ciertamente sí permite inferir la acción de una mente donde no es necesario emitir juicio sobre si los procesos mentales son mecanicistas o no (y ese juicio suele ser innecesario).

Para escapar de este dilema, Dembski invoca el concepto de intencionalidad derivada: la salida de una computadora puede “mostrar diseño”, pero el diseño fue realizado por el creador de la computadora y no por la propia computadora (pp. 223, 326). Siempre que un fenómeno muestre diseño, debe haber un diseñador (una mente consciente, en mi interpretación) en algún punto de la cadena causal de sucesos que conduce a ese fenómeno.

Aun con esta interpretación, todavía encontramos un problema. En su ejemplo de Caputo (p. 55), Dembski usa su inferencia de diseño para distinguir entre dos explicaciones posibles que involucran ambas acciones de un ser consciente: o Caputo hizo un sorteo justo o hizo trampa. Dembski considera solo la segunda de estas alternativas como diseño. Pero ambas explicaciones involucran un agente consciente. Podría decirse que, si Caputo no hizo trampas, simplemente imitó la acción de un dispositivo mecanicista, por lo que eso no cuenta. Pero eso plantearía la cuestión de hasta qué punto puede hacer un dispositivo mecanicista. ¿No es capaz un computador sofisticado de hacer trampa? En efecto, ¿existe alguna acción de una mente humana que no pueda, en principio, ser imitada por un computador suficientemente sofisticado? Si no, ¿cómo distinguir entre diseño consciente y una computadora imitando diseño? Incluso si dudas de que en principio una computadora podría imitar todas las acciones de una mente humana, considera si podría imitar las acciones de una rata, que Dembski también considera un agente inteligente capaz de diseño (pp. 29-30).

Parece que Dembski considera la conciencia como un tipo de proceso muy especial, que no puede atribuirse a leyes físicas. Nos dice que el diseño inteligente no es una explicación mecanicista (pp. 330-331). Dembski no sería el único en esta visión, aunque no está en absoluto claro qué significa que un proceso sea no mecanicista. Sin embargo, parece que dicho proceso queda fuera del ámbito de causa y efecto. Esto plantea todo tipo de preguntas filosóficas difíciles, que no intentaré considerar aquí. Incluso si aceptamos que existen procesos no mecanicistas, Dembski no nos da razones para pensar que la conciencia (o el diseño inteligente) sea el único tipo posible de proceso no mecanicista. Sin embargo, él parece asumir que ese es el caso.

Para un libro que trata por completo sobre la inferencia de diseño, es sorprendente descubrir que No Free Lunch no define con claridad el término. Diseño se equipara con agencia inteligente, pero ese término tampoco se define. También se describe de manera negativa, como el complemento de necesidad (procesos deterministas) y azar (procesos estocásticos). Sin embargo, los procesos deterministas y estocásticos se definen normalmente como complementos mutuamente excluyentes: aquellos procesos que no implican ninguna incertidumbre y aquellos que sí. Por lo tanto, no queda claro qué, si es que queda algo, permanece tras excluir esas dos categorías. Dembski asocia el diseño con las acciones de animales, seres humanos y deidades, pero parece negar la etiqueta a las acciones de las computadoras, por muy innovador que sea su resultado. ¿Qué distingue, por ejemplo, una mente animal de una computadora? Obviamente hay muchas diferencias físicas. Pero, ¿por qué las acciones de una deberían considerarse diseño y las de la otra no? La única explicación que se me ocurre es que una es consciente y la otra, presumiblemente, no lo es. Concluyo que, cuando infiere diseño, Dembski significa que estuvo involucrada una mente consciente.

En primavera, cuando los bosques se vuelven verdes,
trataré de decirte a qué me refiero.
Lewis Carroll, Through the Looking-Glass (Humpty Dumpty)

2. Diseño y naturaleza

Desgraciadamente, algunos navegadores antiguos no pueden mostrar una serie de símbolos matemáticos que se usan en este artículo. Netscape 4 es uno de ellos.

Las citas que consisten únicamente en números de página se refieren a páginas de No Free Lunch.

Esta crítica asume un conocimiento básico de matemáticas, teoría de la probabilidad y teoría evolutiva por parte del lector. Para simplificar algunos de mis argumentos, he relegado muchos detalles a notas finales, a las que se puede acceder mediante enlaces numerados. En algunos casos, afirmaciones que no están sustentadas en el cuerpo del texto se apoyan en argumentos en las notas finales.

Algunos lectores pueden considerar desagradable el tono francamente despectivo que he adoptado hacia el trabajo de Dembski. Los críticos de la pseudociencia del diseño inteligente se enfrentan a un dilema. Si la discuten en términos corteses y académicos, los propagandistas del Diseño Inteligente lo usan como evidencia de que sus argumentos están recibiendo una atención seria por parte de académicos, sugiriendo que esto implica que debe haber algún mérito en sus argumentos. Si los críticos simplemente ignoran los argumentos del Diseño Inteligente, los propagandistas insinúan que es porque los críticos no pueden responderlos. Mi solución a este dilema es refutar los argumentos de manera exhaustiva, dejando claro que lo hago sin otorgarles el menor respeto.

Hace tiempo, publiqué una crítica³ del libro anterior de Dembski, The Design Inference,⁴ en el foro en línea Metaviews, al que él contribuye, señalando las ambigüedades fundamentales de sus argumentos. Su única respuesta fue llamarme un “stalker de Internet” mientras se negaba a abordar los problemas que expuse, alegando que “Internet no es un foro fiable para resolver cuestiones técnicas de estadística y filosofía de la ciencia”.⁵ Sin embargo, está claro que leyó mi crítica, ya que ahora me reconoce como alguien que ha contribuido a su trabajo (p. xxiv). Aunque algunas de las ambigüedades a las que llamé la atención en aquella crítica anterior se han resuelto en su volumen actual, otras se han mantenido y se han añadido muchas nuevas.

3.5 Inferencias comparativas y eliminativas

Si Dembski desea defender los argumentos de dios de los huecos como un modo legítimo de inferencia científica, está en su derecho de intentarlo. Lo que resulta menos bienvenido son sus intentos de disfrazar su método como algo más aceptable.

Sí, estas inferencias de diseño son falibles, como también lo son todas las inferencias científicas. No es eso lo que está en discusión. La diferencia es que estas inferencias no son puramente eliminativas. Los expertos en cuestión tienen en mente un tipo particular de diseñador inteligente (los seres humanos) del que saben mucho acerca de sus capacidades y motivaciones. Por lo tanto, pueden comparar los méritos de tal explicación con los méritos de otras explicaciones.

Los arqueólogos infieren que ciertos trozos de roca son puntas de flecha. Los detectives infieren que ciertas muertes fueron deliberadas. Los criptógrafos infieren que ciertas cadenas de símbolos de aspecto aleatorio son en realidad mensajes cifrados. En todos los casos pueden equivocarse, y un conocimiento adicional podría revelar una hipótesis de azar plausible detrás de lo que inicialmente parecía diseñado. Pero esas meras posibilidades, por sí solas, no hacen caer nuestra confianza en las inferencias de diseño. [p. 71]

Dembski no está siendo criticado por no eliminar todas las hipótesis de azar posibles, sino por adoptar en primer lugar un método puramente eliminativo.

Para cualquier suceso que sea, existe una distribución de probabilidad que concentra toda la probabilidad en ese suceso y, por lo tanto, le asigna una probabilidad de uno. Por ello no tiene sentido criticar mi generalización del enfoque de Fisher para la prueba de hipótesis por no considerar todas las hipótesis de azar posibles. [p. 70]

Este es un argumento de ignorancia claro. Salvo que los escépticos del diseño puedan proponer una explicación natural explícita, Dembski nos dice, debemos inferir diseño.

Las inferencias de diseño, por lo tanto, eliminan el azar en el sentido global de cerrar la puerta a todas las explicaciones de azar relevantes. Sin duda, esto no se puede hacer con absoluta definitividad, ya que siempre existe la posibilidad de que se haya pasado por alto una distribución de probabilidad crucial. No obstante, no basta para el escéptico del diseño simplemente señalar que añadir una nueva explicación de azar a la mezcla puede hacer tambalear una inferencia de diseño. En cambio, el escéptico del diseño necesita proponer explícitamente una nueva explicación de azar y argumentar su relevancia para el caso en cuestión. [pp. 67-68]

La frase de Dembski “exhaustivo respecto de la indagación en cuestión” es una de esas circunloquios en los que él sobresale. Simplemente significa que el conjunto es tan exhaustivo como podamos hacerlo. En otras palabras, es una forma elegante de decir que hemos eliminado todas las hipótesis de azar que hemos podido imaginar.

Las inferencias de diseño que infieren diseño al identificar la complejidad especificada no son, por tanto, puramente eliminativas. No solo excluyen, sino que excluyen de un conjunto exhaustivo en el que el diseño es lo único que queda una vez que la inferencia ha hecho su trabajo (lo que no significa que el conjunto sea exhaustivo lógicamente; más bien, es exhaustivo respecto de la indagación en cuestión, es decir, todo lo que podamos hacer en la ciencia). Las inferencias de diseño, al identificar complejidad especificada, excluyen todo lo que a su vez pudiera excluir el diseño. [p. 111]

Dembski está interpretando mal el cargo de argumento de ignorancia. No se trata de cuánto conocimiento hemos utilizado. El conocimiento científico siempre es incompleto. El método de eliminación del azar es puramente eliminativo porque no intenta considerar los méritos de la hipótesis de diseño, sino que se limita a basarse en eliminar las alternativas disponibles.

En respuesta a esta crítica, obsérvese primero que, aunque la complejidad especificada se establece mediante un argumento eliminativo, no es justo decir que se establece mediante un argumento purement eliminativo. Si el argumento fuera puramente eliminativo, podría estar justificado decir que el paso de la complejidad especificada a una inteligencia diseñadora es un argumento de ignorancia (es decir, no X, por tanto Y). Pero a diferencia del enfoque de Fisher en las pruebas de hipótesis, en el que hipótesis de azar individuales se eliminan sin referencia al conjunto completo de hipótesis de azar relevantes que podrían explicar un fenómeno, la complejidad especificada presupone que el conjunto completo de hipótesis de azar relevantes se ha identificado primero. Esto requiere un considerable conocimiento de fondo. Además, se requiere un considerable conocimiento de fondo para plantear el patrón correcto (es decir, la especificación) para eliminar todas esas hipótesis de azar y así inferir diseño. [p. 111]

Dado que los argumentos de ignorancia son rechazados casi universalmente como falaces por científicos y filósofos de la ciencia, Dembski es sensible al cargo, pero sus intentos de eludir una evidencia evidente son simples evasivas.

3.4 Respuestas de Dembski al cargo de argumento de ignorancia

Dembski no presenta un buen caso para otorgarle a la hipótesis de diseño un estatus privilegiado. ¿Por qué deberíamos preferir “un diseñador desconocido lo hizo” a “causas naturales desconocidas lo hicieron” o “no sabemos qué lo hizo”? Además, como veremos, nos dice que aceptemos el diseño por eliminación incluso cuando sí tenemos algunas ideas generales de cómo las causas naturales podrían haberlo hecho.

Un argumento de dios de los huecos es un argumento de ignorancia en el que la hipótesis por defecto, a aceptarse cuando no hay una hipótesis alternativa disponible, es “Dios lo hizo”. Dado que Dembski nos dice que su criterio solo infiere la acción de un diseñador desconocido, y no necesariamente uno divino, el término diseñador de los huecos podría ser aquí más apropiado, pero creo razonable usar el término más familiar, ya que los argumentos siguen el mismo patrón eliminativo y Dembski ha dejado claro que el diseñador que tiene en mente es el Dios cristiano. El argumento de los huecos de Dios no debe confundirse con una teología de los huecos. La última propone que las acciones de Dios se restringen a aquellas áreas de las que carecemos de conocimiento, pero no presenta esto como un argumento para la existencia de Dios.

Este tipo de argumento es conocido comúnmente como un argumento de ignorancia o argumento de los vacíos (de tipo dios de los huecos). Para evitar malos entendidos, aclararé que la acusación de argumento de ignorancia no es una afirmación de que quienes lo sostienen ignoran los hechos, ni siquiera de que no estén utilizando los hechos disponibles. Los partidarios de un argumento de ignorancia exigen que su explicación sea aceptada solo porque la comunidad científica es ignorante (al menos en parte) de cómo ocurrió un suceso, en lugar de porque su propia explicación se haya demostrado como una buena explicación. Obsérvese que un argumento de ignorancia científica difiere de la falacia deductiva de argumento de ignorancia. La falacia deductiva toma la forma: “Mi proposición no ha sido demostrada falsa, así que debe ser verdadera”. El argumento de ignorancia científica no es una falacia deductiva, porque las inferencias científicas no son argumentos deductivos.

Así vemos que el método de eliminación del azar es puramente eliminativo. Nos dice que inferimos diseño cuando hemos descartado todas las hipótesis de azar (es decir, no diseño) que podemos imaginar. La hipótesis de diseño no dice nada sobre la identidad, naturaleza, objetivos, capacidades o métodos del diseñador. Sólo dice, en efecto, “un diseñador lo hizo”.¹⁰

Así, cuando hemos eliminado todas las hipótesis de azar que podemos imaginar, inferimos que el suceso era altamente improbable respecto de todos los mecanismos causales conocidos, y llamamos a esto complejidad especificada. Más tarde Dembski nos dice que una inferencia de complejidad especificada debe conducir inevitablemente a una inferencia de diseño. Si este es el caso, no queda claro que aquí la noción de complejidad especificada esté cumpliendo una función útil. ¿Por qué no eliminar el intermediario y pasar directamente del Argumento de eliminación de azar genérico al diseño? Lamentablemente, la introducción de ese intermediario sirve para causar una confusión considerable, porque Dembski equipara este sentido de complejidad especificada y el sentido asignado por su método de inferencia de probabilidad uniforme (que explicaré en la sección 6). Para ayudar a aclarar la confusión, me referiré a este sentido del intermediario como complejidad especificada eliminativa y al otro sentido como complejidad especificada de probabilidad uniforme. Nótese que la complejidad especificada de Dembski no es una cantidad: un suceso simplemente muestra complejidad especificada o no la muestra.

Pero, ¿qué ocurre cuando se encuentra algún mecanismo causal que explique un caso dado de complejidad especificada? Algo que es especificado y complejo es altamente improbable respecto de todos los mecanismos causales conocidos actualmente. En consecuencia, para que un mecanismo causal aparezca y explique algo que previamente se consideraba especificado y complejo significa que el elemento en cuestión, de hecho, ya no es especificado y complejo respecto del mecanismo causal recién encontrado. [p. 330]

{H_i} es el conjunto de todas las hipótesis de azar que creemos que “pudieron haber estado operando para producir E” (p.72). Dembski también escribe:

S [el sujeto que hace la inferencia] está autorizado para inferir que E [el resultado observado] no ocurrió de acuerdo con ninguna de las hipótesis de azar en {H_i}_{i in I} y, por lo tanto, que E muestra complejidad especificada. [p. 73]

La conclusión del Argumento de eliminación de azar genérico (paso #8) está formulada por Dembski de la siguiente manera:

3.3 El argumento de ignorancia

Acepto que a veces pueden hacerse generalizaciones proscriptivas, y Dembski puede usarlas para eliminar categorías específicas de hipótesis de azar. Pero no hay una generalización proscriptiva que pueda descartar todas las hipótesis de azar. Además, su afirmación de haber encontrado una generalización proscriptiva contra la evolución darwinista de sistemas de complejidad irreducible es hueca (véase 4.2 abajo).

Dembski sostiene que podemos eliminar categorías completas de hipótesis de azar mediante generalizaciones proscriptivas. Por ejemplo, menciona la segunda ley de la termodinámica, que proscribe la posibilidad de una máquina de movimiento perpetuo. Describe la lógica de tales generalizaciones en términos de invariantes matemáticas (p. 274), aunque esto no añade absolutamente nada a su argumento.

3.2 Generalizaciones proscriptivas

Aunque creo que el método estadístico de Dembski está gravemente defectuoso, el tema no es importante para mi refutación de la inferencia de diseño de Dembski. Por el resto del cuerpo principal de esta crítica, por lo tanto, asumiré para fines de discusión que el método es válido. Una discusión de los defectos se dejará para un apéndice. Sin embargo, vale la pena señalar que este método no se ha publicado en ninguna revista profesional de estadística y parece no haber sido reconocido por ningún otro estadístico.

Una especificación apropiada es simplemente cualquier cosa que pueda derivarse (en algún sentido flexible) del conocimiento de fondo que teníamos disponible antes de observar el suceso en cuestión. Por ejemplo, cuando Dembski aplica su método al flagelo bacteriano, su único ejemplo biológico, no se molesta en usar las reglas técnicas que desarrolló antes, ni siquiera en enunciar explícitamente la especificación. Leyendo entre líneas, su especificación parece ser “cualquier cosa con la función de un motor rotativo externo”, y la única justificación que da para esta especificación es la afirmación de que “los seres humanos desarrollaron motores rotativos externos mucho antes de darse cuenta de que el flagelo era una máquina de ese tipo” (p. 289).
Dembski distingue entre límites de probabilidad locales y universales. Un límite de probabilidad local es uno que se calcula con el propósito de una prueba estadística particular.⁹ El procedimiento para calcular tal límite es difícil y altamente arbitrario (p. 83), por lo que Dembski en general recurre a su límite de probabilidad universal. Se trata de un número muy pequeño, 10^-150 (es decir, 1 entre 10¹⁵⁰), que Dembski nos dice que es el límite de probabilidad más pequeño que necesitamos usar alguna vez, y que siempre podemos usar en ausencia de un límite de probabilidad local adecuado. Lo calcula multiplicando el número de partículas elementales en el Universo, el número máximo posible de transiciones de partículas elementales (el inverso del tiempo de Planck) por segundo, y el número de segundos en mil millones por la edad actual del Universo, para dar una cifra que, según su argumentación, es el número máximo de recursos probabilísticos que necesitamos considerar alguna vez (p. 22):

10⁸⁰ × 10⁴⁵ × 10²⁵ = 10¹⁵⁰

Para aplicar el método de Dembski, necesitamos saber cómo seleccionar una especificación y un límite de probabilidad apropiados. Dembski expone con mucha amplitud un conjunto de reglas para seleccionar estos parámetros, pero pueden resumirse en lo siguiente:

La segunda secuencia (llámese E) tiene exactamente la misma probabilidad que la primera, es decir, P(E|H) = 4.55 × 10^-13, pero esta vez la consideraríamos excepcional, porque la probabilidad de observar tantos Ds es extremadamente pequeña. Cualquier resultado que mostrara tantos Ds como este (40 o más Ds de 41 extracciones) se habría considerado al menos igual de excepcional, por lo que la probabilidad que nos interesa es la probabilidad de observar 40 o más Ds. “40 o más Ds”, entonces, es nuestra especificación, y, como sucede, hay 42 secuencias diferentes que coinciden con esta especificación, de modo que P(R|H) = 42 × P(E|H) = 1.91 × 10^-11, o aproximadamente 1 de 50 mil millones. En otras palabras, la probabilidad que nos interesa aquí no es la probabilidad de la secuencia exacta que observamos, sino la probabilidad de observar algún resultado que coincida con la especificación. Si decidimos que esta probabilidad es lo suficientemente pequeña, rechazamos H, es decir, inferimos que los sorteos de Caputo no eran justos. De ahora en adelante, usaré la expresión “baja probabilidad” para significar “probabilidad por debajo de un límite de probabilidad apropiado”.

Cada una de estas probabilidades individualmente está por debajo del límite de probabilidad universal de Dembski, por lo que no procede multiplicarlas.

p_local es la probabilidad de que se extraiga una colección adecuada de proteínas de un conjunto de proteínas existentes que incluya las requeridas. Dembski supone que las proteínas se extraen al azar entre las 4289 proteínas codificadas por el ADN de E. coli, que se necesitan 5 copias de cada una de 50 proteínas diferentes (lo que suma 250 proteínas en total), y que en cada caso hay 10 proteínas diferentes que serían aceptables (es decir, hay 9 posibles sustitutos de la proteína real). En efecto, tenemos que hacer 250 extracciones, y en cada extracción tenemos una probabilidad de 500/4289 de elegir una proteína útil, lo que da una probabilidad total de (500/4289)²⁵⁰.
p_config es la probabilidad de que, dada la colección correcta de proteínas, formen un flagelo viable si se ordenan al azar. Dembski pretende extraer de una distribución de probabilidad uniforme sobre todas las posibles formas de ordenar las proteínas seleccionadas:

Estríctamente hablando, la probabilidad de configuración de un objeto combinatorio discreto que exhibe alguna función es la proporción de todas las formas de ordenar sus bloques constructivos que conservan la función dividida entre todas las formas posibles de ordenar, de cualquier manera, esos bloques constructivos. [pp. 294-295]

Dado que no puede calcular esto directamente, usa una aproximación que llama probabilidad de perturbación. No necesitamos preocuparnos por los detalles.
p_orig es la probabilidad de que todas las proteínas individuales se formen por combinación aleatoria de aminoácidos y se basa, de nuevo, en una probabilidad de perturbación.

p_dco = p_orig × p_local × p_config

Dembski nos dice que hay que multiplicar tres probabilidades parciales para llegar a la probabilidad de un “objeto combinatorio discreto”:

La única estructura biológica a la que Dembski aplica su método es el flagelo de la bacteria E. coli. Dado que su método exige que comience determinando el conjunto {H_i} de todas las hipótesis de azar que “pudieron estar actuando para producir E [el resultado observado]” (p. 72), cabría esperar una identificación explícita de la hipótesis de azar en consideración. Dembski no ofrece tal identificación explícita, y el lector debe inferirla a partir de los detalles del cálculo. Quizá la razón por la que Dembski no logró identificar su hipótesis de azar es que, al ser nombrada claramente, es de manera transparente un hombre de paja. Ningún biólogo propone que el flagelo apareció por una combinación puramente aleatoria de proteínas: creen que evolucionó por selección natural, y todos estarían de acuerdo en que la probabilidad de aparición por combinación aleatoria es tan minúscula que esto resulta insatisfactorio como explicación científica. Por lo tanto, para Dembski, proporcionar un cálculo probabilístico basado en este escenario absurdo es una pérdida de tiempo. No hace falta considerar si el cálculo de Dembski es correcto, porque es totalmente irrelevante para el problema. No obstante, dado que Dembski no afirma claramente que basó su cálculo en una hipótesis de combinación puramente aleatoria, describiré brevemente el cálculo para demostrar que ese es el caso.

Han pasado varios años desde que Dembski afirmó por primera vez haber detectado diseño en biología al aplicar su método de inferencia. Sin embargo, hasta la publicación de No Free Lunch, nunca había proporcionado ni citado los detalles de tal aplicación. Por ello, los críticos esperaban ver el cálculo de probabilidad largamente prometido que respaldaría la afirmación. Yo, por mi parte, no esperaba un cálculo convincente, y aun así me sorprendió descubrir que Dembski no nos ha ofrecido nada más que una variante del viejo hombre de paja creacionista del “tornado en un patio de chatarra”¹⁴, esto es, la probabilidad de que una estructura biológica ocurra por una combinación puramente aleatoria de componentes.

4.1 Un tornado en un patio de chatarra

Él usa la estadística como un borracho usa las farolas: para apoyo en lugar de iluminación.
Andrew Lang (1844-1912), poeta y novelista

4. Aplicación del método a la naturaleza

Determinar si un sistema con complejidad irreducible muestra complejidad especificada implica dos cosas: demostrar que el sistema está especificado y calcular su probabilidad... [p. 289]

Si bien Dembski ha hecho algunos intentos por aclarar la situación en No Free Lunch, su uso continuado del filtro explicativo en su forma altamente engañosa es inexplicable. Y la desorientación no se limita al propio filtro explicativo. Ocurre también en otros lugares, en enunciados como este:

La descripción del filtro explicativo apenas menciona el concepto de hipótesis de azar y sugiere que solo necesitamos considerar una distribución de probabilidad. El diagrama de flujo del filtro (p. 13) debería contener un bucle, que se ejecutara para cada hipótesis de azar. Muchos lectores de trabajos anteriores de Dembski han llegado a la conclusión errónea de que solo necesitamos calcular la probabilidad con respecto a una distribución de probabilidad uniforme.
El filtro explicativo tiene nodos separados para complejidad (que Dembski usa aquí como sinónimo de improbabilidad) seguidos de especificación, como si fueran dos criterios separados. Pero, como vimos arriba, no podemos calcular la probabilidad hasta que hayamos formulado una especificación. Muchos lectores de Dembski en el pasado han interpretado erróneamente el filtro así: observen que el resultado observado está especificado (en cierto sentido) y luego calculen la probabilidad de ese único resultado (cuando debieron haber calculado la probabilidad de una región de rechazo completa).

El método de eliminación por azar se introduce inicialmente en una forma simplificada llamada filtro explicativo. El criterio para que el filtro reconozca diseño se denomina el criterio de especificación de complejidad. Desafortunadamente, el uso de esta versión simplificada ha causado considerable confusión en el pasado, porque posee dos características engañosas:

3.7 El filtro explicativo

No le serviría a Dembski afirmar que estos son casos de diseño derivado (véase el apartado 6.1 más abajo), p. ej., que los hongos y el sistema solar fueron originalmente diseñados. El método de eliminación por azar infiere diseño en el evento particular que se alega tiene una baja probabilidad de ocurrir bajo causas naturales. Por ejemplo, en el caso del flagelo, Dembski afirma que el diseño estuvo involucrado en el origen del propio flagelo, y no solo de manera indirecta en términos de que la Tierra o el Universo hayan sido diseñados.

Quizá Dembski objetaría que su afirmación (“en todos los casos en los que conocemos la historia causal y donde estuvo implicada complejidad especificada, también estuvo involucrada una inteligencia”) solo se refería a casos en los que observamos complejidad especificada hoy. Pero, por definición, esos son casos en los que no tenemos una explicación natural plausible. Si tuviéramos una, no inferiríamos complejidad especificada. Si conocemos la historia causal y no fue una causa natural, tuvo que ser diseño. Así, si esto es lo que Dembski significa, su afirmación es una tautología. Dice que, siempre que se sepa que la causa es diseño, ¡la causa es diseño! No puedes hacer una inferencia inductiva a partir de una tautología.

Anillos de hadas. Son anillos de hongos causados por un hongo que se expande a través de la hierba a una tasa uniforme desde un punto inicial. Los hongos se manifiestan en el borde externo del círculo afectado. Antes de conocerse la causa, a menudo se atribuían estos anillos a diseñadores inteligentes (“hadas”). Si tomamos la hipótesis de azar de que los hongos estaban ubicados al azar en un prado (con una distribución de probabilidad uniforme), la probabilidad de que formen un círculo ordenado es claramente lo suficientemente pequeña como para justificar el rechazo de esta hipótesis (mediante un límite local de probabilidad apropiado, si no el límite de probabilidad universal de Dembski).¹² Usando el método de eliminación por azar de Dembski, se habría inferido erróneamente complejidad especificada (y por lo tanto diseño).
Cráteres lunares. Al observar los cráteres principales de la Luna, Johannes Kepler concluyó que eran demasiado circulares para haber ocurrido por azar y, por lo tanto, debieron haber sido creados por habitantes de la Luna. Si tomamos la hipótesis de azar de que los cráteres se formaron a partir de muchas colinas individuales, y que esas colinas estaban distribuidas al azar sobre la superficie de la Luna, entonces la probabilidad de que formen círculos tan buenos es claramente suficientemente pequeña para rechazar esa hipótesis. Usando el método de eliminación por azar de Dembski, se habría inferido complejidad especificada (y por lo tanto diseño), pero ahora sabemos que estos cráteres tienen una explicación natural: impactos de objetos que caen. Debo su deuda por este ejemplo al propio Dembski, que lo describe¹³ pero no se da cuenta de que proporciona un contraejemplo a su afirmación.

Dembski quiere que creamos que su método de inferencia es básicamente el mismo método que ya se usa en nuestras inferencias cotidianas y científicas de diseño. Ya he argumentado que esto es falso. Pero incluso si suponemos, por el bien del argumento, que nuestras inferencias típicas de diseño se basan efectivamente en el tipo de enfoque puramente eliminativo propuesto por Dembski, no es difícil encontrar contraejemplos, en los que se infirió erróneamente diseño debido a ignorancia de la causa natural verdadera:

Dejando de lado la cuestión de si tal inducción estaría justificada si su premisa fuera verdadera, consideremos si la premisa es verdadera o no. En contraste con la afirmación de Dembski, su sección 1.6 no mostró nada de ese tipo. De hecho, los únicos casos en los que sabemos que se usó su método para inferir diseño son los dos ejemplos que el propio Dembski describe: el caso de Caputo y el flagelo bacteriano. Y en ninguno de esos casos el diseño se ha establecido de forma independiente.

Primero (sección 1.6) ofrecí un argumento inductivo, mostrando que en todos los casos donde conocemos la historia causal y donde estuvo involucrada complejidad especificada, también estuvo involucrada una inteligencia. La generalización inductiva que sigue es que todos los casos de complejidad especificada involucran inteligencia. [p. 110]

Dembski argumenta, sobre la base de una inferencia inductiva, que el método de eliminación por azar es confiable:

3.6 Confiabilidad y contraejemplos

Al oponerse a los métodos comparativos, Dembski sostiene que las hipótesis pueden eliminarse de forma aislada sin que necesariamente exista un competidor superior. En términos prácticos, estoy de acuerdo, aunque sospecho que no eliminaríamos una hipótesis a menos que tuviéramos en la parte posterior de la mente la existencia de una posibilidad plausible de una mejor explicación. No niego que podamos eliminar una hipótesis sin tener otra mejor presente; niego que podamos aceptar una hipótesis sin haber considerado sus méritos, como Dembski nos haría hacer en el caso de su hipótesis de diseño. Si todas las hipótesis disponibles obtienen una calificación demasiado mala según nuestros criterios, puede ser mejor rechazarlas a todas y decir simplemente “no lo sabemos”.

Otros criterios citados con frecuencia incluyen poder explicativo, historial de resultados, alcance, coherencia y elegancia.

Verosimilitud. La probabilidad de que ocurra la evidencia dada la hipótesis en cuestión.
Probabilidad previa o plausibilidad. Nuestro grado de creencia en la hipótesis antes de observar la evidencia, o suponiendo que no la hubiéramos observado.
Poder predictivo. El grado en que la hipótesis determina qué observaciones potenciales son posibles (o probables) y cuáles son imposibles (o improbables).
Falsabilidad. El grado en que la hipótesis “corre el riesgo” de ser falsada por evidencia nueva.
Parcimonia. El grado en que la hipótesis observa el principio de la navaja de Occam: “No multipliques entidades sin necesidad.”¹¹

No es mi intención argumentar a favor de ningún método particular de comparación de hipótesis. Los filósofos de la ciencia han propuesto una serie de enfoques comparativos, que suelen implicar alguna combinación de los siguientes criterios:

Considere, por ejemplo, el caso de los arqueólogos que realizan inferencias sobre si los sílex son puntas de flecha fabricadas por humanos tempranos o piezas de roca que se producen naturalmente. Tomemos un caso fronterizo, en el que un panel de arqueólogos está dividido sobre si un sílex dado, tomado de un sitio habitado por humanos tempranos, es una punta de flecha. Ahora supongamos que a ese mismo panel se le mostrara el mismo sílex, pero se le dijera que provenía de una ubicación que nunca había sido habitada por humanos que usaban sílex, digamos Antártida. Los arqueólogos estarían ahora mucho más inclinados a dudar de que el sílex fuera hecho por el hombre, y más inclinados a atribuirlo a causas naturales. Una proporción menor (quizá ninguna en absoluto) ahora inferiría diseño. La inferencia de diseño, entonces, estaba claramente influida por factores que afectan la plausibilidad de la hipótesis de diseño: si se sabía o no que humanos que usan sílex habían vivido en la zona. La inferencia no se basaba únicamente en la eliminación de hipótesis naturales.

Dembski argumenta en cierta medida contra la legitimidad de los enfoques comparativos de inferencia (pp. 101-110, 121n59). No voy a tratar las especificidades del enfoque de verosimilitud, en el que concentra su ataque. Dejo eso a sus partidarios. Sin embargo, su rechazo de las inferencias comparativas en su conjunto es claramente insostenible. Cuando disponemos de dos o más hipótesis plausibles, ya sean o no hipótesis con agentes inteligentes, debemos usar algún método comparativo para decidir entre ellas.

Una de las maneras en que Dembski intenta defender su método es sugerir que no hay alternativa viable. Sin embargo, la alternativa obvia es considerar todas las hipótesis disponibles, incluidas las hipótesis de diseño, en función de sus méritos, y luego seleccionar la mejor de ellas. Esta es la posición adoptada por casi todos los filósofos de la ciencia, aunque discrepen sobre cómo evaluar los méritos de las hipótesis. No parece haber motivo para tratar de manera distinta las inferencias que involucran agentes inteligentes con respecto a este asunto a otras inferencias científicas.

Antes de terminar esta sección, podría ser útil aclarar algunos equívocos más que Dembski introduce en su discusión de la complejidad irreducible.

Los cambios de función no son una idea ad hoc inventada como último recurso para resolver un problema difícil. Son una característica fundamental de la evolución. Los sistemas nuevos no aparecen de la nada. La mayoría de los sistemas habrán evolucionado a partir de un sistema anterior con una función distinta.
Los cambios de función pueden ocurrir de dos maneras. Primero, una mutación puede crear una nueva capacidad. Segundo, un cambio en el medio puede proporcionar un nuevo uso para un sistema, por ejemplo, la aleta de un pez comienza a usarse como una pierna primitiva en aguas someras. En cualquiera de los casos, el sistema puede realizar la nueva función de forma muy deficiente al principio y mutar posteriormente para cumplirla mejor. Behe y Dembski enfatizan ambos cuánto parecen estar coordinadas las partes de un sistema. Pero en el pasado pudieron haber estado mucho menos coordinadas.
Un sistema puede tener más de una función. En el ejemplo anterior, la aleta del pez puede seguir utilizándose para nadar además de para escalar rocas sumergidas.
No existe una distinción clara entre sistemas y partes. Toda estructura funcional puede considerarse tanto un sistema por derecho propio como una parte de un sistema mayor. Por ello no necesitamos pensar en términos de un sistema que adquiere un gran número de partes compuestas de proteínas individuales, como nos gustaría que Dembski pensara. Un sistema puede, en cambio, adquirir un pequeño número de subsistemas, cada uno compuesto por múltiples proteínas.
En vez de que un sistema CI tenga que surgir por la combinación simultánea de muchas partes, ahora vemos que puede surgir por la adquisición gradual de unas pocas partes. Esto ya no suena tan improbable como Behe y Dembski lo hicieron parecer.

Vale la pena señalar algunos otros puntos:

Hay una tendencia entre los antifuncionalistas (antievolucionistas) a pensar en los sistemas biológicos como si fueran máquinas hechas por humanos, en las que el sistema y sus partes han sido diseñados para una función específica y son difíciles de modificar para otra función. Pero los sistemas biológicos son mucho más flexibles y dinámicos que los fabricados por el ser humano.

No hay razón para que la función básica de un sistema sea su función original. Los conceptos de función básica y función original quizá no estén siquiera bien definidos. Si un sistema realiza dos funciones vitales, ¿cuál es la básica? El concepto de función original supone que existe un momento identificable en el que el sistema entró en existencia. Pero el sistema puede tener una larga historia en la que las partes han aparecido y desaparecido, y las funciones han cambiado, haciendo imposible trazar el origen del sistema a un momento particular. Y, ¿qué es un sistema? Si dos proteínas comienzan a interactuar de manera beneficiosa, ¿pasan a ser inmediatamente un sistema? En ese caso, quizá debamos rastrear la historia de un sistema hasta el momento en que solo eran dos proteínas interactuantes.

Definición IC_final--Un sistema que realiza una función básica dada es complejidad irreducible si incluye un conjunto de partes bien emparejadas, mutuamente interactivas y no individuadas arbitrariamente, de modo que cada parte del conjunto sea indispensable para mantener la función básica, y por tanto original, del sistema. El conjunto de estas partes indispensables se conoce como el núcleo irreducible del sistema. [p. 285]

El error de Dembski al no considerar la posibilidad de un cambio de función se ve en su definición de complejidad irreducible:

Pero hay, en efecto, una opción que Dembski pasó por alto. El sistema pudo haber evolucionado a partir de un sistema más simple con una función distinta. En ese caso sí podría haber intermediarios funcionales. El error de Dembski es suponer que los únicos intermediarios funcionales posibles son intermediarios con la misma función.

Para lograr un sistema de complejidad irreducible, el mecanismo darwiniano solo tiene dos opciones. Primero, puede intentar lograr el sistema de un solo golpe. Pero si el núcleo de un sistema de complejidad irreducible consiste en numerosas y diversas partes, esa opción queda descartada de manera decisiva. La única otra opción entonces para el mecanismo darwiniano es intentar lograr el sistema gradualmente aprovechando intermediarios funcionales. Pero esta opción solo puede funcionar mientras el sistema admita simplificaciones sustanciales. La segunda condición [de que el núcleo irreducible del sistema se encuentre en el nivel mínimo de complejidad necesario para realizar su función] bloquea esta otra opción. Permítanme insistir en que no hay una falsa dicotomía aquí: no es que existan otras opciones que yo haya ignorado convenientemente, sino que el mecanismo darwiniano las tiene a su disposición.[p. 287]

? La respuesta es nada. La esencia de su argumento es esta:indirectas. ¿Qué ha dicho sobre el tema vital que Behe no abordó, el tema de las vías directas Aceptemos, para el argumento, que la definición de Dembski es lo suficientemente estricta para asegurar que los sistemas CI no puedan evolucionar mediante vías

Puedo comprender la tentación de usar complejidad irreducible como un término abreviado para complejidad irreducible con un núcleo irreducible que tenga numerosas y diversas partes y muestre complejidad y función mínimas, pero Dembski realmente debería haber introducido un nuevo término para esto último. De ahora en adelante, al reclamar haber encontrado un ejemplo de complejidad irreducible en la naturaleza, quienes defienden el diseño inteligente deberían especificar cuál de las siguientes definiciones tienen en mente: la definición original de Behe; la versión corregida de su definición original; la nueva definición propuesta por Behe; la definición de Dembski; o la definición de Dembski más los dos criterios adicionales. Predigo que la mayoría no lo harán. Para el resto de este artículo, usaré el término CI en este último sentido. No debe asumirse que todos los ejemplos de sistemas CI ofrecidos por Behe cumplen necesariamente con los criterios de Dembski. Dembski solo considera el flagelo bacteriano. Queda por establecer si los demás sistemas de ejemplo de Behe son CI en este nuevo sentido.

En particular, la afirmación de que el mecanismo darwiniano puede dar cuenta de la diversidad completa de las formas vivientes deberá ser rechazada en la medida en que ese mecanismo es incapaz de generar la complejidad especificada inherente a--para tomar el ejemplo más popular--sistemas bioquímicos de complejidad irreducible (véase el capítulo 5). [p. 324]

El último de estos cambios seguramente creará aún más confusión. Ya no es suficiente, de acuerdo con Dembski, con demostrar que un sistema es CI. También debe cumplir con los dos criterios adicionales. Sin embargo, en otra parte de su libro, Dembski continúa refiriéndose a la complejidad irreducible como una condición suficiente para inferir diseño:

Behe fue muy vago en cuanto a cómo debía dividirse un sistema en partes. A veces tomó proteínas individuales como partes, pero en el caso del flagelo bacteriano dividió el sistema en solo tres partes, “un paletón, un rotor y un motor”, cada una compuesta por múltiples proteínas (Darwin's Black Box, p. 72). Dembski exige que las partes sean “no individuadas arbitrariamente” (p. 285), lo cual no nos dice mucho. Sin embargo, lo que es significativo es que, en el caso del flagelo bacteriano, él elige proteínas individuales como sus partes. De hecho, parece ni siquiera haber notado que Behe dividió el flagelo en solo tres partes:

Behe muestra que la maquinaria intrincada de este motor molecular, incluyendo un rotor, un estátor, anillos O, bujes y un eje de transmisión, requiere la interacción coordinada de unas treinta proteínas y de otras veinte proteínas o así para ayudar a su ensamblaje. Sin embargo, la ausencia de cualquiera de estas proteínas daría como resultado la pérdida completa de la función motora.... Pero un flagelo sin su conjunto completo de partes proteicas no funciona en absoluto. Behe concluye, por tanto, que si el mecanismo darwiniano va a producir el flagelo, tendrá que hacerlo en una sola generación. [pp. 249-251]
Mientras que Behe solo consideraba un sistema como CI si todas sus partes eran indispensables, Dembski considera CI a un sistema si tiene un núcleo irreducible de partes indispensables.
Dembski ha añadido dos condiciones nuevas que deben cumplirse antes de que un sistema pueda considerarse evidencia de diseño inteligente. Además de ser CI, el núcleo irreducible del sistema debe poseer “numerosas y diversas partes” y tener la propiedad de “complejidad y función mínimas” (p. 287). Ambas condiciones son bastante vagas. “Numerosas” y “diversas” no están cuantificadas. La complejidad del sistema aparentemente no necesita ser precisamente mínima, ya que, en el caso del flagelo bacteriano, Dembski sostiene solo que “la complejidad de los flagelos conocidos no es muy diferente de la complejidad mínima que tales sistemas podrían requerir en principio” (p. 288, mi énfasis).

En segundo lugar, Dembski propuso una nueva definición propia, introduciendo tres cambios principales:

¿Qué ha añadido entonces Dembski al debate sobre la complejidad irreducible? En primer lugar, intentó contrarrestar las objeciones de los críticos de Behe. No comentaré sobre estas salvo para decir que algunos de esos críticos parecen haber malinterpretado lo que Behe quiso decir con complejidad irreducible. Esto no sorprende, ya que su definición era vaga y estuvo acompañada de varias afirmaciones engañosas. De hecho, Behe admitió incluso que su definición era ambigua.¹⁹ Incluso ha propuesto tentativamente una definición completamente nueva.²⁰

Dembski repite la afirmación de que el problema de explicar la evolución de sistemas moleculares CI ha quedado “absolutamente inabordable” (p. 246), pero ahora se han propuesto explicaciones evolutivas para varios de los sistemas citados por Behe, entre ellos la cascada de coagulación sanguínea, el sistema inmune, el sistema del complemento y el flagelo bacteriano. El último de estos es altamente especulativo, pero es suficiente para refutar la afirmación de absoluta inabordabilidad.¹⁸

Para justificar su fracaso al calcular la probabilidad de que el flagelo surgiera por la evolución darwiniana, Dembski invoca la noción de complejidad irreducible, que, según su argumento, proporciona una generalización prescriptiva contra la evolución darwiniana del flagelo. La complejidad irreducible fue introducida en el argumento del diseño inteligente por el bioquímico Michael Behe. El tema se ha tratado con gran detalle en otro lugar, por lo que no repetiré todas las objeciones.¹⁵ Sin embargo, me gustaría llamar la atención sobre un punto que algunos lectores de Behe han pasado por alto. Behe dividió las vías darwinianas potenciales para la evolución de un sistema de complejidad irreducible (en adelante, CI) en dos categorías: directa e indirecta.¹⁶ Las vías directas son aquellas en las que un sistema evoluciona puramente por la adición de varias partes nuevas que no aportan ventaja al sistema hasta que todas están presentes. Todas las demás vías potenciales se denominan indirectas. Behe luego argumenta que los sistemas CI no pueden evolucionar mediante vías directas. Pero sus vías directas excluyen dos elementos esenciales del proceso evolutivo: (a) la evolución de las partes individuales de un sistema; y (b) el cambio de la función de un sistema con el tiempo, de modo que, aunque una parte dada pudiera no haber contribuido nada a la función actual del sistema hasta que las otras partes estuvieran en su sitio, bien pudo haber contribuido a una función anterior. Cuando se trata de vías indirectas, Behe no tiene más que un argumento desde la ignorancia: nadie ha dado una exposición detallada de tal vía. La verdad de esta afirmación ha sido disputada, pero depende de cuánto detalle se exija. Behe exige mucho detalle. Luego sostiene que la evolución de un sistema CI por vías indirectas es extremadamente improbable, pero no ha presentado argumento alguno para sostener esta afirmación. Es meramente su intuición.¹⁷

4.2 Complejidad irreducible

Por añadidura, Dembski se equivoca al elegir calcular una probabilidad de formación para el flagelo en sí. Debería haber considerado la formación del ADN para codificar un flagelo. Si un flagelo apareciera sin el ADN para codificarlo, no sería heredado por la siguiente generación de bacterias y, por lo tanto, se perdería.

Wolpert y Macready hacen un punto similar:

El truco en los algoritmos genéticos es encontrar esquemas que realicen este mapeo de una cadena binaria a un diseño de ingeniería de forma eficiente y elegante, en lugar de por fuerza bruta.... Los operadores genéticos copian y modifican los genotipos de una generación a la siguiente.... Encontrar el equilibrio adecuado entre mutación y selección es especialmente importante.... Finalmente, los parámetros evolutivos [como el tamaño de la población y la tasa de mutación] determinan el contexto general para la evolución y los detalles cuantitativos de cómo operan los operadores genéticos.... Decidir los mejores valores para estos parámetros en una aplicación dada sigue siendo un arte oscuro, impulsado más por intuición ciega y tradición comunitaria que por principios de ingeniería sólidos.²⁴

Son otros elementos del algoritmo evolutivo los que pueden tener que seleccionarse cuidadosamente si el algoritmo debe rendir bien:

Si la función de aptitud no refleja de manera realista las restricciones y demandas del mundo real a las que se enfrentarán los diseños fenotípicos, el algoritmo genético puede entregar una buena solución al problema equivocado.²⁴

Pero los objetivos, restricciones, compensaciones, etc., del ingeniero son parámetros del problema que hay que resolver. Deben elegirse con cuidado para asegurar que el algoritmo evolutivo aborde el problema correcto, no para guiarlo hacia la solución de un problema dado, como Miller nos dice en el párrafo anterior:

¿Y exactamente dónde se incorpora el diseño en un algoritmo evolutivo o genético? Según Miller, se incorpora en la función de aptitud. Escribe:
La función de aptitud debe encarnar no solo los objetivos conscientes del ingeniero, sino también su sentido común. Ese sentido común es en gran medida intuitivo e inconsciente, por lo que es difícil de formalizar en una función de aptitud explícita. Dado que las soluciones de los algoritmos genéticos son tan buenas como las funciones de aptitud usadas para evolucionarlas, el desarrollo cuidadoso de funciones de aptitud apropiadas que encarnen todas las restricciones de diseño, compensaciones y criterios relevantes es un paso clave en la ingeniería evolutiva.²³

En uno de sus artículos, Dembski cita al psicólogo evolutivo Geoffrey Miller en apoyo de su afirmación de que la función de aptitud debe ajustarse finamente:

En general, por tanto, la función de aptitud define el problema que hay que resolver, no la manera de resolverlo, y por ello tiene poco sentido hablar de que el programador ajusta finamente la función de aptitud para resolver el problema. Es cierto que puede haber aspectos del problema que sean desconocidos, o en los que el programador decida, por razones prácticas, simplificar su modelo del problema. Aquí el programador podría tomar decisiones de forma que mejore el rendimiento del algoritmo. Pero no hay razón para pensar que esto contribuya de manera significativa al éxito de los algoritmos evolutivos.

Refleja nuestros objetivos. Si nuestro objetivo es diseñar un puente, podríamos necesitar decidir qué peso dar a una serie de objetivos conflictivos como capacidad de tráfico, integridad estructural, costo e impacto ambiental.
Encapsula nuestro conocimiento relevante sobre el mundo real, con el fin de evaluar qué tan bien una solución potencial cumple con nuestros objetivos.

Estas afirmaciones se basan en una incomprensión fundamental del papel de la función de aptitud en un algoritmo evolutivo. Una función de aptitud incorpora dos elementos:

Así pues, presento que incluso si la evolución darwiniana fue el medio mediante el cual la panoplia de la vida en la Tierra llegó a existir, la función de aptitud subyacente que constriñe la evolución biológica no sería un “almuerzo gratis” ni una condición dada de forma bruta, sino un ensamblaje finamente elaborado de gradientes suaves que presupone mucha complejidad especificada previa. [p. 212]

Una afirmación similar se formula con respecto a la evolución biológica:

Aun así, hay algo extrañamente convincente y casi mágico en la manera en que los algoritmos evolutivos encuentran soluciones para problemas en los que las soluciones no se parecen a nada de lo que hayamos imaginado. Un ejemplo particularmente llamativo es el de las “antenas genéticas de alambre torcido” de Edward Altshuler y Derek Linden. El problema que estos investigadores resolvieron con algoritmos evolutivos (o genéticos) era encontrar una antena que irradie de manera igualmente buena en todas las direcciones sobre una semiesfera situada sobre un plano terrestre de extensión infinita. En contra de las expectativas, ningún alambre con una forma geométrica simétrica y ordenada resuelve este problema. En su lugar, las mejores soluciones a este problema parecen enredaderas en zigzag. Peor aún, los algoritmos evolutivos recorren todos los distintos enredos en zigzag—la mayoría de los cuales no funcionan—hasta llegar a uno que sí funciona. Esto es extraordinario. Aun así, la función de aptitud que prescribe el rendimiento óptimo de la antena está bien definida y aporta sin dificultad la información especificada compleja que una antena genética de alambre torcido óptima parece adquirir gratis. [p. 221]

Dembski reconoce que los algoritmos evolutivos pueden producir resultados bastante innovadores, pero argumenta que solo pueden hacerlo porque su función de aptitud ha sido ajustada finamente por el programador. Al hacerlo, alega, el programador ha “introducido de contrabando” información especificada compleja o complejidad especificada en el resultado. (Estos dos términos se discutirán más adelante.)

5.2 Ajuste fino de la función de aptitud

Otro término usado por Dembski es búsqueda ciega. Lo usa en dos sentidos. En primer lugar significa un paseo aleatorio, un algoritmo que pasa de una ubicación en el espacio de fases a otra seleccionada al azar de entre puntos cercanos (p. 190). Más tarde lo usa para significar cualquier búsqueda en la que la función de aptitud solo tenga dos valores posibles: el punto evaluado o bien está o no está en un área objetivo (p. 197). El significado usual (aunque no exclusivo) de búsqueda ciega en la literatura de los algoritmos evolutivos es el de sinónimo de algoritmo de caja negra.²²

Dembski adopta una definición muy amplia de algoritmo evolutivo que incluye todos los algoritmos de optimización que consideramos aquí, incluyendo la búsqueda aleatoria (pp. 180, 229n9, 232n31).

Búsqueda aleatoria (también conocida como muestreo aleatorio). Este algoritmo simplemente selecciona cada punto al azar (con una distribución de probabilidad uniforme) de entre todos los puntos del espacio de fases.
Ascendentes de colina. Un ascensor de colina visita algunos o todos los puntos cercanos a su ubicación actual y se mueve al más alto que encuentra. Nunca se mueve hacia abajo. Si alcanza la cima de una colina, se queda atascado allí, o puede comenzar una búsqueda aleatoria con la esperanza de encontrar una colina más alta.
Algoritmos evolutivos. Un algoritmo evolutivo mantiene una población de individuos (generalmente generados aleatoriamente al inicio), que evoluciona según reglas de selección, recombinación, mutación y supervivencia. Cada individuo corresponde a un punto en el espacio de fases. Un “entorno” compartido determina la aptitud de cada individuo en la población. Los individuos más aptos tienen más probabilidades de ser seleccionados para reproducción (retención o duplicación), mientras que la recombinación y la mutación modifican esos individuos, produciendo potencialmente unos superiores.

Hay tres tipos de algoritmos de optimización de interés para nosotros aquí:

Evaluar la función de aptitud suele ser un proceso de cómputo muy intensivo, que puede implicar una simulación. Por ejemplo, si estamos intentando optimizar el diseño de una red de carreteras, podríamos querer que el algoritmo ejecute una simulación del tráfico diario para cada diseño posible que considere. El rendimiento del algoritmo se mide, por lo tanto, en términos del número de evaluaciones de la función de aptitud (m) necesarias para alcanzar un nivel dado de aptitud, o el nivel de aptitud alcanzado después de un número dado de evaluaciones de la función. Cada evaluación de función puede entenderse como un paso de tiempo, de modo que podemos pensar en el nivel de aptitud alcanzado en un tiempo determinado. Nótese que nos interesa el mejor valor de aptitud hallado durante todo el período de tiempo, y no solo la aptitud del último punto visitado.

Un algoritmo de optimización es, en términos generales, un algoritmo para encontrar puntos altos en el paisaje. Ser un algoritmo de caja negra significa que no tiene conocimiento sobre el problema que intenta resolver más que la estructura subyacente del espacio de fases y los valores de la función de aptitud en los puntos que ya ha visitado. El algoritmo visita una secuencia de puntos (x₁, x₂, ..., x_m), evaluando la aptitud, f(x_i), de cada uno por turno antes de decidir qué punto visitar a continuación. El algoritmo puede ser estocástico, es decir, puede incorporar un elemento aleatorio en sus decisiones.

Figura 1. Un paisaje de aptitud

El espacio de fases es el conjunto de todas las soluciones potenciales del problema. En general es un espacio multidimensional, con una dimensión por cada parámetro variable en la solución. La mayoría de los problemas reales de optimización tienen muchos parámetros, pero, para facilitar la comprensión, conviene pensar en un espacio de fases bidimensional—uno con dos parámetros—que puede visualizarse como un plano horizontal. La función de aptitud es una función sobre ese espacio de fases; en otras palabras, para cada punto (solución potencial) en el espacio de fases, la función de aptitud nos da el valor de aptitud de ese punto. Podemos visualizar la función de aptitud como un paisaje tridimensional donde la altura de un punto representa su aptitud (figura 1). Los puntos en las colinas representan mejores soluciones, mientras que los puntos en los valles representan peores. Los términos función de aptitud y paisaje de aptitud se usan de forma intercambiable.

Nos ocuparemos aquí de un tipo de algoritmo conocido como algoritmo de optimización (o búsqueda) de caja negra. Dichos algoritmos incluyen a los algoritmos evolutivos, pero no se limitan a ellos. Los problemas que resuelven los algoritmos de optimización de caja negra tienen solo dos atributos definitorios: un espacio de fases y una función de aptitud definida sobre ese espacio de fases. En el contexto de estos algoritmos, los espacios de fases suelen llamarse espacios de búsqueda. También el término función de aptitud suele reservarse para los algoritmos evolutivos, siendo el término más general función objetivo o función de coste (maximizar una función objetivo equivale a minimizar una función de coste). Pero adoptaré la terminología de Dembski por coherencia.

5.1 Algoritmos de optimización de “caja negra”

En los últimos años ha habido un crecimiento considerable del interés en los algoritmos evolutivos ejecutados en computadoras, como un medio para resolver problemas de optimización. Como sugiere el nombre, los algoritmos evolutivos se basan en los mismos principios fundamentales que la evolución biológica: reproducción con variaciones aleatorias y selección de los “más aptos”. Dado que parecen demostrar cómo procesos sin guía pueden producir el tipo de complejidad funcional²¹ que observamos en la biología, constituyen un problema que Dembski necesita abordar. Además, trata de convertir el tema en su favor apelando a un conjunto de teoremas matemáticos, conocidos como teoremas de No Free Lunch, que imponen restricciones a las capacidades de resolución de problemas de los algoritmos evolutivos.

Intenta alcanzar el fin y nunca vaciles;
Nada es tan difícil, pero la búsqueda lo descubrirá.
Robert Herrick (1591-1674)

5. Algoritmos evolutivos

Especificidad causal. Esto es solo otra cubierta del argumento por ignorancia:

Salvo que se proponga un modelo concreto lo suficientemente detallado como para ser criticado seriamente, no será posible determinar la adecuación de ese modelo. Por supuesto, esto es decir de otra manera que la objeción del andamiaje aún no ha logrado demostrar la especificidad causal cuando se aplica a sistemas bioquímicos realmente irreduciblemente complejos. [p. 254]

En otras palabras, hasta que se proporcione una hipótesis natural suficientemente detallada, deberíamos proceder e inferir diseño. No molesta a Dembski (o Behe, que hace el mismo punto) que su hipótesis alternativa (diseño) carezca por completo de detalles.
Invariantes. Dembski describe algunos problemas geométricos que no tienen solución y explica cómo la inexistencia de una solución puede probarse mostrando que cierta propiedad permanece invariante bajo la transformación del sistema. ¿Cómo es esto relevante para la complejidad irreducible? ¿Usa Dembski la invariancia de alguna propiedad para establecer que los sistemas de complejidad irreducible no pueden evolucionar? No, la propiedad que dice que permanece invariante (bajo la evolución natural) es la propiedad de la complejidad irreducible misma. Pero la afirmación de que la complejidad irreducible no puede ser producida por la evolución natural era exactamente el punto que él trataba de establecer. En otras palabras, la invariancia no aporta nada para fundamentar la conclusión de Dembski. Es solo otra manera de expresar esa conclusión.

Al intentar relacionar el tema de los invariantes con la evolución, Dembski escribe: “considere una invariante efectiva aquí como un obstáculo insuperable para el mecanismo darwiniano” (p. 285). Uno debe preguntarse por qué no usa simplemente la expresión “obstáculo insuperable” desde el principio y omite toda la discusión irrelevante sobre invariantes.
Complejidad especificada. A Dembski le gusta decir que “la complejidad irreducible es un caso especial de complejidad especificada” (p. 289), como si eso demostrara la integración de dos conceptos en un marco coherente. Pero ya vimos que la complejidad especificada es meramente una etiqueta que aplicamos cuando no tenemos una hipótesis natural plausible para explicar algún evento. Así, decir que la complejidad irreducible es un caso de complejidad especificada es solo otra manera de reiterar la afirmación de que no tenemos explicación natural para el origen del flagelo bacteriano (que es el único sistema biológico que Dembski ha mostrado como CI en su sentido).

A Fitness Landscape

Operator... Give me Information.
Canción de William Spivery

6. El método de probabilidad uniforme

Si bien socava el argumento de Dembski basado en NFL, la regularidad de las leyes no basta para asegurar que la evolución del mundo real produzca complejidad funcional. Dembski ofrece un ejemplo de laboratorio en el que las moléculas replicantes se hicieron más simples (el experimento de Spiegelman, p. 209). Pero de ello no se sigue que así sea siempre. Dembski no ha establecido ninguna regla general. Sugeriría que, dado que el espacio de fases de la evolución biológica es masivamente multidimensional, no deberíamos sorprendernos de que haya producido una inmensa complejidad funcional.

Dembski podría entonces argumentar que esto solo desplaza el problema, y que tenemos una suerte increíble de que el Universo tenga leyes regulares. Sin duda, no habría vida si el Universo no tuviera leyes razonablemente regulares. Pero esto es obvio y no es una consecuencia específica de NFL. Este argumento se reduce a una mera variante del argumento de ajuste fino cosmológico, y particularmente débil además, ya que la «elección» de tener leyes regulares en lugar de caóticas apenas es una elección «precisa».

Además, NFL apenas es pertinente para el argumento de Dembski incluso para los algoritmos evolutivos más simples y no interactivos a los que sí se aplica (aquellos en los que el éxito reproductivo de los individuos se determina mediante una comparación de su aptitud innata). NFL nos dice que, del conjunto de todas las funciones de aptitud matemáticamente posibles, solo una proporción diminuta es aquella en la que los algoritmos evolutivos rinden tan bien como se observa que lo hacen en la práctica. De esto, Dembski argumenta que sería increíblemente afortunado que una función de aptitud adecuada ocurriera sin un ajuste fino por parte de un diseñador. Pero la alternativa al diseño no es una selección puramente aleatoria del conjunto de todas las funciones de aptitud matemáticamente posibles. Las funciones de aptitud están determinadas por reglas, no generadas aleatoriamente. En el mundo real, esas reglas son las leyes físicas del Universo. En un modelo de computadora, pueden ser las reglas que el programador elija, pero, si el modelo es una simulación de la realidad, estarán basadas en cierto grado en las leyes físicas reales. Las reglas inevitablemente dan lugar a patrones, de modo que las funciones de aptitud con patrones se verán favorecidas sobre las totalmente caóticas. Si las reglas son razonablemente regulares, esperaríamos que el paisaje de aptitud fuera razonablemente suave. De hecho, las leyes físicas suelen ser regulares, en el sentido de que corresponden a funciones matemáticas continuas, como «F = ma», «E = mc²», etc. Con estas funciones, un pequeño cambio de entrada conduce a un pequeño cambio de salida. Así, cuando la aptitud está determinada por una combinación de tales leyes, es razonable esperar que un pequeño movimiento en el espacio de fases conduzca en general a un cambio razonablemente pequeño en el valor de aptitud, esto es, que el paisaje de aptitud sea suave. Por el contrario, esperamos que haya excepciones, porque la teoría del caos y la teoría de catástrofes nos dicen que incluso leyes suaves pueden dar lugar a discontinuidades. Pero los espacios de fases reales tienen muchas dimensiones. Si el movimiento en algunas dimensiones está bloqueado por discontinuidades, todavía puede haber contornos suaves en otras dimensiones. Aunque muchas mutaciones potenciales son catastróficas, muchas otras no lo son.

Esto es similar al problema de paisajes de aptitud coevolutivos planteado por Stuart Kauffman (p. 224-227). Sin embargo, la respuesta de Dembski a Kauffman no aborda mi argumento. Nada de lo que escribe Dembski (p. 226) cambia el hecho de que, en la evolución biológica, la función de aptitud en un momento dado no puede determinarse independientemente del estado de la población, y por lo tanto NFL no se aplica.³¹

No serviría de nada sugerir que las interacciones entre individuos puedan modelarse dentro del algoritmo de optimización, en lugar de en la función de aptitud. Esto se ve impedido por la restricción de caja negra, que impide que el algoritmo de optimización tenga acceso directo a información sobre el entorno.

NFL no es aplicable a la evolución biológica, porque la evolución biológica no puede representarse mediante ningún algoritmo que satisfaga las condiciones dadas anteriormente. A diferencia de los algoritmos evolutivos más simples, donde el éxito reproductivo se determina por la comparación de la aptitud innata de distintos individuos, el éxito reproductivo en la naturaleza se determina por todos los acontecimientos contingentes que ocurren en las vidas de los individuos. La función de aptitud no puede tomar en cuenta estos acontecimientos, porque dependen de interacciones con el resto de la población y, por tanto, con las características de otros organismos que también cambian bajo la influencia del algoritmo. En otras palabras, la función de aptitud de los organismos biológicos cambia con el tiempo en respuesta a cambios en la población (de la misma especie y de otras especies), lo que viola la condición final mencionada antes. Lo mismo se aplica a cualquier simulación no biológica en la que los individuos interactúan entre sí, como las redes neuronales rivales de damas que se discuten más abajo.

5.4 La irrelevancia de NFL para los argumentos de Dembski

En vista de la corrección de este «teorema del no free lunch» (Wolpert y Macready 1997), el resultado no resulta demasiado interesante. Es fácil ver que promediar sobre todas las distintas funciones de aptitud no se ajusta a la situación de la optimización de caja negra en la práctica. Incluso puede demostrarse que en escenarios de optimización más realistas no puede existir algo como un teorema de no free lunch (Droste, Jansen y Wegener 1999).³⁰

Ya podemos ver que la relevancia de NFL para problemas reales es limitada. Los paisajes de aptitud de los problemas reales no son así de caóticos. Este hecho ha sido señalado por numerosos investigadores:

Figura 2. Un «paisaje» de aptitud aleatorio

Este resultado parece increíble, pero en realidad es cierto. Lo importante es recordar la frase clave «promediado sobre el conjunto de todas las funciones de aptitud posibles». La gran mayoría de las funciones de aptitud en ese conjunto son totalmente caóticas, con la altura de dos puntos adyacentes sin relación alguna entre sí. Solo un número diminuto de esas funciones de aptitud tiene las colinas y valles suaves y ondulados que normalmente asociamos con un «paisaje». En un paisaje caótico, no hay colinas con mérito de ese nombre que merezcan ser escaladas. Además, recuerde que cada punto que un escalador o descendente de colinas inspecciona cuenta como «encontrado», incluso si el algoritmo decide no moverse allí. Así, si un descendente de colinas se mueve casualmente al lado de un pico muy alto, el valor de aptitud de ese pico se registrará y contará en la evaluación final de rendimiento del descendente. Un paisaje escogido al azar del conjunto de todas las funciones de aptitud posibles será casi con toda probabilidad solo una masa aleatoria de picos (figura 2).

Ahora estamos en condiciones de comprender lo que dice NFL. Supongamos que tomamos un algoritmo a₁, medimos su rendimiento en cada función de aptitud de ese vasto conjunto de funciones de aptitud posibles y calculamos el promedio de todos esos valores de rendimiento. Luego repetimos esto con cualquier otro algoritmo a₂. NFL nos dice que el rendimiento medio será el mismo para ambos algoritmos, independientemente del par de algoritmos que hayamos seleccionado. Dado que esto es cierto para todos los pares de algoritmos y que la búsqueda aleatoria es uno de esos algoritmos, esto significa que ningún algoritmo es mejor (ni peor) que una búsqueda aleatoria, cuando se promedian los resultados sobre todas las funciones de aptitud posibles. Incluso significa que, al promediar sobre todas las funciones de aptitud posibles, un algoritmo de descenso de colinas será tan bueno como un algoritmo de ascenso de colinas para encontrar puntos altos (un descendente de colinas es como un ascensor de colinas, excepto que se mueve al punto disponible más bajo en lugar del más alto).

El mismo algoritmo puede usarse con cualquier problema, es decir, en cualquier paisaje de aptitud, aunque no será eficiente en todos ellos. En términos de un programa de computadora, podemos imaginar insertar diversos módulos alternativos de función de aptitud en el programa. También podemos imaginar el conjunto de todas las funciones de aptitud posibles. Este es el conjunto inmenso que consta de toda forma posible del paisaje sobre nuestro espacio de fases dado. Si hay S puntos en el espacio de fases y F posibles valores de la función de aptitud, entonces el número total de funciones de aptitud posibles es F^S, puesto que cada punto puede tener cualquiera de los F valores, y debemos permitir cualquier permutación posible sobre los S puntos.

El algoritmo debe ser un algoritmo de caja negra, es decir, no debe poseer conocimientos sobre el problema que intenta resolver más allá de la estructura subyacente del espacio de fases y los valores de la función de aptitud en los puntos que ya ha visitado.
En principio, debe haber un número finito de puntos en el espacio de fases y un número finito de valores de aptitud posibles. En la práctica, sin embargo, las variables continuas se pueden aproximar redondeando a valores discretos.
El algoritmo no debe visitar el mismo punto dos veces. Esto puede evitarse haciendo que el algoritmo conserve un registro de todos los puntos que ha visitado hasta ahora, con sus valores de aptitud, de modo que pueda evitar visitas repetidas a un punto. Esto puede no ser práctico en un programa de computadora real, pero la mayoría de los espacios de fases reales son tan vastos que las revisitas es poco probable que ocurran con frecuencia, de modo que podemos ignorar este problema.
La función de aptitud puede permanecer fija durante la ejecución del programa, o puede variar con el tiempo de una manera independiente del progreso del algoritmo. Estas dos opciones corresponden a los teoremas 1 y 2 de Wolpert y Macready respectivamente. Sin embargo, la función de aptitud no puede variar en respuesta al progreso del algoritmo. En otras palabras, el algoritmo no puede deformar el paisaje de aptitud.²⁹

NFL se aplica solo a algoritmos que cumplen las siguientes condiciones:

Dembski intenta usar los teoremas de No Free Lunch (en lo sucesivo, NFL) de David Wolpert y William Macready²⁸ para apoyar su afirmación de que las funciones de aptitud deben ser afinadas con precisión. Presumiblemente, Dembski considera NFL importante para su caso, dado que nombra su libro con ese nombre. Sin embargo, mostraré que NFL no es aplicable a la evolución biológica y que, incluso para los algoritmos evolutivos a los que se aplica, no respalda la afirmación de ajuste fino. Comenzaré dando una breve explicación de lo que dice NFL, haciendo varias simplificaciones y omitiendo detalles que aquí no nos conciernen.

5.3 Los teoremas No Free Lunch

Si Dembski cree que las condiciones iniciales de la evolución habían sido diseñadas, lo obvio sería intentar aplicar su método de eliminación por azar a el origen de esas condiciones. Señalo que él no intenta hacerlo.

Las dos conclusiones de Dembski no pueden ser ambas verdaderas. Por un lado afirma que las condiciones iniciales estaban ajustadas con precisión para hacer posible la evolución natural de la vida. Por el otro lado, afirma que la evolución natural de la vida no era posible. No hay nada de malo en que Dembski tenga dos oportunidades. Si un argumento fracasa, puede recurrir al otro. Alternativamente, Dembski podría argumentar que el diseñador cósmico dejó el Universo casi bien para la evolución natural de la vida, pero se reservó un poco de trabajo para hacer después.

Vemos, pues, que el argumento de Dembski sobre el ajuste fino de las funciones de aptitud es solo una versión encubierta del argumento ya conocido sobre el ajuste fino de las condiciones iniciales cosmológicas y terrestres.²⁷ Dembski enumera un catálogo de condiciones cosmológicas y terrestres que deben estar justas de la forma correcta para el origen de la vida (pp. 210-211). Este argumento es antiguo, y no lo trataré aquí. La única novedad que Dembski le añade es plantear el argumento en términos de funciones de aptitud y apelar a los teoremas de No Free Lunch como apoyo. Ese recurso se considerará más abajo, pero primero quiero hacer un par de observaciones.

Cuando Dembski habla del ajuste fino de la función de aptitud para la evolución biológica, lo que realmente significa es el ajuste fino de las condiciones iniciales cosmológicas y terrestres, incluidas las leyes físicas. Cuando estas condiciones están dadas, como lo están para fines prácticos, contribuyen a determinar la función de aptitud. Pero Dembski argumenta que estas condiciones debieron haber sido seleccionadas entre un conjunto de posibilidades alternativas para hacer posible la evolución de la vida. Cuando se considera de esta manera, los conjuntos alternativos de condiciones iniciales deberían considerarse apropiadamente como elementos de otro espacio de fases, y no como parte de la función de aptitud. A veces Dembski se refiere a esto como un espacio de fases de funciones de aptitud. Puede comprenderse lo que significa con esto, pero es potencialmente confuso, no menos porque las funciones de aptitud de los organismos biológicos no están fijas, sino que evolucionan a medida que evoluciona su entorno.

En el caso de la evolución biológica, la situación es algo distinta, porque los propios parámetros evolutivos evolucionan durante el curso de la evolución. Por ejemplo, según la teoría de la evolución, el código genético ha evolucionado por selección natural. Por lo tanto, no es solo buena suerte que el código genético esté tan adaptado a la evolución. Ha evolucionado para que sea así.

Quizá la confusión de Dembski sobre este asunto pueda explicarse por su obsesión con el programa de Richard Dawkins, Weasel,²⁶ al que dedica una gran parte de su capítulo sobre algoritmos evolutivos. En ese ejemplo, inventado solo para ilustrar un punto específico, la función de aptitud fue efectivamente elegida para ayudar a que el algoritmo convergiera en la solución. Sin embargo, ese programa no fue creado para resolver un problema de optimización. El programa tenía un punto objetivo específico, a diferencia de los algoritmos de optimización reales, donde la solución se desconoce.

En definitiva, por supuesto, la única pregunta importante es: «¿Cómo encuentro buenas soluciones para mi función de coste dada f?». La respuesta correcta a esta pregunta es empezar con la f dada, determinar ciertas características salientes de ella y luego construir un algoritmo de búsqueda, a, específicamente adaptado para ajustarse a esas características. El procedimiento inverso, mucho más popular en algunas comunidades, consiste en investigar cómo rinden algoritmos específicos en distintas f distintas. Este procedimiento inverso es de interés solo en la medida en que nos ayuda con nuestro procedimiento principal, de pasar de las (características relativas a) f a una a apropiada.²⁵

A Random Fitness Landscape

Aunque la evidencia es inconclusa, parece favorecer predominantemente la interpretación de probabilidad uniforme, y es ésta la que consideraré en adelante. Pero permítanme echar un vistazo breve a las alternativas:

Exhibición #1 -- El argumento del diseño derivado

Como se argumentó en 6.1 arriba, el argumento del diseño derivado de Dembski implica que la IS es una propiedad observada de un fenómeno, lo que supuestamente nos permite inferir diseño en el pasado remoto independientemente de los procesos naturales subsecuentes que podrían haber conducido al fenómeno. Por tanto, no hay distribuciones de probabilidad relevantes bajo las cuales calcular la probabilidad de la IS. Debemos usar alguna distribución de probabilidad predeterminada, y una distribución uniforme parece ser la única candidata.

Exhibición #2 -- El programa Weasel²⁶

Aquí Dembski menciona específicamente una distribución de probabilidad uniforme:

Por ejemplo, en el ejemplo de METHINKS-IT-IS-LIKE-A-WEASEL de Dawkins (véase la sección 4.1), el espacio de fases consiste en todas las secuencias de 28 caracteres de longitud compuestas de letras mayúsculas romanas y espacios (los espacios se representan con viñetas). Una probabilidad uniforme sobre este espacio asigna la misma probabilidad a cada una de estas secuencias: el valor de la probabilidad es aproximadamente de 1 entre 10⁴⁰ y señala una situación de hechos altamente improbable. Es esta improbabilidad la que corresponde a la complejidad de la secuencia objetivo y que, mediante su identificación explícita, especifica la secuencia y así la convierte en un caso de complejidad especificada (aunque, como se señaló en la sección 4.1, somos algo laxos en este ejemplo respecto del nivel de complejidad requerido para la complejidad especificada: técnicamente, el nivel de complejidad debería corresponder al límite de probabilidad universal de 1 entre 10¹⁵⁰). [p. 188-189]

Esto parece claro. Sin embargo, Dembski sigue diciendo que “E [el algoritmo evolutivo] en realidad no ha generado complejidad especificada en absoluto, sino que sólo la ha movido de un sitio a otro” (p. 195). (En este punto Dembski ha cambiado a otra versión del programa Weasel, pero el cambio es inconsecuente.) Aunque no lo dice explícitamente, la implicación es que el resultado exhibe complejidad especificada, aunque esto fue “introducido” en el programa y no generado por él.

Exhibición #3 -- Algoritmos evolutivos

Mi siguiente prueba proviene de los relatos de Dembski de la simulación de sitios de unión de Tom Schneider³³ (pp. 213-218) y de las redes neuronales jugadoras de damas de Kumar Chellapilla y David Fogel (pp. 221-223), que describiré más adelante. Estos programas tienen alta probabilidad de producir una buena solución (tal como me han confirmado sus programadores). Dado que Dembski afirma que los resultados exhiben complejidad especificada (CSI), lo que implica una baja probabilidad de producir un resultado especificado (una buena solución), se sigue que debe haber estado estimando la probabilidad con respecto a alguna distribución de probabilidad distinta de la verdadera. La única candidata aparente es una distribución de probabilidad uniforme.

Exhibición #4 -- La secuencia SETI

Uno de los ejemplos de Dembski (pp. 6-9) es un evento de la película Contact, protagonizada por Jodie Foster, en el que astrónomos de SETI (la Búsqueda de Inteligencia Extraterrestre) detectan una señal de radio de origen extraterrestre. La señal comprende una secuencia de 1126 pulsos y pausas, que representa los primeros 25 números primos: 2, 3, 5, 7, ..., 101. Cada número primo está representado por una secuencia de pulsos igual al número, con números consecutivos separados por una pausa. Al convertir los pulsos en 1 y las pausas en 0, la señal puede representarse mediante una secuencia de 1126 dígitos binarios (bits), que comienza con “110111011111011111110...”. Los astrónomos ficticios reconocieron de inmediato que esta señal tenía un origen inteligente.

Dembski nos dice que la secuencia SETI exhibe complejidad especificada (p. 359). En las pp. 143-144 ofrece una versión abreviada de 1000 bits de esta secuencia, indicando que tiene una probabilidad de 1 entre 2¹⁰⁰⁰, lo que da una IS de más de 500 bits (presumiblemente 1000 bits). El último ejemplo se basa en una causa conocida (agencia inteligente o lanzamiento de monedas), pero presumiblemente la secuencia tiene la misma IS independientemente de su causa. Después de todo, no conocemos la causa verdadera de la secuencia SETI, y sin embargo Dembski todavía nos dice que exhibe complejidad especificada. Es muy poco probable que la secuencia SETI se haya producido por el equivalente al lanzamiento de monedas. Un escenario mucho más probable es que los extraterrestres hayan programado una computadora para generar automáticamente la secuencia. En ese caso, estamos de nuevo ante el mismo tipo de situación que con el programa Weasel. Además, si estuviéramos considerando todas las hipótesis de azar relevantes, deberíamos considerar la posibilidad de que los dos resultados alternativos de cada pulso/pausa no fueran igualmente probables. En ausencia de cualquier otra información, la mejor estimación de las probabilidades de pulso y pausa sería 1102/1126 y 24/1126 respectivamente, ya que observamos 1102 pulsos y 24 pausas. Con estas probabilidades (y todavía asumiendo que cada pulso/pausa es independiente de los demás), la probabilidad de recibir la secuencia SETI sería (1102/1126)¹¹⁰² × (24/1126)²⁴ = 3,78 × 10^-51, considerablemente mayor que el límite de probabilidad universal de 10^-150. Por lo tanto concluyo que Dembski calcula la IS de la secuencia SETI sobre la base de que los pulsos y las pausas tienen probabilidad igual (1/2) y que la secuencia exhibe 1126 bits de IS.

Exhibición #5 -- URF13

Por último, debo mencionar un contraejemplo a mi interpretación de probabilidad uniforme. Dembski considera el caso de un gen, T-urf13, que aparece en una cepa particular de maíz (pp. 218-219). Este gen codifica un producto proteico llamado URF13. Al determinar si URF13 exhibe CSI, Dembski comienza calculando una probabilidad de 20⁸³, por el hecho de que el tamaño funcional mínimo de URF13 es de 83 aminoácidos y que hay 20 aminoácidos posibles. Así, está asumiendo que URF13 se extrae de una distribución de probabilidad uniforme sobre el espacio de todas las secuencias posibles de 83 aminoácidos. Luego señala que la probabilidad es en realidad mayor que esto, ya que debemos permitir la posibilidad de otras secuencias que tengan la misma función que URF13, es decir, otras secuencias que coincidan con la misma especificación. Por ahora, esto respalda la interpretación de probabilidad uniforme. Sin embargo, más adelante en la página, argumenta que la probabilidad en la que debe basarse la IS es aún más alta:

Por muchos modos que lo seccionáramos, las improbabilidades calculadas resultaron ser menores que el límite universal de probabilidad? ¿Demostraría eso que la CSI había sido generada de forma naturalista? No. Para empezar, no hay razón para pensar que los segmentos de genes que no codifican proteínas sean verdaderamente aleatorios; como se señaló arriba, T-urf13, que se compone de tales segmentos, es homólogo al ARN ribosomal. Por tanto, no es que estos segmentos se produjeran mediante el muestreo de una urna llena de ácidos nucleicos mezclados de manera laxa. Además, no está claro que la recombinación en sí misma sea realmente aleatoria. [p. 219]

Ahora Dembski está diciendo que no debemos calcular la IS sólo en base a un modelo de probabilidad uniforme (urn), sino que debemos tener en cuenta los procesos causales que creemos que están operando. Pero esto contradice los ejemplos de computadoras dados arriba, donde conocíamos el proceso causal real (la ejecución de un programa informático) y ese proceso daba un resultado especificado con alta probabilidad, sin embargo Dembski nos dijo que el resultado, aun así, exhibía CSI.

El hecho de que la probabilidad utilizada para calcular la IS se base siempre en una distribución de probabilidad uniforme es extremadamente importante. Dembski usa una distribución uniforme (o de “azar puro”) aunque se sepa que el fenómeno ha sido causado por un proceso que tiene alguna otra distribución de probabilidad. Dado que esto no se dice explícitamente por parte de Dembski y puede parecer sorprendente, presentaré varios elementos de evidencia para justificar mi interpretación.

6.3 Evidencia para la interpretación de probabilidad uniforme

Si la IS de un fenómeno supera un límite universal de complejidad de 500 bits, entonces Dembski dice que el fenómeno exhibe información especificada compleja (o CSI).³² El límite universal de complejidad se obtiene directamente del límite universal de probabilidad de Dembski de 10^-150, dado que -log₂(10^-150) es aproximadamente 500. Dembski también se refiere a la CSI como complejidad especificada, utilizando ambos términos de forma intercambiable. Como se indicó antes, este significado de complejidad especificada es distinto del que encontramos antes. Lo llamaré complejidad especificada de probabilidad uniforme. Para que quede claro: la complejidad especificada eliminativa es un atributo inferido de un evento, que indica que creemos que el evento era altamente improbable respecto de todos los mecanismos causales conocidos; la complejidad especificada de probabilidad uniforme (o CSI) es un atributo observado de un fenómeno, que indica que el fenómeno tiene una configuración “compleja”, con independencia de cómo haya surgido. Veremos que la noción de “complejidad” de Dembski es muy diferente de nuestra comprensión normal de la palabra.

Dembski diseña su propia medida de cuán compleja es la configuración de un fenómeno, y la llama información especificada (que abreviaré como IS). Calcula esta medida al elegir una especificación (tal como se describe en 3.1 arriba) y luego calcular la probabilidad de un resultado que coincida con esa especificación como si el fenómeno hubiera sido generado por un proceso con una distribución de probabilidad uniforme. Una distribución de probabilidad uniforme es aquella en la que todos los resultados posibles (es decir, configuraciones) tienen la misma probabilidad, y Dembski calcula la IS sobre esta base aunque se sepa que el fenómeno en cuestión no fue generado por tal proceso. (Esto se considerará con más cuidado en la siguiente sección.) La probabilidad calculada de este modo se convierte luego en “información” aplicando la función I(R) = -log₂P(R), es decir, la información es la negación del logaritmo (base 2) de la probabilidad, y se refiere a la medida resultante como un número de bits.

6.2 Información especificada compleja (CSI)

Nótese que se trata de otro método puramente eliminativo; infiere diseño a partir de la alegada ausencia de cualquier proceso natural capaz de generar CSI. Si la afirmación fuera verdadera, podría considerarse una generalización restrictiva, pero veremos que la afirmación no tiene base alguna.

Ya hemos visto este argumento formulado en términos de ajuste fino de las funciones de aptitud. Dembski también lo plantea en términos de complejidad especificada. Anteriormente, la complejidad especificada se introdujo como algo a inferir cuando habíamos eliminado todas las hipótesis naturales que podíamos considerar para explicar un evento. Pero ahora Dembski nos está diciendo que, incluso si no podemos eliminar la evolución darwinista como explicación, todavía deberíamos hacer una inferencia de diseño derivado si observamos complejidad especificada. Está claro que, por tanto, este es un significado diferente de complejidad especificada. Este nuevo significado es una propiedad observada de un fenómeno, no una propiedad inferida de un evento. Indica que el fenómeno tiene una configuración compleja (en un sentido especial). Esta propiedad también se denomina información especificada compleja (CSI).

Este es un argumento para lo que yo llamaré diseño derivado. (Dembski usa el término intencionalidad derivada.) No argumenta a favor del diseño en un evento en particular (como la evolución de alguna estructura), sino que simplemente argumenta que el diseño debió haber estado involucrado en algún momento de la cadena causal de eventos que condujeron a algún fenómeno que observamos.

El darwinista, por tanto, objeta que la “vida real” la evolución darwinista sí puede generar complejidad especificada sin introducirla de ninguna manera posteriormente. La función de aptitud en la evolución biológica se deriva directamente de la supervivencia y reproducción diferenciales, y esto, según el darwinista, puede legitimamente considerarse como una “comida gratis”.... Si se concede esta objeción, entonces la única forma de mostrar que el mecanismo darwiniano no puede generar complejidad especificada es demostrar que los gradientes de la función de aptitud inducidos por la supervivencia y reproducción diferenciales no son lo suficientemente suaves para que el mecanismo darwiniano conduzca a la evolución biológica a gran escala. Para usar otra metáfora de Dawkins, hay que mostrar que no hay manera gradual de ascender “el Monte Improbable”. Esta es una línea de argumento separada y es una que abordaré en el próximo capítulo [que trata sobre la complejidad irreducible y el flagelo bacteriano]. Aquí, sin embargo, quiero mostrar que esta concesión no debe concederse y que el problema del desplazamiento sí socava el darwinismo. [p. 208]

Dembski nos dice que tiene dos argumentos distintos para el diseño en la naturaleza. Además de intentar mostrar que existen en la naturaleza fenómenos que la evolución darwinista no tiene la capacidad de generar (como el flagelo bacteriano), Dembski también presenta otro argumento. Incluso si la evolución darwinista tuviera esa capacidad, él argumenta, sólo podría tenerla en virtud de que hubiera habido diseño involucrado en la selección de las condiciones iniciales subyacentes a la evolución.

6.1 Diseño derivado

Además, su elección no tiene un análogo natural. Chellapilla y Fogel mantuvieron constante su criterio de “victoria en el torneo”. Para los sistemas biológicos, el criterio de “victoria en el torneo” variará considerablemente dependiendo de quién esté jugando en el torneo. [p. 223]

Contrariamente a la afirmación de Dembski de que la elección de un criterio constante “no tiene un análogo natural”, el análogo natural del criterio constante de victoria es la constancia de las leyes de la física y de la lógica.

Como vimos antes, la función de aptitud refleja el problema que hay que resolver. En este caso, el problema es producir redes neuronales que jueguen bien a las damas bajo las condiciones prevalecientes. Dado que las condiciones bajo las que las redes neuronales evolucionadas estarían jugando eran (presumiblemente) desconocidas en el momento en que se programó el algoritmo, podría argumentarse que la elección del criterio de victoria fue libre. Los programadores, por tanto, podrían haber elegido cualquier criterio que quisieran. Sin embargo, en una situación así la elección natural es escoger la opción más simple. En escoger un criterio constante de victoria, eso es lo que hicieron los programadores. Como no tenían motivo para pensar que las redes neuronales se encontrarían en un torneo con condiciones de victoria variables, no había motivo para evolucionarlas bajo tales condiciones.

Las redes neuronales producidas por este algoritmo eran muy buenas jugadoras de damas, y Dembski asume que mostraban complejidad especificada (CSI). No ofrece justificación para esta suposición, pero parece razonable dada la interpretación de probabilidad uniforme. Presumiblemente la especificación aquí es, en términos generales, la producción de un buen jugador de damas, y el espacio de fase es el espacio de todos los valores posibles de los parámetros de una red neuronal. Si los parámetros se extrajeran al azar, la probabilidad de obtener un buen jugador de damas sería extremadamente baja. Dado que el resultado del programa exhibía CSI, Dembski necesita mostrar que había CSI en la entrada. En su mérito, Dembski no toma el camino fácil y afirma que el CSI estaba en la computadora o en el programa en su conjunto. La programación de las redes neuronales era bastante independiente del algoritmo evolutivo. En cambio, Dembski afirma que el CSI fue “insertado” por Chellapilla y Fogel como consecuencia de su decisión de mantener constante el “criterio de victoria” de una generación a la siguiente. Pero un criterio constante es la opción más simple, no una compleja, y la idea de que una decisión tan directa podría haber insertado mucha información es absurda.

Mi primer contraejemplo a la LCI es uno que Dembski introduce con valentía, a saber, las redes neuronales para jugar damas en evolución de Chellapilla y Fogel (pp. 221-223).³⁷ Comenzaré con una breve descripción del algoritmo evolutivo. Las redes neuronales se definían por un conjunto de parámetros (los detalles son irrelevantes) que determinaban su estrategia para jugar damas. Al inicio de la ejecución del programa, se creó una población de 15 redes neuronales con parámetros aleatorios. No tenían estructuras especiales correspondientes a ningún principio de estrategia de damas. Se les proporcionó solo la ubicación, el número y los tipos de piezas, la misma información básica que un jugador principiante tendría en su primera partida. En cada generación, la población actual de 15 redes neuronales generó 15 descendientes, con variaciones aleatorias en sus parámetros. Las 30 redes neuronales resultantes jugaron luego un torneo, con cada red neuronal jugando 5 partidas como rojo (jugando primero) contra oponentes seleccionados al azar. Se otorgaban +1 punto por una victoria, 0 por un empate y -2 por una derrota. Luego, las 15 redes neuronales con las puntuaciones totales más altas pasaban a la siguiente generación. Me referiré al triplete (+1, 0, -2) como el régimen de puntuación, y a la supervivencia de las 15 redes neuronales con la puntuación total más alta como el criterio de supervivencia.

6.6 Contraejemplo: Redes neuronales para jugar damas

En este caso, la LCI es solo un límite de probabilidad y no tiene nada que ver con la información o la complejidad en ningún sentido real. Por lo tanto, no consideraré esta interpretación más allá de esto.

P(X|Y) >= 10^-150
<=> P(Y&X) >= P(Y) × 10^-150 (ya que P(Y&X) = P(Y) × P(X|Y))
<=> I(Y&X) <= I(Y) + 500 (tomando log₂ de ambos lados).

Mi discusión de la LCI más abajo se basará en mi interpretación del SI de probabilidad uniforme. Sin embargo, en caso de que Dembski rechace esta interpretación, primero consideraré qué significaría la LCI si el SI se basara en las verdaderas probabilidades de los eventos. Entonces sería solo una versión encubierta de la antigua Ley de probabilidades pequeñas de Dembski, de The Design Inference, que afirma que los eventos especificados de probabilidad pequeña (menos de 10^-150) no ocurren. Él solo ha convertido la probabilidad en “información” aplicando la función I = -log₂P a cada lado de una desigualdad, con las probabilidades condicionadas a la ocurrencia de Y. Para ver esto, sea X un evento especificado que ha ocurrido como resultado de Y. Entonces, por la ley de probabilidades pequeñas,

Pese a su nombre, la LCI no es una ley de conservación. Dado que Dembski reconoce que pequeñas cantidades de SI (menos de 500 bits) pueden ser generadas por procesos aleatorios (pp. 155-156), la LCI no puede interpretarse como una ley de conservación en ningún sentido razonable del término. Es, más bien, un límite de cuánto SI puede ser generado.

donde I(Y) es la cantidad de SI exhibida por Y. (He hecho que Y sea antecedente de X, en lugar de lo contrario, para mantener la consistencia con la explicación de Dembski en las páginas 162-163.)

I(Y&X) <= I(Y) + 500

La ley de conservación de la información (en adelante LCI) es la formulación de Dembski de su afirmación de que las causas naturales no pueden generar CSI; solo pueden redistribuirla de un lugar a otro. La LCI afirma que, si un conjunto de condiciones Y es suficiente para causar X, entonces el SI mostrado por Y y X combinados no puede exceder el SI de Y solo en más que el límite superior universal de complejidad, es decir:

6.5 La ley de conservación de la información

Dado que el SI se basa en una distribución de probabilidad uniforme, hay poca duda de que el CSI existe en la naturaleza. De hecho, se pueden encontrar todo tipo de fenómenos naturales que exhiben CSI si se elige un espacio de fase adecuado. Tómese el ejemplo mencionado antes de los cráteres en la Luna. Si tomamos el espacio de todos los paisajes lunares teóricamente posibles y escogemos al azar un paisaje de una distribución uniforme sobre ese espacio, entonces la probabilidad de obtener un paisaje que exhiba tales formaciones circulares como las que realmente observamos en la Luna es extremadamente pequeña, suficientemente pequeña como para concluir que el paisaje lunar real exhibe CSI. Incluso las órbitas de los planetas exhiben CSI. Si una órbita planetaria se escogiera al azar de una distribución de probabilidad uniforme sobre el espacio de todas las formas posibles de trazar una trayectoria alrededor del Sol, entonces la probabilidad de obtener una trayectoria elíptica tan suave como la órbita de un planeta es diminuta.

Dembski dedica una sección de su libro (pp. 133-137) al problema de seleccionar un espacio de fase, pero no logra resolver el problema. Argumenta que deberíamos “inclinar la balanza hacia la abundancia e incluir tantas posibilidades como razonablemente puedan obtenerse en ese contexto” (p. 136). Pero esto significa que nos inclinamos hacia el lado de sobreestimar la cantidad de información exhibida por un fenómeno, y por lo tanto inclinarnos hacia la inferencia falsa de diseño. Esto apenas es razonable para un método que se supone infiere diseño de manera fiable. En cualquier caso, Dembski no sigue su propio consejo. Acabamos de ver en el ejemplo de METHINKS que eligió un espacio basado en solo 27 caracteres, difícilmente el número máximo plausible sin conocimiento del proceso causal.

La selección de un espacio de fase apropiado no es tal problema en la teoría de la información de Shannon estándar,³⁶ porque allí estamos preocupados por medir la información transmitida (o producida) por un proceso. Dembski, en cambio, quiere medir la información exhibida por un fenómeno dado y, a partir de ello, inferir el proceso causal que produjo el fenómeno. Esto lo obliga a elegir un espacio de fase sin conocer el proceso causal, con el resultado de que sus espacios de fase son arbitrarios.

Más problemático aún es el rango de posibles caracteres. Aquí Dembski eligió las 26 letras mayúsculas y un espacio como las únicas posibilidades. Pero, ¿por qué no incluir letras minúsculas, números, signos de puntuación, símbolos matemáticos, letras griegas, etc.? Solo porque no observamos ninguna de esas no significa que no fueran posibilidades reales. Y si debemos considerar únicamente los valores que realmente observamos, ¿por qué Dembski incluyó las 26 letras del alfabeto? Muchas de esas letras no se observaron en la palabra METHINKS ni siquiera en la oración más larga en la que estaba incrustada. Quizá Dembski se base en el conocimiento del proceso causal que dio origen a la palabra, sabiendo que las letras se sacaron de una colección de 27 fichas de Scrabble, digamos. Pero depender del conocimiento del proceso causal vuelve inútil el criterio para los casos en que no conocemos la causa. Y todo el propósito del criterio era permitirnos inferir el tipo de proceso causal (natural o de diseño) cuando es desconocido.

Problemas similares surgen en otros lugares. En la p. 166, Dembski calcula la complejidad de la palabra METHINKS como -log₂(1/27⁸) = 38 bits.³⁵ Esto se basa en un espacio de fase de cadenas de 8 caracteres donde cada carácter tiene 27 posibilidades (26 letras del alfabeto más un espacio). No considera la posibilidad de más o menos de 8 caracteres. Por tanto, claramente Dembski tiene una regla de que solo debemos considerar permutaciones posibles del mismo número de caracteres (o componentes) que realmente observamos. No se da ninguna justificación para tal regla, y todavía nos deja con una elección arbitraria que hacer respecto de la unidad de permutación. En el caso de METHINKS, podría argumentarse que la única unidad de permutación razonable es el carácter. Pero en otros casos debemos tomar una decisión. ¿En una oración, deberíamos considerar permutaciones de caracteres o de palabras? ¿En un genoma, deberíamos considerar permutaciones de genes, codones, pares de bases o átomos?

Si bien basar el SI en una distribución de probabilidad uniforme ayuda a hacerlo independiente del proceso causal que produjo el fenómeno, no puede hacerlo completamente independiente. Dado un espacio de fase (o clase de referencia de posibilidades, como lo llama Dembski), hay una sola distribución uniforme posible, aquella en la que todos los resultados tienen igual probabilidad. Pero, ¿cómo elegimos un espacio de fase? En el caso de la secuencia SETI puede parecer obvio que el espacio de fases relevante es el espacio de todas las secuencias binarias posibles de longitud 1126. Pero ¿por qué deberíamos suponer que la secuencia fue extraída de un espacio de secuencias de 1126 bits, y no de secuencias de longitud variable? ¿Por qué deberíamos suponer que el pulso y la pausa eran los únicos dos valores posibles? Los supuestos extraterrestres pudieron haber elegido transmitir pulsos de amplitudes variables.

6.4 La elección del espacio de fase

Pero un espacio de fase (como el espacio de búsqueda de un algoritmo de optimización) no viene acompañado de una distribución de probabilidad adherida. Es simplemente un espacio de posibles soluciones que nos interesa explorar.³⁴

Además, esos espacios típicamente vienen con una probabilidad uniforme que se adapta a la topología del espacio de fase. Esto significa que Ω [el espacio de fase] posee una medida de probabilidad uniforme U adaptada a la métrica en Ω de modo que piezas geométricamente congruentes de Ω reciben probabilidades idénticas (véase sección 2.2). [p. 188]

Dembski también parece considerar que las distribuciones de probabilidad uniformes son “privilegiadas” en cierto sentido (p. 50). Al referirse al espacio de fase de un algoritmo de optimización, escribe:

Mi conjetura es que Dembski no se dio cuenta de que tiene dos métodos distintos. Una razón de su confusión puede ser que todas las hipótesis de azar que considera en sus ejemplos son aquellas que dan lugar a una distribución de probabilidad uniforme, con la única excepción de un caso trivial (p. 70).

Si Dembski insiste en que solo tiene un método de inferencia de diseño y que es el método de eliminación de la casualidad, entonces debe explicar las objeciones anteriores y justificar su introducción de los términos “complejidad” e “información”. El método de eliminación de la casualidad utiliza una técnica estadística (probabilística) para eliminar hipótesis. Esto no tiene nada que ver con complejidad o información. Transformar probabilidades aplicando la función trivial I = -log₂P no las convierte mágicamente en medidas de complejidad o información. Solo sirve para enmascarar la naturaleza del argumento.

El SI se basa en la probabilidad con respecto al verdadero proceso causal responsable del evento. Esto haría al SI inútil para el propósito de hacer inferencias sobre la causa de un fenómeno. ¡Necesitaríamos conocer la causa para inferir la causa! Además, sería inútil decir que un fenómeno diseñado muestra CSI, ya que no hay una distribución de probabilidad con respecto a la cual podamos calcular el SI de un fenómeno diseñado (ya que Dembski nos dice que el diseño no es un proceso probabilístico). Esta interpretación es claramente insostenible.
El SI se basa en nuestra mejor comprensión de los procesos causales que pensamos podrían estar detrás del evento que dio lugar al fenómeno observado. Pero esto es justamente el método de eliminación de la casualidad una vez más. Calculamos el SI bajo la mejor hipótesis de azar que podemos imaginar (aquella que confiere la probabilidad más alta a una región de rechazo separable). Si el SI bajo esta hipótesis de azar es lo suficientemente alto (la probabilidad lo suficientemente baja), rechazamos esta hipótesis de azar y deducimos diseño. Por implicación, ya hemos considerado y rechazado todas las hipótesis de azar inferiores que podríamos imaginar (aquellas que confieren probabilidades más bajas a las regiones de rechazo separables). En ese caso, la afirmación de que un fenómeno exhibe CSI es simplemente una afirmación de que es improbable bajo todas las hipótesis de azar que podemos pensar. En otras palabras, este es el mismo argumento de ignorancia que se trató antes.

donde U indica una distribución de probabilidad uniforme sobre el espacio de todas las secuencias posibles de 1126 bits.

SI = -log₂(P(B|U)) = -log₂(2^-1126) = 1126 bits

Por el bien de un ejemplo concreto, consideremos una de las secuencias matemáticas anteriores, digamos la secuencia prima de SETI de 1126 bits. Entonces A es el programa que produce la secuencia y B es la secuencia misma. Entonces es cierto que P(B|A) (la probabilidad de B dado A) es igual a 1, ya que A siempre conduce a B. Por tanto, al aplicar la transformación I(E) = -log₂P(E), llegamos a I(B|A) = 0. Hasta aquí, todo bien. Sin embargo, I(B|A) aquí no es la información especificada de Dembski, SI. Asumo que los eventos en cuestión están especificados, por lo que el problema no tiene que ver con la especificación. El problema es que I(B|A) es solo P(B|A) transformado, y P(B|A) es la probabilidad condicional verdadera del evento, que en este caso es 1. La SI, por otro lado, se basa en el supuesto de una distribución de probabilidad uniforme, independientemente de la probabilidad verdadera del evento. En el caso de SETI, la SI exhibida por B se da por

Así, el resultado de Dembski es simplemente otra forma de decir que el resultado de un proceso determinista ocurre con probabilidad 1. Pero esto no dice nada sobre la información especificada exhibida por el resultado, ya que esta se basa en una distribución de probabilidad uniforme, independientemente de la probabilidad verdadera.

P(B|A) = P(A&B) / P(A).

que Dembski expresa en la siguiente forma (pp. 128-129):

P(A&B) = P(A) × P(B|A)

La ecuación anterior se dedujo de la siguiente ecuación básica de probabilidad, simplemente transformando ambos lados de la ecuación mediante la transformación trivial I(E) = -log₂P(E):

Dado que B (el resultado de un proceso determinista) está totalmente determinado por A (las condiciones antecedentes), argumenta Dembski, I(B|A) = 0, y por lo tanto I(A&B) = I(A). Así, el proceso no ha producido información nueva. (He simplificado un poco la notación de Dembski).

I(A&B) = I(A) + I(B|A).

Las primeras 4 páginas de la justificación de Dembski (pp. 151-155) se ocupan de mostrar que la LCI es verdadera para procesos deterministas. El error en este argumento se ve con mayor claridad al partir de la siguiente ecuación (p. 152):

Dembski afirma haber proporcionado una justificación matemática para su LCI. Dado que acabamos de ver que se pueden encontrar fácilmente contraejemplos a la LCI, debe haber algo incorrecto en esa justificación matemática. De hecho, los errores no son difíciles de ver.

6.8 Justificación matemática de Dembski

Por lo tanto, contrario a las implicaciones de Dembski, su concepto de complejidad especificada es bastante distinto del de Davies y Orgel.⁴⁴.

Pero, según la definición de Dembski, los cristales tienen alta complejidad, porque la probabilidad de obtener una forma cristalina por combinación puramente aleatoria de moléculas es muy pequeña. Al igual que Davies, Orgel define la complejidad en términos del «número mínimo de instrucciones necesarias para especificar la estructura».⁴³

Los organismos vivos se distinguen por su complejidad especificada. Los cristales como el granito no califican como vivos porque carecen de complejidad; las mezclas de polímeros aleatorios no califican porque carecen de especificidad. [p. 229n5]

En un sentido similar, Dembski cita a Leslie Orgel:

Sin embargo, si leemos The Fifth Miracle, encontramos que Davies usa complejidad en el sentido de información algorítmica (complejidad de Kolmogorov), y no en el sentido de probabilidad bajo una distribución uniforme de Dembski. Davies también llama a su medida specific randomness, mientras que Dembski identifica CSI, en la cita anterior, con cadenas no aleatorias.⁴²

Los organismos vivos son misteriosos no por su complejidad per se, sino por su complejidad estrechamente especificada. [p. 180]

Así, la información de Dembski (SI) tiende a variar inversamente con la información algorítmica. Una secuencia muy comprimible puede ser alta en SI pero baja en información algorítmica. Dembski nos lleva a creer que su CSI es equivalente al término specified complexity tal como lo usan otros autores, repitiendo la siguiente cita del libro de Paul Davies The Fifth Miracle no menos de cuatro veces:

Es CSI que dentro de la teoría de Chaitin-Kolmogorov-Solomonoff de la información algorítmica se identifican las cadenas de dígitos altamente comprimibles y no aleatorias... [p. 144]

El problema para Dembski es que los fenómenos altamente estructurados están estrictamente especificados, lo que les confiere baja probabilidad y, por lo tanto, alta SI. A diferencia de la información algorítmica (complejidad de Kolmogorov), que es una medida de incomprensibilidad, la SI se correlaciona con la compresibilidad. Secuencias altamente comprimibles como la secuencia de SETI presentan alta SI. A Dembski parece agradarle este hecho:

«Toda la SI de la salida estaba contenida en el programa». Esto significa que el programa contiene una cantidad ilimitada de SI. Dudo que a Dembski le guste adoptar la posición de que un programa trivial pueda contener una cantidad ilimitada de SI.
«La SI de una secuencia matemática está limitada a la longitud del programa necesario para generarla». Esto es cierto para la información algorítmica (complejidad de Kolmogorov),⁴¹ pero no para la SI de Dembski.
«La salida de un proceso determinista no exhibe SI porque no es contingente, como requiere el Filtro Explicativo». Pero esto haría que la evaluación de la SI dependiera del tipo de proceso causal que conduce al fenómeno, precisamente la cuestión que está en discusión. Si la secuencia de SETI exhibe CSI cuando se recibe del espacio exterior, ¿por qué la misma secuencia no debería exhibir CSI cuando es producida por una computadora? Y para todo lo que sabemos, la secuencia de SETI podría haber sido también generada por un programa determinista de computadora (programado por ETs). En cualquier caso, podemos hacer que nuestro programa de computadora sea no determinista si fuera necesario, por ejemplo, iniciando la secuencia prima desde un primo seleccionado aleatoriamente.

Me ocuparé de todas las objeciones que Dembski podría hacer a este argumento:

Dado que la SI del programa es finita (N bits) pero la SI de la secuencia de salida es ilimitada, el programa puede generar una cantidad ilimitada de SI.

Presento la siguiente justificación para afirmar que la SI de un programa no es mayor que la longitud del programa. Considere un programa dado de longitud N bits. Por analogía con el ejemplo de Dembski de METHINKS (p. 166), argumento que puedo tomar como mi espacio de fases el espacio de todos los programas de la misma longitud que mi programa dado. Entonces, la probabilidad de extraer cualquier programa dado (es decir, una secuencia de bits) de una distribución uniforme sobre este espacio es 1/2^N, por lo que la información de un programa particular es -log₂(1/2^N) = N bits. La SI exhibida por el programa puede ser menor que esto (si más de un programa coincide con la misma especificación que el programa dado), pero no puede ser mayor.

Como se discutió antes, Dembski aparentemente considera que la secuencia prima de SETI de 1126 bits presenta 1126 bits de SI. Pero, si esto es así, se sigue que una secuencia de n bits presentaría n bits de SI. Así, un programa informático que produzca esta secuencia puede generar tanta SI como queramos, simplemente dejando que el programa se ejecute el tiempo suficiente. La SI de la salida podría llegar a millones de bits y superar fácilmente la SI del programa, sin importar cuán grande sea ese programa. Tal vez la tarea de generar primos sea demasiado intratable para que esto sea una posibilidad práctica. En ese caso podemos elegir simplemente una secuencia más simple, como la secuencia de Fibonacci. Si tomamos una secuencia realmente simple como la secuencia de Champernowne (p. 64), incluso podemos programarla con solo unas pocas instrucciones de código máquina y ejecutarla en una computadora sin sistema operativo, de modo que la SI total del software sea inferior a 500 bits, ni siquiera suficiente para constituir CSI.

6.7 Contraejemplo: Secuencias matemáticas

Habiendo visto que se insertó muy poca, si acaso, SI a través de la elección del régimen de puntuación, Dembski podría elegir centrarse en otros parámetros, como el tamaño de la población. Sin embargo, la virtud del algoritmo de Chellapilla y Fogel es que tiene muy pocos parámetros y aun esos pocos podrían variarse considerablemente sin afectar negativamente el rendimiento del programa. No se afinó nada. Al igual que en el caso del régimen de puntuación, la selección de esos otros parámetros, por lo tanto, implica poca SI.

En caso de que Dembski tenga un problema incluso con la restricción natural que sugerí antes, consideremos una alternativa que no tenga restricciones previas. Supongamos que, al inicio de cada ejecución, el programa extrae 6 números aleatorios de un rango arbitrario (como antes). Llamemos a estos números W^-, W⁺, D^-, D⁺, L^-, L⁺. Para cada generación, el programa genera un nuevo triplete de puntuación (W, D, L), seleccionando estos parámetros aleatoriamente de distribuciones de probabilidad uniforme sobre los rangos [W^-, W⁺], [D^-, D⁺] y [L^-, L⁺] respectivamente. Muchas ejecuciones del programa fallarán por completo en producir buenos jugadores de damas (aunque puedan producir jugadores que sean buenos jugando damas suicida o buenos forzando un empate). Sin embargo, en una pequeña proporción de ejecuciones (1/720 en promedio), ocurrirá que W⁺ > W^- > D⁺ > D^- > L⁺> L^-, y en esas ejecuciones podemos esperar que el programa produzca buenos jugadores de damas.³⁹ Así, si ejecutamos el programa suficientes veces, la salida a veces mostrará CSI aunque no hubiera SI en el régimen de puntuación. Alternativamente, podemos decir que un régimen exitoso como el de Chellapilla y Fogel⁴⁰ tiene una SI de -log₂(1/720) = 9.49 bits, más algunos bits para tener en cuenta que no todos los regímenes exitosos rinden tan bien como este, como se ha discutido más arriba.

Por las razones ya expuestas, no parece razonable considerar que el régimen de puntuación fue seleccionado de dicho espacio de fases. No obstante, incluso si lo hacemos, la cantidad de SI insertada por la elección de Chellapilla y Fogel fue mínima. Esto se debe a que la SI debe basarse en una región de rechazo compuesta por todos los regímenes de puntuación dependientes del tiempo posibles que habrían funcionado tan bien como el de Chellapilla y Fogel o mejor. Supongamos que, en lugar de usar un régimen de puntuación constante, el programa generaba aleatoriamente un nuevo triplete de puntuación (W, D, L) para cada generación, sujeto únicamente a la restricción de que W > D > L. Esta restricción no es una imposición artificial; es una característica del problema que debe resolverse. Si el problema fuera encontrar buenos jugadores para el juego de damas suicida (donde el objetivo del juego es «perder»), la restricción sería L > D > W. Dado que la SI se basa en una distribución de probabilidad uniforme, los valores de W, D y L se extraerían de una distribución de probabilidad uniforme sobre algún rango continuo, digamos [+2, -2]. Solo nos interesan los valores relativos de W, D y L, por lo que la elección del rango es arbitraria y podría hacerse de forma aleatoria al inicio de cada ejecución. La pregunta entonces es con qué frecuencia tal programa rendiría tan bien como el original, es decir, produciría tan buenos jugadores en la misma cantidad de tiempo. Si, por ejemplo, el programa revisado rinde tan bien como el original en 1/8 de las ocasiones (de una muestra suficientemente grande), eso significa que 1 de cada 8 regímenes dependientes del tiempo rinden tan bien como los de Chellapilla y Fogel. La SI del régimen de Chellapilla y Fogel sería entonces solo de -log₂(1/8) = 3 bits. Para sostener su afirmación de que esta elección insertó CSI, la carga recae en él para mostrar que la proporción de regímenes que rinden tan bien como los de Chellapilla y Fogel es menor que 1 en 10¹⁵⁰, y eso parece muy poco probable.

Cuando Dembski se refiere aquí a una «función de aptitud local», aparentemente se refiere a la función de aptitud de una generación concreta.³⁸ Pero, contrario a la afirmación de Dembski, la secuencia de funciones de aptitud no fue «coordinada» por Chellapilla y Fogel. Dependía de la evolución de la población de redes neuronales. Por ello, no tiene sentido hablar de Chellapilla y Fogel eligiendo de «el espacio de todas las combinaciones posibles de funciones de aptitud locales». Sin embargo, sí tendría algún sentido hablar de que eligieron del espacio de fases de todos los regímenes de puntuación dependientes del tiempo posibles (un triplete por generación), y asumiré que a esto se refiere Dembski.

No hay siquiera una función de aptitud definida sobre todo el espacio de redes neuronales que juegan a las damas. En cambio, cada colección de 30 redes neuronales obtiene su propia función de aptitud local que asigna la aptitud según cómo le va a una red neuronal en un torneo con otras redes neuronales... [p. 222]

Dembski insiste en que la SI «insertada» por la elección de Chellapilla y Fogel está determinada con respecto al «espacio de todas las combinaciones posibles de funciones de aptitud locales del que eligieron su conjunto coordinado de funciones de aptitud locales». No está claro qué significa Dembski aquí con fitness functions. Como hemos visto, en una situación donde el éxito de un individuo depende de sus interacciones con otros individuos de la población (en este caso, la población de redes neuronales), la función de aptitud varía a medida que varía la población, ya que la aptitud de un individuo es relativa a su entorno, que incluye al resto de la población. Dembski parece reconocer esto, ya que escribe:

Antes de considerar algunas objeciones adicionales a la afirmación de Dembski, necesito decidir qué significa por «criterio de victoria». ¿Quiere decir solo el régimen de puntuación? ¿O quiere decir el conjunto completo de reglas del torneo: la selección de oponentes, el régimen de puntuación y el criterio de supervivencia? Para abreviar, consideraré solo el régimen de puntuación, pero se pueden hacer argumentos similares respecto de los otros elementos de las reglas del torneo.

No está claro qué significa Dembski por «el criterio de victoria en el torneo». Sin embargo, el hecho de que el éxito de un sistema biológico dependa de quién está «jugando en el torneo» ciertamente tiene un análogo en el algoritmo de Chellapilla y Fogel. El éxito de una red neuronal dependía de qué otras redes neuronales estaban jugando en el torneo.

La hipótesis de diseño ha sido criticada con frecuencia por ser indemostrable. Lo que se entiende exactamente por testabilidad no está claro, pero Dembski utiliza el término como un encabezado general bajo el cual considerar una serie de criterios más específicos.

7.2 Testabilidad

La pregunta final de Dembski es: "¿Quién o qué es el diseñador?", pero agrega rápidamente que esto no es una cuestión científica. Qué extraño. Pensé que Dembski, como otros defensores del diseño inteligente, estaba en contra de trazar líneas arbitrarias entre lo que puede y no puede incluirse en la ciencia. ¿Por qué la identidad del diseñador debería ser un tema prohibido?

No se intenta seriamente sugerir de qué manera podrían responderse estas preguntas. Una lista de preguntas no constituye un programa de investigación.

Problema de construcción--¿Cómo fue construido el objeto diseñado? Dada suficiente información sobre la historia causal de un objeto, esta pregunta puede admitir una respuesta. [p. 313]⁴⁶

El movimiento de diseño inteligente ha sido criticado con frecuencia por no llevar a cabo ni siquiera proponer ninguna investigación, y Dembski intenta abordar aquí esta preocupación (pp. 311-314). La primera parte de este "programa" es la búsqueda de más casos de complejidad especificada, es decir, más sistemas biológicos para los que supuestamente no existe explicación natural conocida. Además de esto, todo lo que presenta es una lista de preguntas, de las cuales la siguiente es típica:

7.1 Esquema de un programa de investigación positivo

Habiendo negado previamente el valor de comparar hipótesis y basado su razonamiento en un enfoque puramente eliminativo para inferir diseño, Dembski cambia de rumbo en su capítulo final e intenta construir un caso positivo para su hipótesis de diseño. Gran parte de esto se basa en la premisa de que la complejidad especificada es un indicador de diseño, una premisa que hemos visto que es falsa. Ignoraré esas partes y me concentraré en las afirmaciones adicionales.

¡Investigación! Un simple pretexto para la inactividad; jamás ha logrado,
y jamás logrará ningún resultado ni de ligero valor.
Benjamin Jowett (1817-93), erudito clásico y Master de Balliol College, Oxford

7. El caso positivo para el diseño

Dembski afirma con gran osadía que su LCI puede considerarse una "cuarta ley de la termodinámica". Dado que he mostrado que el LCI carece de base, no consideraré esta afirmación adicional.

En resumen, Dembski no ha logrado demostrar que los procesos naturales no pueden producir complejidad especificada o CSI, aunque se defina como sea. Simplemente ha evadido el problema de la selección acumulativa.

El problema no es cuánta SI puede exhibir una estructura, sino si esa SI puede surgir mediante procesos naturales, y Dembski no da absolutamente ninguna razón para pensar que la SI no puede acumularse durante múltiples etapas de selección acumulativa. Quizá Dembski respondería que la probabilidad de que todo el proceso alcance un resultado especificado es el producto de las probabilidades de las etapas individuales, y por lo tanto seguirá quedando por debajo del límite de probabilidad universal. Pero esto no reconoce que en cada etapa habrá muchos intentos (muchos individuos en la población durante muchas generaciones), de modo que la probabilidad de éxito será mucho mayor que si un solo individuo tuviera que superar cada etapa en sucesión.

Dembski vuelve a este asunto varias páginas después (pp. 165-166), cuando afirma que CSI es holístico, y por tanto no puede acumularse. Pero su argumento para apoyar la afirmación fracasa por completo al abordar el problema. Señala que la frase "METHINKS IT IS LIKE A WEASEL" exhibe más SI que el conjunto agregado de palabras individuales {A, IS, IT, LIKE, WEASEL, METHINKS}, porque la primera consiste en una secuencia especificada de palabras. Dependiendo de las especificaciones que elijamos, eso puede ser cierto. Pero es irrelevante, ya que todavía no hay límite en la cantidad de SI que un agregado puede exhibir, dado un número suficiente de palabras. En cualquier caso, Dembski no nos ha dado ninguna razón para pensar que las causas naturales se ven limitadas a producir agregados ordenados aleatoriamente.

Pero, ¿qué pasa con la selección acumulativa (para tomar prestado el término opuesto de Dawkins)? La selección acumulativa es una serie de pequeños pasos a través del espacio de fases (el conjunto de todas las configuraciones posibles), basada en ensayo y error, en la que los pasos ventajosos se retienen y se usan como base para un desarrollo ulterior. ¿Cuál es el argumento de Dembski contra la generación de CSI por selección acumulativa? Al abordar si un proceso estocástico puede generar CSI (pp. 157-158), Dembski descompone el proceso en dos etapas: una etapa de puro azar seguida de una etapa determinista. Argumenta que ninguna de las dos etapas puede producir CSI, y que el proceso combinado de dos etapas tampoco puede hacerlo. Extrañamente, Dembski no menciona la posibilidad de múltiples iteraciones de procesos de azar y deterministas. Pero eso es exactamente en lo que se basa la selección acumulativa (por ejemplo, la evolución biológica). Cada etapa de azar (mutación aleatoria) puede producir un poco de SI, y la selección natural puede actuar para impedir que la SI existente se pierda, permitiendo que se acumule con el tiempo en un proceso similar a un trinquete.

La siguiente etapa en la justificación de Dembski es argumentar que los procesos puramente aleatorios no pueden generar CSI (pp. 155-157). Aceptaré de buen grado que esto es así, dado el siguiente desarrollo de lo que quiero decir con esto: consideramos efectivamente imposible que un fenómeno altamente especificado (como un organismo vivo) pudiera extraerse de una distribución de probabilidad uniforme sobre el espacio de todas las combinaciones posibles de las partes componentes del fenómeno (si tomamos partes suficientemente simples). La probabilidad es simplemente demasiado baja. Esto sería lo que Richard Dawkins llama selección de un solo paso.⁴⁵ Sin embargo, como señala Dembski, los procesos puramente aleatorios pueden producir cantidades menores de SI, por debajo de CSI, ya que estos corresponden a sucesos de mayor probabilidad. En otras palabras, el LCI no prohíbe que procesos naturales produzcan SI.

Así que los procesos deterministas pueden generar CSI. Sin embargo, Dembski pudo haber evitado este problema adoptando una medida de información razonable, como la complejidad de Kolmogorov especificada de Davies. Con esa medida, sería cierto que los procesos deterministas no pueden generar información, ya que la salida de un programa determinista, por definición, tiene la misma o menor complejidad de Kolmogorov que el programa. Para abordar los argumentos de Dembski sobre los procesos estocásticos, fingiré, por el resto de esta sección, que la SI no puede ser generada por procesos deterministas.

En resumen, Dembski está confundiendo dos significados distintos de información.

La respuesta de Dembski es atacar "la visión reduccionista de la ciencia de Dawkins" (p. 353). Pero esto no es reduccionismo. Es el principio de que las explicaciones científicas deben explicar realmente las cosas y no simplemente pedir a la conclusión!

Hay que decir algo como "Dios siempre estuvo ahí", y si te permites ese tipo de salida perezosa, bien podrías decir simplemente "el ADN siempre estuvo ahí", o "la vida siempre estuvo ahí", y ya estaría. [p. 353]

Por supuesto, es cierto que las explicaciones científicas con frecuencia crean nuevas preguntas sin respuesta. Pero, al evaluar el valor de una explicación, esas preguntas no son irrelevantes. Deben sopesarse frente a las mejoras en nuestra comprensión que la explicación aporta. Invocar un ser inexplicado para explicar el origen de otros seres (nosotros mismos) es poco más que pedir a gritos. La nueva pregunta planteada por la explicación es tan problemática como la pregunta que la explicación dice responder. Como dice Dawkins (citando a Dembski):

La pregunta de quién diseñó al diseñador invita a una regresión que puede rechazarse con facilidad. La razón por la que esa regresión puede ser rechazada es porque tal regresión surge siempre que los científicos introducen una entidad teórica novedosa. Por ejemplo, cuando Ludwig Boltzman introdujo su teoría cinética del calor a fines del siglo XIX e invocó el movimiento de partículas no observables (lo que hoy llamamos átomos y moléculas) para explicar el calor, uno podría haber argumentado igualmente que esas partículas no observables no explican nada porque ellas mismas necesitan ser explicadas. [p. 354]

No sólo Dembski no explica la naturaleza de su diseñador incorpóreo, sino que incluso intenta sacar de los límites las preguntas sobre su origen:

Un diseñador incorpóreo, por otro lado, es otra cosa totalmente distinta. Dembski define a un diseñador incorpóreo como "una inteligencia cuyo modo de operación no puede limitarse a una entidad física ubicada dentro del espaciotiempo" (pp. 333-334). No tenemos idea de cómo podría existir un ser así o incluso qué significa que un ser así exista. Por mi parte, no excluyo a los seres incorpóreos de la ciencia por principio, pero se requerirían algunos desarrollos científicos muy significativos antes de que tal hipótesis pudiera tomarse en serio. Mientras tanto, los diseñadores incorpóreos son una explicación altamente poco parca.

Ese es exactamente el punto. En el caso de SETI, podemos considerar la posibilidad de que los extraterrestres evolucionaron naturalmente, desarrollaron la tecnología para enviar una señal de radio a través del espacio interestelar y decidieron que valía la pena intentar comunicarse con nosotros. Hay enormes incertidumbres implicadas, pero podemos hacer una conjetura informada sobre la plausibilidad relativa de tal hipótesis en comparación con la hipótesis de que una señal de radio extraterrestre es de origen natural.

Al menos con inteligencias extraterrestres podemos adivinar qué pudo haber ocurrido. Pero no tenemos ninguna experiencia con diseñadores incorpóreos, y eso es claramente con lo que estamos lidiando cuando se trata del diseño en biología. [p. 359]

Dembski no intenta ocultar el hecho de que el diseñador que tiene en mente es uno incorpóreo. Por qué, pregunta, ¿por qué los científicos están dispuestos a considerar diseño que involucra seres extraterrestres (como en SETI) pero no diseñadores incorpóreos? Él mismo responde la pregunta:

7.3 Diseñadores incorpóreos

Así, la teoría evolutiva prevalece sobre la hipótesis de diseño en términos de productividad como programa de investigación, falsabilidad, parquedad, poder predictivo y (al menos según la definición considerada arriba) poder explicativo.

Falsabilidad

Tanto los partidarios como los oponentes del diseño inteligente tienen la desafortunada tendencia de afirmar que "el diseño inteligente es/no es falsable", sin aclarar exactamente cuál es la hipótesis a la que se refieren. De hecho, como ya hemos visto, la hipótesis del diseño de Dembski no nos dice nada más que que un diseñador intervino en algún punto de la cadena causal de los acontecimientos que condujeron al flagelo bacteriano (y posiblemente a otros sistemas biológicos). La hipótesis de diseño no dice nada en absoluto sobre la identidad, las capacidades o los objetivos del diseñador; si hubo muchos diseñadores o sólo uno; o cómo y cuándo se implementó el diseño.

El filósofo de la ciencia Karl Popper sostuvo que la falsabilidad es una condición necesaria para que una proposición sea considerada una hipótesis científica, y este principio se ha usado con frecuencia como criterio de demarcación para separar la ciencia de la pseudociencia. Si no existe evidencia que pudiera contradecir una hipótesis, entonces la hipótesis puede mantenerse sin importar la evidencia. El principio se ha debilitado por la observación (atribuida a Duhem y Quine) de que cualquier hipótesis puede salvarse de la falsificación abandonando una hipótesis auxiliar. Por ejemplo, a veces se argumenta que el hallazgo de un cráneo humano fosilizado en una estratificación precámbrica falsificaría la teoría de la evolución. Pero, incluso ante una observación así, la teoría de la evolución podría salvarse suponiendo que existe algún medio desconocido por el cual un fósil podría hundirse a través de estratos antiguos. No obstante, podemos pensar en términos de grados de falsabilidad. La teoría de la evolución es relativamente falsable, porque hay muchas observaciones hipotéticas, como un cráneo en el Precámbrico, que causarían una grave consternación entre los científicos, obligándolos a reevaluar al menos una hipótesis científica bien respaldada.

Por otro lado, no existe ninguna observación potencial que pudiera causar un problema similar para los defensores de la hipótesis de diseño, ya que cualquier observación es coherente con esa hipótesis, con o sin hipótesis auxiliares. A pesar de esto, Dembski afirma que la hipótesis de diseño es falsable, al tiempo que admite que ha sido "rápido y suelto" en su uso del término (p. 357). Su uso se indica en el siguiente pasaje:

Si pudiera mostrarse que sistemas biológicos como el flagelo bacteriano, que son maravillosamente complejos, elegantes e integrados, pudieron haberse formado por un proceso gradual darwiniano (que por definición es no teleológico), entonces el diseño inteligente sería falsificado por la razón general de que no se invocan causas inteligentes cuando las causas puramente naturales bastan. En ese caso, la navaja de Occam liquida elegantemente al diseño inteligente. [p.357]

Todo lo que Dembski dice aquí es que la hipótesis de diseño tiene el potencial de ser reemplazada por una mejor. Pero eso es cierto para cualquier hipótesis, por lo que el punto es totalmente poco interesante. Esto ciertamente no es lo que Popper quiso decir con falsabilidad.

Parquedad

Es reconfortante que, mediante su invocación de la navaja de Occam, Dembski parezca haber reconocido que la hipótesis de la evolución natural es más parca que la hipótesis de diseño. Entonces uno se ve obligado a preguntar por qué piensa que una hipótesis (diseño) que carece por completo de detalle debería preferirse a una hipótesis más parca (evolución natural) con detalle limitado. Claramente, las hipótesis de diseño tienen un estatus muy privilegiado en el sistema de Dembski.

Poder predictivo

El poder predictivo (o predictibilidad como lo llama Dembski) está muy relacionado con la falsabilidad (en el sentido de Popper), ya que una hipótesis se falsifica al hacer una observación que contradice una predicción de la hipótesis. Para que una hipótesis haga predicciones, debe ser capaz de distinguir entre observaciones posibles bajo la hipótesis y las que no lo son, o entre las que son más probables que otras. La hipótesis de diseño fracasa por completo en esto. Sin conocimiento de las capacidades y objetivos del diseñador, todas las posibilidades concebibles parecen igualmente probables.

En un artículo anterior, Dembski reconoció la falta de poder predictivo de la hipótesis de diseño: "Sí, el diseño inteligente concede la predictibilidad".⁴⁷ En No Free Lunch se retracta de esta concesión, ofreciendo dos ejemplos de predicciones hechas por la hipótesis de diseño, pero ninguna de ellas resiste el escrutinio.

En primer lugar, nos dice que "El diseño inteligente nos ofrece una predicción evidente, a saber, que la naturaleza debería estar repleta de complejidad especificada y, por lo tanto, debería contener numerosos indicios de diseño" (p. 362). En absoluto. La hipótesis de diseño no nos dice nada sobre cuántas estructuras fueron diseñadas, y el propio Dembski nos dijo antes (p. 24) que el diseño no deja necesariamente rastros detectables. Incluso escribe:

Obsérvese que no estoy ofreciendo una teoría sobre la frecuencia o intermitencia con que un diseñador incorpóreo imparte información al mundo. No me sorprendería que la mayor parte de la información impartida por un diseñador así nos eluda, sin ajustarse a ningún patrón que pudiera permitirnos detectar a ese diseñador... [pp. 346-347]
Luego apela a patrones que han sido reconocidos en la evolución de la tecnología humana, argumentando que la hipótesis de diseño predice que también deberíamos ver esos patrones en la evolución biológica (p. 362). Pero, ¿por qué debería ser así? ¿Está Dembski diciendo ahora que su diseñador incorpóreo está obligado a seguir patrones de desarrollo similares a los de los diseñadores humanos? Si es así, eso es una adición a la hipótesis de diseño que realmente tiene algunas implicaciones predictivas. Pero corta en ambos sentidos. Si encontramos patrones en la evolución que no son típicos del desarrollo tecnológico humano, eso contará como evidencia en contra de la hipótesis de diseño. Y encontramos tales patrones. Por ejemplo, vemos que los cambios evolutivos biológicos ocurren de manera fragmentada, con sistemas adaptados a funciones totalmente nuevas, donde un diseñador humano rediseñaría el sistema desde cero. Esto suele conducir a sistemas subóptimos como la retina invertida de los mamíferos, con su punto ciego, que podría mejorarse con un cambio simple, fácil de hacer por un ingeniero humano pero posiblemente inaccesible para la evolución natural.⁴⁸ Así que Dembski tiene aquí una elección: o ningún poder predictivo o fracaso predictivo. ¿Qué será?

Tras no haber establecido ningún poder predictivo para su propia hipótesis, intenta darle la vuelta a la teoría evolutiva, señalando que la teoría evolutiva no predice hechos como la existencia de especies particulares (p. 361). Esto es cierto, ya que tales hechos son el resultado de contingencias históricas impredecibles. Pero la teoría evolutiva ciertamente sí hace muchas predicciones igualmente.⁴⁹ Por ejemplo, la teoría evolutiva predice que habrá un alto grado de congruencia entre los árboles filogenéticos derivados de estudios morfológicos y de estudios moleculares independientes. Esta predicción se ha confirmado y continúa confirmándose a medida que se analizan más especies.⁵⁰

Los partidarios del diseño inteligente a veces argumentarán que gran parte del poder predictivo de la teoría evolutiva puede ser asimilado por el diseño inteligente. Por ejemplo, quienes aceptan la descendencia común de las especies pueden argumentar que la congruencia de los árboles filogenéticos es una predicción de la descendencia común, independientemente de si el descenso de un ancestro común fue controlado o no por un diseñador. Dembski no parece hacer tal argumento e, de hecho, es bastante ambivalente sobre la descendencia común (pp. 314-316). En cualquier caso, la introducción de un diseñador en el proceso evolutivo debilita las predicciones derivadas de la descendencia común, pues nos obliga a admitir, por ejemplo, que el diseñador introdujo repentinamente material genético totalmente nuevo. La única manera de preservar plenamente el poder predictivo de la teoría evolutiva al introducir un diseñador es hipotetizar que el diseñador imita perfectamente los efectos empíricos de la evolución natural. Dicha hipótesis es totalmente superflua desde el punto de vista científico.

Poder explicativo

El término poder explicativo se usa ampliamente pero es difícil de definir. No intentaré dar una definición, pero señalaré que, en parte, es otra cara del poder predictivo, refiriéndose a la capacidad de "retropredicción" de observaciones pasadas. En este sentido, la hipótesis de diseño carece de poder explicativo de manera tan absoluta como de poder predictivo.

Dembski afirma que hay "cosas que podrían ocurrir en biología para las que un marco teórico de diseño podría ofrecer una explicación mejor y más precisa que un marco puramente darwiniano y, por lo tanto, no teleológico" (p. 363). Para respaldar esta afirmación, da solo un ejemplo:

Para ver esto, supongamos que fuera un biólogo molecular supergenio y que hubiera inventado alguna maquinaria molecular hasta ahora desconocida, mucho más complicada y maravillosa que el flagelo bacteriano. Supongamos además que introduje esta máquina en una bacteria, solté a ese organismo modificado genéticamente en libertad, permití que se reprodujera en estado salvaje y destruí toda evidencia de que yo había creado la maquinaria molecular. Supongamos, por ejemplo, que la máquina es un aguijón que inyecta otras bacterias y las hace explotar bombeándoles rápidamente gas (no conozco ningún aguijón molecular así en estado natural), permitiendo así que bacterias dotadas de mi invención consuman a sus infortunadas presas.

Ahora hagamos la pregunta: si un darwinista encontrara esta bacteria con la nueva maquinaria molecular en estado salvaje, ¿atribuiría esa máquina al diseño o a la selección natural?" [p. 364]

Dembski nos dice que "el diseño inteligente, al centrarse en la complejidad especificada del aguijón, confirmaría el diseño del aguijón mientras que el darwinismo nunca podría" (p. 364). ¡Qué disparate! No hay razón para que un darwinista (es decir, un científico de corriente principal) no considere la posibilidad de un diseño humano, así como podría sospechar ingeniería genética de una nueva cepa inusual de tomate, o cría selectiva de un perro. En el caso del aguijón de Dembski, consideraríamos factores como si el dispositivo estuviera al alcance de la tecnología actual, qué motivo podría tener alguien para crearlo, si el dispositivo tenía apariencia de una estructura evolucionada, si había organismos conocidos similares de los que este pudiera haber evolucionado, etc.

En cualquier caso, esto no tiene nada que ver con si hay o no poder explicativo en la hipótesis de que un ser desconocido diseñó el flagelo bacteriano. En el ejemplo de Dembski consideraríamos a un posible diseñador humano con capacidades y motivaciones conocidas (al menos en cierto grado).

La vacuidad de esta afirmación de rigor pronto se hará evidente.

Los patrones se dividen así en dos tipos, aquellos que en presencia de complejidad [baja probabilidad] justifican una inferencia de diseño y aquellos que, a pesar de la presencia de complejidad, no justifican una inferencia de diseño. Al primer tipo de patrón lo llamo una especificación, al segundo una fabricación. Las especificaciones son patrones no ad hoc que pueden usarse legítimamente para eliminar el azar y justificar una inferencia de diseño. Por el contrario, las fabricaciones son patrones ad hoc que no pueden usarse legítimamente para justificar una inferencia de diseño. Como veremos en el capítulo 2, la distinción entre especificaciones y fabricaciones puede hacerse con total rigurosidad estadística. [p. 12]

En un intento de resolver este problema, al tiempo que se ampliaba el rango de estadísticas de prueba permitibles, Dembski introduce algunas reglas que supuestamente nos constriñen a elegir solo estadísticas de prueba apropiadas y, por ende, solo regiones de rechazo apropiadas. Los patrones que describen las regiones de rechazo apropiadas (o desprendibles) se denominan especificaciones, mientras que los que describen las inapropiadas se llaman fabricaciones:

Fisher no permitió una adaptación ilimitada de la estadística de prueba al resultado observado E, pero nunca se trazó una frontera clara entre lo que se permitía y lo que no. Habría permitido la estadística de prueba usada por Dembski en el caso Caputo (el número de Ds en una secuencia), pero no habría permitido la estadística de prueba recién discutida (la función indicadora 1_E). Tampoco, creo yo, habría permitido la estadística de prueba elegida por Dembski en el caso Champernowne, que se discute a continuación.

Lo que hay que excluir, entonces, es la adaptación de f [la estadística de prueba] a E. Alternativamente, f necesita ser independiente (en algún sentido apropiado) de la muestra E. [p. 54]

Este problema se ve con mayor claridad en la posibilidad de adaptar la elección de la estadística de prueba al resultado observado concreto, garantizando que la región de rechazo se enfoque estrechamente en ese resultado y que la probabilidad calculada sea pequeña. Por ejemplo, en el caso Caputo, podríamos elegir como nuestra estadística de prueba la función indicadora 1_E que asigna al resultado observado E un valor de 1 y a todos los demás resultados un valor de 0. Esto conduce a una región de rechazo que consiste solo en E, con el resultado de que P(R|H) = P(E|H) = (1/2)⁴¹. Dembski nos advierte sobre esta adaptación:

La teoría de Fisher tal como se ha expuesto hasta ahora es lógicamente inconsistente. El problema surge porque siempre hay muchas variables aleatorias que pueden definirse en cualquier espacio muestral dado, y no todas ellas conducen a la misma conclusión cuando se usan como estadística de prueba en una prueba de significación. Por ello, una estadística de prueba puede indicarle rechazar alguna hipótesis cuando otra le dice que no debe hacerlo."⁵⁷

Se puede encontrar una excelente comparación de los distintos enfoques de la estadística en Scientific Reasoning: The Bayesian Approach de Howson y Urbach.⁵⁶ Este libro se recomienda encarecidamente a cualquier lector que desee comprender el problema en detalle. La claridad de la exposición es un antídoto refrescante frente al pensamiento confuso de Dembski. Howson y Urbach formulan dos objeciones principales al enfoque de Fisher: la falta de una base racional y la dependencia del resultado de la elección de la estadística de prueba. He aquí cómo resumen la segunda objeción:

A.1 Especificaciones

También intenta usar su extensión del enfoque de Fisher para justificar su método eliminativo de inferir diseño. Pero esto es una distracción. Como se muestra en la sección 3.3 anterior, el método de eliminación del azar de Dembski simplemente consiste en aplicar su método estadístico, por turno, a cada hipótesis de azar disponible e inferir diseño si el método estadístico rechaza todas las hipótesis de azar que podamos imaginar. Por ello, en este apéndice, no volveré a decir nada sobre "barre la gama de hipótesis de azar", como dice Dembski (p. 67), sino que consideraré simplemente el método estadístico de Dembski en términos de probar una hipótesis de azar individual.

Dembski se atribuye ambiciosamente haber proporcionado una base racional firme para el enfoque estadístico de Fisher—algo que siempre ha faltado en el pasado—que le permite extender el enfoque a una clase más amplia de regiones de rechazo (especificaciones) que las permitidas por el propio Fisher, y proveer límites de probabilidad pequeños no arbitrarios (pp. 45-47). La mayor parte de este apéndice se centrará en mostrar los principales problemas inherentes en los métodos de Dembski para establecer especificaciones y límites de probabilidad. Terminaré regresando al tema de si ha proporcionado una base racional para el enfoque de Fisher.

El método estadístico de Dembski para rechazar hipótesis individuales del azar se deriva del enfoque de inferencia estadística desarrollado por el estadístico y genetista R. A. Fisher. Si bien está ampliamente usado debido a su atractivo intuitivo, este enfoque es rechazado cada vez más por estadísticos, incluidos quienes defienden los enfoques de Neyman-Pearson, Bayesianos y de verosimilitud. No es mi intención aquí resolver esta vieja controversia de la teoría estadística, sino señalar problemas en las afirmaciones de Dembski que son adicionales a la cuenta estándar del enfoque de Fisher.

Apéndice. Examen del método estadístico de Dembski

Estoy agradecido por la ayuda de Wesley Elsberry, Jeffrey Shallit, Erik Tellgren y de otros que han compartido conmigo sus ideas.

Agradecimientos

En resumen, No Free Lunch es completamente inútil, salvo como obra de retórica pseudocientífica dirigida a un público matemáticamente poco sofisticado que puede confundir su jerga matemática enrevesada con erudición auténtica. Sin embargo, puesto que se me ha pedido encontrar algo positivo para escribir sobre ello, me complace poder informar que el libro tiene un excelente índice.

El método de eliminación de la probabilidad del azar no es más que un argumento del Dios de las brechas. Simplemente nos dice que infiramos diseño cuando hemos rechazado todas las hipótesis no de diseño que podamos imaginar.
Al aplicar el método de eliminación del azar a un sistema bioquímico (el flagelo bacteriano), Dembski no ha considerado explicaciones evolutivas que involucren cambio de función. En cambio, solamente considera y rechaza una hipótesis absurda basada en una combinación puramente aleatoria de partes: el escenario del tornado en un vertedero.
Los teoremas de No Free Lunch no tienen aplicabilidad a la evolución biológica.
El argumento del supuesto ajuste fino de las funciones de aptitud termina siendo solo una variación trivial del conocido argumento del ajuste fino cosmológico y terrestre.
Los conceptos idiosincrásicos de Dembski de complejidad e información son engañosos, y su supuesta Ley de Conservación de la Información es defectuosa de forma fatal.
La complejidad especificada (CSI) no es un marcador de diseño inteligente. Si la complejidad especificada se determina según la interpretación de probabilidad uniforme, entonces los procesos naturales son perfectamente capaces de generarla. Si se determina por el método de eliminación del azar, entonces la complejidad especificada no es más que un disfraz del argumento del Dios de las brechas.
Las afirmaciones de Dembski sobre estadística, teoría de la información, algoritmos evolutivos y termodinámica no han pasado por revisión por pares y no han sido aceptadas por expertos en esos campos.

No Free Lunch se caracteriza por un pensamiento confuso, argumentos falaces, errores, equívocos y uso engañoso de jerga técnica. Una vez aclaradas estas cuestiones, se hacen evidentes las siguientes conclusiones:

Mejor es el fin de una cosa que su comienzo...
Eclesiastés 7:8.

9. Conclusión

Se nos dice (por Dembski y el editor) que The Design Inference sí pasó por un proceso de revisión, aunque no están disponibles detalles de ese proceso. Sin embargo, es interesante notar que The Design Inference originalmente constituyó la tesis doctoral de Dembski en filosofía, y que sus supervisores de doctorado eran filósofos, no estadísticos. El editor (Cambridge University Press) cataloga el libro bajo "Philosophy of Science". Uno sospecha que los revisores que consideraron el libro para el editor eran filósofos que quizás no tenían la formación estadística necesaria para ver a través de las matemáticas de Dembski. En cualquier caso, gran parte del material de No Free Lunch, incluyendo la aplicación de los métodos de Dembski a la biología, no apareció en The Design Inference, y por lo tanto no ha recibido ninguna revisión.

El hecho de que Dembski tenga que recurrir a referencias apenas favorables como apoyo indica la falta total de aceptación de su trabajo por parte de los expertos en los campos técnicos relevantes.

Probability, S, P, L. The Design Inference: Eliminating Chance Through Small Probabilities. William A. Dembski. Stud. in Prob., Induction, & Decision Theory. Cambridge Univ Pr, 1998, xvii + 243 pp, $54.95. [ISBN 0-521-62387-1] Not a text but a philosophical tract about when one can infer design behind events of very small probability. Thought provoking, fun to read, full of interesting examples. SN⁵⁵

Keith Devlin es un matemático respetado y ampliamente publicado, pero no es un estadístico. Su artículo era de carácter general en una revista popular, no en una revista académica, y no abordaba los detalles del trabajo de Dembski. En conjunto, el contenido del artículo era bastante más negativo hacia el trabajo de Dembski de lo que sugiere la observación final.⁵⁴ La "reseña positiva" en American Mathematical Monthly dice lo siguiente, en su totalidad:

Matemáticos y estadísticos han sido mucho más receptivos [que filósofos] a mi formulación de inferencias de diseño. Tomemos, por ejemplo, la reseña positiva de The Design Inference en el número de mayo de 1999 de American Mathematical Monthly, así como las observaciones apreciativas del matemático Keith Devlin sobre mi trabajo en su artículo de julio/agosto de 2000 para The Sciences titulado "Snake Eyes in the Garden of Eden": "La teoría de Dembski ha aportado una contribución importante a la comprensión del azar—si no fuera más que por destacar lo difícil que puede ser diferenciar las huellas del diseño de los remolinos de la casualidad."⁵³ [p. 372n2]

Dembski afirma haber proporcionado una base racional para el enfoque fisheriano de las estadísticas y haber descubierto una nueva Ley de Conservación de la Información. Si esas afirmaciones fueran ciertas, serían de profundo alcance para los estadísticos y los teóricos de la información. Incluso uno de sus aliados en el Discovery Institute lo ha aclamado como "el Isaac Newton de la teoría de la información".⁵² Sin embargo, su trabajo sobre estos temas no ha aparecido en ninguna revista de estadística o teoría de la información, y, hasta donde puedo determinar, ningún estadístico o teórico de la información profesional ha aprobado ese trabajo. Si alguno lo hubiera hecho, estoy seguro de que habríamos oído hablar de ello de boca de Dembski, ya que acostumbra a usar referencias informales como sustituto de la revisión por pares:

Últimamente me he vuelto algo indiferente con respecto a enviar cosas a revistas donde muchas veces hay que esperar dos años para que se publiquen las cosas. Y descubro que puedo acelerar realmente la respuesta escribiendo un libro y exponiendo allí las ideas. Mis libros se venden bien. Recibo un derecho de autor. Y el material se lee más.⁵¹

Suele ocurrir que los académicos, especialmente los de campos técnicos, sometan su trabajo a revisión por sus pares, sus colegas académicos con experiencia en los campos relevantes. Esto suele tomar la forma de presentación en revistas especializadas en las que los artículos deben pasar por un proceso de revisión por pares antes de su publicación. A la larga, lo que importa es si una idea es aceptada por los expertos del campo pertinente, pero el proceso de revisión por pares proporciona un primer cribado para eliminar ideas a medias. Los académicos también presentan su trabajo a sus pares en conferencias académicas. Sin embargo, Dembski, al igual que otros defensores del Diseño Inteligente, rehuye estos procesos, prefiriendo vender sus ideas directamente al público y cuidando de evitar la revisión por parte de los expertos. Se le cita diciendo:

Los recipientes vacíos hacen más ruido.
Proverbio tradicional

8. Dembski y revisión por pares

No se sugiere de qué manera podrían "inducirse" los eventos cuánticos deseados.

Sin embargo, por ahora, la teoría cuántica es probablemente el mejor lugar para ubicar el indeterminismo. [p. 336]

Las limitaciones termodinámicas se aplican si estamos tratando con diseñadores encarnados que necesitan emitir energía para transmitir información. Pero los diseñadores no encarnados que cooptan procesos aleatorios y los inducen para que muestren complejidad especificada no están obligados a gastar energía. Para ellos el problema de "mover las partículas" simplemente no surge. De hecho, están totalmente libres de la acusación de sustitución contrafactual, en la que las leyes naturales dictan que las partículas tendrían que moverse en una dirección pero terminaron moviéndose en otra porque un diseñador no encarnado intervino. El indeterminismo significa que un diseñador no encarnado puede afectar sustantivamente la estructura del mundo físico al impartir información sin impartir energía. [p. 341]

Una cosa que Dembski sí está dispuesto a afirmar sobre su diseñador sin encarnar es que probablemente interviene en el mundo mediante la manipulación de eventos cuánticos no deterministas:

Jay Richards, otro defensor del Diseño Inteligente, también apuesta por una retórica vacía: "Si un detective explica una muerte como el resultado de un asesinato por, digamos, Jeffrey Dahmer, nadie dice: 'OK, entonces, ¿quién hizo a Jeffrey Dahmer?'" (p. 355). Dado que sabemos perfectamente bien que Jeffrey Dahmer existió, obviamente no hay motivo alguno para plantearnos esa pregunta. Si, por el contrario, el detective anunciara que la víctima fue asesinada por un androide (un tipo de persona artificial descrita en muchas novelas de ciencia ficción), y si no tuviéramos evidencia independiente de la existencia de androides, sin duda exigiríamos una explicación de cómo pudo surgir un ser así.

Me referí antes a la “complejidad” de una especificación. Es importante notar que este no es el mismo tipo de complejidad que Dembski define en otras partes como una función monótona de la probabilidad (-log₂P). Según Dembski, ahora se refiere a “una medida de complejidad φ que caracteriza la complejidad de patrones en relación con el conocimiento de fondo y las capacidades de S [un sujeto] como cognizador para percibir y generar patrones” (p. 76). La vaguedad de este concepto no mejora con una nota, en la que Dembski ofrece no menos de tres interpretaciones (p. 118n29):

SpecRes es el número de especificaciones potenciales que pudimos haber elegido antes de ser conscientes del resultado. Sin embargo, solo contamos especificaciones potenciales que tengan una probabilidad inferior (o igual) y una “complejidad” menor que la de nuestra especificación elegida (correspondiente a nuestra región de rechazo R), e ignoramos las especificaciones que son subconjuntos de otras especificaciones que estamos contando (p. 77). Me referiré a las especificaciones que cumplen estos criterios como especificaciones relevantes, de modo que SpecRes sea el número de especificaciones relevantes.

Sin embargo, como sugiere la cita anterior, Dembski con frecuencia escribe como si los recursos probabilísticos se incorporaran en P(R|H) (por multiplicación) en vez de en α (por división). Esto no cambia el valor de verdad de la desigualdad P(R|H) < α, por supuesto, pero parece natural pensar en términos de multiplicar P(R|H) por SpecRes como compensación por la disminución excesiva de esta probabilidad que resulta de adaptar de forma estrecha la especificación al resultado observado.

α = ½ ÷ (ReplRes × SpecRes).

El número de recursos probabilísticos es el producto del número de recursos replicacionales (ReplRes) y el número de recursos de especificación (SpecRes). Entonces α se determina dividiendo el número 1/2 por este producto:

Los recursos probabilísticos comprenden las maneras relevantes en que un suceso puede ocurrir (recursos replicacionales) y especificarse (recursos de especificación). Por lo tanto, la pregunta importante no es cuál es la probabilidad del suceso en cuestión, sino cuál se convierte en dicha probabilidad después de tener en cuenta todos los recursos probabilísticos relevantes. [p. 21]

Habiendo elegido una especificación y calculado la probabilidad de que cualquier resultado encaje con esa especificación, el método de Dembski requiere que comparemos esa probabilidad con un límite de probabilidad α, y rechacemos la hipótesis de azar H si P(R|H) < α. Para establecer un valor de α, Dembski introduce el concepto de recursos probabilísticos:

¿Pero importa esto? Además del concepto de especificaciones, Dembski también ha introducido el concepto de recursos de especificación. Aunque no lo declara explícitamente, el propósito de los recursos de especificación es compensar la adaptación de las especificaciones.

A.2 Recursos de especificación

Para resumir esta sección: ahora vemos que el método de Dembski para distinguir entre especificaciones y fabricaciones está lejos de mostrar el “rigor estadístico completo” que él afirmó. Por el contrario, la distinción entre especificaciones y fabricaciones es altamente arbitraria, permitiendo un alto grado de adaptación de la especificación al resultado observado.

Sugiero que, en este ejemplo, no importa qué resultado observemos, el enfoque de Dembski podría utilizarse para justificar una región de rechazo consistente solo en el resultado observado específico.

Supongamos que se lanzan diez dados y se cuenta la suma de los resultados. Será un número del 10 al 60. Quiero sostener que, sea cual sea el número que salga, ese número no solo será improbable que haya salido, sino que además tendrá al menos una propiedad única e interesante, no poseída por ninguno de los otros cincuenta números. Por ejemplo, si es, digamos, 25, entonces ese número sería el único cuadrado perfecto que a su vez es la suma de dos cuadrados (9 & 16) y también es el único número impar que es el cuadrado de su último dígito. El número 27 es el único cubo perfecto de todos ellos. El número 28 es el único que es la suma de todos sus divisores menores que sí mismo (1, 2, 4, 7, 14). El número 30 es el número X más grande tal que todos los números menores que X que no tienen divisor en común con X (excepto 1) son números primos. El número 32 es la menor potencia de 2 tal que el número posterior no es primo (dado que el número posterior a 16 es un primo). El número 36 es el único que es el producto de dos cuadrados (4 & 9) y el único número par que es el cuadrado de su último dígito. El número 11 es el número palindrómico más pequeño y el 55 el más grande. El número 59 es el número primo más grande. Y 60 es ese número que puede descomponerse en más formas que cualquier número menor. Sostengo que cada número del 10 al 60 tiene al menos una propiedad única e interesante, especialmente si se incluyen propiedades no matemáticas (como 26 = el número de letras del alfabeto inglés; 29 = el número de días de febrero en un año bisiesto; 31 = los puntos máximos que se pueden anotar en una mano de cribbage, y así sucesivamente). A la luz de este hecho, no importa qué número salga como suma de los diez dados, podríamos decir: “Qué asombroso: no solo es extremadamente improbable que ese número haya salido, sino que es el único número tal que ...”, y proceder a especificar la o las propiedades interesantes que ese número posee de manera única. Luego podríamos preguntar: “¿Cuál es la explicación de que ese número haya salido en lugar de otro?” La respuesta correcta es que fue solo una coincidencia (o un hecho bruto) que ese número haya salido, y cualquier número que hubiera salido habría sido improbable que lo hiciera y, además, habría habido alguna propiedad o propiedades interesantes poseídas solo por ese número.⁵⁸

Presumo que el hecho de que Dembski no note problemas como estos se debe a que todos sus ejemplos son extremadamente simples. En cuanto se observan ejemplos más complicados, las fallas del método se vuelven mucho más evidentes. Aquí hay un ejemplo particularmente problemático, procedente de otra fuente:

Supongamos que el juez en el juicio Caputo era un defensor del método de Dembski. En lugar de adoptar la especificación “40 o más Ds”, podría haber adoptado la especificación más estrecha “22 Ds, luego una R, luego 18 Ds más” (basada en el único resultado observado E), justificando esta elección con el siguiente argumento: “Mientras yo estaba en el equipo de fútbol de mi escuela, perdimos los primeros 22 partidos que jugamos, ganamos 1 y luego perdimos los 18 restantes. Así que 22-1-18 es un patrón preexistente, y lo selecciono como mi conocimiento de fondo K. A partir de esto, obtengo la función de rechazo 1_E, y por tanto la especificación ‘22 Ds, luego una R, luego 18 Ds más’.”

Podría argumentarse que el récord de fútbol del juez es irrelevante para el caso Caputo. Pero actualmente no se incluye ningún criterio de relevancia de ese tipo en el método de Dembski, y, si el conocimiento de fondo se excluyera por motivos de relevancia, sería un criterio altamente subjetivo. Si observamos un patrón sospechosamente regular sin conocer su causa y queremos probar si surgió de una distribución de probabilidad determinada, ¿cómo podemos decidir si cualquier pieza concreta de conocimiento de fondo es relevante para ello?
Ahora supongamos que el juez no hubiera visto nunca antes una secuencia así. Aun así podría defender la especificación “22 Ds, luego una R, luego 18 Ds más” con los siguientes motivos: “No había visto antes la secuencia 22-1-18, pero sí había visto por separado los números 22, 1 y 18. Así que los seleccioné para formar parte de mi conocimiento de fondo K, y luego derivé de ellos la función de rechazo”. Dado que Dembski no nos dice cómo derivar una función de rechazo de un conjunto de conocimiento de fondo, no tiene bases para declarar ilegítima esta derivación.

Los dos problemas descritos se combinan para permitir un alto grado de adaptación de la función de rechazo (y por ende de la especificación). Para ver el tipo de extremos a los que puede llegar dicha adaptación, considérese los siguientes ejemplos.

En primer lugar, tenemos una libertad enorme en nuestra elección de K. Dembski impone lo que él llama un criterio de independencia condicional, cuyo efecto es evitar que incluyamos cualquier información que nos diga directamente algo sobre el resultado. Sin embargo, no nos impide incluir información cuya elección nos diga algo sobre el resultado. Esto significa que, cuando elegimos K después de observar el resultado, nuestra elección de especificación no será estadísticamente independiente del resultado, y esto de hecho ocurre en los propios ejemplos de Dembski.

Considere el ejemplo anterior. Dembski afirma que K es condicionalmente independiente (esto es, estadísticamente independiente dada la hipótesis de chance en cuestión) del resultado porque nuestro conocimiento de la aritmética binaria y los ordenamientos lexicográficos no nos dice nada sobre si la secuencia E ha ocurrido. Quizá sí. Pero nuestra decisión de seleccionar “nuestro conocimiento de la aritmética binaria y los ordenamientos lexicográficos” como información de fondo dependió mucho del resultado. Si, por ejemplo, hubiéramos observado una secuencia de números primos en los lanzamientos de la moneda, habríamos seleccionado “nuestro conocimiento de números primos y ordenamientos lexicográficos” como conocimiento de fondo. Por lo tanto, la función de rechazo derivada de ese conocimiento de fondo no es estadísticamente independiente del resultado, y tampoco lo es la especificación resultante.

En realidad, Dembski no afirma que sus especificaciones sean estadísticamente independientes del resultado, solo que son independientes “en un cierto sentido bien definido” (p. 15). Pero este es un sentido peculiar, que es muy distinto tanto de nuestro sentido cotidiano de la palabra como del sentido técnico usado por los estadísticos. Tampoco está bien definido, como veremos a continuación.
En segundo lugar, Dembski no nos dice cómo obtener la función de rechazo a partir del conocimiento de fondo elegido. Nos dice que debemos seleccionar conocimiento de fondo “que identifique explícita y unívocamente la función de rechazo f” (p. 72), pero esto claramente no ocurre en los dos ejemplos que nos ofrece.

Considere de nuevo el ejemplo anterior. El conocimiento de fondo seleccionado (“nuestro conocimiento de la aritmética binaria y los ordenamientos lexicográficos”) claramente no identifica unívocamente la función de rechazo 1_D, que se basa en la secuencia de Champernowne (D). Hay muchos otros patrones que involucran aritmética binaria y ordenamientos lexicográficos sobre los que podríamos haber basado nuestra función de rechazo, por ejemplo, una simple secuencia de números binarios consecutivos:

0|1|10|11|100|101|110|111|1000|1001|1010|1011|1100|1101|1110|1111|...

El fracaso de Dembski al seguir su propia regla es indicativo de un problema más general. El concepto de “derivar” una función de rechazo o un patrón a partir de nuestro conocimiento de la aritmética binaria y los ordenamientos lexicográficos (o cualquier otro conjunto de conocimiento) no está bien definido. Esa vaguedad nos deja con mayor libertad para adaptar la función de rechazo al resultado observado.

En caso de que Dembski responda que podría haber seleccionado “nuestro conocimiento de la secuencia de Champernowne” como su conocimiento de fondo en lugar de “nuestro conocimiento de la aritmética binaria y los ordenamientos lexicográficos”, permítanme señalar que esto tampoco identificaría unívocamente una función de rechazo. Podemos inventar cualquier número de variantes de la secuencia de Champernowne. Si hubiéramos observado una secuencia de Champernowne precedida por 5 dígitos superfluos, Dembski podría haber elegido la función de rechazo que cuenta el número de dígitos que preceden a la secuencia de Champernowne (o 100 si no hay una secuencia de Champernowne). Esto conduciría a la especificación “secuencia de Champernowne precedida por 5 o menos dígitos superfluos”. Si hubiéramos observado una variante de la secuencia de Champernowne que excluye todos los números binarios con un número par de dígitos, Dembski podría haber elegido alguna otra función de rechazo adaptada a esta variante particular. Y así sucesivamente.

Así que hay tres pasos para llegar a una especificación: seleccionar conocimiento de fondo; pasar del conocimiento de fondo a la función de rechazo; pasar de la función de rechazo a la especificación. El último de estos no está completamente libre de problemas, pero no lo consideraré aquí. Solo consideraré los problemas de los dos primeros pasos.

El primer paso para elegir una especificación es seleccionar lo que Dembski llama conocimiento de fondo (K). Esto es, en términos generales, cualquier subconjunto de todo el conocimiento que teníamos disponible antes de observar el suceso en cuestión. En este caso, Dembski selecciona “nuestro conocimiento de la aritmética binaria y los ordenamientos lexicográficos”. A partir de esto obtiene una función de rechazo, en este caso la función indicadora 1_D, que asigna al resultado D el valor 1 y a todos los demás resultados el valor 0. Finalmente, a partir de esta función de rechazo, Dembski obtiene la especificación formada por el único resultado E.

Esta secuencia se conoce como la secuencia de Champernowne (p. 64), y se la denominará D.

D: 0|1|00|01|10|11|000|001|010|011|100|101|110|111|0000|0001|0010|0011|...

Al convertirla a dígitos binarios, la secuencia pasa a consistir en todos los números binarios de 1 dígito en orden ascendente, seguidos por los números binarios de 2 dígitos, y así sucesivamente:

E: THTTTHHTHHTTTTTHTHTTHHHTTHTHHHTHHHTTTTTTTHTTHTTTHH...

Para ilustrar el papel de la función de rechazo en la determinación de la especificación, consideraré otro de los ejemplos de Dembski. Se genera una secuencia de 100 caras y cruces, supuestamente al lanzar una moneda justa 100 veces, y en la secuencia se observa un patrón particular (pp. 15-18). Los primeros 50 resultados de la secuencia (denominados E) son los siguientes:

Comencemos señalando que Dembski usa el término función de rechazo en lugar de estadístico de prueba. De hecho, lo utiliza de forma ambigua para referirse tanto al propio estadístico de prueba como a su función de densidad de probabilidad (o su función de probabilidad en el caso de una variable aleatoria discreta) (pp. 50, 62). Yo utilizaré el término en el sentido anterior, es decir, como sinónimo de estadístico de prueba.

Luego, Dembski argumenta que recursos probabilísticos ilimitados permitirían posibilidades absurdas como que Arthur Rubinstein fuera un pianista mundialmente famoso y que no supiera absolutamente nada de música, que su música fuera nada más que un golpe de azar increíblemente fortuito sobre el teclado del piano. En realidad, no todas las hipótesis de múltiples universos involucran recursos ilimitados, pero asumamos para efectos del argumento que así fuera. Dembski mismo da la razón de por qué tales posibilidades absurdas no necesitan preocuparnos:

Su primer argumento es que no hay "evidencia independiente" de universos múltiples (pp. 90-92). Independientemente de si esto es cierto—y dejo esa cuestión a los físicos—, no respalda el caso de Dembski. Al adoptar un método de inferencia puramente eliminativo, ha aceptado la carga de rechazar todas las hipótesis naturales que podamos imaginar. El problema aquí no es si se ha mostrado que las hipótesis naturales sean verdaderas, sino si Dembski puede mostrar que sean falsas. Ahora está intentando trasladar la carga de la evidencia que voluntariamente se impuso.

Algunos físicos han propuesto que el universo que observamos es solo uno dentro de un conjunto de muchos universos. Como señala Dembski, existen varias propuestas de este tipo, incluyendo la propuesta de que el universo observable es solo una región dentro de un universo inflado enormemente mayor, la interpretación de muchos mundos de la mecánica cuántica y otras. Para brevedad, me referiré a todas esas propuestas como "universos múltiples". Dembski considera la posible relevancia de los universos múltiples para la estimación de recursos probabilísticos, pero descarta la idea de que sean relevantes como "la falacia inflacionaria" (pp. 86-87). Emplea dos argumentos, ninguno de los cuales resiste el escrutinio.

A.5 La falacia de la "falacia inflacionaria"

De hecho, todos los métodos de inferencia estadística involucran elementos subjetivos. Los enfoques bayesiano y de verosimilitud lo hacen explícito. Por supuesto, es ventajoso dejar claro la existencia de esos elementos subjetivos, y Dembski lo hace en esta instancia pero con mayor frecuencia no lo hace, como hemos visto. En cualquier caso, la idea de que la existencia de un elemento subjetivo indica que su método subjetivo particular es una reconstrucción racional de cómo pensamos habitualmente es absurda en extremo.

Los factores subjetivos a menudo influyen en la determinación de recursos probabilísticos, y el argumento de eliminación del azar genérico refleja fielmente este hecho (confirmación adicional de que este esquema de argumento proporciona una reconstrucción racional coherente de cómo eliminamos el azar). [p. 83]

Por cierto, no pude evitar reírme ante la afirmación de Dembski de que la subjetividad de su método sirve como confirmación de su solidez:

Ciertamente, para muchas pruebas, 10^-150 puede considerarse un límite muy conservador. Pero no puede considerarse un límite universal, y el juicio de si es un límite adecuado en un caso dado seguirá siendo subjetivo.

Dembski parece pensar que la única manera en que el "sujeto" (el usuario de su método) podría adaptar la especificación al resultado observado es recorriendo todas las especificaciones concebibles hasta llegar a una que se ajuste estrechamente al resultado. Pero esta es una concepción muy peculiar de cómo funciona la mente. Las personas no identifican patrones recorriendo todos los patrones que pueden imaginar y preguntándose si el patrón observado los coincide. Esta idea simplista de los procesos de pensamiento humano parece particularmente extraña viniendo de Dembski, dada su visión no mecanicista de la inteligencia (véase sección 2). Dada la verdadera capacidad de las personas para detectar patrones mediante métodos heurísticos rápidos (aún poco entendidos), es irrelevante cuántas especificaciones individuales puede elaborar una mente humana, y el intento de Dembski de fijar un límite superior universal para SpecRes está condenado al fracaso.

Al tener en cuenta todos los recursos probabilísticos relevantes, la especificación impide efectivamente la adaptación sin límites de los eventos a las regiones de rechazo—cada intento de especificar un evento incurre en un costo probabilístico que debe compensarse con un recurso probabilístico que contemple ese intento. [p. 76]

Sin embargo, eso aún deja el problema de un sujeto que identifica numerosos elementos distintos de conocimiento previo, cada uno de los cuales es condicionalmente independiente de E dado H. Supongamos que cada uno de esos elementos de conocimiento previo induce una función de rechazo que a su vez induce un par de regiones de rechazo. Entonces cada una de esas regiones de rechazo es potencialmente capaz de eliminar H. Por lo tanto, identificando suficientes elementos de ese tipo de conocimiento previo, un sujeto puede, en principio, recorrer una región de rechazo tras otra hasta llegar a una que elimine la hipótesis de azar H. La preocupación, entonces, es que el argumento de eliminación del azar genérico podría eliminar cualquier hipótesis de azar imaginable. [p. 74]

La cuenta formal de Dembski de los recursos especificacionales (p. 77) se basa en el número de especificaciones potenciales que cumplen ciertos criterios. No hay mención de ninguna restricción física para enumerar especificaciones. Tampoco hay mención de tal restricción en el ejemplo de Caputo. Pero, para establecer un límite superior universal para SpecRes, Dembski anuncia que solo deberíamos contar el número físico de oportunidades para formular una especificación. La mención más cercana que Dembski hace para proporcionar una justificación de esta restricción parece estar en los siguientes pasajes:

Esta es una estimación del número máximo de transiciones de partículas elementales que podrían ocurrir durante la vida del Universo observable. Creo que hay motivos para cuestionar si esto representa realmente el número máximo posible de eventos que podrían ocurrir, dado que el mismo evento elemental puede incluirse en más de un evento compuesto. Sin embargo, no profundizaré en este punto y aceptaré que este es el número máximo posible de recursos replicacionales en el universo observable. Sin embargo, queda mucho menos claro por qué esta cifra debería tomarse como el número máximo posible de recursos especificacionales, y menos aún como el número máximo posible de recursos probabilísticos combinados (ReplRes × SpecRes).

10⁸⁰ × 10⁴⁵ × 10²⁵ = 10¹⁵⁰

Como vimos antes, el límite universal de probabilidad asume que el número máximo posible de recursos probabilísticos viene dado por:

Tal límite de probabilidad universal tiene en cuenta todos los recursos especificacionales que podrían encontrarse en el universo físico conocido (de modo interesante, al agotar los recursos especificacionales del universo, también agotamos todos los recursos replicacionales que podrían surgir). [p. 83]

Dembski reconoce que hay un grado de subjetividad involucrado en su método para establecer límites de probabilidad locales (al menos en lo que respecta a SpecRes), pero afirma que su límite universal de probabilidad evita este problema:

A.4 El límite universal de probabilidad

De sus estimaciones de SpecRes = 100 y ReplRes = 125 millones, Dembski llega a una cifra de 1 en 25 mil millones para α, en comparación con una cifra de 1 en 50 mil millones para P(R|H). Concluye que, dado que P(R|H) < α, "La Corte Suprema de Nueva Jersey está justificada en inferir que E no ocurrió de acuerdo con la hipótesis de azar H" (p. 82). Con la desigualdad decidida solo por un factor de 2, esta conclusión debe considerarse altamente sospechosa, dado los problemas descritos.

En un punto de detalle, observo que Dembski contó el número de elecciones individuales. Pero el evento observado en el caso Caputo involucró 41 elecciones supervisadas por el mismo encargado. El número de veces que un único encargado saca el orden de papeletas para un total de 41 elecciones de condado de EE. UU. debe ser muchas veces menor que el número total de esas elecciones.

Aunque Dembski ha sido generoso al estimar los valores de sus parámetros (excepto, se espera, la esperanza de vida de la democracia de los EE. UU.), la elección de parámetros es arbitraria. En realidad, solo hubo una oportunidad para que ocurriera el evento observado específico. Por supuesto, hubo muchas oportunidades para eventos similares de ocurrir, pero ¿cómo decidimos cuán similar debe ser un evento para calificar para su inclusión en ReplRes? ¿Por qué, por ejemplo, deberíamos incluir elecciones de condado pero no elecciones de juntas escolares? ¿Por qué elecciones en EE. UU. pero no elecciones en otros países? ¿Por qué no otros eventos que involucraran 41 pruebas con solo dos resultados posibles, como lanzar 41 monedas? El método de Dembski nos obliga a trazar una línea arbitraria entre eventos que consideramos suficientemente similares al observado (como elecciones en otros estados) y aquellos que consideramos insuficientemente similares (como elecciones en otros países).

La corte es generosa al distribuir recursos probabilísticos. La corte imagina que cada estado de los Estados Unidos tiene c = 500 condados (una exageración), que cada condado tiene e = 5 elecciones al año (otra exageración), que había s = 100 estados (imaginamos un imperialismo estadounidense desenfrenado duplicando el número de estados de la unión), y que la forma actual de gobierno perdura y = 500 años (más del doble del total actual). El producto de c por e por s por y es igual a 125 millones y significa un límite superior en el número total de elecciones que razonablemente se podría esperar que ocurrieran a lo largo de la historia de los EE. UU. Éstos constituyen los recursos replicacionales pertinentes, que denotamos por ReplRes, para tener en cuenta que Caputo diera a los demócratas la primera papeleta 40 de 41 veces. [p. 81]

Los recursos replicacionales son conceptualmente mucho más simples que los recursos especificacionales, pero también sufren el problema de la arbitrariedad. Dembski los define como "el número de oportunidades para que ocurra un cierto evento" (p. 19). Para el caso Caputo, proporciona el siguiente cálculo de ReplRes:

A.3 Recursos replicacionales

Si bien un mecanismo de compensación así es claramente bienvenido, Dembski no hace ningún intento por racionalizar sus criterios particulares para calcular SpecRes. Mi propia interpretación es que está intentando contar todos los patrones posibles que son, en cierto sentido, tan excepcionales como el patrón señalado en el resultado observado. Multiplicar P(R|H) por SpecRes puede interpretarse entonces como un intento de estimar la probabilidad de una región de rechazo mayor que incluye todos los resultados tan excepcionales como el observado. Sin embargo, dado el número de estimaciones altamente subjetivas que deben hacerse y la falta de un fundamento racional, no está claro que este enfoque ofrezca alguna ventaja sobre simplemente formular una sola pregunta: "¿Qué proporción de resultados potenciales consideraríamos como excepcionales o más excepcionales que el observado?"

Al tener en cuenta todos los recursos probabilísticos relevantes, la especificación impide efectivamente la adaptación sin límites de los eventos a las regiones de rechazo—cada intento de especificar un evento incurre en un costo probabilístico que debe compensarse con un recurso probabilístico que contemple ese intento. [p. 76]

Dembski parece sugerir que, cuanto más estrecha sea la especificación que elegimos para calcular P(R|H), menos especificaciones relevantes habrá, y por tanto más pequeño será SpecRes. Esto apoya la idea de que SpecRes compensa por la adaptación de la especificación:

Sugiere que podría haber especificaciones relevantes adicionales, pero piensa que el número no excederá de un solo dígito, y toma el número total como 100 "por si las moscas". No se intenta calcular la complejidad computacional de ninguna especificación. Se asume simplemente que la complejidad computacional de las especificaciones puede compararse sobre alguna base intuitiva. La primera de las especificaciones anteriores es la que elegimos para calcular P(R|H), y dado que la segunda exhibe una simetría evidente con la primera, podría ser razonable tomarla como que tiene la misma complejidad computacional, aunque nuestro conocimiento previo relacionado con los demócratas sea distinto de nuestro conocimiento previo relacionado con los republicanos, y uno se pregunte si eso debería tener algún efecto. Dado que se esperaría que Caputo favoreciera a su propio partido, un resultado que coincida con la primera especificación parecería más sospechoso que uno que coincida con la segunda. Cómo se compara la complejidad computacional de la tercera especificación con la de las otras dos es un misterio. Finalmente, nos queda adivinar cuántas especificaciones relevantes más, desconocidas, podría haber. Si 100 es una sobreestimación conservadora es imposible de juzgar, dada la vaguedad del criterio con el que se comparan las especificaciones.

Todas las secuencias de longitud 41 con 40 o más Ds.
Todas las secuencias de longitud 41 con 40 o más Rs.
Todas las secuencias de longitud 41 que consistan en alternancia de Ds y Rs.

En el caso Caputo, Dembski enumera las siguientes especificaciones potenciales, después de eliminar subconjuntos (p. 81):

En The Design Inference Dembski se refirió a esta medida como la complejidad computacional o el grado de dificultad asociado con el problema de formular una especificación. Pero dado que nunca nos ha dicho cómo se formulan las especificaciones (es decir, cómo se derivan funciones de rechazo del conocimiento previo), esta medida no está bien definida. La afirmación de Dembski de que "Tal medida se da objetivamente (relativa a S)" (p. 76) es un puro deseo. Me referiré a esta medida como complejidad computacional.

"Complejidad computacional". Esto es una medida de la cantidad de recursos computacionales (como tiempo de computador y memoria) necesarios para resolver un problema (p. 140).
"El grado de compresibilidad de una especificación según se mida dentro de la teoría de la información algorítmica". Esto es la complejidad de Kolmogorov (Dembski claramente se refiere a la in-compresibilidad),⁴¹ y es un atributo de un objeto, como una secuencia de caracteres, no un atributo de un problema, por lo que no es conmensurable con la complejidad computacional.
"La disposición de un sujeto de producir una especificación dada". No se da idea de cómo podría medirse tal concepto subjetivo.

Al afirmar que "el Paso #8 ahora se sigue de inmediato", implica que deberíamos inferir complejidad especificada, y presumiblemente que sigue una inferencia de diseño. Pero, como este es el único ejemplo completo de Dembski de una inferencia de diseño (aparte del caso altamente cuestionable del flagelo bacteriano), se habría esperado una declaración clara del resultado.

Paso #8 [del argumento genérico de eliminación por azar] ahora se sigue de inmediato: El Tribunal Supremo de Nueva Jersey está autorizado a inferir que E no ocurrió de acuerdo con la hipótesis de chance H. [p. 82]

10. Dembski es bastante vago sobre qué inferencia debería extraerse en el caso de Caputo. Considera solo una hipótesis de azar, a saber, la hipótesis de sorteo justo H. Tras rechazar esta hipótesis, Dembski no afirma claramente que debamos inferir diseño, limitándose a escribir:

9. El término límite de probabilidad local aparece en el trabajo anterior de Dembski y no en No Free Lunch, pero me resulta conveniente usarlo aquí.

8. William Dembski, "The Explanatory Filter: A three-part filter for understanding how to separate and identify cause from intelligent design", 1996, http://www.arn.org/docs/dembski/wd_explfilter.htm.

7. Un outcome es un evento que no puede subdividirse. También se conoce como un evento elemental. Por ejemplo, en el caso de Caputo, cada secuencia posible de 41 Ds y Rs se considera un resultado diferente. El conjunto de todos esos resultados se conoce como el espacio de resultados o espacio muestral. (Dembski usa el término espacio de fase.) Eventos como "40 o más Ds" y "el 5º as es D" se conocen como eventos compuestos, porque consisten en más de un resultado.

6. Mi propia opinión es que el naturalismo metodológico es una restricción mal definida y arbitraria que debería abandonarse. El principio de que "las afirmaciones extraordinarias requieren evidencia extraordinaria" es suficiente para evitar apelaciones prematuras a seres no encarnados, pero no hay motivo para excluir a esos seres de la ciencia para siempre independientemente de la evidencia que pudiera surgir.

5. William Dembski, "Intelligent Design Coming Clean", Metaviews online forum, November 2000, http://www.discovery.org/viewDB/index.php3?program=CRSC%20Responses&command=view&id=534.

4. William Dembski, "The Design Inference: Eliminating Chance Through Small Probabilities", Cambridge University Press, 1998.

3. Richard Wein, "What's Wrong With The Design Inference", Metaviews online forum, October 2000, http://www.metanexus.org/archives/message_fs.asp?ARCHIVEID=2654.

2. No intento trazar una línea dura de demarcación entre ciencia y pseudociencia. Por pseudociencia entiendo una ciencia francamente mala. Véase también: "pseudoscience", The Skeptic's Dictionary, http://skepdic.com/pseudosc.html.

1. William Dembski, No Free Lunch: Why Specified Complexity Cannot be Purchased without Intelligence, Rowman & Littlefield, 2002.

Notas

La afirmación de Dembski de haber proporcionado una base racional para el método de Fisher de contraste de hipótesis es totalmente falsa, y su propia versión del método sufre en gran medida de los mismos problemas de arbitrariedad que el de Fisher. ¿Pero ofrece el método de Dembski alguna ventaja frente al de Fisher? Podría argumentarse que, al intentar contar el número de recursos probabilísticos, por muy subjetivos que sean, Dembski al menos ha descompuesto un juicio subjetivo (respecto al tamaño del límite de probabilidad) en un número de juicios más pequeños y manejables. Tal vez. Pero cualquier ventaja menor debe verse compensada por el hecho de que Dembski ha permitido al usuario del método una libertad mucho mayor para adaptar la región de rechazo al resultado observado, y frente a la confusión causada por la exposición enrevesada y equívoca de lo que en realidad es más bien una idea trivial.

A.7 Conclusión del anexo

Considere un experimento mental en el que un ensayo del tipo descrito arriba es la única vez que se lanzan monedas en toda la existencia de la raza humana.
Imagine el primer ensayo de algún proceso tecnológico radicalmente nuevo, que por desgracia resulta en la destrucción del mundo. Los únicos supervivientes son los habitantes de una pequeña colonia lunar, que no disponen de la tecnología para repetir el ensayo y no sobrevivirán el tiempo suficiente para obtenerla. Resulta que uno de los colonos tenía interés en la nueva tecnología, y antes del ensayo especificó el ensayo como una prueba de su hipótesis de que la probabilidad de destrucción global no superaba 1/3. Tras la destrucción, ¿debería rechazar esta hipótesis?
Considere el argumento del ajuste fino cosmológico, que intenta inferir diseño desde la alegada probabilidad minúscula de obtener un universo apto para la vida mediante generación aleatoria de las constantes cosmológicas. Si aceptáramos la conclusión de Dembski, entonces los defensores de este argumento solo necesitarían mostrar que la probabilidad de un universo apto para la vida era inferior a 1/2, en lugar de la probabilidad mucho menor que realmente se afirma. El número de recursos de replicación en este caso es solo 1, ya que el argumento se basa en la suposición de que hay un solo universo. El número de recursos de especificación también es 1, dado el enunciado "universo apto para la vida", puesto que no podríamos haber observado ningún otro resultado. Dudo que el argumento del ajuste fino cosmológico gozara de su popularidad actual (o incluso de cualquier popularidad) si se hubiera demostrado que la probabilidad de un universo apto para la vida fuera 1/3.

Un ejemplo similar aparece en The Design Inference (pp. 196-197), donde Dembski insiste en que el sujeto debe contar como recursos de replicación todos los lanzamientos de moneda que ha realizado a lo largo de su vida. En efecto, a diferencia de mi ejemplo, el sujeto de Dembski no estipuló de antemano que el ensayo se consideraría una prueba de la imparcialidad de la moneda ni que habría solo un ensayo, de modo que los ejemplos no son equivalentes. En cualquier caso, podríamos imaginar, para el bien del argumento, que en mi ejemplo soy reemplazado por una persona que nunca ha lanzado una moneda antes y jura no volver a hacerlo jamás. No obstante, aunque no puedo ver ninguna base para que lo hiciera, sospecho que Dembski intentará eludir la fuerza de este contraejemplo alegando que debemos contar todos los lanzamientos de moneda realizados (o que probablemente se realizarán) a lo largo del curso de la existencia humana. En caso de que hiciera eso, ofrezco los siguientes ejemplos adicionales:

Considere este ejemplo: lanzo una moneda dos veces como prueba de su imparcialidad, especificando de antemano que rechazaré la hipótesis de imparcialidad (que cada lanzamiento tiene probabilidad 1/2 de resultar en cara) si obtengo dos caras. Para asegurar que habrá solo un intento de esa moneda, se selecciona una moneda recién emitida y la moneda se destruye tras el ensayo. Como solo puede haber un ensayo, el número de recursos de replicación es 1. Como he indicado la especificación de antemano, solo hay una especificación posible y por tanto el número de recursos de especificación es 1. Por lo tanto, la probabilidad saturada del evento es 1/4. Si luego obtengo dos caras, aparentemente debería inferir que la moneda era injusta. Pero dudo que cualquier lector de este artículo haría esa inferencia.

Dado que Dembski está haciendo una afirmación tan ambiciosa, la carga de la prueba recae sobre él para sostenerla con un argumento sólido, y ha fracasado de manera tajante al hacerlo. No obstante, aunque no sea necesario, aportaré algunos contraejemplos.

En realidad, la conclusión de Dembski es un non sequitur. No da ninguna razón coherente de por qué deberíamos considerar que la ocurrencia de un evento inesperado sea una "inconsistencia". Los eventos inesperados ocurren con frecuencia, y no necesariamente nos llevan a revisar las creencias que los hacían inesperados.

Uno podría pensar que, si un argumento tan simple pudiera aportar una base racional al enfoque de Fisher, ¡dudo de que hubiera pasado desapercibido para toda la comunidad de estadísticos durante tanto tiempo!

El argumento se desarrolla con mayor extensión en The Design Inference (pp. 193-198), pero no significa más que esto: si la probabilidad saturada (es decir, la probabilidad después de contabilizar todos los recursos probabilísticos) del evento es inferior a 1/2, deberíamos esperar que el evento no haya ocurrido; pero ocurrió; esto es una "inconsistencia probabilística"; para resolver la inconsistencia, deberíamos rechazar la hipótesis de azar que confirió esa probabilidad al evento.

El razonamiento aquí es que, puesto que al contabilizar todos los recursos probabilísticos relevantes nos queda un evento con probabilidad inferior a 1/2, el evento es menos probable que su negación, y en consecuencia deberíamos favorecer el evento opuesto, que es más probable que su negación y lo excluye.

Dembski cree que ha logrado lo que todos los demás estadísticos han fracasado en hacer: colocar el enfoque de Fisher sobre una base racional firme. Resume su argumento en No Free Lunch como sigue:

Las exposiciones de las pruebas de significación fisherianas típicamente vacilan sobre la naturaleza de las conclusiones que tales pruebas autorizan a extraer. Por ejemplo, Cramér dijo que cuando una hipótesis ha sido rechazada mediante tal procedimiento, "consideramos que la hipótesis está refutada" (1946, p. 334). Sin embargo, rápidamente señaló que "[e]sto, por supuesto, no equivale en modo alguno a una refutación lógica". Sin embargo, Cramér sostuvo que, aunque una teoría rechazada podría de hecho ser verdadera, cuando el nivel de significación es suficientemente pequeño, "nos sentimos" prácticamente justificados en descartar esta posibilidad (cursivas originales alteradas). Sin duda esos sentimientos surgen con frecuencia (aunque, como veremos en el capítulo 9, sección c.3, hay excepciones a la regla); pero Cramér no aportó fundamentos para pensar que esos sentimientos, cuando ocurrían, fueran generados por el tipo de razonamiento empleado en las pruebas de significación, ni pudo colocarlos en ninguna base sistemática o racional.⁶¹

La fuerza de una prueba de significación, afirmó Fisher, "es lógicamente la de la disyunción simple: o ha ocurrido una chance excepcionalmente rara, o la teoría de distribución aleatoria [es decir, la hipótesis nula] no es verdadera" (Fisher, 1956, p. 39). Pero al evitar así una interpretación inadecuadamente fuerte, Fisher se inclinó por una de débil utilidad, pues los resultados significativos o críticos en una prueba de significación son, por definición, improbables en relación con la hipótesis nula. Por tanto, inevitablemente, la ocurrencia de un resultado significativo es o bien un "golpe de chance" (un evento improbable) o la hipótesis nula es falsa, o ambas cosas. Y la afirmación de Fisher no constituye nada más que esta verdad necesaria. Sin duda no permite inferir la verdad o falsedad de ninguna hipótesis estadística a partir de un resultado particular. (Hacking, 1965, p. 81, hizo el mismo punto).

Howson y Urbach comentan lo siguiente sobre la falta de una base racional para el enfoque de Fisher (este pasaje también es citado por Dembski en The Design Inference):

A.6 ¿Una base racional?

Debe subrayarse que mi refutación del intento de Dembski de aplicar su inferencia de diseño a la biología no se apoya en la existencia de múltiples universos. Dembski ha fracasado en establecer una probabilidad pequeña para la evolución de estructuras biológicas incluso en relación con su propio límite universal de probabilidad de 10^-150.

En efecto, si existen múltiples universos, el límite universal de probabilidad de Dembski de 10^-150 se convierte meramente en un local de probabilidad dentro del contexto del conjunto de universos. Para la inmensa mayoría de los fines, como decidir si Arthur Rubinstein podría haber tocado tan bien por puro azar, solo necesitamos considerar este límite local de probabilidad, de modo que la existencia de múltiples universos no cambia nada. Sin embargo, al considerar el caso muy especial del origen de la vida inteligente, debemos tener en cuenta los recursos probabilísticos del conjunto completo de universos. Esto se debe al fenómeno bien conocido del efecto de selección observacional.⁵⁹ Incluso si la vida inteligente ocurre solo en una proporción infinitesimal de un vasto conjunto de universos, no deberíamos considerarnos afortunados por encontrarnos en uno de esos universos raros, puesto que no podríamos encontrarnos en ninguno otro. El mismo efecto de selección se aplica igualmente a cualquier prerrequisito para la vida inteligente, como el propio origen de la vida. El propio Dembski describe y acepta la relevancia de este efecto de selección con respecto al número de planetas en los que la vida pudo haberse originado potencialmente,⁶⁰ y exactamente el mismo argumento se aplica con respecto al número de universos en los que la vida pudo haberse originado potencialmente.

Habiendo hecho por una vez un argumento sólido, pero uno que contradice su propia postura, Dembski pasa luego las dos páginas siguientes dando vueltas al asunto, intentando deshacer su buen trabajo, pero sin lograr producir nada de sustancia.

Dadas los recursos probabilísticos ilimitados, solo existe una manera de refutar este escepticismo antiinductivo, y es admitir que, aunque unos recursos probabilísticos ilimitados permitan posibilidades tan extrañas como esta, esas posibilidades siguen siendo altamente improbables en el pequeño fragmento de realidad que habitamos. Los recursos probabilísticos ilimitados hacen inevitables las posibilidades extrañas a gran escala. El problema es cómo mitigar la locura que ellas implican, y la única forma de hacerlo una vez que se conceden dichas posibilidades extrañas es hacerlas improbables a escala local. Así, en el caso de Arthur Rubinstein, hay mundos en los que alguien llamado Arthur Rubinstein es un pianista de fama mundial y no sabe nada de música. Pero es muchísimo más probable que, en los mundos en que alguien llamado Arthur Rubinstein es un pianista de fama mundial, esa persona sea un músico consumado. Además, la inducción nos dice que el nuestro es un mundo así. [p. 93]

31. Dembski establece una función de aptitud de orden superior F en el espacio de fases Ω × J, donde Ω es el espacio de fases original y J es el conjunto de todas las funciones de aptitud posibles en Ω. Luego considera una búsqueda sobre este espacio, es decir, una secuencia de pares ordenados (x_i, f_i), donde x_i está en Ω y f_i está en J, con F_i = f_i(x_i). La F de Dembski es equivalente a la función de aptitud dependiente del tiempo T considerada por Wolpert y Macready.²⁸ En el teorema 2 de la ATP de Wolpert y Macready, T es independiente del algoritmo, por lo que no puede tener en cuenta la coevolución. Con coevolución, f_i depende del estado actual de la población.

30. Thomas Jansen, "On Classifications of Fitness Functions", 1999, http://eldorado.uni-dortmund.de:8080/FB4/sfb531/1999/reiheCI76. Ver también:
- Stefan Droste, Thomas Jansen y Ingo Wegener, "Perhaps Not a Free Lunch But At Least a Free Appetizer", Proceedings of the 1st Genetic and Evolutionary Computation Conference (July 13-17, 1999, Orlando, FL), pages 833-839, http://citeseer.nj.nec.com/droste98perhaps.html.
- Oliver Sharpe, "Beyond NFL: A Few Tentative Steps", Genetic Programming 1998: Proceedings of the Third Annual Conference (July 22-25, 1998, University of Wisconsin), http://citeseer.nj.nec.com/296977.html.
- Christian Igel y Marc Toussaint, "On Classes of Functions for which No Free Lunch Results Hold", 2001, enviado a IEEE Transactions on Evolutionary Computation, http://www.neuroinformatik.ruhr-uni-bochum.de/PEOPLE/mt/work/2001nfl/.

29. En términos de un programa informático, podemos pensar que la función de aptitud se actualiza por otro módulo, separado del algoritmo de optimización. Debido a la restricción de caja negra, este módulo adicional, que representa factores externos, no está autorizado para comunicarse con el módulo del algoritmo de ninguna otra manera si queremos que el NBA sea aplicable.

28. David Wolpert y William Macready, "No Free Lunch Theorems for Optimization", IEEE Transactions on Evolutionary Computation, 1(1):67-82, April 1997, http://citeseer.nj.nec.com/wolpert96no.html.

27. Véase, por ejemplo, Hugh Ross, "Design and the Anthropic Principle", http://www.reasons.org/resources/apologetics/design.html.
Como refutación del argumento de ajuste fino cosmológico, véase Theodore Drange, "The Fine-Tuning Argument Revisited (2000)", Philo 2000 (Vol. 3, No. 2), http://www.infidels.org/library/modern/theodore_drange/tuning-revisited.html.

Dembski también presenta una versión revisada del programa, y luego formula la absurda afirmación de que su versión, a diferencia de la original de Dawkins, no implica un elemento de "teleología" porque busca en el espacio de fases "sin recurso explícito al objetivo" (p. 193). En realidad, ambas versiones descritas por Dembski recurren explícitamente al objetivo, comparando cada secuencia de prueba con la secuencia objetivo.

Aunque el modelo mono/Shakespeare es útil para explicar la distinción entre la selección de un solo paso y la selección acumulativa, es engañoso en aspectos importantes. Una de estas es que, en cada generación de cría selectiva, las frases mutantes de la "progenie" eran juzgadas según el criterio de semejanza con un objetivo de ideal distante, la frase METHINKS IT IS LIKE A WEASEL. La vida no es así. La evolución no tiene una meta a largo plazo. [p. 208]

Dembski también se sitúa en una larga línea de creacionistas y partidarios del diseño inteligente que han criticado el programa Weasel por no ser aquello que Dawkins jamás afirmó que fuera. Según Dembski, el programa, según Dawkins, "muestra cómo un algoritmo evolutivo puede generar complejidad especificada" (p. 181). En realidad, Dawkins no califica el programa Weasel como un algoritmo evolutivo ni afirma que pueda "generar" complejidad de ningún tipo. El propósito único del programa Weasel era ilustrar la diferencia entre selección de un solo paso y selección acumulativa. (Estos dos términos se describen en 6.8 arriba.) Dawkins es muy cuidadoso al decirlo claramente, aunque aparentemente no lo suficientemente claro para los antievolucionistas. Dembski cita el siguiente pasaje de Dawkins, pero parece no haberlo entendido:

26. Dado que el programa Weasel de Richard Dawkins ya le será familiar a muchos lectores, no lo describiré aquí. La descripción original de Dawkins puede encontrarse en The Blind Watchmaker (Penguin, 1991), pp. 45-50. Una breve explicación puede encontrarse en línea en http://www.talkorigins.org/faqs/fitness/, sección 1.2.3. La descripción de Dembski del programa en No Free Lunch contiene errores graves.

25. David Wolpert y William Macready, "No Free Lunch Theorems for Search", Santa Fe Institute Technical Report 95-02-010, 1995, http://citeseer.nj.nec.com/wolpert95no.html.

24. Geoffrey Miller, "Technological Evolution As Self-Fulfilling Prophecy", in J. Ziman (Ed.), Technological innovation as an evolutionary process (Cambridge U. Press, 2000). pp. 203-215, http://www.unm.edu/~psych/faculty/technological_evolution.htm.

23. William Dembski, "Why Natural Selection Can't Design Anything", 2001, http://iscid.org/papers/Dembski_WhyNatural_112901.pdf.

22. Dembski cita a Joseph Culberson en un pasaje que parece usar el término búsqueda a ciegas en el segundo sentido de Dembski (p. 196). Pero una lectura cuidadosa de Culberson revela que está usando el término para significar cualquier algoritmo de caja negra: "El entorno actúa como una caja negra, y por ello nos referimos a esto como el modelo de caja negra o búsqueda a ciegas.... [Wolpert and Macready] demuestran en un marco formal que todos los algoritmos de optimización tienen un comportamiento medio equivalente cuando se enfrentan a un entorno de este tipo de caja negra". Joseph Culberson, "On the Futility of Blind Search", Evolutionary Computation 6(2), 1998. Una versión anterior del artículo puede encontrarse en línea en http://citeseer.nj.nec.com/culberson96futility.html.

21. Utilizo el término complexidad funcional en un sentido amplio para referirme al tipo de complejidad que reconocemos intuitivamente al mirar máquinas y organismos.

La idea de IC en términos de pasos seleccionados o no seleccionados pone así el foco en el proceso de intentar construir el sistema. Una gran ventaja, creo, es que anima a la gente a prestar atención a los detalles; con suerte alentaría escenarios realmente detallados por parte de los defensores del darwinismo (aquellos que podrían comprobarse experimentalmente) y desalentaría las historias de "así pasó" que salta sobre muchos pasos sin comentario. Así, con esos pensamientos en mente, ofrezco la siguiente definición evolutiva provisional de complejidad irreducible:

Una vía evolutiva de complejidad irreducible es una que contiene uno o más pasos no seleccionados (es decir, una o más mutaciones necesarias pero no seleccionadas). El grado de complejidad irreducible es el número de pasos no seleccionados en la vía.

20. Michael Behe, "A Response to Critics of Darwin's Black Box", Discovery Institute, December 2001, http://www.iscid.org/papers/Behe_ReplyToCritics_121201.pdf:

Ahora está claro que, aunque el paradigma de la trampa para ratones siga siendo una buena idea, hay cierta ambigüedad en la definición escrita, como se discute más abajo. No obstante, creo que la definición se puede reparar.

19. Michael Behe, "Respuesta a mis críticos: una respuesta a las críticas de Darwin's Black Box: The Biochemical Challenge to Evolution", Biology and Philosophy 16: 685–709, 2001:

18. Kenneth Miller, "La evolución de la coagulación sanguínea de los vertebrados", http://www.millerandlevine.com/km/evol/DI/clot/Clotting.html.
- Don Lindsay, "How Could The Immune System Evolve?", April 1999, http://www.cs.colorado.edu/~lindsay/creation/evolve_immune.html.
- Mike Coon, "Is the Complement System Irreducibly Complex?", The Archivo TalkOrigins, February 2002, http://www.talkorigins.org/faqs/behe/icsic.html.
- Ian Musgrave, "Evolution of the Bacterial Flagella", March 2000, http://cidw.rmit.edu.au/~e21092/flagella.htm. Actualmente se está preparando una versión actualizada de esta página web.

Los sistemas que requieren varias partes para funcionar y no necesitan estar bien emparejadas, podemos llamarlos sistemas de "interacción simple" (designados 'SI'). Los que requieren componentes bien emparejados son de complejidad irreducible ('IC'). La línea que divide los sistemas SI e IC no es nítida, porque asignar uno u otro tipo se basa en factores probabilísticos que a menudo son difíciles de calcular y que generalmente deben estimarse de forma intuitiva sobre la base de conocimientos de fondo siempre incompletos. Además, ninguna ley física descarta automáticamente el origen por azar ni siquiera del sistema IC más intrincado. Sin embargo, a medida que la complejidad aumenta, las probabilidades se vuelven tan abismalmente bajas que rechazamos el azar como explicación (Dembski 1998).

17. Michael Behe, "Self-Organization and Irreducibly Complex Systems: A Reply to Shanks and Joplin", Philosophy of Science 67 (1), 2000, http://www.discovery.org/viewDB/index.php3?program=CRSC%20Responses&command=view&id=465:

16. Michael Behe, Darwin's Black Box (Simon & Schuster, 1998), pp. 39-40.

15. Existen muchas páginas web que rebatían los argumentos de Behe con detalle, incluyendo las siguientes:
- Kenneth Miller, "Design on the Defensive", http://biocrs.biomed.brown.edu/Darwin/DI/Design.html.
- Don Lindsay, "Review: 'Darwin's Black Box, The Biochemical Challenge to Evolution' by Michael J. Behe", August 2000, http://dlindsay.best.vwh.net/creation/behe.html.
- "Irreducible Complexity and Michael Behe", The Archivo TalkOrigins, http://www.talkorigins.org/faqs/behe.html

14. En apoyo de su argumento de la probabilidad de la combinación puramente aleatoria, los creacionistas suelen citar al astrónomo Fred Hoyle: "El escenario actual del origen de la vida es tan probable como que un tornado pase por un vertedero de chatarra junto a la empresa de aviones Boeing produciendo accidentalmente un avión 747".

13. William Dembski, "El movimiento del diseño inteligente", Cosmic Pursuit, Primavera de 1998, http://www.arn.org/docs/dembski/wd_idmovement.htm.

12. Dembski afirma frecuentemente que cierto suceso o fenómeno muestra una complejidad especificada, sin haber realizado un cálculo de probabilidad explícito. Tomo aquí la libertad de hacer lo mismo.

11. "La navaja de Occam", Principia Cybernetica Web, http://pespmc1.vub.ac.be/:/OCCAMRAZ.html.

Así pues, parece que la inferencia de diseño en este caso representa varias posibilidades: Caputo hizo trampa, Caputo mintió sobre su método de aleatorización, o algún otro agente inteligente (quizás incorpóreo) intervino en el proceso.

¿Qué tan seguros estamos de que no pudieron estar actuando otras causas naturales? Dembski sostiene que H es "la única hipótesis de azar que pudo haber estado actuando para producir E... porque Caputo mismo era responsable de las selecciones de las papeletas y afirma haber usado este proceso de azar" (p. 80). Descarta la posibilidad de que el procedimiento de aleatorización de Caputo hubiera sido defectuoso de forma inocente, alegando que Caputo extrajo cápsulas de un recipiente y que "los modelos de urna están entre las técnicas de aleatorización más fiables disponibles" (p. 56). Presumiblemente, esta exclusión de la posibilidad de un procedimiento de urna defectuoso debería considerarse una generalización proscriptiva. Pero, ¿y si Caputo estaba mintiendo sobre el proceso que utilizó y en realidad empleó otro proceso que él creía justo pero no lo era? Parece que Dembski seguiría contando esto como "diseño".

46. La lista completa se puede encontrar en: William Dembski, "Intelligent Design Coming Clean", Metaviews online forum, noviembre de 2000, http://www.discovery.org/viewDB/index.php3?program=CRSC%20Responses&command=view&id=534.

45. Richard Dawkins, The Blind Watchmaker, pp. 45-50.

Estoy al tanto de que mi caracterización de un objeto complejo, estadísticamente improbable en una dirección especificada no con retrospección, puede parecer idiosincrática.... Si prefiere alguna otra forma de definir la complejidad, no me importa y estaría feliz de aceptar su definición para fines de discusión. [Richard Dawkins, The Blind Watchmaker, p. 15.]

Aunque Dawkins también emplea el término especificado, no está claro que su término signifique lo mismo que el de Dembski. Aunque no es del todo explícito, parece que Dawkins exige que consideremos todas las funciones que podría haber tenido el objeto, y no solo la función particular que observamos, como permite el concepto de Dembski. Además, Dawkins menciona brevemente un criterio adicional de heterogeneidad, que quizá salva a los fenómenos altamente patrones de ser clasificados como complejos, como ocurre con la versión de Dembski. La definición de complejidad de Dawkins también puede ser defectuosa, pero esto es relativamente poco importante, ya que la usa solo para aclarar de qué tipo de sistemas está hablando, y no juega un papel significativo en su argumento:

Probemos otro enfoque en nuestra búsqueda de una definición de complejidad, y hagamos uso de la idea matemática de probabilidad. Supongamos que probamos la siguiente definición: una cosa compleja es algo cuyos componentes constitutivos están dispuestos de tal manera que es improbable que haya surgido solo por azar. Para tomar una analogía de un astrónomo eminente, si toma las partes de un avión y las revuelve al azar, la probabilidad de que usted lograra ensamblar por casualidad un Boeing operativo es insignificante. Hay miles de millones de formas posibles de armar las piezas de un avión, y solo una, o muy pocas, de ellas serían en realidad un avión. [Richard Dawkins, The Blind Watchmaker (Penguin, 1991), p. 7.]

44. Dawkins, por otro lado, sí adopta una definición de complejidad basada en la probabilidad bajo una distribución de probabilidad uniforme, y quizá de ahí es donde Dembski obtuvo la idea. En The Blind Watchmaker Dawkins escribe:

43. Leslie Orgel, The Origins of Life (Chapman and Hall, 1973), p. 190.

42. Paul Davies, The Fifth Miracle (The Penguin Press, 1998), pp. 85-89.

41. La información algorítmica o complejidad de Kolmogorov de una secuencia es la longitud del programa más corto que pueda generar la secuencia. Por lo tanto, es una medida de incomprensibilidad.

40. El régimen de puntuación de Chellapilla y Fogel es aquel en el que W^- = W⁺ = +1, D^- = D⁺ = 0, y L^- = L^{+ =} -2.

39. Esto es pesimista. Un solapamiento modesto de rangos (p. ej., W^- un poco menor que D⁺) aún puede dar un buen resultado.

38. En sentido estricto, cada red neuronal en una generación tiene una función de aptitud diferente, ya que su entorno (la población de otras redes neuronales) es distinto.

37. Kumar Chellapilla y David Fogel, "Co-Evolving Checkers Playing Programs using only Win, Lose, or Draw", SPIE's AeroSense'99: Applications and Science of Computational Intelligence II (Apr. 5-9, 1999, Orlando, Florida), http://vision.ucsd.edu/~kchellap/Publications.html.

Como algunos otros autores, Dembski se refiere a la sorpresa (-log₂p_i) como información de Shannon (p. 230n16). Eso en sí no es particularmente importante. Lo que importa no es cómo llama a esta medida, sino cómo la usa. El problema es que él solo la usa como una medida de probabilidad disfrazada. La función f(x) = -log₂x es una función monótona, lo que significa que una mayor sorpresa siempre corresponde a una mayor improbabilidad. Cada una de las afirmaciones de Dembski sobre la información también podría expresarse igualmente (y con mucha mayor claridad) como una afirmación sobre la improbabilidad. A menudo usa los términos improbabilidad, información y complejidad de manera intercambiable. En el índice de The Design Inference incluso tiene una entrada para "probability... information in disguise". Al disfrazar sus probabilidades como información, Dembski simplemente añade otra capa de ofuscación a sus argumentos, sin lograr nada de valor.

Ahora supongamos que, como en el ejemplo de Dembski (pp. 126-127), se reparte una escalera real (10-J-Q-K-A en un mismo palo). Hay 4 escaleras reales posibles (una en cada palo), de modo que la probabilidad de una escalera real de cualquier palo es 4 × 0.0000005 = 0.000002. La sorpresa de este evento es por lo tanto -log₂(0.000002) = 19 bits.

Por el bien de un ejemplo, considere una mano de 5 cartas repartida de una baraja bien barajada de 52 cartas. Hay (52×51×50×49×48)/(5×4×3×2×1) = unas 2 millones de posibles resultados. Como todos los resultados son igualmente probables, p = 0.0000005, y la incertidumbre (H) asociada con el reparto es -log₂(0.0000005) = 21 bits, usando la fórmula especial para distribuciones equiprobables que se acaba de deducir. Una vez que hemos visto las 5 cartas no hay incertidumbre sobre lo que se repartió, por lo que H_y(x) = 0, y la información de Shannon queda dada por R = 21 - 0 = 21 bits.

Esto no debe confundirse con la sorpresa, aunque tiene la misma fórmula. Para un conjunto de resultados posibles que son todos igualmente probables, la sorpresa de cada resultado sucede con la misma incertidumbre del conjunto.

H = - Σ_i=1...N p_i log₂p_i
    = - N . p log₂p
    = - N . 1/N . log₂p
    = - log₂p

Nótese que, cuando todos los resultados posibles son igualmente probables (es decir, p_i es una constante p), la incertidumbre se reduce a - log₂p:

Para estar seguros, esta información en la teoría de la comunicación se relaciona no tanto con lo que usted dice, como con lo que usted podría decir. Es decir, la información es una medida de la libertad de elección de uno al seleccionar un mensaje. Si uno se enfrenta a una situación muy elemental en la que tiene que elegir uno de dos mensajes alternativos, entonces se dice arbitrariamente que la información asociada con esta situación es unidad. Obsérvese que es engañoso (aunque a menudo conveniente) decir que uno u otro mensaje transmite información unitaria. El concepto de información no se aplica a los mensajes individuales (como lo haría el concepto de significado), sino más bien a la situación en su conjunto; la unidad de información indica que en esta situación uno tiene una cantidad de libertad de elección, al seleccionar un mensaje, que conviene considerar como una cantidad estándar o unitariamente determinada. [Shannon & Weaver, 1949, pp. 8-9]

Weaver es más explícito y deja claro que la información es una propiedad del conjunto de mensajes posibles, no de un mensaje particular:

La cantidad H tiene un número de propiedades interesantes que refuerzan todavía más su validez como una medida razonable de elección o información. [Shannon & Weaver, 1949, p. 51]

Sin embargo, esto no es el uso de Shannon ni de Weaver, quienes se refieren a R como la información. En consecuencia, la mayoría de los teóricos de la información se refieren a R como la información de Shannon. La expresión -log₂p_i no aparece en ninguna parte de los artículos de Shannon y Weaver. Para un canal sin ruido, Shannon equipara información con incertidumbre:

Parece haber desacuerdo sobre qué medida se conoce correctamente como la información de Shannon. Algunos autores, incluyendo a Dembski, se refieren a la sorpresa como la información de Shannon asociada con la recepción de un mensaje específico. El razonamiento parece ser que, si H es la tasa de transmisión de información promediada sobre todos los mensajes posibles, entonces la sorpresa debe ser la información asociada con la recepción de un mensaje particular.

Es importante tener en cuenta que R y H son tasas, o promedios (ponderados por probabilidad), basados en el conjunto de todos los mensajes que podrían transmitirse. No son valores asociados con la recepción de un mensaje en particular. Sin embargo, hay otra medida, definida como -log₂p_i, que sí está asociada con la recepción de un mensaje específico. A veces se conoce como sorpresa, según M. Tribus [Thermostatics and Thermodynamics (D. van Nostrand Co., 1961)], ya que indica cuánta sorpresa deberíamos sentir al recibir ese mensaje. Entonces la incertidumbre H es igual a la sorpresa promedio, en todos los mensajes posibles, ponderada por probabilidad.

donde hay N mensajes posibles y la probabilidad de que se transmita el mensaje i es p_i.

H = - Σ_i=1...N p_i log₂p_i

La incertidumbre H(x) (o simplemente H) se define así:

Si pensamos en términos de transmitir un mensaje, extraído al azar de un conjunto de mensajes posibles, desde un transmisor a un receptor, entonces H(x) es la incertidumbre del receptor sobre qué mensaje se transmitió (o se transmitirá) antes de recibir cualquier mensaje. H_y(x) es la incertidumbre del receptor sobre qué mensaje se transmitió después de recibir un mensaje. R también puede considerarse como la reducción de la incertidumbre como resultado de recibir el mensaje. Si el canal está libre de ruido —de modo que el mensaje recibido es siempre el mismo que el enviado— entonces H_y(x) = 0 y R = H(x).

R = H(x) - H_y(x)

La tasa de transmisión de información se define por Shannon como sigue:

La teoría de la información de Shannon se ocupa de la transmisión de mensajes a través de un canal de comunicaciones. El significado de los mensajes es irrelevante. Solo importa la eficiencia y precisión con que se transmiten los mensajes. Los mensajes se tratan como si se seleccionaran al azar de un conjunto de mensajes posibles. Esto significa que la misma teoría también puede usarse en relación con otros tipos de eventos probabilísticos, en los que se observa la ocurrencia de un resultado entre un conjunto de resultados posibles.

36. He encontrado en discusiones anteriores del trabajo de Dembski que una considerable confusión ha sido causada por su mal uso de la teoría de la información de Shannon. Aunque no es esencial para mi crítica, intentaré aquí aclarar parte de esa confusión. Mi principal fuente es The Mathematical Theory of Communication (Univ. of Illinois Press, 1949). Este pequeño libro consta de dos artículos, uno de Claude Shannon y otro de Warren Weaver. Una versión anterior (1948) pero en gran medida idéntica del artículo de Shannon está disponible en línea en http://cm.bell-labs.com/cm/ms/what/shannonday/paper.html. Para una introducción más suave en línea a la teoría de la información, véase http://www.lecb.ncifcrf.gov/~toms/paper/primer/.

35. No está claro si Dembski considera esto como 38 bits de complejidad/información especificada (SI). Él sí dice que la secuencia METHINKS está especificada, en la medida en que es una "palabra conocida en el idioma inglés". Pero, si la especificación es "palabra conocida en el idioma inglés", necesita calcular la probabilidad de extraer cualquier palabra inglesa de 8 letras, lo que da un valor de complejidad bastante menor. De hecho, Dembski solo escribe que la complejidad está acotada por 38 bits, no que sea precisamente 38 bits. Quizá esto fue para permitir palabras alternativas de 8 letras.

34. Quizá la elección de terminología de Dembski haya contribuido a confundirlo. El espacio de fases de un algoritmo de optimización se llama normalmente espacio de búsqueda, mientras que el espacio de fases de una distribución de probabilidad se llama espacio de resultados o espacio muestral. Al usar siempre el término espacio de fases sin importar el contexto, Dembski ha difuminado esta distinción.

33. Thomas Schneider, "Evolution of Biological Information", Nucleic Acids Research, 28(14): 2794-2799, 2000, http://www.lecb.ncifcrf.gov/~toms/paper/ev/. También en este sitio se puede encontrar la respuesta de Schneider al tratamiento de su trabajo por parte de Dembski: "Rebuttal to William A. Dembski's Posting and to His Book 'No Free Lunch'", 9 de marzo de 2002, http://www.lecb.ncifcrf.gov/~toms/paper/ev/dembski/rebuttal.html; y un útil "Information Theory Primer", http://www.lecb.ncifcrf.gov/~toms/paper/primer/.

32. Dembski es inconsistente en su uso de los términos especificada información y CSI. A veces son "elementos" de la forma (T, E), donde E es un resultado observado y T (o objetivo) es otro nombre para una región de rechazo desprendible R (pp. 142-143). A veces son propiedades que son o no exhibidas por un fenómeno (p. 151). A veces son cantidades: "Dado que se pueden producir pequeñas cantidades de información especificada por puro azar..." (p. 161); "La CSI en un sistema cerrado de causas naturales permanece constante o disminuye" (p. 163). Para evitar expresiones demasiado largas como "la cantidad de información en un elemento de información especificada" (p. 160), usaré información especificada (o SI) en el último de estos tres sentidos, es decir, como una cantidad. Usaré CSI en el segundo sentido, es decir, como un atributo que puede ser exhibido o no. Debe entenderse que la probabilidad usada para calcular SI o CSI es siempre la probabilidad de una región de rechazo desprendible R, y no solo la probabilidad del resultado observado E por sí sola.

61. Howson & Urbach, Razonamiento científico, pp. 179-180 (citado por Dembski, The Design Inference, pp. 199-200).

60. Dembski, The Design Inference, pp. 182-183.

59. Para un análisis muy detallado de los efectos de selección observacional, véase Nick Bostrom, "Observational Selection Effects and Probability", 2000, http://www.anthropic-principle.com/phd/.

58. Theodore Drange, "El argumento del ajuste fino (1998)", http://www.infidels.org/library/modern/theodore_drange/tuning.html.

57. ibid., p. 181.

56. Colin Howson & Peter Urbach, Razonamiento científico: El enfoque bayesiano (Open Court, 1993).

55. En respuesta a mi consulta sobre el tema, Sam Northshield (el autor del aviso) respondió: "La obra que revisé, según recuerdo, fue definitivamente más filosófica que matemática y la valoré como una obra filosófica. No recuerdo haberme esforzado por entender su contenido matemático (ya fuera porque parecía difícil de seguir o porque no había ninguno; no recuerdo cuál). Por lo tanto, no puedo decir nada sobre la corrección del trabajo de Dembski y mi reseña no debe interpretarse como un juicio matemático sobre el trabajo." (Comunicación personal.)

54. Keith Devlin está de acuerdo con esta valoración. (Comunicación personal.)

53. Keith Devlin, "Snake Eyes in the Garden of Eden", The Sciences, julio/agosto de 2000, http://www.nyas.org/books/sci/sci_0700_devl.html

Dembski y Koons son ambos miembros del Center for the Renewal of Science & Culture del Discovery Institute (http://www.discovery.org/csc/), un organismo que existe específicamente para promover el Diseño Inteligente. Este tipo de alabanza mutua de los libros de cada uno es habitual entre los miembros del Centro.

William Dembski es el Isaac Newton de la teoría de la información, y como estamos en la Era de la Información, eso hace de Dembski uno de los pensadores más importantes de nuestro tiempo. Su "ley de conservación de la información" representa un avance revolucionario. En Diseño Inteligente: el puente entre ciencia y teología, Dembski explica el significado y la importancia de sus descubrimientos con tal claridad que el público general puede comprenderlos con facilidad. Diagnostica de manera convincente nuestras actuales confusiones sobre la relación entre ciencia y teología y ofrece una alternativa prometedora.
-- Rob Koons, Profesor asociado de Filosofía de la Universidad de Texas en Austin

52. La siguiente recomendación apareció en la portada del libro de Dembski Diseño Inteligente: el puente entre ciencia y teología (véase http://www3.baylor.edu/~William_Dembski/docs_books/inteldes.htm):

51. Beth McMurtrie, "Darwinism Under Attack", The Chronicle of Higher Education, 21 de diciembre de 2001, http://chronicle.com/free/v48/i17/17a00801.htm.

50. Douglas Theobald, "El verdadero árbol filogenético", The Talk.Origins Archive, http://www.talkorigins.org/faqs/comdesc/section1.html.
No le servirá a Dembski señalar que hay unas pocas excepciones a esta congruencia. Los métodos para establecer árboles filogenéticos son falibles. La predicción es solo que habrá un alto grado de congruencia, no una congruencia perfecta.

49. Para ver una lista de predicciones de la teoría evolutiva, véase:
- Douglas Theobald, "29 pruebas de macroevolución", The Talk.Origins Archive, marzo de 2002, http://www.talkorigins.org/faqs/comdesc/.
- Don Lindsay, "¿Es la evolución ciencia?", agosto de 2001, http://www.don-lindsay-archive.org/creation/evo_science.html.

48. Douglas Theobald, "La naturaleza oportunista de la evolución y la restricción evolutiva", The Talk.Origins Archive, http://www.talkorigins.org/faqs/comdesc/section3.html
- Chris Colby & Loren Petrich, "Evidencia de diseño improvisado en la naturaleza", The Talk.Origins Archive, http://www.talkorigins.org/faqs/jury-rigged.html.

47. William Dembski, "¿Es comprobable el diseño inteligente?", foro en línea Metaviews, enero de 2001, http://www.discovery.org/viewDB/index.php3?program=CRSC%20Responses&command=view&id=584.