En una entrada anterior, y a modo de introducción para esta de hoy, hablé del problema de la inducción. Como prometí entonces, esta segunda será sobre "el nuevo problema de la inducción", que intentaré resumir a continuación.
Pongamos que tenemos unas observaciones y queremos construir una teoría basándonos en ellas. Por ejemplo, hemos observado las posiciones de los planetas en el cielo y formulamos el modelo heliocéntrico gobernado por las leyes de Kepler. Con ese modelo hacemos predicciones y encontramos que estas se cumplen con mayor precisión que las predicciones hechas con un modelo alternativo, por ejemplo, con el modelo geocéntrico con epiciclos.
Entendiendo la inducción como inferencia estadística, y usando, dentro de ella, el modelo bayesiano, diremos que, si partíamos de ambas teorías, a las que asignábamos ciertas probabilidades a priori de ser ciertas (p para la primera y 1-p para la segunda), la información de los nuevos datos, que eran más esperables con la primera que con la segunda, hace que nuestras nuevas probabilidades de aceptación de las teorías sean p' y 1-p', donde p' > p. Es decir, los nuevos datos, que son más compatibles con la primera teoría nos llevan, por la regla de Bayes, a aumentar nuestra confianza en esa primera teoría.
Hasta aquí la explicación bayesiana del principio de inducción, y a partir de aquí tenemos "el nuevo problema de la inducción". Todo el truco está en que hemos partido de dos teorías suficientemente distintas, pero podíamos haber tenido un punto de partida distinto, manteniendo las dos teorías anteriores y añadiendo una tercera: un modelo heliocéntrico gobernado por las leyes de Kepler hasta el solsticio de invierno de 2012. Si, como antes, asignamos unas probabilidades a priori para cada una de las tres teorías (q para la heliocéntrica de antes, r para la heliocéntrica hasta el solsticio y 1-q-r para la geocéntrica), los nuevos datos nos harán dar más probabilidad a las dos primeras (q' > q y r' > r) y quitársela a la última. Y ahí está la clave: los datos no distinguen entre las dos teorías heliocéntricas, solo entre ellas y la geocéntrica. Si hubiéramos tenido q = r (ambas igual de probables a priori), tras los datos tendríamos q' = r' (ambas igual de probables a posteriori).
Sin embargo, muy pocos científicos tendrán por igual de buenas ambas teorías y desdeñarán la heliocéntrica con final a la profecía maya. ¿Por qué? La razón no puede estar en la aplicación del teorema de Bayes con los nuevos datos (por lo menos, no hasta el solsticio de invierno), sino en la especificación de las probabilidades a priori, que asignará muy poca probabilidad a la teoría heliocéntrica con final en el solsticio. La pregunta parece ser: ¿por qué preferimos asignar un bajo valor a priori a esa teoría? Al fin y al cabo, no tenemos datos que nos permitan decir que una de las dos teorías heliocéntricas es mejor que la otra. ¿O sí?
Pero la entrada se alarga. Dejaremos la discusión para una muy próxima ocasión. De momento, vayamos entendiendo y digiriendo este nuevo problema de la inducción.
------------------------------------------------------------------------------------------------------------Hace tres años en el blog: ¿Una bronca a Hollywood?------------------------------------------------------------------------------------------------------------