Tiempo de elección: predicción de resultados electorales

Publicado el 04 octubre 2019 por Daniel Rodríguez @analyticslane

"Time for Change" es un modelo con el que es posible pronosticar los resultados de las elecciones presidenciales en los Estados Unidos. Llegando a predecir la victoria de Donald Trump en 2016. Siempre me he preguntado qué tan podría funcionar un modelo similar en otros procesos electorales. Por eso he creado un modelo, al que llamaré "Tiempo de elección", con el que intentaré predecir el porcentaje de voto del partido en el gobierno en las elecciones generales de España. Una vez entrenado el modelo con los datos históricos lo usaré para predecir el resultado de las futuras elecciones de 2019.

La entrada comenzará presentando el modelo "Time for Change" y los resultados que ha obtenido a lo largo del tiempo. Posteriormente se propondrá un modelo un modelo inspirado en los principios de "Time for Change" para las elecciones generales en España ("Tiempo de elección"). Finalmente, se entrenará el modelo con y se ofrecerá una predicción para las elecciones del 10 de noviembre de 2019.

El modelo "Time for Change"

"Time for Change" es un modelo que predice el voto popular del partido en el gobierno en las siguientes elecciones presidenciales de los Estados Unidos. Utilizando una regresión lineal en la que las variables son el estado de la economía, la popularidad del presidente y el tiempo que lleva este en el cargo. A pesar de su simplicidad, los resultados que ofrece son muy precisos. Siendo el error absoluto medio entre las elecciones de 1988 y 2012 de solamente un 2,2%.

Un modelo para las elecciones en España

El sistema electoral español tiene muchas diferencias respecto al estadounidense, donde "Time for Change" ofrece resultados bastante precisos. Una de las principales diferencias es que en España no se elige al presidente, sino que se eligen los diputados que posteriormente elegirán a este. Pudiendo producir coaliciones postelectorales que no garantizan la presidencia al partido más votado. Además, esto hace que los electores tengan más de dos opciones viables a la hora de elegir a sus representantes.

Además, los datos disponibles en España son más limitados. Una de las fuentes para medir el sentimiento de la población son los barómetros del CIS, para los que solamente existen series desde 1996.

A pesar de que en España hubo elecciones generales desde 1979, los barómetros del CIS solamente se encuentran disponibles desde 1996. Esto limita los datos que se pueden utilizar para entrenar el modelo a los procesos electorales del año 2000 y posteriores. Ya que para las elecciones del 1996 o anteriores no existe una medida del pulso político.

Situación económica

Para la creación del modelo es necesario buscar datos equivalentes a los empleados en "Time for Change". Uno de los datos básicos es el producto interior bruto (PIB), el cual se puede obtener fácilmente en la web del Banco de España.

Popularidad del presidente

Un indicador de la aprobación del presidente no se puede obtener tan fácilmente. En las series históricas del CIS existen un indicador de la labor del gobierno, pero no se publica desde julio de 2018. También se puede encontrar la valoración de la gestión del gobierno, pero con periodos en los que no se ha medido. Como alternativa, para medir el pulso político, se puede utilizar los indicadores de expectativa políticas disponibles desde enero de 1996 hasta la actualidad.

Tiempo en el gobierno

Otro dato es el tiempo que el partido lleva en el gobierno. Un dato que se puede calcular simplemente como las fechas entre elecciones sin cambio de gobierno. Teniendo en cuenta que en 2018 hubo un cambio de gobierno debido a una moción de censura

Resultado de las elecciones

Finalmente es necesario obtener el porcentaje de voto del partido en gobierno en las elecciones. Un dato que es fácilmente accesible.

A pesar de que en España hubo elecciones generales desde 1979, los datos del CIS solamente están disponibles desde 1996. Por lo que solamente se podrá entrenar el modelo con los resultados desde las elecciones del 2000. Ya que para las elecciones del 1996 o anteriores la serie del CIS no existe.

Presentación del modelo: "Tiempo de elección"

El modelo, al que se puede llamar "Tiempo de elección", utilizará los siguiente datos seis meses antes de las elecciones:

  • Variación interanual del PIB
  • Indicador de expectativas políticas
  • Tiempo del presidente en el gobierno

El valor para predecir es el porcentaje de voto que ha obtenido el partido en el gobierno. Utilizando para ello un modelo de regresión lineal. Así, utilizando los resultados de las elecciones generales desde 2000 hasta las de abril de 2019 se puede obtener un modelo con un R 2 de 0,86 y cuyos resultados son:

Con un error absoluto medio de 2,1% en la predicción. Cometiendo un error por encima de 2,5% solamente en una ocasión, las elecciones de 2008.

La variable más importante del modelo es el indicador de expectativas políticas, posiblemente porque es una medida del sentimiento político de la población. Por otro lado, la menos importante de las tres el tiempo en el poder.

Dado que el 2019 habrá una repetición de elecciones como en 2016, puede ser interesante fijarnos en estos resultados. El modelo predijo una bajada del partido en el gobierno en las elecciones del 2016 respecto a las del 2015, cosa que no sucedió. La bajada se debe a un empeoramiento del indicador de expectativas políticas y al aumento del tiempo en el gobierno. Aunque se compense un poco por una ligera mejora del PIB.

Aunque los resultados en entrenamiento son buenos, no se puede estar seguro de que el modelo no esté sobre ajustado. Ya que los datos disponibles son escasos.

Aplicación a las elecciones de noviembre de 2019

Aplicando este modelo a los datos del mes de mayo de 2019, se puede estimar que el porcentaje de votos del partido en gobierno será de 34,42%, un resultado algo mayor que estimado y obtendio en las anteriores.

En este caso la mejora en los resultados se debe un aumento del indicador de expectativas políticas. Aunque ahora la variación interanual del PIB se reduce y, al igual que en 2016, aumenta el tiempo en el gobierno.

El modelo prevé una subida de los resultados del partido en el gobierno. Teniendo en cuenta que, en una situación similar como las elecciones de 2016, predijo una bajada del partido en el gobierno cuando se produjo una subida. Por lo que es necesario tomar este resultado con cautela.

Conclusiones

Se ha visto un modelo con el que es posible obtener una estimación del voto recibido por el partido en el gobierno con un error absoluto en torno al 2%. Los resultados de "Tiempo de elección" no son tan buenos como los de "Time for Change". El error es mayor y por lo tanto el grado de confianza que podemos tener en el es mayor. Esto es debido a que el sistema electoral español hay más de dos partidos con opciones y a disponer de solamente siete elecciones para el entrenamiento.

El sistema electoral español, junto a la falta de datos históricos posiblemente hagan que "Tiempo de elección" no puede ser tan preciso como "Time for Change". Además, el reparto de los escaños en pequeñas circunscripciones hace que sea más complicado traducir el porcentaje de votos en diputados. Por lo que los resultados han de tomarse con cautela.

En este aspecto, "Tiempo de elección" es más una curiosidad que un intento real por predecir los resultados electorales.

Imágenes: Unsplash (Arnaud Jaegers)