ELECCIONES COMUNIDAD DE MADRID
Análisis
Exposición didáctica de ideas, conjeturas o hipótesis, a partir de unos hechos de actualidad comprobados —no necesariamente del día— que se reflejan en el propio texto. Excluye los juicios de valor y se aproxima más al género de opinión, pero se diferencia de él en que no juzga ni pronostica, sino que sólo formula hipótesis, ofrece explicaciones argumentadas y pone en relación datos dispersos

Así están las encuestas en Madrid: las opciones de ganar para izquierda y derecha

Una mayoría de PP y Vox es el resultado probable, según los sondeos y su precisión histórica. No obstante, una de cada cuatro veces pasará otra cosa

La derecha llegaba con ventaja al primer debate de la campaña en Madrid. Se han publicado decenas de sondeos que ahora mismo colocan al PP como el partido más votado (ronda el 41%-42% en votos), seguido de PSOE (23%), Más Madrid (13%-14%), Vox (9%), Unidas Podemos (7%) y Ciudadanos (4%).

Pero, además, se observan algunas tendencias en la izquierda. El PSOE ha bajado un punto en dos semanas, y Unidas Podemos quizás unas décimas, mientras subía Más Madrid: el partido de Mónica García ha pasado del 12,5% al 13,5%.

El resultado de las elecciones depende de dos claves: la entrada de Ciudadanos y el equilibrio exacto de votos entre los bloques. La suma de PP y Vox ronda el 50% de votos y aventaja en seis puntos a la suma de PSOE, Más Madrid y Podemos (44%). Pero veamos como se traduce eso en escaños y en probabilidades de victoria.

La predicción de escaños

El gráfico siguiente representa nuestra estimación de escaños a partir del promedio de sondeos. El PP rondaría los 60 diputados, seguido de PSOE (33), Más Madrid (19), Vox (13), Unidas Podemos (10) y Ciudadanos (0 de resultado probable; 2 de media).

Para hacer esta estimación usamos un modelo estadístico y simulamos las elecciones 15.000 veces. El modelo se alimenta de sondeos e incorpora una pieza clave de información: su acierto histórico. El resultado son unas horquillas amplias, pero no caprichosas, porque representan la precisión que han tenido los sondeos en el pasado. Al final del texto se puede consultar la metodología detallada.

Así es fácil ver la incertidumbre. Los sondeos se equivocan en un par de puntos por partido, y es normal ver errores de tres o cuatro puntos con alguno. Eso explique que, por ejemplo, el resultado más probable del PP sea lograr 61 escaños, pero que su intervalo de 90% de probabilidad vaya desde 50 a 69 asientos. Es decir, que una de cada veinte veces veríamos al PP por encima (o por debajo) de esas cifras.

La clave: Quién alcanzará la mayoría

La principal ventaja de tener un modelo de predicción es que permite atribuir probabilidades a diferentes resultados, algo que los sondeos no pueden hacer por sí mismos. Así podemos responder la pregunta clave de estas elecciones: ¿Qué partidos tienen opciones de sumar los 69 diputados necesarios? El gráfico muestra el resumen:

  • 3 de 4 veces (77%) habrá una mayoría de derechas (PP y Vox). De las 15.000 simulaciones, esa es la frecuencia con que los dos partidos suman los 69 escaños que necesitan
  • 1 de 10 veces (12%) habrá una mayoría de izquierdas (PSOE, MM y UP). Es la probabilidad de que pase algo que les dé ventaja: un cambio en los próximos días o un error de los sondeos. Aquí se incluye la posibilidad de que tanto Vox como Ciudadanos caigan del 5%, e Isabel Díaz Ayuso se quede sin socios.
  • 1 de 10 veces (8%) Ciudadanos será decisivo. Esta es la probabilidad combinada de que pasen dos cosas, (1) que Cs supere el 5% de votos y logre escaños (20% de probabilidad), y (2) que esos escaños los necesiten derecha e izquierda.
  • Y… en 1 de 50 veces se producirá un empate. Como la asamblea reparte un número par de asientos, puede pasar que PP-Vox y PSOE-MM-UP empaten a 68 escaños.

Este último gráfico resume los pronósticos de las encuestas para estas elecciones, teniendo en cuenta lo que apuntan todas juntas y también la probabilidad que tienen de equivocarse. Lo iré actualizando desde hoy hasta que se publiquen los últimos sondeos.

Suscríbete aquí a la ‘newsletter’ de Kiko Llaneras donde analiza y explica la actualidad con datos y gráficos.

Metodología

Las predicciones las produce un modelo estadístico basado en sondeos y en su precisión histórica. El modelo es similar al que usamos en las elecciones de abril y noviembre de 2019, en México, Francia, el Reino Unido, Andalucía o Cataluña. Funciona en tres pasos: 1) agregar y promediar las encuestas, 2) incorporar la incertidumbre esperada, y 3) simular 15.000 elecciones para repartir escaños y calcular probabilidades.

 

Paso 1. Promedio de encuestas. Nuestro promedio tiene en cuenta decenas de sondeos para mejorar su precisión. El promedio está ponderado para dar distinto peso a cada encuesta según tres factores: el tamaño de la muestra, la casa encuestadora y la fecha.

 

Paso 2. Incorporar la incertidumbre de las encuestas. Este es el paso más complicado e importante. Se necesita estimar la precisión esperada de los sondeos. ¿De qué magnitud son los errores habituales? ¿Cómo de probable es que se produzcan errores de 2, 3 o 5 puntos? Para responder esas preguntas se estudian cientos de encuestas en España y miles internacionales.

 

Calibrar los errores esperados. Primero se estima el error de las encuestas en España. Se construye una base de datos con todas las elecciones desde 1986. El error absoluto medio (MAE) de los promedios de encuestas ha rondado los 2 puntos por partido. Eso significa que fueron habituales desviaciones de 3 o 4 puntos y que el margen de error (al 95%) se acerca a los siete puntos para partidos alrededor del 30% de votos. Esos errores dependen al menos de dos cosas: del tamaño del partido y de la cercanía de las elecciones. Para tener en cuenta esos dos factores se recurre a la base de datos de Jennings y Wlezien, publicada en Nature. Se han analizado los errores de más de 4.100 encuestas en 241 elecciones de 19 países occidentales. Así se construye un modelo sencillo que estima el error MAE del promedio de votos estimado por las encuestas para cada partido, teniendo en cuenta: 1) su tamaño (es más fácil estimar un partido que ronda el 5% en votos que uno que supera el 30%), y 2) los días que faltan hasta las elecciones (porque las encuestas mejoran al final).

 

Elección del tipo de distribución. Para incorporar la incertidumbre al voto de cada partido en cada simulación se utiliza una distribución multivariable. Se usan distribuciones t-student en lugar de normales para que tengan colas más largas (curtosis): eso hace más probable que sucedan eventos muy extremos. Las ventajas de esa hipótesis la explica Nate Silver: "El nivel de curtosis lo he estimado con la base de datos. Luego defino la matriz de covarianzas de estas distribuciones para que la suma de los votos no sobrepase el 100% (una idea de Chris Hanretty). La incertidumbre la incorporo con 53 distribuciones, una a nivel nacional y otra en cada provincia. La primera distribución introduce errores iguales para el voto de un partido en toda España. Es importante hacerlo así porque en general los errores de las encuestas son sistémicos e iguales en todos los territorios. Si los asumimos independientes, los errores se cancelan entre provincias y el modelo falla por exceso de confianza. Esto pasó con algunos modelos de las elecciones de EE UU en 2016. La segunda parte de la incertidumbre la incorporo sobre cada provincia. Por último, hay que escalar la amplitud de las matrices de covarianza para que las distribuciones de voto que resultan al final tengan el MAE y la desviación estándar esperados según la calibración".

 

Paso 3. Simular. El último paso consiste en ejecutar el modelo 15.000 veces. Cada iteración es una simulación de las elecciones con porcentajes de voto que varían según la distribución definida en el paso anterior. Los resultados en esas simulaciones permiten calcular las probabilidades que tiene cada partido de lograr cierto número de escaños, alcanzar la mayoría, quedar primero, etcétera.

 

Por qué encuestas. Este modelo se basa por entero en encuestas. Existe la percepción de que los sondeos no son fiables, pero lo cierto es que las encuestas no lo han hecho mal últimamente. En los últimos dos o tres años han sido bastante precisas en España, aunque con excepciones, como las elecciones andaluzas de 2018. Las encuestas raramente son perfectas, pero no existe ninguna alternativa que se haya demostrado mejor.


Sobre la firma

Kiko Llaneras

Es periodista de datos en EL PAÍS y doctor en ingeniería industrial. Antes de llegar al periódico en 2016 era profesor en la Universitat de Girona y en la Universidad Politécnica de Valencia. Escribe una newsletter semanal, con explicaciones y gráficos del día a día.

Normas

Más información

Archivado En

Recomendaciones EL PAÍS
Recomendaciones EL PAÍS
Recomendaciones EL PAÍS