Un error estadístico frecuente ocurre cuando se comparan resultados en intenciones de voto en una encuesta entre un par de candidatos, usualmente los dos más fuertes. El error consiste en tomar la diferencia entre los porcentajes obtenidos y compararla con el margen de error que reporta la encuesta. Si la diferencia es mayor que el margen de error (o dos veces el margen de error, algo así), se concluye erróneamente que la ventaja es significativa. En realidad ese margen de error no aplica a diferencias de valores sino a valores puntuales, por decirlo burdamente. Las diferencias de valores tienen una distribución distinta y un margen de error propio. Hace un par de días Guillermo Moncecchi publicó este cuaderno de iPython mostrando cómo evaluar rigurosamente esas diferencias. En algún apartado proponía armas una página que permitiera poner los valores a comparar y el número de encuestados y la página calculara si la diferencia era significativa o no. Ayer me senté un rato y la armé. Permite comparar valores a una pregunta en una misma encuesta o el mismo valor en dos encuestas distintas con la misma pregunta. En el primer caso, si la diferencia no es significativamente distinta de cero con un nivel de confianza del 95% entonces indica cuál sería el mínimo número de encuestados con los cuales esa diferencia sería efectivamente significativa. Aquí, como acompañamiento, cuatro gráficos señalando para porcentajes p1 y p2 cuáles pares tienen diferencia significativa (azul marino) y cuales no (rosa claro) dependiendo del número de encuestados (N). Sombreo la zona irrelevante en la que p1 y p2 suman más de 1. Entre más altos sean los valores de p1 y p2 se vuelve más difícil asegurar que su diferencia sea respaldada por la encuesta.

confianzas