Encuestas electorales y margen de error

Terence Tao publicó en su blog el artículo Small samples, and the margin of error, en el cual discute las matemáticas de las encuestas electorales, al menos las ideas básicas en situaciones ideales.

En él discute sobre los posibles problemas de una encuesta electoral que pueden afectar el resultado. Sin embargo, bajo las hipótesis de homogeneidad (los votantes se encuentran uniformemente distribuidos), honestidad de los encuestados (responden genuinamente su intención de voto) y de los encuestadores (se evita parcialidad de los resultados), se pueden obtener resultados muy precisos: por ejemplo, de una muestra de sólo 1,000 encuestados, se obtiene con 95% de probabilidad la intención de voto de 200 millones de votantes con un margen de error del 3%.

Tao, además, llama la atención a la página Margin of Error Calculator, puesta por el American Research Group, en donde se estima el margen de error, con probabilidad de 95%, de una muestra en una población dada. Por ejemplo, de una población de tamaño 77,000,000 (el padrón electoral mexicano), una muestra de 1,000 encuestados dará resultados con un margen de error similar, del 3% (3.1, para ser exactos).

Sobre los detalles matemáticos, Tao menciona que, bajo las hipótesis discutidas, el margen de error puede ser calculado con mucha precisión utilizando la distribución binomial, aunque él prefiere discutir el problema por medio del método del segundo momento y el uso básico de la desigualdad de Markov. A través de este método Tao muestra que el margen de error, con una muestra de 1,000 encuestados, es de a lo más 7% con probabilidad de 95%, independientemente del tamaño de la población.

Utilizando la distribución binomial podemos obtener el 3.1% discutido. La distribución binomial, que resulta de realizar un experimento n veces con probabilidad de éxito p, tiene como distribución la función \binom{n}{k}p^k(1-p)^{n-k}, la probalidad de obtener k resultados con éxito.

Supongamos que, de una población dada, una proporción p de la población votará por un candidato X. Entonces, al seleccionar n personas al azar, la probabilidad que k de los seleccionados vote por X es precisamente \binom{n}{k}p^k(1-p)^{n-k}. Entonces, la probabilidad que la proporción de encuestados que votarán por X esté entre p-r y p+r, es decir, nuestra encuesta tenga un margen de error r, es igual a

\displaystyle \mathcal P(n,r)=\sum_{n(p-r)\le k\le n(p+r)}\binom{n}{k}p^k(1-p)^{n-k}.

Si el tamaño de la muestra es n=1000, y r=.031 (3.1%), obtenemos que \mathcal P \ge 0.950015, donde el mínimo ocurre precisamente en p=1/2.

De hecho, podemos observar que la probabilidad de obtener un margen de error del 4.1% es de \mathcal P \ge 0.990486.

About these ads

Un comentario

  1. Pingback: Matemáticas cefalópodas, II (también equinas) « Series Divergentes


Deja un comentario

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s