Muestreo de las letras del alfabeto

El pasado miércoles, Julio Hernández en Astillero comentó sobre la selección de la letra «z» por el IFE para llamar las mesas directivas de casillas para estas elecciones, sin dejar de mencionar las sospechas generadas a partir de la rareza de esta letra inicial de los apellidos en México. Más aún, menciona la selección hecha en las últimas seis elecciones, y lo «extraño» de que la «w» haya aparecido dos veces:

…la letra y el mes de nacimiento correspondientes a esos seis procesos: 1994, la t y noviembre; 1997, la w y julio; 2000, la o y abril; 2003, la f y septiembre; 2006, la w y enero, y 2009, la z y julio.

Es cierto que no es muy probable que aparezca la «w» dos veces, pero no como lo dice este lector de Astillero, publicado por Julio en la columna de hoy:

la probabilidad de que una letra cualquiera salga sorteada es de apenas 3 por ciento… que salga sorteada dos veces en seis intentos representa una probabilidad ínfima

Utss, error típico del cálculo de probabilidades: Asumir que dos eventos son independientes cuando en realidad no lo son.

Veamos cuál es la probabilidad de que la «w» aparezca al menos dos veces. El lector de Astillero tiene razón: la probabilidad que una letra en particular salga sorteada es de «apenas» 3%. Como hay 27 letras en el alfabeto, entonces la probabilidad de que salga cada una de ellas es 1/27\approx 0.037, o sea 3.7% (un poco más cerca de 4% que de 3%, pero no hay pex). Si multiplicamos 0.037 por sí mismo, obtenemos 0.0014, una cantidad que no llamaría «ínfima», pero definitivamente mucho más pequeña que el 3%.

Sin embargo, la probabilidad de que una letra aparezca al menos dos veces no es 0.037 por 0.037. Calculemos esta probabilidad. Empecemos por calcular la probabilidad de que no aparezca: Esta es igual a (1 - 0.037)^6 = 0.963^6 \approx 0.80; sólo hemos multiplicado seis veces por sí misma la probabilidad de que la letra no aparezca en cada ocasión. La probabilidad de que aparezca una sólo vez es

0.037 \times 0.963^5 \times 6 \approx 0.18,

es decir, la probabilidad de que aparezca en una ocasión, 0.037, por la probabilidad de que no aparezca en las otras cinco, 0.963^5, y hemos multiplicado por 6 porque la letra puede aparecer en cualquiera de las 6 oportunidades. Entonces, la probabilidad de que una letra en particular, por ejemplo la «w», aparezca repetida es

1 - 0.963^6 - 6 \times 0.037 \times 0.963^5 \approx 0.019,

es decir, 1.9%. Menor que 3% sí, pero lejos de ser «ínfima». Más aún, esa es sólo la probabilidad de que una letra en particular aparezca repetida. La probabilida de que cualquier letra aparezca repetida es mucho mayor.

La probabilidad que todas las letras sean distintas se calcula de la siguiente manera: Una vez que salió la primera, nos quedan 26 de las 27 letras, por lo que la probabilidad de que las dos primeras sean diferentes es \dfrac{26}{27} \approx 0.96. Cuando han salido las primeras dos, ya sólo quedan 25 de dónde escoger, así que la probabilidad de que las tres primeras sean distintas es \dfrac{26}{27} \times \dfrac{25}{27} \approx 0.89. Seguimos así para obtener que la probabilidad de que seis letras tomadas al azar sean diferentes es igual a

\dfrac{26}{27} \times \dfrac{25}{27} \times \dfrac{24}{27} \times \dfrac{23}{27} \times \dfrac{22}{27} \approx 0.55,,

o sea, la probabilidad de que aparezca una letra repetida es

1 - \dfrac{26}{27} \times \dfrac{25}{27} \times \dfrac{24}{27} \times \dfrac{23}{27} \times \dfrac{22}{27} \approx 0.45,

o sea del 45%. Nada raro.

2 comentarios sobre “Muestreo de las letras del alfabeto

Deja un comentario