De los narcolaboratorios más grandes a la función logarítmica, I

Hace unas semanas, la revista Proceso publicó la nota “Desmantelan el narcolaboratorio más grande que ha habido en Chiapas”, reportando el descubrimiento por el ejército de un laboratorio que podría ser “el más grande del sureste mexicano”. No voy a discutir si verdaderamente es o no el laboratorio más grande de Chiapas (o del sureste, o de México), pero sí sobre cuántas notas de este tipo podemos esperar en los periódicos.

Considerando que (más o menos) se descubre un narcolaboratorio a la semana (así parece desde mi historial en Google Reader), nos preguntamos ¿cuántas veces se descubrirá un laboratorio que sea el más grande que los anteriores descubiertos, digamos, durante un año? Esta pregunta se puede aplicar a distintos tipos de récords, como el del verano más caliente que se tiene registrado (¿cuántas veces nos tocará temperatura récord en Colima, por ejemplo, durante nuestra vida), o el de récords deportivos (aunque matemáticamente no es una pregunta equivalente, ya que los deportistas profesionales constantemente están buscando romper dichos récords).

Enunciamos el problema de forma precisa. Si tenemos una sucesión de n eventos aleatorios e independientes, digamos X_1, X_2, \ldots, X_n, ¿cuál es el valor esperado del número de ellos que satisfacen ser el mayor de todos los anteriores? Es decir, en valor esperado, cuántos elementos tiene el conjunto

\{ i=1, \ldots, n| X_i \ge X_j, j\le i\}.

En el caso de los récords históricos, también debemos considerar que no solo tomamos en cuenta, por ejemplo, los veranos de nuestra vida, sino todos los anteriores hasta donde se tiene registro. De manera precisa, si 1 < m < n, nos interesa el valor esperado de los elementos del conjunto

\{ i=m+1,\ldots,n|X_i \ge X_j, j\le i\}.

Es decir, el número de récords observados no desde i=1, sino a partir de i=m.

Analizamos la primer pregunta, inductivamente en n. Sea E(n) el número esperado de récords observados en X_1, \ldots, X_n. Si n=1, entonces solo se ha hecho una observación, por lo que X_1 es, obviamente, el mayor y E(1) = 1.

Ahora bien, si n=2, entonces E(2) = E(1) + p_2, donde p_2 es la probabilidad de que el segundo evento sea mayor al anterior. Como tenemos dos posibilidades,

X_1 < X_2 \qquad \text{ y } \qquad X_2 > X_1

(asumiremos que X_1 = X_2 tiene probabilidad cero, lo cual es una hipótesis razonable si los eventos son mediciones de cantidades continuas), y estamos asumiendo que los eventos son aleatorios e independientes, entonces cada una de tales posibilidades tiene la misma probabilidad y así p_2 = \dfrac{1}{2}. Por lo tanto

E(2) = 1 + \dfrac{1}{2}.

De la misma forma, E(n) = E(n-1) + p_n, donde p_n es la probabilidad de que el n-ésimo evento sea el mayor de todos. Así, p_n = \dfrac{1}{n},, e inductivamente obtenemos

E(n) = 1 + \dfrac{1}{2} + \dfrac{1}{3} + \cdots + \dfrac{1}{n}.

Así, tenemos que E(2) = 3/2 = 1.5, E(3) = 11/6 \approx 1.833, o E(10) = 7381/2520 \approx 2.929, por ejemplo.

Para el segundo caso, el valor esperado de récords entre los eventos m y n es entonces igual a

E(n) - E(m) = \dfrac{1}{m+1} + \dfrac{1}{m+2} + \cdots + \dfrac{1}{n}.

En el ejemplo de los narcolaboratorios, si es descubierto uno a la semana, durante el año, en promedio, E(52) \approx 4.54 veces se descubrirá el mayor del año, mientras que en el sexenio esto ocurrirá unas E(312) \approx 6.32 veces.

En el ejemplo del clima, si vivimos durante 70 años (en promedio), E(70) \approx 4.83 veces sufriremos el peor verano de nuestras vidas. Para el peor verano histórico, tenemos que considerar los registros desde que empezaron a tomarse. Por ejemplo, para alguien que nació en 1950, si los registros fueron tomados a partir de 1870, entonces durante su vida (70 años) habrá visto

E(150) - E(80) \approx .626

peores veranos, en promedio. Como esta cantidad es menor que uno, no es común este tipo de récords (desde luego, considerando todos los lugares del planeta, entonces ya no son tan raros).

De la expresión anterior, observamos que la diferencia entre E(80) \approx 4.965 y E(150) \approx 5.591 es apenas .626, es decir, en esos 70 años apenas ocurren .626 récords, mientras que en los primeros 70 ocurren 4.83, como ya habíamos visto antes. Es decir, la función E(n) crece cada vez más lentamente. Esto tiene sentido porque a E(n) cada vez le sumamos “más poquito”, apenas una fracción 1/n.

Es decir, mientras que la diferencia entre E(9) y E(10) es un décimo, la diferencia entre E(999) y E(1000) es apenas un milésimo. Así que la rapidez de crecimiento de E(n) es cada más pequeña. ¿Qué tan pequeña? De hecho, ¿es tan pequeña que E(n) se puede mantener acotada?

Con “acotada” queremos decir que no pasa de cierto valor “límite”; en otras palabras, que existe algún número M tal que, no importa qué tan grande sea n,

E(n) \le M.

¿Existe dicho M? Si no, ¿qué tan rápido “tiende a infinito” la función E(n)? Discutiremos estas preguntas en una futura entrada.

Un comentario en “De los narcolaboratorios más grandes a la función logarítmica, I

  1. Pingback: De los narcolaboratorios más grandes a la función logarítmica, II | Series divergentes

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s