Tiempo de escape

puertaAyer, una estudiante vino a pedirme ayuda sobre un problema de probabilidad: Suponemos que un preso, al intentar escapar de su prisión, se encuentra en el camino con tres puertas. Sólo una de ellas lo lleva a la salida, mientras que las otras dos, después de cierto tiempo, lo conducen al mismo lugar.

¿Cuál es el tiempo esperado que el preso permanecerá en la prisión, si el preso toma una de las tres puertas al azar?

Existen dos posibles hipótesis para este problema: La primera, que después de tomar una puerta equivocada, el preso recuerde cuál puerta tomó y sólo escoja una de las dos restantes la siguiente vez; y la segunda, que olvide cuál de ellas ha tomado, y en la siguiente vez escoja de nuevo una de las tres puertas al azar (con la misma probabilidad para cada una).

Es claro que bajo la segunda hipótesis el preso tomará más tiempo, ya que siempre existe la posibilidad que vuelva a tomar la misma puerta equivocada. Así que la pregunta es, ¿cuál es la relación entre el tiempo esperado para salir de la prisión entre ambas hipótesis?

La respuesta es, de hecho, que el preso perderá en promedio el doble de tiempo si no recuerda cuál de las puerta tomó anteriormente.  Vamos a mostrar esto.

La manera más eficaz de resolver este problema es a través de esperanza condicional. Vamos a proceder primero bajo la segunda hipótesis (que es la más sencilla).

Supongamos que la primera puerta, P1, es la que dirige a la salida, P2 regresa al mismo lugar después de un tiempo t, y P3 lo regresa también al mismo lugar después de un tiempo s. Entonces, si T es el tiempo de salida, entonces el valor esperado de T satisface la ecuación

E[T] = \dfrac{1}{3} r + \dfrac{1}{3}(t + E[T]) + \dfrac{1}{3}(s + E[T]),

donde r es el tiempo que toma el preso en salir a la calle si tomó la puerta correcta. Notamos que, de tomar una de las puertas equivocadas, el tiempo de espera es de nuevo E[T], además del tiempo perdido que se toma en regresar al lugar de origen.

Resolviendo esta ecuación obtenemos E[T] = r + t + s, simplemente la suma del tiempo de salida si se toma la puerta correcta, más el tiempo perdido por tomar cada una de las puertas incorrectas.

Ahora suponemos que el preso sí recuerda cuál puerta toma en cada ocasión. En este caso, la ecuación que satisface la esperanza de T es

E[T] = \dfrac{1}{3} r + \dfrac{1}{3}(t + E[T|P2]) + \dfrac{1}{3}(s + E[T|P3]),

donde E[T|Pi] es el tiempo esperado de salida después de que en la primera vuelta se tomó la puerta Pi. (Observamos que E[T|P1] = 0.)

Ahora bien, después de tomar la puerta P2, el preso sólo escogerá entre la P1 y la P3, por lo que tenemos

E[T|P2] = \dfrac{1}{2}r + \dfrac{1}{2}(s + r),

ya que, si toma P3 en esta ocasión, le tomará un tiempo s (perdido) además del tiempo r en salir. Similarmente, 

E[T|P3] = \dfrac{1}{2}r + \dfrac{1}{2}(t + r),

y por lo tanto E[T|P2] = r + \frac{1}{2}s y E[T|P3] = r + \frac{1}{2}t. Así que

E[T] = \dfrac{1}{3} r + \dfrac{1}{3}(t + r + \dfrac{1}{2}s) + \dfrac{1}{3}(s +r + \dfrac{1}{2}t) = r + \dfrac{1}{2}(t+s),

donde observamos que el tiempo perdido, en promedio, es la mitad que el tiempo perdido cuando no se recuerda qué puerta se tomó en cada caso.

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s