Proyecciones pitagóricas

En la sabermétrica, la disciplina que usa estadística para analizar el beisbol, una proyección pitagórica es una estimación del porcentaje de partidos ganados a partir de las carreras anotadas de un equipo. Se le llama así porque la primer fórmula, propuesta por Bill James, da un aire al teorema de Pitágoras.

Si un equipo ha anotado RS carreras en sus partidos, y ha recibido RA carreras, entonces la estimación de su porcentaje de victorias W está dado por

W \approx \dfrac{RS^2}{RS^2 + RA^2}.

Una mejor estimación, sin embargo, requiere de modificar el exponente 2 de la fórmula (obtenido empíricamente por James). La más reciente fórmula fue propuesta por David Smyth, llamada PythagenPat, en la cual el exponente depende también del número de carreras anotadas y permitidas por partido, RPG. Si definimos

RPG = \dfrac{RS + RA}{G},

donde G es el número de partidos jugados, entonces el exponente está dado por

EXP = RPG^{.287},

donde .287 es también un número obtenido empíricamente. Así, la estimación PythagenPat está dada por

W \approx \dfrac{RS^{EXP}}{RS^{EXP} + RA^{EXP}}.

Por ejemplo, en los 19 partidos jugados hasta el 26 de abril, los Mets de Nueva York han anotado 83 carreras y recibido 58, por lo que su estimación pitagórica es 0.672 y su PythagenPat es .654. Como han, de hecho, ganado 12 de esos partidos, su porcentaje real de victorias es .632, bastante cercano a su PythagenPat. De hecho, 19×.654~12, por lo que PythagenPat sí nos da una buena estimación de sus victorias. Notamos que 19×.672~13, por lo que la estimación pitagórica se pasa por una victoria.

Aunque todavía es temprano en la temporada (cada equipo ha jugado, en promedio, 20 partidos, que corresponden solo a la octava parte del total), podemos utilizar estas estimaciones para hacer una proyección de cómo quedará el equipo al final del torneo. Por ejemplo, de seguir, en promedio, anotando y recibiendo carreras como hasta ahora, los Mets terminarían el torneo con ~106 victorias, lo que los pondría en primer lugar de su división.

Nomás por hacer el ejercicio, pongamos aquí las proyecciones con PythagenPat de todos los equipos de MLB. Desde luego, lo más probable es que estos números cambien y se acerquen más a la media (sobre todo los casos extremos), por lo que los iré actualizando, más o menos, cada 20 partidos en la temporada.

Las columnas denotan el nombre del equipo, los partidos jugados, los ganados, las carreras anotadas, recibidas, PythagenPat, y la estimación de victorias. La columna PythagenPat Diff denota la diferencia entre esta estimación y el número real de victorias. Notamos que esta diferencia, si es negativa, implica que un equipo tiene carreras “desperdiciadas”: es decir, ha anotado muchas carreras en partidos ganados, mientras que en los que ha perdido no ha recibido tantas; si la diferencia es positiva, implica que ha perdido recibiendo más carreras que las que ha anotado cuando gana (recordemos que estamos comparando con la media). La penúltima columna denota la proyección de victorias al final del torneo, y la última tomando en cuenta la diferencia con las victorias reales hasta ahora.

La última línea denota los promedios de la liga.

Tm G W RS RA PythPat PythPat W PythPat Diff PythPat Proj Corr Proj
ARI 22 11 111 113 0.491 11 0 80 80
ATL 20 4 65 104 0.296 6 -2 48 46
BAL 19 11 82 72 0.559 11 0 91 91
BOS 20 11 102 94 0.539 11 0 87 88
CHC 20 15 123 54 0.823 16 -1 133 132
CHW 21 15 78 53 0.658 14 1 107 108
CIN 21 9 83 126 0.308 6 3 50 52
CLE 18 9 79 72 0.543 10 -1 88 87
COL 20 9 104 124 0.412 8 1 67 68
DET 19 9 80 83 0.483 9 0 78 78
HOU 21 6 79 110 0.349 7 -1 57 55
KCR 20 12 75 70 0.530 11 1 86 87
LAA 21 10 72 80 0.454 10 0 73 74
LAD 21 12 99 80 0.597 13 -1 97 96
MIA 19 8 72 83 0.435 8 0 71 70
MIL 20 8 79 117 0.319 6 2 52 53
MIN 21 7 72 91 0.396 8 -1 64 63
NYM 19 12 83 58 0.654 12 0 106 106
NYY 19 8 70 89 0.391 7 1 63 64
OAK 21 11 74 78 0.477 10 1 77 78
PHI 20 10 66 91 0.359 7 3 58 61
PIT 21 12 110 99 0.551 12 0 89 90
SDP 21 7 76 107 0.346 7 0 56 56
SEA 20 11 89 69 0.613 12 -1 99 98
SFG 22 11 105 93 0.557 12 -1 90 89
STL 20 11 126 85 0.684 14 -3 111 108
TBR 20 10 70 68 0.513 10 0 83 83
TEX 21 11 92 84 0.542 11 0 88 87
TOR 22 10 91 93 0.490 11 -1 79 79
WSN 19 14 82 49 0.710 13 1 115 116
LgAvg 20 10 86 86 0.500 10 0 81 81

Notemos los casos extremos: los bravos de Atlanta (ATL) y los cachorros de Chicago (CHC).

Los bravos llevan el peor récord del torneo: 16 partidos perdidos de los primeros 20 (de hecho, perdieron los primeros 9 consecutivos, ganaron los siguentes 4, y desde entonces no han vuelto a ganar). Llevan 65 carreras anotadas y 104 recibidas (el promedio es 86), lo que les da una estimación PythagenPat de 0.296. De seguir así, terminarán ganando solo 46 partidos en todo el torneo. Insisto: lo más probable es que ganen más partidos por la regresión a la media, aunque 46 no es tan extremo. El peor resultado histórico ha sido el de los atléticos de Oakland, en 1916 (cuando eran los atléticos de Filadelfia), cuando ganaron solo 36 partidos de 154, lo que da un porcentaje de solo .234 (el equivalente en 162 partidos actuales es 38).

Sin embargo, el resultado de los cachorros se ve, de plano, imposible: con 123 carreras anotadas y 54 recibidas, su proyección al final del año (contando la corrección) es de 132 victorias, lo cual está lejos del récord histórico, que es de 116 victorias en 153 partidos, en 1906, de hecho por los mismos cachorros. Eso equivale a 123/162 partidos, lo que significa 9 partidos de diferencia de su propio récord.

Esto muestra el impresionante ritmo de juego con el que empezaron el torneo. Comparemos con los white sox, también de Chicago (CHW), que también llevan 15 partidos ganados (de 21), pero con menos carreras por partido: 78 anotadas y 53 recibidas. Su proyección es 108 partidos al final del torneo, el cual es número impresionante, pero no se ve imposible.

Como mencioné antes, iremos comparando estos números, más o menos, cada 20 partidos, para observar la evolución de estas proyecciones.


Toda la información estadística fue obtenida de Baseball Reference: baseball-reference.com.

La tabla fue hecha en LibreOffice Calc.

Un comentario en “Proyecciones pitagóricas

  1. Pingback: Actualización de proyecciones pitagóricas – Series divergentes

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s