En la sabermétrica, la disciplina que usa estadística para analizar el beisbol, una proyección pitagórica es una estimación del porcentaje de partidos ganados a partir de las carreras anotadas de un equipo. Se le llama así porque la primer fórmula, propuesta por Bill James, da un aire al teorema de Pitágoras.
Si un equipo ha anotado RS carreras en sus partidos, y ha recibido RA carreras, entonces la estimación de su porcentaje de victorias W está dado por
.
Una mejor estimación, sin embargo, requiere de modificar el exponente 2 de la fórmula (obtenido empíricamente por James). La más reciente fórmula fue propuesta por David Smyth, llamada PythagenPat, en la cual el exponente depende también del número de carreras anotadas y permitidas por partido, RPG. Si definimos
,
donde G es el número de partidos jugados, entonces el exponente está dado por
,
donde .287 es también un número obtenido empíricamente. Así, la estimación PythagenPat está dada por
.
Por ejemplo, en los 19 partidos jugados hasta el 26 de abril, los Mets de Nueva York han anotado 83 carreras y recibido 58, por lo que su estimación pitagórica es 0.672 y su PythagenPat es .654. Como han, de hecho, ganado 12 de esos partidos, su porcentaje real de victorias es .632, bastante cercano a su PythagenPat. De hecho, 19×.654~12, por lo que PythagenPat sí nos da una buena estimación de sus victorias. Notamos que 19×.672~13, por lo que la estimación pitagórica se pasa por una victoria.
Aunque todavía es temprano en la temporada (cada equipo ha jugado, en promedio, 20 partidos, que corresponden solo a la octava parte del total), podemos utilizar estas estimaciones para hacer una proyección de cómo quedará el equipo al final del torneo. Por ejemplo, de seguir, en promedio, anotando y recibiendo carreras como hasta ahora, los Mets terminarían el torneo con ~106 victorias, lo que los pondría en primer lugar de su división.
Nomás por hacer el ejercicio, pongamos aquí las proyecciones con PythagenPat de todos los equipos de MLB. Desde luego, lo más probable es que estos números cambien y se acerquen más a la media (sobre todo los casos extremos), por lo que los iré actualizando, más o menos, cada 20 partidos en la temporada.
Las columnas denotan el nombre del equipo, los partidos jugados, los ganados, las carreras anotadas, recibidas, PythagenPat, y la estimación de victorias. La columna PythagenPat Diff denota la diferencia entre esta estimación y el número real de victorias. Notamos que esta diferencia, si es negativa, implica que un equipo tiene carreras «desperdiciadas»: es decir, ha anotado muchas carreras en partidos ganados, mientras que en los que ha perdido no ha recibido tantas; si la diferencia es positiva, implica que ha perdido recibiendo más carreras que las que ha anotado cuando gana (recordemos que estamos comparando con la media). La penúltima columna denota la proyección de victorias al final del torneo, y la última tomando en cuenta la diferencia con las victorias reales hasta ahora.
La última línea denota los promedios de la liga.
Tm | G | W | RS | RA | PythPat | PythPat W | PythPat Diff | PythPat Proj | Corr Proj |
ARI | 22 | 11 | 111 | 113 | 0.491 | 11 | 0 | 80 | 80 |
ATL | 20 | 4 | 65 | 104 | 0.296 | 6 | -2 | 48 | 46 |
BAL | 19 | 11 | 82 | 72 | 0.559 | 11 | 0 | 91 | 91 |
BOS | 20 | 11 | 102 | 94 | 0.539 | 11 | 0 | 87 | 88 |
CHC | 20 | 15 | 123 | 54 | 0.823 | 16 | -1 | 133 | 132 |
CHW | 21 | 15 | 78 | 53 | 0.658 | 14 | 1 | 107 | 108 |
CIN | 21 | 9 | 83 | 126 | 0.308 | 6 | 3 | 50 | 52 |
CLE | 18 | 9 | 79 | 72 | 0.543 | 10 | -1 | 88 | 87 |
COL | 20 | 9 | 104 | 124 | 0.412 | 8 | 1 | 67 | 68 |
DET | 19 | 9 | 80 | 83 | 0.483 | 9 | 0 | 78 | 78 |
HOU | 21 | 6 | 79 | 110 | 0.349 | 7 | -1 | 57 | 55 |
KCR | 20 | 12 | 75 | 70 | 0.530 | 11 | 1 | 86 | 87 |
LAA | 21 | 10 | 72 | 80 | 0.454 | 10 | 0 | 73 | 74 |
LAD | 21 | 12 | 99 | 80 | 0.597 | 13 | -1 | 97 | 96 |
MIA | 19 | 8 | 72 | 83 | 0.435 | 8 | 0 | 71 | 70 |
MIL | 20 | 8 | 79 | 117 | 0.319 | 6 | 2 | 52 | 53 |
MIN | 21 | 7 | 72 | 91 | 0.396 | 8 | -1 | 64 | 63 |
NYM | 19 | 12 | 83 | 58 | 0.654 | 12 | 0 | 106 | 106 |
NYY | 19 | 8 | 70 | 89 | 0.391 | 7 | 1 | 63 | 64 |
OAK | 21 | 11 | 74 | 78 | 0.477 | 10 | 1 | 77 | 78 |
PHI | 20 | 10 | 66 | 91 | 0.359 | 7 | 3 | 58 | 61 |
PIT | 21 | 12 | 110 | 99 | 0.551 | 12 | 0 | 89 | 90 |
SDP | 21 | 7 | 76 | 107 | 0.346 | 7 | 0 | 56 | 56 |
SEA | 20 | 11 | 89 | 69 | 0.613 | 12 | -1 | 99 | 98 |
SFG | 22 | 11 | 105 | 93 | 0.557 | 12 | -1 | 90 | 89 |
STL | 20 | 11 | 126 | 85 | 0.684 | 14 | -3 | 111 | 108 |
TBR | 20 | 10 | 70 | 68 | 0.513 | 10 | 0 | 83 | 83 |
TEX | 21 | 11 | 92 | 84 | 0.542 | 11 | 0 | 88 | 87 |
TOR | 22 | 10 | 91 | 93 | 0.490 | 11 | -1 | 79 | 79 |
WSN | 19 | 14 | 82 | 49 | 0.710 | 13 | 1 | 115 | 116 |
LgAvg | 20 | 10 | 86 | 86 | 0.500 | 10 | 0 | 81 | 81 |
Notemos los casos extremos: los bravos de Atlanta (ATL) y los cachorros de Chicago (CHC).
Los bravos llevan el peor récord del torneo: 16 partidos perdidos de los primeros 20 (de hecho, perdieron los primeros 9 consecutivos, ganaron los siguentes 4, y desde entonces no han vuelto a ganar). Llevan 65 carreras anotadas y 104 recibidas (el promedio es 86), lo que les da una estimación PythagenPat de 0.296. De seguir así, terminarán ganando solo 46 partidos en todo el torneo. Insisto: lo más probable es que ganen más partidos por la regresión a la media, aunque 46 no es tan extremo. El peor resultado histórico ha sido el de los atléticos de Oakland, en 1916 (cuando eran los atléticos de Filadelfia), cuando ganaron solo 36 partidos de 154, lo que da un porcentaje de solo .234 (el equivalente en 162 partidos actuales es 38).
Sin embargo, el resultado de los cachorros se ve, de plano, imposible: con 123 carreras anotadas y 54 recibidas, su proyección al final del año (contando la corrección) es de 132 victorias, lo cual está lejos del récord histórico, que es de 116 victorias en 153 partidos, en 1906, de hecho por los mismos cachorros. Eso equivale a 123/162 partidos, lo que significa 9 partidos de diferencia de su propio récord.
Esto muestra el impresionante ritmo de juego con el que empezaron el torneo. Comparemos con los white sox, también de Chicago (CHW), que también llevan 15 partidos ganados (de 21), pero con menos carreras por partido: 78 anotadas y 53 recibidas. Su proyección es 108 partidos al final del torneo, el cual es número impresionante, pero no se ve imposible.
Como mencioné antes, iremos comparando estos números, más o menos, cada 20 partidos, para observar la evolución de estas proyecciones.
Toda la información estadística fue obtenida de Baseball Reference: baseball-reference.com.
La tabla fue hecha en LibreOffice Calc.
Un comentario sobre "Proyecciones pitagóricas"