El fútbol hoy: analítica y visualización de datos

Thumbnail

Tags: Estadística y fútbol; Estadisticas del futbol; Estadísticas Fútbol Colombia; Fútbol Profesional Colombiano; Gol y fútbol; Predicción resultados

Seguir a @golyfutbol

Goles son amores. Salvo para algunos ‘expertos’, la mayoría de aficionados al fútbol coincidimos en que lo más divertido del fútbol son los goles. Es al fin y al cabo, el objetivo del juego. Resulta pues paradójico que el gol sea uno de los acontecimientos menos comunes en un partido de fútbol. Un partido se compone de muchos centros, infinitos pases, aleves patadas, demasiados piscinazos y hasta un número importante de tiros de esquina. Pero goles, aquello que busca el hincha, hay pocos.

Goles en los mundiales hay menos que antes. Pero no es una regla estricta tal como comenté hace un tiempo. Es decir, a pesar de las predicciones más pesimistas, goles siguen habiendo, y ayer como hoy son un acontecimiento poco común. En un reciente libro, recomendado para aquellos que gusten de los números en el fútbol, dos economistas (Anderson y Sally) profesores en la universidades de Cornell y Dartmouth en los Estados Unidos respectivamente, decidieron estudiar la rareza del gol en las ligas más poderosas del mundo (alemana, española, francesa, inglesa e italiana).

En el libro rememoran la bien conocida historia que dio fama a la distribución de Poisson. La idea básica es que mediante la formula desarrollada por Siméon-Denis Poisson en 1838 es posible predecir el número de veces que un evento de baja ocurrencia (raro, en otras palabras) podría suceder en un lugar o momento dado. Denominada por algunos la _Ley de los Pequeños Números, _se puede en principio predecir la frecuencia y la probabilidad de que ocurran eventos raros. Por ejemplo, los goles.

Revisemos el caso colombiano utilizando datos facilitados por OPTA para la temporada del fútbol profesional colombiano del primer semestre de 2013. Son 188 partidos, un número menor del ideal, pero suficiente para ilustrar el ejercicio. Decíamos en la introducción que los goles son una rareza. ¿Quiere eso decir que los partidos tienden a terminar 0 – 0?

La siguiente gráfica reporta los resultados más repetidos en el FPC. Cada eje representa el número de goles marcado por cada equipo en enfrentamientos directos: locales en el eje vertical, visitantes en el eje horizontal. El tamaño de la burbuja ilustra la frecuencia con que se repite el marcador. Por ejemplo, sólo en un partido el local venció 6-1 al equipo visitante.

El 0 – 0, que se repitió 19 veces a lo largo del torneo, no es el marcador más frecuente. El más frecuente fue el 1 – 1, resultado que se obtuvo en 30 partidos. Incluso el 2 -1 (23 veces) es más frecuente que el 0 – 0. El 1 – 0 se dio también 19 veces. Se observa, además, que el 1 – 2 es el resultado con el que mayor frecuencia gana el equipo visitante. A mí personalmente me sorprende que tenga mayor frecuencia que el 0 – 1.

En cualquier caso el gol es un hecho extraño. En 26.6% de los partidos el resultado es 0 – 0; 1 – 0 ó 0 – 1; es decir en poco más de 1 de cada 4 partidos hay como mucho un gol en los 90 minutos. Lo realmente sorprendente es que en Alemania, España, Francia, Inglaterra e Italia el patrón es prácticamente el mismo. El marcador más repetido es el 1 – 1. En la English Premier League  (EPL) algo más del 30% de los partidos terminan con 1 o menos goles. Es decir, sin importar la evidente diferencias de calidad, el Fútbol Profesional Colombiano se comporta igual que la multimillonaria EPL.

Se concluye además, que si bien hay múltiples resultados posibles, ellos no ocurren con la misma frecuencia. De hecho, la probabilidad de ocurrencia de goles se puede aproximar a una distribución de Poisson.

La gráfica anterior ilustra el punto. Para ello generé una serie de datos utilizando la formula de Poisson. Estos datos simulados (lo que en la gráfica llamo predicción) los comparo con el número de goles efectivamente observados en el torneo colombiano. En la medida que las dos series coincidan, la conclusión sería que en Colombia también una distribución de Poisson sirve para ‘pronosticar’ los goles por partido. Esto último hay que matizarlo. Lo hago más adelante.

Como apunté antes, el ejercicio lo hago con 188 partidos. Lo ideal sería hacerlo con muchos más datos. En el caso europeo, por ejemplo, Anderson y Sally lo hicieron con con más de 32.000 partidos en 17 temporadas. En un futuro, a medida que recolecte más datos, el ejercicio se puede replicar. Pero por ahora la gráfica es bastante sugestiva: pareciera haber una importante correlación entre los goles pronosticados por la distribución de Poisson y los goles observados.

Ambas series muestran que hay una menor frecuencia de partidos con cero goles que aquellos con 1 gol. Igualmente, 2 goles en un partido son más frecuentes que los de uno o ninguno. A partir de ahí, se advierten algunas diferencias. La serie de goles observados revela que lo más común en Colombia es que un partido termine con 3 goles. La serie de predicción tiende a darle menos importancia a los partidos con 3 goles. En ambas, sin embargo, se hace evidente que  5 goles por partido son eventos muy raros.

Los datos de predicción y los observados en la gráfica de Anderson y Sally para el caso europeo cazaba mejor. Hay dos posibles explicaciones para esta discrepancia con el caso colombiano: (i) somos especiales y nuestro fútbol no se explica tan bien por la distribución de Poisson o (ii) simplemente se requieren más observaciones. Yo tiendo creer en la segunda. Intuyo que a medida que disponga de más datos, más acertada será la predicción.

Ahora, decía antes que hay que matizar aquello de la predicción. Efectivamente, incluso para el caso colombiano, la distribución de Poisson parece capaz de predecir con cierto grado de precisión los resultados que se obtendrán a lo largo del torneo. No utilizamos datos de calidad de los jugadores, esquemas tácticos, presión del momento, clima o cualquier otra variable que uno crea que puede afectar el resultado. Son resultados puramente estadísticos. La fortaleza es a la vez su debilidad. Sabemos que la mayoría de partidos van a terminar 1 – 1. El problema es que no sabemos cuál.

Es como la historia del marcador de Garrincha durante un partido en Bogotá. Antes del partido el entrenador fue claro: “maestro, a Garrincha se lo marca fácil. Siempre hace la misma jugada. Amaga para un lado, sale por el otro y centra”. Garrincha, crack él, hizo la fiesta durante el primer tiempo. En el descanso el entrenador enfadado gritó: “Todo el tiempo ha hecho la misma: ‘amaga y sale. ¿Cuál es el problema?'”. El jugador, entre angustiado y enfadado contestó: “Si profe. Todo el tiempo hace la misma. Amaga y sale ¡El problema es que usted no que me dijo cuándo!”

Más o menos lo mismo nos pasa con las predicciones basadas en la distribución de Poisson.

golyfutbol
comments powered by Disqus