El fútbol hoy: analítica y visualización de datos

Thumbnail

Tags: Fútbol Profesional Colombiano; Liga Águila 2019-1; Cuadrangulares Finales; Modelo de Goles Esperados; xG; Millonarios; Deportivo Cali; Deportes Tolima; América de Cali; Atlético Nacional; Deportivo Pasto; Unión Magdalena

El campeón de la Liga Águila del primer semestre del 2019 está entre Millonarios, Cali, Tolima, América, Nacional, Pasto, Junior y Unión Magdalena quienes, tras finalizar la temporada regular, clasificaron en este orden a los cuadrangulares finales. El peculiar (por no decir desastroso) sistema del torneo colombiano hace que los 9 puntos de diferencia entre Millonarios y Unión no sirvan para nada. Así que una forma de ver cómo llegan, e intentar intuir qué va a pasar, es revisando los detallados datos del Modelo de Goles Esperados (xG).

El modelo de goles esperados es un modelo estadístico que permite establecer la probabilidad de que un disparo sea gol. El modelo que manejo para el caso colombiano tiene a la fecha 14.980 disparos. La probabilidad de que un disparo sea gol depende de la distancia y el ángulo, además de otras variables relevantes como pueden ser el tipo de disparo (fuerte, suave), circunstancia (rebote, pase), contragolpe, entre otras variables. Con base en los resultados de la estimación se le puede asignar a cada disparo una probabilidad de que sea gol basado en los casi 15.000 disparos de la base de datos.

Así, se pueden tomar todos los disparos de un equipo durante un partido, calcularle a cada uno la probabilidad de que sea gol, y sumarlos para encontrar los goles esperados del equipo en ese partido. Dado que se maneja una base de datos tan amplia, si el equipo en cuestión marcó más goles de los goles esperados por el modelo estadístico, es que sus jugadores fueron más eficientes (al menos en ese partido), que el promedio de futbolistas del torneo colombiano. Si marcaron menos goles de los goles esperados, quiere decir que fueron poco productivos en relación a la historia del fútbol colombiano (al menos a la historia de los 15.000 disparos que a la fecha comprenden los torneos del primer y segundo semestre de 2018, además del primero de 2019). Cabe destacar que el modelo no considera goles de penal, ni autogoles. El penal es una suerte aparte. Los autogoles son circunstancias del partido que no indican necesariamente la habilidad del disparo, sino la mala suerte del rival.

El resultado se puede presentar aún más agregado: Sumar los goles esperados del semestre y comparar con los goles anotados durante el primer semestre. Se puede realizar la comparación para todos los equipos. La Figura 1 hace precisamente eso para la fase regular de todos contra todos. Puesto que en el eje vertical se presentan los goles anotados, y en el horizontal los goles esperados, quiere decir que si un equipo está por encima, es que anotó más goles de los esperados. Este es el caso del Pasto, Unión Magdalena, Junior, América, Nacional, Millos y Tolima. Cali es el único equipo de los clasificados que anotó menos goles de los esperados. Tolima y Millonarios son los equipos que debieron anotar más goles (mayor gol esperado): 22,5 y 22,12 respectivamente. En la práctica anotaron 24 y 26, es decir están operando ofensivamente muy bien.

Figura 1. Goles Esperados vs Goles Anotados. Fase Regular

Pasto clasificó anotando apenas 15 goles, cifra algo superior a los 13,4 goles esperados que debió anotar. Los dos equipos costeños, Unión y Junior, son los equipos que más goles marcaron respecto a los goles esperados: 4,17 y 4,11 goles de más sobre lo esperado celebraron.

Por supuesto el fútbol no es sólo ataque (aunque sí es lo más divertido). Si los disparos de un equipo indican cuántos goles debió anotar, también indican cuántos goles debió recibir el rival. Es decir, es posible sumar los disparos recibidos por un equipo y calcular cuántos goles debió recibir, o los goles esperados en contra. La Figura 2 muestra en el eje vertical los goles en contra que recibió un equipo. Y en el eje horizontal los goles esperados. Si está por encima de la línea punteada de 45º es que el equipo recibió más goles de los esperados. Esa zona la ocupan varios de los equipos eliminados. Pasto y Unión Magdalena está tangencialmente por encima. En el caso del Pasto es evidente (dada la Figura 1), que si anotó pocos goles, debía recibir poco. De ahí que no sorprenda que sea el equipo que menos goles esperados en contra recibió y también el que menos goles efectivos recibió, apenas 12.

Figura 2. Goles Esperados vs Goles Reciidos. Fase Regular

Además de Pasto, Tolima con 16,9 y Cali con 17,6 goles esperados en contra son los equipos que menos goles reciben. El Tolima, sobresaliente en este rubro, también lo es en el rubro de ataque. En eso comparte méritos con Millonarios (que recibió 17,8 goles esperados en contra). Conjugando ambas variables los azules de Bogotá y el vino tinto parecen los equipos más sólidos del rentado.

El análisis anterior determina como fue el comportamiento agregado de los equipos durante las 20 jornadas. Unos fueron fuertes atacando, otros defendiendo, e incluso los hay que destacaron en ambas facetas. En ese sentido, son los favoritos. La riqueza del modelo de goles esperados es que se pueden presentar los datos de forma diferentes. Así, analizando la evolución partido a partido es posible revisar cómo llegan los equipos a la instancia decisiva.

La Figura 3 presenta la evolución partido a partido y acumulada de la diferencia de goles y goles esperados para Millonarios, que acabó líder durante la fase regular. En otras palabras, se toman los goles anotados y se restan los goles esperados. Las áreas azules son la evolución partido a partido. Su referencia es el eje vertical izquierdo. La línea punteada es la diferencia entre goles anotados y esperados acumulada a lo largo de la temporada. Es decir, si en el primer partido la diferencia de goles anotados vs esperados fue de 0,3, y en la segunda fecha fue de -0,4, quiere decir que el acumulado a la segunda fecha tal diferencia es de -0,1. La referencia es el eje derecho donde se observa que, efectivamente en la segunda fecha, el acumulado de Millonarios era ligeramente negativo.

Figura 3. Diferencia de goles esperados: Millonarios. Fase Regular

En el caso de Millonarios, se observa que el equipo logró mantener una diferencia acumulada (línea a puntos, referencia eje derecho) sostenida desde la fecha 12. Sin embargo, desde la fecha 15 Millonarios presenta oscilaciones fuertse partido a partido (áreas azules, referencia eje izquierdo), que ha ido tendiendo a cero en las últimas dos jornadas. Dado que Millos estaba clasificado, quizás en este caso tenga mayor sentido mirar el acumulado.

La Figura 4 muestra que los goles esperados del Cali han sido negativos desde la primera fecha. Y empeoró en la segunda mitad del torneo. A pesar de tener a uno de los goleadores del torneo, Dinenno, debe preocuparles a los verdes del Valle que definen por debajo de las oportunidades que crean.

Figura 4. Diferencia de goles esperados: Deportivo Cali. Fase Regular

La Figura 5 muestra los mismos indicadores para el Tolima, que terminó de tercero en la temporada regular. Su gráfica se parece más a la de Millos que a la del Cali. Sus goles esperados están sistemáticamente por encima de cero durante prácticamente todo el torneo lo que sugiere que es un equipo que define por encima de la media.

Figura 5. Diferencia de goles esperados: Deportes Tolima. Fase Regular

Cuarto en la temporada regular fue el América, cuya gráfica se presenta en la Figura 6. En la fecha 9, tras derrotar al Caldas 3-1, la diferencia acumulada de goles anotados menos goles esperados (línea a puntos, referencia eje derecho) se disparó. Pero desde entonces América se desinfló hasta prácticamente el final. En los últimos 2 partidos el América logro revertir la tendencia a la baja de la diferencia acumulada a lo largo del torneo y termina claramente al alza. Quizás sea coincidencia que el Pecoso no esté ya dirigiendo a los rojos. Pero es evidente cierta mejoría en la producción ofensiva.

Figura 6. Diferencia de goles esperados: América de Cali. Fase Regular

De la Figura 7 a la Figura 10, se ilustran los casos de los otros cuatro clasificados (Nacional, Pasto, Junior y Unión Magdalena) para que el lector interesado realice su propio análisis.

Figura 7. Diferencia de goles esperados: Atlético Nacional. Fase Regular
Figura 8. Diferencia de goles esperados: Deportivo Pasto. Fase Regular
Figura 9. Diferencia de goles esperados: Junior. Fase Regular
Figura 10. Diferencia de goles esperados: Unión Magdalena. Fase Regular

Un grupo, el A, recordemos, está conformado por Millonarios, América, Pasto y Unión Magdalena. El otro está conformado por Cali, Tolima, Nacional y Junior. En el A, los favoritos a priori son Millos y América. Pero como se observa en la Figura 8 y Figura 10, tanto Pasto como Unión Magdalena llegan al alza. En el B, todos históricos, pero el menos ganador, Tolima, parece el más fuerte. Junior viene en caída su diferencia de goles acumulada (Figura 9), Nacional está en diferencia de goles de ceros (Figura 7), y Cali está en negativo (Figura 4). Quizás el grupo de la muerte sea el A, no el B. El fútbol definirá a la larga los mejores de cada grupo.

Nota final: El modelo de goles esperados se basa en datos de Opta. A la fecha, Opta tuvo problema con la generación de datos en tres partidos de la última fecha razón por la cual no están incluidos: Alianza Petrolera vs Patriotas Boyacá; Deportivo Cali vs Envigado; Cúcuta vs Junior.

golyfutbol
comments powered by Disqus