El fútbol hoy: analítica y visualización de datos

Thumbnail

Tags: Expected Goals; Goles Esperados; Liga Águila; Fútbol Profesional Colombiano; Millonarios; Atlético Nacional; Santa Fe; Once Caldas; Junior; América de Cali

El big data ha transformado el mundo, el fútbol no puede ser menos. Los científicos de datos han explotado la riqueza de información procedente del mundo del balón para generar múltiples indicadores que permitan entender cada vez mejor el fútbol. Desde el trabajo pionero de Charles Reep en los años 50, Inglaterra ha ido siempre a la vanguardia. Allí se desarrollaron indicadores que hoy día son estándar en el análisis de la jornada. La métrica por excelencia hoy por hoy es los goles esperados o expected goals.

El modelo de goles esperados consiste en asignar estadísticamente una probabilidad de gol a toda oportunidad creada a favor o en contra durante un partido dado. En otras palabras, el método permite cuantificar la probabilidad de que cada disparo al arco sea gol o no. No es lo mismo un disparo desde el punto de penal, a rebote del arquero, que desde el lateral del área con apenas ángulo.

En www.golyfutbol.com hemos desarrollado el modelo de goles esperados para Colombia. Para cada partido de la Liga Águila se toman todos los disparos realizados, se aplica el modelo y se estima la probabilidad de que cada disparo termine en gol. Así, es posible establecer los goles esperados a favor y en contra de cada equipo. Estos datos se pueden agrupar por posición, por jugador o por equipo. Se puede analizar la evolución de un equipo o de un jugador.

Consideremos el caso del Once Caldas (Figura 1). Recordemos que el blanco blanco comenzó ganando arriba en la tabla durante las primeras jornadas del torneo. Como puede verse en el título de la gráfica, estamos ilustrando la diferencia de goles acumulados en lo que llevamos de temporada. Es decir, considerando todos los partidos jugados al 29 de marzo de 2018, se agrupan los goles esperados a favor y los goles esperados en contra. El indicador se compara con los goles observados a favor y en contra.

Figura 1. Goles esperados Once Caldas

Si la diferencia de goles observados a favor es mayor que la diferencia de goles esperados, estamos en capacidad de decir que el equipo está en una racha favorable que no se compadece con lo que se está viendo en el campo. Es el caso del Once Caldas. En la primera jornada marcó dos goles, uno de relativa baja probabilidad desde fuera del área, otro más fácil desde dentro del área. Pero la diferencia de goles esperados, daba para empate. El Caldas siguió cosechando buenos resultados, pero su evolución no era sostenible. La diferencia de goles esperados apenas llegó a más uno en su mejor momento. A la luz de este indicador, las cuatro derrotas consecutivas a la fecha de la gráfica no sorprenden dada la poca calidad de las oportunidades creadas respecto a las recibidas.

Por otro lado, la diferencia observada de goles esperados de Nacional llega a 7 (Figura 2). La esperada a algo más de cinco. Se observa que el verde antioqueño tuvo unos inicios complicados, pero poco a poco ha ido consolidándose. Su diferencia de gol observada está por encima de esperada, pero tienen tendencias paralelas ascendentes. Nacional es un líder sólido si bien está desempeñándose ligeramente por encima de lo que se espera de sus disparos.

Figura 2. Goles esperados Atlético Nacional

Consideremos ahora el caso de los finalistas de la Liga Águila 2017-2, Millonarios y Santa Fe. A la fecha ambos sufren para entrar entre los ocho. La Figura 3 muestra el caso de Millonarios. La diferencia de gol esperada tiende a estar por debajo de cero y además la línea de goles observados esté por debajo. Esto es reflejo de poble bajo desempeño a la fecha pero, eso sí, que Millonarios está desempeñándose peor de lo esperado. El problema es que aun desempeñándose como se espera, Millos tiende a perder los partidos.

Figura 3. Goles esperados Millonarios

Santa Fe (Figura 4) en una posición similar en la tabla, tiene una interesante diferencia con Millonarios. Su desempeño esperado (por encima de cero, tendencia creciente y por encima de la diferencia observada) indica que debería estar rindiendo más de lo que en la práctica muestran sus resultados.

Figura 4. Goles esperados Santa Fe

Junior, otro de los equipos importantes en la clasificación muestra una recuperación importante. Si bien empezó mal (Figura 5), siempre mostró una diferencia de goles esperados mayor a cero y poco a poco su desempeño en el campo ha mejorado acercándose a lo que las estadísticas indican que rendirán.

Figura 5. Goles esperados Atlético Junior

Buena parte del poder del indicador de goles esperados es que se puede presentar de diferentes maneras. La Figura 6 muestra la diferencia de goles acumuladas al 29 de marzo de 2018 para todos los equipos de la Liga Águila. El origen de la flecha indica los goles esperados según el modelo. La punta de la flecha señala los goles observados. Si la flecha apunta hacia la derecha (azul), indica que el equipo se está desempeñando mejor de los esperado. Que la flecha apunte hacia la izquierda (rojo) quiere decir que el equipo se está desempeñando peor de lo esperado. La longitud de la flecha, por supuesto, indica que tan bien o tan mal se está desempeñando un equipo.

Figura 6. Goles esperados fútbol profesional colombiano

Así, Nacional y Cali están desempeñándose un poco por encima de lo que se espera. Pero su indicador es sólido. Medellín, Patriotas, Bucaramanga, Envigado, Caldas y Pasto, en cambio, se están desempeñando muy por encima de lo que se espera de ellos. El indicador sugiere que son equipos que no están rindiendo estructuralmente bien, sino que las están metiendo todas (o por supuesto, sacando todas). Pero eventualmente, van a tender a mermar su rendimiento.

Otros como Tolima, América y Jaguares están rindiendo muy por debajo de lo esperado. En otras palabras, son equipos que van a terminar recuperándose un poco. Esto es especialmente cierto para Tolima porque su diferencia de goles esperadas es positiva, así que si llega a rendir como se espera, va a ganar partidos. Lo mismo no es necesariamente cierto para América y Jaguares.

Santa Fe, Junior y Equidad están rindiendo por debajo de lo esperado, pero sus valores son positivos. Como ya dijimos de Santa Fe y Junior, rindiendo lo esperado, van a ganar partidos. Alianza y Millonarios también están rindiendo por debajo de lo esperado, pero su nivel esperado apenas si bordea el empate.

La Figura 7 muestra la capacidad ofensiva de los equipos del torneo colombiano. Se compara en la gráfica el número promedio de disparos por partido con la probabilidad de que esos disparos terminen en gol. Volvamos al caso del Once Caldas. Realiza comparativamente pocos disparos por partido, pero su probabilidad estimada de que terminen en gol es alta. Ello lleva a que su rendimiento xG, diferencia de goles anotados vs esperados sea alta.

Figura 7. Goles esperados: rendimiento ofensivo

En contraste América dispara mucho y tiene una probabilidad alta de marcar. Pero la diferencia entre los goles anotados y los goles esperados es baja (color rojo). Así que el tamaño del punto que representa a los Diablos Rojos es chiquito, pues son pocos los goles que marcó.

Por último revisemos en la Figura 8 el componente defensivo. El Tolima recibe relativamente pocos disparos y la probabilidad de que se los marquen es relativamente baja. Pero el azul del punto que representa a los Pijaos indica que están recibiendo muchos goles que estadísticamente no deberían serlo. Eso confirma el análisis anterior del Tolima (Figura 6). Está rindiendo por debajo de lo esperado, y el origen de ello está en la parte defensiva. En cuanto logre estabilizarse, tal que los disparos que no deben ser gol no lo sean, el Tolima comenzará a repuntar en la tabla.

Figura 8. Goles esperados: rendimiento defensivo

La métrica de los goles esperados, generalmente denominados xG, es muy útil para el análisis detallado del rendimiento de los equipos. Permite entender mucho de lo que sucede en el campo, a través de la temporada y que no necesariamente es obvio para el espectador. No es un indicador para cambiar el fútbol. Sí es una forma de modernizar el análisis del fútbol en Colombia.

golyfutbol
comments powered by Disqus