La estadística es un ámbito cada vez más esencial en la vida. Todo lo que nos rodea es medido y cuantificado con el objetivo de interpretar de la mejor forma posible nuestro entorno y, actuar en consecuencia. En la mayoría de los campos de investigación se necesita recopilar datos estadísticos, estos datos se hacen cada vez más necesarios, ya que ayudarán a evaluar la tendencia futura de un fenómeno determinado y la interpretación adecuada de estos, puede ayudar al analista a tomar las mejores decisiones en el momento preciso.
Lo que ha ocurrido en el pasado puede ayudarnos a predecir lo que puede pasar en el futuro de una manera más o menos fiable, y en este sentido los datos juegan un papel fundamental. Obtener los mejores datos implica obtener los mejores resultados.
Cada vez se disponen de más datos sea cual sea la disciplina en que se desee desarrollar un estudio, los datos son cada vez más necesarios en cualquier investigación, por eso existe un interés especial de recopilar, almacenar o coleccionar grandes volúmenes de datos, esto es lo que se conoce como "Big Data"1 (Datos a gran escala).
El fútbol (el deporte más mediático del mundo y el que más recursos económico genera) es un ejemplo muy claro de ello. Tanto analistas, periodistas, como aficionados contemplan tras cada partido las cifras de cada jugador y de cada equipo, con el objetivo de interpretar lo mejor posible el encuentro y determinar cuáles han sido los puntos fuertes y débiles y así poder ser mejorado, por ello, son cada vez más los entrenadores de equipos de primer nivel quien se apoyan en estas estadísticas.
Las anotaciones de todo lo que acontece en un terreno de juego se está volviendo en casi una obsesión para muchos entrenadores y técnicos, recopilar toda la información posible en un partido de fútbol es casi una obligación para cualquier entrenador de primera línea mundial, muchos de ellos se apoyan en un cuerpo técnico que les ayuda en esta tarea tan importante y que ayudará a corregir sus decisiones tácticas. Esta información se transmite a los jugadores y ellos mismos pueden conocer una información que puede resultar valiosa para mejorar el rendimiento individual y del equipo.
Pero, ¿cómo se miden todas esas estadísticas del fútbol? ¿Cómo es posible generar datos tan precisos sobre jugadores individuales y del equipo? La respuesta la tiene una compañía llamada Stats.
2
El sistema de esta compañía consta de un conjunto de nueve cámaras. Tres de ellas situadas a pie de campo y destinadas a cubrir el centro del terreno de juego y las dos áreas de los equipos. Las otras seis están situadas en zonas más elevadas alrededor del campo con el objetivo de apoyar las imágenes capturadas por las tres primeras. Todas ellas graban las imágenes a una alta definición y velocidad (unos 60 FPS), lo que permite capturar con todo lujo de detalles lo que ocurre en el terreno de juego.
Las imágenes capturadas por este conjunto de nueve cámaras son, más tarde, procesadas por una unidad central que es capaz de interpretar la imagen mediante la triangulación de esta. Mediante la tecnología player tracking, el sistema reconoce todos los jugadores del campo y sus dorsales, así como el balón en movimiento.
Esto le permite crear una especie de mapa 3D en tiempo real, a partir del cual se realizan medidas de todas las variables de interés de los jugadores: tiempos con el balón, número de pases, zonas en las que ha poseído el balón, zonas en las que se ha posicionado, kilómetros recorridos por cada jugador, etc. Y, gracias a estas mediciones, después también es posible realizar estudios más globales de los equipos, como los tiros a puerta totales, la posesión de balón, los mapas de calor y otras variables de interés.
Este sistema, aunque no es perfecto, arroja un escaso margen de error del 3%, una cifra que, considerando el gran número de variables de cada partido de fútbol, es realmente baja y aceptable.
Este sistema desarrollado por Stats es el empleado por la UEFA en sus competiciones, pero hay muchos otros sistemas similares empleados en otros deportes como la NBA, el tenis, etc... donde la obtención de estos datos y la correcta interpretación de los mismos es esencial para mejorar el nivel en las competiciones deportivas actuales.
La existencia hoy en día de multitud de datos estadísticos en cualquier partido de primer nivel, resultaría muy interesante para construir modelos econométricos específicos que ayudarían a determinar qué variables pueden influir en la probabilidad de ganar un partido de fútbol.
Estas variables pueden ser seleccionadas de los partidos de los equipos de primera división, lo que ahora se llama “la liga Santander”, nombre del patrocinador. Los datos de estas variables pueden ser recogidas de las revistas y periódicos deportivos más importantes del país en sus versiones digitales y otras fuentes privadas, correspondientes a cada jornada del campeonato nacional de Liga.
Para este análisis puede resultar útil la aplicación de modelos de respuesta dicotómica en el que la variable dependiente es cualitativa, (los modelos que tienen una variable dependiente con estas características son los Modelos de elección discreta y los que pueden resultar de mayor interés, podrían ser los Modelos Logit y Probit).
Para trabajar con estos modelos, se considera que la variable principal objeto de estudio es una variable dependiente dicotómica, variable que se crea artificialmente por el analista y que toma dos valores: se asigna el valor 1 si el equipo gana el partido y 0 en caso contrario.
Como variables explicativas que podrían considerarse a priori relevantes para estudiar la variación que experimenta la probabilidad de ganar un partido de fútbol, pueden ser:
- Porcentaje de posesión de balón por partido
- Número de goles a favor por partido
- Número de goles en contra por partido
- Número de disparos por equipo fuera de los tres palos por partido
- Número de disparos a portería dentro de los tres palos por equipo
- Porcentaje de disparos a portería por equipo
- Número de centros al área contraria por equipo
- Número de pases por equipo con éxito
- Porcentaje de victorias en casa
- Porcentaje de victorias fuera de casa
- Porcentaje de empates.
- Número de saques de esquina por partido.
- Número de jugadores considerados "Cracks" según ranking FIFA y la revista "France Football" (publicación creadora del balón de oro)3.
En un intento de identificar algunas de estas variables explicativas que puedan influir en el éxito de ganar un partido de fútbol, se ha consultado: “Análisis de las acciones a balón parado en el fútbol de alto rendimiento: saques de esquina y tiros libres indirectos4 de Maneiro 2014.”
Según la investigación de Maneiro, las conclusiones más relevantes de ambas acciones a nivel probabilístico, se pueden resumir en las siguientes:
- La eficacia de este tipo de acciones: ABP (Acciones a balón parado) es muy limitada, ya que se necesitan 4 saques de esquina y 5 tiros libres indirectos para que se produzca un remate: 10 y 11 respectivamente para que se produzca un remate entre los tres palos; y 50 saques de esquina y 36 tiros libres indirectos para que se produzca un gol.
- A pesar de ser acciones de eficacia muy reducida, se revelan como transcendentes en el desenlace de los partidos. El 76% y el 64% de los goles que proceden de saques de esquina y de tiros libres indirectos han dado la victoria o sumado puntos para los equipos.
A pesar de todo, hay que tener en cuenta un factor importante, y es que las predicciones tanto en el deporte como en la economía, pueden resultar tanto efectivas como desatinadas. No existe ninguna garantía de que por ejemplo las predicciones que se hagan sobre el comportamiento del precio del dólar o para determinar el campeón de Europa sean acertadas. Creer o no depende de cada quien, aunque la metodología utilizada para realizar predicciones puede arrojar un mayor o menor grado de confianza.5
Un ejemplo de estos desaciertos predictivos según publica este artículo, está en el Banco UBS6, en un intento de predecir qué selección iba a levantar la copa del mundo en el Mundial de Sudáfrica de 2010, el banco se basó en tres pilares para realizar este estudio: Las actuaciones en los pasados mundiales de las selecciones que participaban en la fase final de la copa del mundo, la localización donde se celebra el campeonato y una medición cuantitativa sobre cada uno de los equipos tres meses antes de comenzar el torneo.
Para la edición de la Copa del mundo en Sudáfrica, las previsiones del UBS aseguraban que Brasil conquistaría su sexto título mundial con una probabilidad del 22%.
El segundo equipo con más opciones de ganar en Sudáfrica según las mediciones de UBS era la selección alemana con un 18%, Italia un 13%, Holanda 8% y Francia con un 6% completaban los cinco primeros equipos.
De acuerdo con las mediciones del UBS, los semifinalistas serían: Brasil (49%), Alemania (38%), Holanda (34%) e Italia (32%), aunque las selecciones que lograron finalmente el pase a semifinales fueron: Uruguay, Holanda, Alemania y España, un 50% de acierto final según la Sociedad.
Según algunos especialistas España e Inglaterra que podrían dar la sorpresa en este campeonato, no estaban en los primeros lugares según las mediciones de UBS. Finalmente, fue la selección Española la ganadora del campeonato del mundo en Sudáfrica 2010.
Según el informe posterior de UBS, España no logró pasar de cuartos de final en las tres últimas ediciones de la copa del mundo.
Sin embargo, en el mundial de Alemania de 2006, las predicciones realizadas por UBS fueron más acertadas, el banco pronosticó que la selección Italiana se proclamaría campeona del mundo, y así fue tras vencer en la tanda de penas máximas ("penaltis") a Francia. Además el modelo utilizado predijo de manera satisfactoria a la mitad de los semifinalistas, el 75% de los equipos clasificados a cuartos de final y el 81% de las selecciones que pasaron a la segunda ronda.
La mayor complicación en realizar pronósticos mundialistas es predecir cuáles de las 32 selecciones pasarían la fase de grupos, aunque los cabezas de serie de cada uno de los 8 grupos son los favoritos, el fútbol siempre tiene sorpresas y equipos que decepcionan, la selección francesa campeona en Francia 1998, quedó eliminada en la primera ronda en el Mundial de Corea y Japón de 2002 sin marcar un solo gol.
Igual ocurrió con la selección española, ganadora del campeonato mundial en Sudáfrica 2010, cayó en la fase de grupos en el mundial de Brasil 2014, tras ganar sólo un partido de los tres jugados, cuando las principales casas de apuestas la situaban como la segunda favorita para revalidar el título mundial por delante de Argentina, Alemania y Brasil y detrás de Bélgica. España venía de ganar la segunda Eurocopa consecutiva en 2014 y partía como una de las favoritas indiscutibles.
Aunque las predicciones realizadas por el UBS en el mundial de Alemania de 2006 estuvieron cerca de la perfección, el Banco explica que su método no es infalible.
Ha fallado también en otras ocasiones, como en la Eurocopa de 2008 pronosticando que sería la República Checa la que conquistaría el campeonato y sin embargo no superó la fase de grupos y además no atinó a ninguna de las cuatro selecciones que disputaron las semifinales. Fue finalmente España quien conquistó su segunda Eurocopa 44 años después.
"La moraleja de esta historia es que hay que ser humilde sobre los poderes de predicción de un modelo. Unos pronósticos acertados dependen tanto de la suerte como de la capacidad, que es una lección que frecuentemente se olvida cuando se intenta cuantificar el futuro", explica UBS en su informe.7
El fútbol, al igual que cualquier otro deporte está lleno de situaciones incontrolables y el factor residual en la modelización de un estudio cuantitativo es grande y esto es una de las mayores similitudes entre la Economía y el deporte, por más preciso que sea el modelo predictivo, puede ocurrir algo que lo cambie todo.
1. Big Data es la gestión y análisis de enormes volúmenes de datos que no pueden ser tratados de manera convencional, ya que superan los límites y capacidades de las herramientas de software habitualmente utilizadas para la captura, gestión y procesamiento de datos.
El objetivo de Big Data, al igual que los sistemas analíticos convencionales, es convertir el Dato en información que facilite la toma de decisiones, incluso en tiempo real. Sin embargo, más que una cuestión de tamaño, es una oportunidad de negocio. Las empresas ya están utilizando Big Data para entender el perfil, las necesidades y el sentir de sus clientes respecto a los productos y/o servicios vendidos. Esto adquiere especial relevancia ya que permite adecuar la forma en la que interactúa la empresa con sus clientes y en cómo les prestan servicio.
No obstante, el asociar el concepto Big Data a grandes volúmenes de datos no es nuevo. La gran mayoría de las empresas ya llevan mucho tiempo manejando grandes volúmenes de datos y han desarrollado DataWarehouses y potentes herramientas analíticas que les permiten tratar de forma adecuada esos grandes volúmenes. La evolución de la tecnología y los menores costes del almacenamiento han hecho que los volúmenes manejados por estas aplicaciones hayan aumentado de manera muy importante.
elEconomista.es. Jueves, 27 de Febrero de 2014
2. Stats es la empresa de tecnología, información y contenido de deportes líder en el mundo. Proporciona contenido de deportes de última generación y están continuamente a la vanguardia en el sector de la tecnología del deporte.
Stats proporciona información de más de 600 ligas de todo el mundo; para ello utiliza los métodos tecnológicamente más avanzados y disponibles en la actualidad a fin de respaldar una experiencia de contenido de deportes óptima.
Las fuentes de distribución de datos predictivos de Stats proporcionan información sobre las probabilidades para los resultados de un partido.
Xinfo de Stats ofrece información completa sobre los eventos estadísticos que no se capturan mediante la recolección tradicional de datos. Stats integra estos datos con la información tradicional jugada a jugada para crear contenido exclusivo e información sobre los eventos estadísticos no capturados mediante los métodos de recopilación de datos tradicionales.
www.stats.com
3. Según la reseña del libro: Economics, Uncertainty and European Football. By Loek Groot, Edward Elgar Publishing (2008), 169 pp. Reviewed by Arne Feddersen. University of Hamburg, Germany, Department of Economics.
En el cuarto capítulo se establece la conclusión, de que la probabilidad de ganar un partido un equipo de fútbol, aumenta cuando este realiza una alta inversión en el talento.
Además Groot ofrece una serie de ideas interesantes sobre los efectos de tres posibles determinantes del equilibrio competitivo: el número de promedio de goles por partido, la ventaja de ser equipo local y el papel del árbitro.
4. de Rubén Maneiro Dios, Universidad de A Coruña. Fecha publicación 2014.
5. Cuando la Economía juega con el balón. Nelson Doria Arcila. Portafolio (May 8, 2010)
6. UBS SA es una sociedad global de servicios financieros con sede en las ciudades de Basilea y Zúrich, en Suiza. Es un Banco privado y de inversión y sus actividades principales consisten en la gestión de riquezas, la gestión de activos y la banca de inversión. Estos servicios se ofrecen tanto a nivel internacional a clientes privados, corporativos e institucionales.
La Sociedad bancaria suiza está considerada como uno de los mayores bancos del mundo en la gestión de riquezas privadas con 2.7 billones de activos invertidos.
7. Cuando la Economía juega con el balón. Nelson Doria Arcila. Portafolio (May 8, 2010)