Modelos de predicción

Cómo funciona nuestro modelo: Elo + Poisson explicado sin tecnicismos

TL;DR. Nuestro modelo de predicción de fútbol combina dos piezas: el sistema Elo mide cuánta fuerza tiene cada equipo (y la actualiza después de cada partido), y la distribución de Poisson convierte esa fuerza en goles esperados y, de ahí, en la probabilidad de cada resultado y de cada mercado (1X2, Over/Under, ambos marcan). Le añadimos parámetros de ataque/defensa, una corrección de Dixon-Coles para los resultados cortos y un anclaje al mercado para no inventar ventajas que no existen. Aquí te lo explicamos en lenguaje claro, con ejemplos, y siendo sinceros sobre lo que NO puede hacer.

Índice

  1. Qué problema resuelve un modelo de predicción de fútbol
  2. Pieza 1 — Elo: medir la fuerza de un equipo
  3. Pieza 2 — Poisson: repartir los goles
  4. Cómo encajan Elo y Poisson en BetsTalent
  5. Las correcciones que importan: ataque/defensa, Dixon-Coles y el anclaje al mercado
  6. De los goles esperados a las probabilidades de cada mercado
  7. Cómo sabemos si el modelo es bueno: calibración y backtest
  8. Qué NO puede hacer este modelo (lo importante)
  9. Cómo lo aplica BetsTalent en cada ficha
  10. Preguntas frecuentes

Qué problema resuelve un modelo de predicción de fútbol

Antes de un partido, todos tenemos una intuición: "el Madrid es mejor que el Getafe, debería ganar". El problema es que la intuición no se puede comparar con una cuota. La cuota de una casa de apuestas es un número frío que dice "este resultado tiene, según nosotros, esta probabilidad". Para tener una opinión propia que se pueda contrastar con ese número, necesitas tú también traducir tu intuición a probabilidades: 62 % el local, 23 % el empate, 15 % el visitante.

Ese es exactamente el trabajo de un modelo de predicción de fútbol: tomar datos objetivos (resultados pasados, goles a favor y en contra, dificultad de los rivales, campo) y devolver un número de probabilidad para cada desenlace posible. No para "adivinar" el marcador exacto —eso es imposible—, sino para estimar con qué frecuencia ocurriría cada resultado si ese mismo partido se jugara muchísimas veces.

La pregunta natural es: ¿cómo se pasa de "el Madrid es mejor" a "62 % de probabilidad de victoria"? Ahí entran nuestras dos piezas. Una mide cuánto mejor es cada equipo. La otra convierte esa diferencia de nivel en goles y, por tanto, en resultados. Vamos con la primera.


Pieza 1 — Elo: medir la fuerza de un equipo

De dónde viene el Elo

El sistema Elo nació en el ajedrez en los años 60 para clasificar a los jugadores con un único número. La idea es elegante: cada jugador tiene una puntuación; cuando dos se enfrentan, el resultado te dice si esa puntuación estaba bien calibrada. Si ganas a alguien mucho mejor que tú, subes mucho; si pierdes contra alguien peor, bajas mucho. Con el tiempo, las puntuaciones convergen hacia la fuerza real de cada uno.

El fútbol tomó prestada esa idea, y es una de las bases más sólidas para un modelo. ¿Por qué? Porque resuelve de un plumazo el mayor problema de las estadísticas de fútbol: el calendario no es justo.

El problema que resuelve: no todos los rivales valen lo mismo

Imagina dos equipos que llevan los mismos puntos. Uno los ha sumado contra los tres peores de la liga; el otro, contra los tres mejores. Una media de goles "a pelo" los trata igual. Es un error grave. El Elo, en cambio, pondera por la calidad del rival: ganar a un coloso suma mucho más que ganar a un colista.

En BetsTalent, esto es el corazón de nuestro motor: el Elo se ajusta por rival, de modo que un buen registro contra equipos fuertes vale más que un buen registro contra equipos flojos. Es lo que evita el espejismo del equipo "en racha" que en realidad solo ha jugado contra rivales asequibles.

Cómo se actualiza después de cada partido

La fórmula del Elo es sencilla de entender por su lógica, aunque tenga aritmética detrás:

  1. Antes del partido, comparas las puntuaciones de los dos equipos. La diferencia genera un resultado esperado (por ejemplo: "el local debería sacar, de media, 0,70 de un máximo de 1").
  2. Después del partido, comparas lo esperado con lo que pasó de verdad (1 si ganó, 0,5 si empató, 0 si perdió).
  3. Ajustas la puntuación según la sorpresa: si el resultado fue como se esperaba, el cambio es mínimo; si fue inesperado, el cambio es grande.

El tamaño de ese ajuste lo controla un parámetro llamado K. Un K alto hace que el modelo reaccione rápido a las novedades (útil tras un fichaje o un cambio de entrenador), pero también lo vuelve nervioso ante resultados puntuales. Un K bajo es estable pero lento. Calibrar bien K es parte del oficio.

A nuestro Elo le añadimos dos refinamientos habituales:

  • Ventaja de campo: jugar en casa suma un plus a la puntuación del local antes de calcular el resultado esperado. No es un detalle menor: en fútbol el factor campo es real y medible.
  • Margen de victoria (con cautela): ganar 4-0 dice más que ganar 1-0, pero hay que moderarlo para que una goleada anecdótica no distorsione la puntuación. Lo aplicamos con un tope.

Qué nos da el Elo y qué le falta

Al final de este proceso, cada equipo tiene una puntuación que resume su fuerza relativa ajustada por la dificultad de su calendario. Y de la diferencia entre dos puntuaciones sale directamente una probabilidad de victoria.

Pero hay un hueco. El Elo te dice quién es más probable que gane y por cuánto de margen, pero no te dice cuántos goles se marcarán en total ni con qué frecuencia "ambos equipos marcan". Y muchos de los mercados interesantes (Over/Under, BTTS) van precisamente de goles, no de ganadores. Para eso necesitamos la segunda pieza.


Pieza 2 — Poisson: repartir los goles

Por qué los goles siguen una pauta predecible

Los goles en el fútbol parecen caóticos, pero en realidad se comportan como un tipo concreto de fenómeno estadístico: eventos raros que ocurren a un ritmo medio durante un intervalo de tiempo. Igual que las llamadas que entran a una centralita por hora, o los coches que pasan por un peaje por minuto, los goles de un equipo en 90 minutos siguen aproximadamente la distribución de Poisson.

La distribución de Poisson tiene una sola entrada, que se llama lambda (λ): el número medio de goles que esperamos de un equipo en ese partido. Si le dices a Poisson "este equipo marca de media 1,5 goles contra este rival", te devuelve la probabilidad de que marque exactamente 0, exactamente 1, exactamente 2, exactamente 3, etc.

Un ejemplo con números

Supongamos que nuestro modelo calcula que, en un partido concreto:

  • El local marcará de media λ = 1,6 goles.
  • El visitante marcará de media λ = 1,1 goles.

Poisson convierte cada lambda en una tabla de probabilidades de goles. Para el local (λ = 1,6), aproximadamente:

Goles del localProbabilidad
020 %
132 %
226 %
314 %
4 o más8 %

Y otra tabla parecida para el visitante. El truco está en que, asumiendo que ambos marcadores son razonablemente independientes, multiplicamos las dos tablas para obtener la probabilidad de cada marcador exacto: 1-0, 2-1, 0-0, 1-1... Cada casilla de esa cuadrícula de marcadores tiene su probabilidad.

De la cuadrícula de marcadores a todo lo demás

Y aquí está la magia. Una vez tienes la probabilidad de cada marcador posible, cualquier mercado es solo una suma de casillas:

  • 1X2 (quién gana): suma todas las casillas donde el local marca más que el visitante (victoria local), las de empate y las de victoria visitante.
  • Over/Under 2.5: suma todas las casillas donde el total de goles es 3 o más (Over) frente a las de 0, 1 o 2 (Under).
  • Ambos equipos marcan (BTTS): suma todas las casillas donde los dos marcadores son 1 o más.

Por eso decimos que Poisson es tan potente: con una sola estructura —la cuadrícula de marcadores— alimentas todos los mercados a la vez, y todos quedan coherentes entre sí. No puede pasar que tu probabilidad de Over y tu probabilidad de 1X2 se contradigan, porque salen del mismo reparto.


Cómo encajan Elo y Poisson en BetsTalent

Ya tenemos las dos piezas. La pregunta clave es: ¿de dónde sale la lambda que le damos a Poisson? Aquí es donde el Elo y los datos de ataque/defensa se dan la mano.

El flujo de nuestro modelo, en orden, es este:

  1. Elo ajustado por rival estima la fuerza relativa de cada equipo y, con la ventaja de campo, una probabilidad de ganador y un margen esperado.
  2. Combinamos esa fuerza con los parámetros de ataque y defensa de cada equipo (cuántos goles genera y cuántos concede, también ajustados por la calidad de los rivales) para fijar las dos lambdas: la del local y la del visitante.
  3. Poisson + Dixon-Coles convierten esas lambdas en la cuadrícula de marcadores.
  4. De la cuadrícula salen las probabilidades de todos los mercados (1X2, Over/Under, BTTS).
  5. Anclamos al mercado las dimensiones donde sabemos que la casa tiene más información que nosotros (más sobre esto en un momento).
  6. Comparamos nuestras probabilidades con las cuotas para señalar dónde hay (o no hay) valor.

Dicho en una frase: el Elo decide quién es mejor; el ataque/defensa decide cuántos goles caben en ese duelo; Poisson reparte esos goles en resultados concretos. Cada pieza hace lo que mejor sabe hacer.


Las correcciones que importan: ataque/defensa, Dixon-Coles y el anclaje al mercado

Un Poisson "de manual" funciona, pero comete tres errores conocidos. Corregirlos es lo que separa un modelo de juguete de uno serio.

Ataque y defensa por separado (y ajustados por rival)

No basta con saber que un equipo "marca 1,5 de media". Importa contra quién y a quién enfrenta hoy. Por eso descomponemos cada equipo en una fuerza de ataque y una fuerza de defensa independientes, y las calibramos contra la calidad de los rivales (con la misma filosofía del Elo). La lambda del local de hoy sale de cruzar su ataque con la defensa del visitante, y viceversa. Así, un equipo con buen ataque pero mala defensa no se confunde con uno equilibrado que sume los mismos goles totales.

Para los equipos con pocos partidos (principio de temporada, ligas menores) aplicamos shrinkage: acercamos sus parámetros hacia la media de su liga hasta que acumulan muestra suficiente. Es la forma honesta de decir "todavía no tengo datos para fiarme de este equipo", y evita los famosos valores fantasma que aparecen cuando un modelo se cree a pies juntillas tres partidos sueltos.

Dixon-Coles: el ajuste de los resultados cortos

El Poisson puro asume que los goles del local y del visitante son independientes. En la práctica, en los partidos de pocos goles eso no se cumple del todo: resultados como el 0-0, 1-0, 0-1 y 1-1 ocurren con una frecuencia ligeramente distinta a la que predice la independencia pura (por dinámicas de partido: un equipo que se adelanta se cierra, etc.).

La corrección de Dixon-Coles es un retoque que ajusta exactamente esas cuatro casillas de marcadores bajos para que cuadren con la realidad observada. Es un detalle, pero importa mucho en mercados como el Under 2.5 o el "no marcan ambos", donde esos resultados pesan.

Anclaje al mercado: la humildad como parámetro

Esta es, probablemente, la decisión más importante de nuestro diseño y la que mejor refleja nuestra filosofía. El mercado de apuestas —el conjunto de todas las casas y todo el dinero que entra— es muy difícil de batir. Agrega muchísima información que un modelo de goles no ve: alineaciones de última hora, lesiones, motivación, rumores.

Por eso, en las dimensiones donde sabemos que el mercado suele tener razón, anclamos nuestra estimación al mercado en lugar de imponer la nuestra. En concreto, la supremacía (quién se espera que marque más) la fijamos a partir del 1X2 de la casa, no solo de nuestro Elo. ¿Por qué? Porque comprobamos que, cuando nuestro Elo discrepaba del mercado en quién era el favorito, esa discrepancia generaba valor falso: parecía una oportunidad y era simplemente un error nuestro.

El total de goles (la base del Over/Under) sí lo mantenemos nuestro, porque es donde nuestro modelo de ataque/defensa está mejor calibrado. La regla general es: confía en tu modelo donde lo tienes calibrado, y apóyate en el mercado donde el mercado sabe más. Un modelo que no se ancla a nada es un modelo que se cree más listo que miles de profesionales con más datos. Casi nunca lo es.


De los goles esperados a las probabilidades de cada mercado

Recapitulemos con el ejemplo de antes (local λ = 1,6, visitante λ = 1,1) para ver el resultado final. Tras pasar por Poisson, Dixon-Coles y el anclaje, una salida típica del modelo sería algo así:

MercadoProbabilidad del modelo
Victoria local (1)~46 %
Empate (X)~26 %
Victoria visitante (2)~28 %
Over 2.5 goles~52 %
Under 2.5 goles~48 %
Ambos marcan (BTTS sí)~55 %

Estos números son los que comparamos con las cuotas. Para hacerlo, primero traducimos la cuota a su probabilidad implícita (lo que la casa "cree" que va a pasar, con su margen incluido) y luego miramos la diferencia. Si nuestro modelo da más probabilidad a un resultado de la que sugiere la cuota, ahí podría haber valor; si da menos o igual, no lo hay.

Importante y honesto: que el modelo vea más probabilidad que el mercado no garantiza nada. El mercado lleva un margen (el vig) y suele estar muy bien informado. Una diferencia pequeña casi siempre es ruido nuestro, no una ventaja real. Por eso preferimos enseñar la probabilidad y el porqué, y dejar que tú decidas, antes que venderte un "pick ganador".

Si quieres profundizar en ese paso, lo explicamos en la guía Probabilidad implícita: cómo convertir cuotas en porcentaje y en Qué es el value betting (apuestas de valor).


Cómo sabemos si el modelo es bueno: calibración y backtest

Un modelo que escupe números bonitos no sirve de nada si esos números no se cumplen. Por eso lo medimos con dos criterios objetivos.

Calibración: ¿se cumplen las probabilidades?

Un modelo está bien calibrado si, de todas las veces que dice "55 % de probabilidad", el suceso ocurre aproximadamente el 55 % de las veces. Ni más (sería un modelo timorato) ni menos (sería un modelo sobreconfiado). La calibración no va de "acertar el resultado", sino de que los porcentajes signifiquen lo que dicen.

Para medirlo usamos métricas como el Brier score (cuánto se desvían las probabilidades de los resultados reales: cuanto más bajo, mejor) y comparamos siempre contra un baseline. Un modelo solo merece la pena si bate a la alternativa simple de "usar la media".

Backtest sin trampas

El error clásico al validar un modelo es el lookahead: probarlo con datos que en su momento no existían. Si calibras el Elo con la temporada completa y luego "predices" un partido de octubre, estás haciendo trampa, porque le has dado al modelo información del futuro.

Nuestro backtest recalcula las puntuaciones partido a partido, usando solo lo que se sabía antes de cada encuentro. Es más lento y da resultados más modestos, pero es el único honesto. Y los resultados, dichos sin maquillar, son matizados: nuestro modelo de goles está bien calibrado (las probabilidades se cumplen), pero eso no significa que batamos sistemáticamente al mercado. En 1X2 el mercado suele ser igual de bueno o mejor; nuestra mejor calibración relativa está en los totales de goles. Esa es la verdad, y preferimos contarla.

Puedes ver el detalle en la guía Calibración, Brier y backtest: cómo evaluar un modelo de predicción.


Qué NO puede hacer este modelo (lo importante)

Tan importante como explicar lo que hace el modelo es ser claro con lo que no hace. Esto no es letra pequeña: es el núcleo de cómo entendemos los datos.

  • No adivina el marcador. Da probabilidades de marcadores, no certezas. El 0-0 más improbable a veces sale.
  • No conoce el contexto de última hora salvo lo que ya esté en la cuota (anclaje): alineaciones, lesiones de mañana, un mercado interno, la motivación de un partido intrascendente.
  • No bate al mercado de forma sistemática. El mercado de apuestas es, en general, eficiente: la cuota ya incorpora casi toda la información disponible. Encontrar valor real y sostenido es muy difícil, y cualquiera que te prometa lo contrario te está vendiendo humo.
  • No es una máquina de ganar dinero. Es una herramienta para que decidas con más criterio, comparando tu probabilidad con la cuota. Decidir bien reduce errores; no garantiza beneficios.
  • Tiene ruido. Con muestras pequeñas (un equipo recién ascendido, una liga menor), las estimaciones son frágiles, y por eso aplicamos shrinkage y avisamos cuando la muestra es corta.

Si lees una web de pronósticos que solo te muestra "el acierto" y nunca los fallos ni el contexto, desconfía. Un modelo serio enseña sus límites.


Cómo lo aplica BetsTalent en cada ficha

Todo lo anterior no se queda en teoría. En cada ficha de partido de BetsTalent verás el resultado de este modelo aplicado:

  • La probabilidad del modelo para el 1X2, el Over/Under y el BTTS, junto a la cuota del mercado, para que compares de un vistazo.
  • El razonamiento estadístico del partido (fuerza relativa por Elo, goles esperados, factores de ataque/defensa) explicado en prosa.
  • En tenis, el mismo enfoque adaptado: Elo por superficie (la superficie cambia radicalmente la fuerza de un jugador), con la superficie inferida por sede cuando hace falta.
  • En baloncesto y balonmano, el motor propio ajustado a las particularidades de cada deporte.

Puedes explorarlo en los pronósticos de fútbol, en la sección de estadísticas filtrables y, cuando esté pública, en la página de rendimiento del modelo, donde mostramos la calibración real sin filtros. Si quieres seguir aprendiendo, el siguiente paso natural es la guía pilar de qué es el value betting y la de estadística avanzada para apostar (xG y más).


Preguntas frecuentes

¿Qué es el sistema Elo en el fútbol?

El Elo es un método para puntuar la fuerza de cada equipo con un solo número que se actualiza después de cada partido. Su gran ventaja es que pondera por la calidad del rival: ganar a un equipo fuerte suma más puntos que ganar a uno débil. Así corrige el problema de que no todos los calendarios son igual de difíciles, algo que las medias de goles "a pelo" no tienen en cuenta.

¿Cómo predice goles el modelo de Poisson?

La distribución de Poisson toma el número medio de goles que se espera de un equipo (la lambda) y devuelve la probabilidad de que marque exactamente 0, 1, 2, 3 o más goles. Cruzando las tablas del local y del visitante se obtiene la probabilidad de cada marcador posible, y de ahí, sumando casillas, la probabilidad de cualquier mercado: quién gana, Over/Under y ambos marcan.

¿Por qué combinar Elo y Poisson en lugar de usar solo uno?

Porque hacen cosas distintas y complementarias. El Elo mide quién es más fuerte y por cuánto margen, pero no dice cuántos goles caerán. Poisson reparte los goles en marcadores concretos, pero necesita que alguien le diga cuántos goles esperar. Juntos —Elo y ataque/defensa para fijar los goles esperados, Poisson para repartirlos— cubren todo el cuadro de mercados de forma coherente.

¿Este modelo garantiza ganar en las apuestas?

No, y nadie puede garantizarlo de forma honesta. El mercado de apuestas es muy eficiente: la cuota ya incorpora casi toda la información disponible, e incluye un margen a favor de la casa. Nuestro modelo está bien calibrado (sus probabilidades se cumplen), pero eso no equivale a batir sistemáticamente al mercado. Es una herramienta para decidir con más criterio, no una fórmula para ganar dinero.

¿Qué es la corrección de Dixon-Coles y por qué la usáis?

El Poisson puro asume que los goles del local y del visitante son independientes, pero en los partidos de pocos goles los resultados cortos (0-0, 1-0, 0-1, 1-1) no se reparten exactamente así. Dixon-Coles es un ajuste que corrige esas cuatro casillas para que coincidan con lo observado en la realidad. Mejora sobre todo la precisión en mercados como el Under 2.5 o el "no marcan ambos".



Sigue aprendiendo en el cluster de modelos: