Radiografía Quinielística 2021-2022

Compartir

Finalizada la temporada queremos hacer una radiografía de la misma, con el objetivo de analizar diferentes cuestiones que os puedan a ayudar a tener una perspectiva de cómo ha sido la temporada 2021-2022.

Disclaimer: No importa si no entiendes algunas fórmulas, no son imprescindibles para entender los distintos conceptos que hablaremos en el post.

Empezamos por lo básico

Para calcular las rentabilidades de las columnas y partidos de cada jornada, se necesita de una variable objetiva, que calcule el valor esperado positivo(EV +) y así poder calcular la probabilidad real de cada evento.

En Q84, esta probabilidad real, la obtenemos de las cuotas de las casas de apuestas para así poder compararlo con los datos de los quinielistas y obtener valor de ello.

Piensa que a largo plazo la probabilidad  obtenida a partir de las cuotas de las casas de apuestas es altamente eficiente. Todo lo contrario ocurre con las frecuencias apostadas por los quinielistas que no son un buen reflejo de la realidad.

Los quinielistas suelen ofrecer valoraciones sesgadas, que en esencia es lo que hace la quiniela una inversión rentable a largo plazo.

Tabla con las 58 jornadas de toda la temporada:

Como puedes ver en la tabla, tenemos una serie de variables que he considerado importantes para que puedas entender lo que queremos explicar.

Por un lado, tenemos la parte más sencilla, que es la recaudación, los acertantes de 14 y su premio correspondiente y por otro lado las variables de “EM” y “Posición 14T”

-> La EM (sin pleno al 15) es la rentabilidad que tiene la columna ganadora estimada con los % aportados por los quinielistas. Es decir, todo lo que la columna recupera a largo plazo, en todas las categorías de premio (excepto pleno al 15).

Por tanto, siempre que “EM” sea superior a 1, la columna es rentable. 

Sin embargo no es un valor absoluto, ya que como no tenemos en cuenta el pleno al 15, un número ligeramente inferior a 1 también se podría considerar una cifra rentable.

-> Posición 14T, es la posición que ocupa la columna ganadora si tomamos la probabilidad real de las casas de apuestas y ordenamos los millones de posibles columnas de más a menos probable, por lo que, cuanto menor sea la posición más fácil es la columna ganadora.

¿Qué conclusiones podemos sacar?

Básicamente, las mejores jornadas son aquellas que tienen un EM superior al 0,75 y la posición 14T  está dentro de las 500.000 más probables.

En este caso y viendo la tabla expuesta, las mejores jornadas serían la 3 y la 51, cumpliendo holgadamente ambos requisitos.

Por cierto, la jornada tres, sólo tuvo un único acertante y fuimos nosotros, Q84 🙂

Sin embargo, han habido otras jornadas con una rentabilidad más moderada, como fueron la jornada 4, la 18 y la 47, dónde los premios fueron atractivos, mientras que otras han sido muy rentables (J12,J20 y J28) pero muy poco atractivas debido a los bajos premios.

En conclusión, la temporada 2021-2022 tuvo pocas jornadas con valor esperado positivo, donde muchas columnas estaban en zonas de muy baja probabilidad (por encima de las 500.000 más probables) donde es complicado obtener beneficio y en ocasiones, ni siquiera los arrastres suelen compensar.

Rentabilidad Esperada vs Rentabilidad Final

Antes de iniciar una jornada se puede calcular la rentabilidad “media” esperada de la misma (E.R) y compararla con la rentabilidad final (EM) una vez terminada la jornada.

Esto puede producir la falsa sensación de que, algunas jornadas futuras pueden ser muy rentables y por tanto, siguiendo la formula (Mayor EV + = Mayor apuesta) sería interesante apostar más

Sin embargo, esto no es tan sencillo

Después de analizar distintos escenarios, con distintos análisis estadísticos y agrupaciones por algoritmos clúster, llegamos a la conclusión de que existe una baja correlación entre la rentabilidad esperada y la rentabilidad final.

En esta gráfica de nubes de puntos de las jornadas de la temporada 21/22, no existe correlación entre ambas variables, de hecho para empezar a encontrar algún patrón fiable, se tendrían que aplicar unas cálculos que se excede del objetivo de este artículo.

¿Quieres saber más? Sigue leyendo

Una vez ya hemos conocido lo básico, ahora queremos entrar más en detalle con dos conceptos:

  • Eficiencia de la probabilidad real (cuotas casas)
  • Eficiencia de los quinielistas (frecuencia apostada)

Es posible que en ocasiones, hayas escuchado aquello de :

“Este equipo tiene una probabilidad de ganar del 80%”

Y que, después de que haya perdido el partido, escucharas esto otro

“Las casas se han equivocado”

Realmente esto es tan común como erróneo.

El mercado de apuestas está basado en la inteligencia colectiva.

Las cuotas reflejan con bastante exactitud las probabilidades reales para cualquier evento. 

Sin embargo, a corto plazo es probable que en un partido pueda ocurrir cualquier resultado, mientras que a largo plazo esos equipos realmente si ganarán aproximadamente el 80% de esos partidos.

Es decir, a muestras pequeñas (corto plazo) puede pasar cualquier cosa, mientras que a largo plazo, la cosa tiende a estabilizarse.

Para ilustrar mejor este ejemplo, vamos a observar todos los partidos de la quiniela en esta temporada y calcularemos, cómo de eficientes eran las probabilidades reales. 

Para ello nos basaremos en una variable, la llamada “Entropía” que, aplicada al fútbol viene a definirse como el grado de incertidumbre que existe en un partido en función de las probabilidades “1X2”

-> Formula

-> Donde

H = Entropía 

p(i) = probabilidad de cada uno de los tres sucesos (1, X y 2) 

Para un partido con probabilidades (%) 50,00 / 30,00 / 20,00: 

Su entropía sería = 0,937231 

Suponiendo victoria local con probabilidad de 50% la información de la entropía se resolvería como: 

Vemos que, cuanto mayor es el valor de la entropía, mayor incertidumbre existe  y viceversa.

La variable de “información”

Una vez conocido el resultado, podemos obtener esa entropía y conoceremos lo que se denomina como “información”.

Esta es una variable sumamente importante que nos ayudará a identificar si el resultado del partido, fue más fácil o más difícil de lo esperado. Como hemos dicho, cuanto mayor es el valor de entropía mayor incertidumbre existe y viceversa. Si información es < entropía significa que el resultado es más fácil de lo esperado y viceversa.

Como venimos diciendo, esto en una muestra pequeña de partidos no tiene demasiada relevancia, pero si tomamos una muestra lo suficientemente grande de partidos, los promedios de entropía e información deberían de converger en el tiempo.

Veamos esta temporada

Para un total de 812 partidos de quiniela hasta la jornada 58 observamos qué: 

Si tomamos la entropía media de los (%) apostados por los quinielistas y la comparamos con su información media se obtiene una divergencia de -0.0878 lo cual indica que los partidos resultaron ser más difíciles de lo que los quinielistas en promedio esperaban. 

En cambio, con los (%) reales de las casas de apuestas se observa todo lo contrario, con una entropía media de 0.9022 frente a una información media de 0.8683 se obtiene una divergencia de 0.0390, salieron resultados más fáciles en promedio de los que las casas (mercado) esperaban. 

Por último, para comparar que valoraciones fueron mejor es tan sencillo como quedarse con las que tienen la información más baja, en este caso los (%) reales, que incluso en el corto plazo son mucho mejores que lo apostado por los quinielistas. 

La rentabilidad de los signos

Lo que queremos explicar en este apartado es en qué consiste la distribución de la rentabilidad en cualquier jornada de la quiniela.

En esta tabla observamos, los (14) primeros partidos con sus valoraciones reales (R) y los apostados por los quinielistas (A) que son los dos datos necesarios para calcular el coeficiente de rentabilidad (C.R) de todos los signos. 

-> El cálculo sería: C.R= Prob Real/ Frecuencia apostada (quinielistas)

El objetivo de la misma es calcular la distribución de la rentabilidad de cada jornada. 

Se ve más claro con ejemplos, utilizando la tabla:

El signo más rentable en la jornada 3,  era la victoría del Getafe (2,65) su probabilidad real rondaba el 13% y los quinielistas lo estaban apostando solamente un 5%.

El menos rentable, fue el Almería (0,68) con una probabilidad real que rondaba el 50%, mientras que los quinielistas lo estaban apostando un 72%.

Con esta información, te puedes hacer una idea de como venía repartida la rentabilidad en cada jornada pero existe otro dato.

Jerarquía de signos interesantes

Este otro dato es la llamada“jerarquía de signos interesantes” que consiste en etiquetar del signo más interesante hasta el menos interesante de cada boleto.

Tiene en cuenta la probabilidad y la rentabilidad, a la vez que clasifica jerárquicamente  los 42 signos del boleto.

Por ejemplo, el Osasuna (2) en casa del Cádiz, era el signo más interesante de la jornada ya que su probabilidad real era del 38% mientras que estaba apostado sobre un 22%. 

No era el más rentable de todos, pero dentro de los signos rentables era el más probable.

Y es que, esto es algo muy valioso de entender.

La rentabilidad se logra normalmente a costa de las probabilidades, es por eso que este tipo de signos son necesarios para luego encontrar sorpresas menos probables y que nos aporten un “edge”.

La distribución de la tabla de jerarquías, tiene una alta correlación con la distribución jugada por los sistemas que aplican EM. 

Tras aplicar todos los filtros de un sistema EM, es muy probable que muchas apuestas jugadas se harían con la victoria del Osasuna. Mientras que, la victoria del Almería que hablábamos más arriba, que era el peor signo de rentabilidad y por tanto de poco interés.

Apostar por los signos más interesantes, reporta altos beneficios incluso aplicando el margen a las cuotas.

Aunque la temporada quinielística no nos ha reportado demasiadas oportunidades rentables, individualmente apostando a cada partido la cosa cambia.

Queda claro que, el sesgo del quinielista existe y que las cuotas de las casas de apuestas son las más eficientes para medir la probabilidad real de los eventos.

¿Cuánto se gana con los mejores signos?

Hagamos un experimento.

Para poder hacerlo, vamos a cambiar algunos roles.

Los % apostados por los quinielistas, vamos a convertirlos a cuotas 1X2 como si los datos de los quinielistas fueran las casas de apuestas, y los cruzaremos con los % reales.

Así podremos ver de un plumazo, la jerarquía de signos de interés que se haya ido acumulando durante la temporada y comprobar así, si realmente los mejores signos dan beneficios a nivel individual.

Disclaimer: Ten en cuenta que, la quiniela es, en principio, como una combinada de 14 partidos, pero los partidos son independientes los unos de los otros. Es decir, la probabilidad real no afecta al bloque, pero si lo hace la frecuencia apostada por los quinielistas.

Es muy importante tener en cuenta esto antes de seguir.

En el ejemplo anterior vimos cómo los quinielistas apostaron mucho por la victoria del Almería (72%).

Lo que sabemos es que el quiniliesta apuesta o toma decisiones en base a una multitud de sesgos. Sabemos que la distribución de cada quiniela, también influye en las decisiones que toma el quinielista. 

Por ejemplo un boleto en dónde haya muchos favoritos, seguramente la frecuencia apostada por el Almería sería menor ya que el quinielista medio varía su forma de apostar en función de la dificultad de cada quiniela, aunque la probabilidad real nunca cambie. 

Es justamente por eso, que el “sesgo de los quinielistas” ayuda a encontrar deficiencias en el mercado, ya que la toma de decisiones se ve influenciada por diversos factores, que alteran algunos signos mientras que la probabilidad real de los partidos no cambia. 

Para hacer el experimento más realista, ahora vamos a añadirle un margen a las cuotas. Habría que buscar un margen que, elevado a 14 se aproxime a la fracción de pago del operador de loterías (LAE) que es del 55%, es decir, para este caso un 45%.

Margen equivalente: (1,027)^14 = 1,4520

Por tanto, aplicaremos un margen del 2.7% que es, además un margen muy similar al que aplican las casas de apuestas para profesionales, como Pinnacle.

Por tanto, aplicando este margen, veamos como quedaría para el Amorebieta vs Almería:

-> Frecuencia apostada: 10% / 18% / 72%

-> Cuotas sin margen: 10 / 5,56 / 1,39

Para aplicar el margen sería: 3 x cuota sin margen / (3+(margen x cuota) 

-> Cuotas con margen: 9,17 / 5,29 / 1,37

Aplicaremos otra condición, que será el tamaño de apuesta. Este será proporcional a la probabilidad real del suceso, así evitaremos que influyen en el experimento, valores atípicos.

En el siguiente gráfico, te presento los beneficios de apostar sistemáticamente a cada uno de los 42 signos de las 58 jornadas de la temporada:

Para cada uno de los niveles de jerarquía se representa el beneficio / perdida que se lograría (tamaño de las barras) y el yield correspondiente (etiquetas), además los datos están segmentados para la situación de la apuesta, si es al local, empate, visitante y total general. 

Tal y como cabía esperar, apostar por los signos más interesantes (sobre todo los diez primeros) reporta altos beneficios incluso penalizando la cuota con el margen equivalente al que existe en la quiniela, aunque la temporada quinielística no diera demasiadas oportunidades rentables, individualmente apostando en cada partido la cosa cambia.

El sesgo del quinielista queda totalmente evidenciado y demuestra que las valoraciones obtenidas por el mercado de las apuestas son altamente eficientes. 

Para completar el experimento vamos a realizar solamente las apuestas que tienen un valor esperado positivo (EV +), en esta ocasión dejaremos de lado el tema de la jerarquía de signos y pasaremos directamente a evaluar cada uno de los 812 partidos que componen las 58 jornadas 21/22.  

-> Lo segmentamos en función de si la apuesta es para el local, empate o visitante

Apostar por el equipo local cuando se detecta valor nos dejaría (+15,32) unidades de beneficio, con un yield de (+100,40%) aplicando un tamaño de apuesta proporcional a la probabilidad real. 

Los números apostando al empate todavía mejoran más respecto a la apuesta por el local, se obtienen (+40,61) unidades de beneficio y un yield superior al 115% aplicando un tamaño de apuesta proporcional a la probabilidad real. 

La opción de apostar por el equipo visitante cuando existe valor es la más rentable de todas alcanzando un yield de (+118,07%) con (+39,16) unidades de beneficio, sin duda existe un altísimo valor en muchas victorias visitantes. 

“Se logra una altísima rentabilidad apostando individualmente cuando detectamos (EV +)” 

Desafortunadamente en la quiniela no podemos apostar de forma individual ni tampoco los quinielistas son una casa de apuestas.

Por esto, queda totalmente demostrado que es tremendamente interesante aprovechar los errores que comete el quinielista medio.

Durante la temporada 21/22 no surgieron demasiadas jornadas interesantes pero el ratio entre probabilidad real y frecuencia apostada por los quinielistas sigue funcionando a la perfección, el problema es que en combinadas de 14 partidos es mucho más difícil cuadrar los números a tu favor.

La varianza aquí juega un papel demasiado protagonista. 

¿Qué papel juegan realmente los equipos en los sesgos del quinielista? 

Me ha parecido interesante para terminar analizar directamente a los equipos de esta temporada para observar como de sesgados han estado los quinielistas con algunos de ellos.

En este caso solo voy a fijarme en los equipos españoles que han aparecido en quiniela durante la temporada y solo en jornadas de liga. 

Sí recuerdas, al principio del articulo he hablado sobre la E.R (entropía relativa) que mide básicamente el grado de despiste que tienen los quinielistas en un partido respecto a la probabilidad real.

Pues bien

He creado un box plot para observar este nivel de “despiste” de los quinielistas, diferenciando cuando el equipo juega de local y cuando juega de visitante. 

-> Locales

No importa si no estás familiarizado con este tipo de gráficos, básicamente aquí tenemos para cualquier equipo todos los valores de E.R que ha habido en sus partidos y dentro de las cajas se señala la “mediana” de E.R del equipo, además te he sombreado la mediana de ambas ligas (1ª y 2ª) para que puedas comparar. 

Cuanto mas alargadas son las cajas y los bigotes más variabilidad de E.R ha tenido el equipo, de este modo con un simple vistazo se pueden hacer comparaciones interesantes. 

Equipos como Real Sociedad B se han movido en un rango muy pequeño de E.R, digamos que los quinielistas no han patinado demasiado, pero equipos como Éibar o Almería en segunda división y Sevilla o Valencia en primera, son sin duda un buen reflejo de lo sesgado que está el quinielista medio dejando unos valores de E.R muy por encima de la mediana de las ligas. 

-> Visitantes

Equipos como Betis y Girona destacan por su poca variabilidad cuando juegan de visitantes con valores de E.R por debajo de la mediana, en cambio Amorebieta sería el equipo que cuando actuó de visitante mas variabilidad de E.R generó con valor mediano muy por encima de las ligas. 

En definitiva, la E.R es un indicador muy interesante para observar con que equipos van mas despistados los quinielistas o lo que es lo mismo, nos ayuda a definir en que equipos existe mas rentabilidad acumulada en sus partidos. 

Conclusiones del artículo 

Espero que este artículo te haya aportado un punto de vista interesante sobre la temporada 21/22 .

He querido mostrarte que a pesar de haber sido una mala temporada para la EM, donde no ha habido casi buenas oportunidades, la cosa cambia si se analizan las cosas de manera individual y con unas buenas valoraciones (1X2).

Con este análisis individual se llega a la conclusión de que “es muy fácil” batir al quinielista medio ya que su toma de decisiones cuando hace las quinielas, está fuertemente sesgado debido a la necesidad de abaratar el coste de sus jugadas. 

Compartir

Comentarios

  1. Mucho ánimo para esta nueva etapa.

    ¡¡Cuidadla muy bien porque se os ve llenos de ilusión!! El proyecto tiene una pintaza.

    1. Hola Antonio:

      Gracias, la verdad es que estamos muy ilusionados y nos alegra ver que a vosotros también os gusta

      Gracias por los ánimos 🙂

  2. Magnifica y necesaria explicación para mi,
    Me han aclarado varías cosas, aunque sigo ignorante en otras muchas.
    GRACIAS

    1. Hola Luis:

      Nos alegramos que te haya servido para aprender cosas nueva, es el objetivo de este tipo de publicaciones.

      No te preocupes, poco a poco irás adquiriendo más conocimientos.

      Nosotros también estamos en constante aprendizaje

      Saludos y gracias por comentar 🙂

También te puede interesar

La metodología de la esperanza matemática, o EM, establece una clara formulación para hallar aquellas apuestas rentables en cualquier juego de azar.
La metodología de la esperanza matemática, o EM, establece una clara formulación para hallar aquellas apuestas rentables en cualquier juego de azar.
Finalizada la temporada queremos hacer una radiografía de la misma, con el objetivo de analizar diferentes cuestiones que os puedan a ayudar a tener una perspectiva de cómo ha sido la temporada 2021-2022.
La metodología de la esperanza matemática, o EM, establece una clara formulación para hallar aquellas apuestas rentables en cualquier juego de azar.
La metodología de la esperanza matemática, o EM, establece una clara formulación para hallar aquellas apuestas rentables en cualquier juego de azar.
Finalizada la temporada queremos hacer una radiografía de la misma, con el objetivo de analizar diferentes cuestiones que os puedan a ayudar a tener una perspectiva de cómo ha sido la temporada 2021-2022.