serac

La valeur d'un but

Nous avons analysé 7304 matchs des 5 grands championnats afin d'estimer la valeur d'un but.

10/04/2020

Le problème

Intuitivement, il est facile de comprendre que le 6è but d'une équipe menant déjà 5-0 a moins de valeur qu'un but à la toute fin d'un match fermé et dont le score est nul.

Mais il est plus délicat de quantifier précisément la valeur précise de l'un et l'autre but.

Définissons avant tout la notion que nous essayons de mesurer :

Ici, la valeur d'un but est la différence de points qu'entraîne ce but pour l'équipe qui l'a marqué

On ne veut pas seulement calculer la différence directement induite par le but, sinon le premier but d'une rencontre vaudrait toujours autant, peu importe le moment auquel il est marqué.
Hors, on intuite que ce but est plus important à la fin d'un match que lors de son entame, quand l'équipe adverse dispose encore du temps nécessaire pour revenir au score.
On entend ici, différence à la fin du match. En théorie, il faudrait au moment du but, filer deux réalités distinctes :

  • une où le but est effectivement marqué
  • l'autre où le but n'est pas marqué

Puis faire la différence de points entre ces deux réalités.

Une solution

Puisqu'il nous est impossible de scinder la réalité en deux, essayons plutôt avec des hacking statistics.
Notre modèle se base sur l'ensemble des matchs des grands championnats lors des saisons 2014-2015 à 2017-2018.
En s'appuyant sur ces données, nous obtenons les différentes probabilités d'évolution du score à partir des paramètres suivants :

  • le temps restant
  • équipe domicile ou extérieure

Regardons par exemple l'évolution de la probabilité de ne plus avoir de but :

Probabilité au fil du match de ne pas avoir de but

La probabilité de la première minute correspond à celle de terminer sur un match vierge ; un peu moins de 10%.
pas de but p

Ou la probabilité de n'avoir qu'un seul but :

Probabilité au fil du match de n'avoir qu'un seul but supplémentaire

La probabilité maximale est atteinte vers la 70è minute. Avant il y a plus de chance d'avoir deux buts ou plus. un seul but p

Application à notre problème

Ce modèle donne à un instant donné, la probabilité de nouveaux buts d'un côté ou de l'autre. Avec la moyenne pondérée de toutes les configurations possilbes, nous obtenons le nombre de points qu'une équipe peut espérer avoir.

Par exemple :

  • À la 50è minute, si l'équipe à domicile est menée 0-1, elle obtiendra en moyenne 0.62 points
  • Si c'est l'équipe extérieure qui est menée, elle n'aura que 0.42 points

Points moyens au fil du match lorsque le score est de 0-0

On tend naturellement vers 1 point en fin de match.

points mean 0

Nous pouvons alors déterminer la valeur d'un but en calculant la différence de points évoquée ci-dessus.

Valeur moyenne d'un but au fil du match alors qu'il y a match nul

C'est dans cette configuration qu'un but vaut le plus de points, à la 90è minute sa valeur fleurte même avec les 2 points, le maxiumum théorique. diff mean 0

Valeur moyenne d'un but au fil du match alors que l'équipe mène déjà d'un but

Lorsque l'équipe mène déjà, ne serait-ce que d'un but, le second ne vaut déjà plus grand chose. diff mean 1

Évolution de la valeur d'un but alors que l'équipe est menée d'un but

Dans la situation inverse, un but peut rapporter jusqu'à un point, en cas d'égalisation en toute fin de match. diff mean 2

Et après ?

Un tel modèle permet de nombreuses autres applications, citons :

  • Un classement des buteurs les plus décisifs
  • Un suivi des probabilités de gagner au fur et à mesure d'un match
  • ...

Source : fbref


Écrit par @n_mondon

© 2020 - serac.io