serac

La valeur d'un but (partie 2)

Suite de mon premier article sur la valeur d'un but.
J'y cherchais un moyen de calculer la valeur (en point) d'un but en Ligue 1.
Je suis parti sur une formule statistique qui exprime la différence de points potentielle que peut apporter un but.

Quand un but est marqué dans un état donné (minute + score avant le but) :

  • on calcule les probabilités d'évolution de score dans le temps restant : par exemple, 15% de chance de ne plus avoir aucun but, 10% de chance d'avoir un but supplémentaire pour l'équipe à domicile et aucun but pour l'équipe extérieure, 8% de chance d'avoir un but de part et d'autre, ...
  • pour chacune de ces probabilités, on calcule la différence de points avec ou sans le but en question
  • on somme le tout en pondérant chaque différence de points par sa probabilité d'arriver
pour chaque score S possible  
avec ∆ = (points avec le but - points sans le but)  
et P(S) la probabilité du score S d'arriver 

Valeur attendue d'un but = ∑ (∆ . P(S))  

Dans ce nouvel article, je vais implémenter la table permettant de calculer les probabilités de buts après un temps donné.
Elle sera basé sur les précédentes saisons de Ligue 1 en notre possession (2008/2009 - 2016/2017).
Pour chaque tranche de 5 minutes, je calculerai les probabilités de buts supplémentaires, en m'arrêtant à 10 maximum de part et d'autre.
On peut ensuite calculer :

  • la différence de points qu'apporte un but
  • ou la différence dans les probabilités de V/N/D

Jetons d'abord un oeil à la table générée :

(il s'agit d'une version simplifiée qui ne prend en compte que 4 buts maximum par équipes)

Pour chaque tranche de 5 minutes, on voit la probabilité (en %) de buts.
Ainsi, la probabilité qu'il n'y ait plus de buts marqués après les 5 premières minutes est de 9%. Cette probabilité monte à 84% pour les 5 dernières minutes.

Nous allons maintenant pouvoir comparer l'évolution de la valeur d'un but dans le temps suivant différentes configurations de score :

  • L'ouverture du score

On remarque tout de suite un résultat qui peut paraître contre-intuitif ; un but à domicile vaut moins qu'un but à l'extérieur.
Pourtant la probabilité de marquer à domicile est plus grande, aussi la valeur de l'ouverture du score à l'extérieur devrait être diminuée par la plus grande probabilité pour l'équipe à domicile d'égaliser.
Mais avec notre formule, il faut voir les choses autrement ; un but à domicile a plus de chance de se retrouver diluer parmi d'autres buts, et de voir ainsi sa valeur baisser.
On peut dire qu'un but à domicilie a moins de chance d'être décisif qu'un but à l'extérieur.

Cette courbe tend vers 2 points, le maximum de valeur que peut prendre un but. En effet, c'est en fin de match qu'un but sera le plus décisif, du fait du manque de temps pour qu'un changement de score se produise à nouveau.

Du fait de notre modèle, le graphe est valable aussi bien pour une ouverture du score (à 0-0) que pour un autre score d'équité (1-1, 2_2, ...).
Un modèle plus précis tendrait à différentier cela.

  • Le but du break (2 buts d'avance)

Ici, nous nous trouvons dans la situation du but du 2-0 ou du 0-2. Contrairement au but du 1-0, sa valeur baisse avec le temps. En effet, le but du 2-0 ne change la répartition des points que si l'équipe adverse réussit à mettre au moins un but.

  • Le débreak (plus qu'un but de retard)

Nous sommes désormais dans la situation où une équipe marque un but alors qu'elle est menée par deux buts d'écart. Là aussi, plus le temps passe, moins le but a de valeurs. En revanche, on constate une inversion entre domicile et extérieur par rapport aux précédentes courbes.

  • L'égalisation

Autre situation intéressante, le but de l'égalisation. On s'attend plutôt à ce que ce but ait une valeur maximale de 1 point en fin de match.

  • Le 3-0

Pour se rendre compte de l'écart de valeur entre certains buts, il suffit de regarder la valeur du but d'un 3-0 ou d'un 0-3. Ce but a en effet très peu de chance de faire la différence et plafonne à un misérable ~0.16 points en début de match.


Au-delà de ces chiffres, cette étude aura été l'occasion de développer un outil permettant de voir à n'importe quel moment quelle sont les probabilités de V/N/D pour une équipe suivant la configuration du match. J'espère pouvoir en faire une démonstration très rapidement.