serac

Quelle équipe a eu le plus de chance en Ligue 1 ?

Nous avons analysé tous les tirs de la saison précédente pour comprendre comment les choses auraient pu se dérouler autrement

18/08/2020

Le football est un sport chaotique. Un tir improbable peut faire basculer un match, voire une saison. C'est sans doute là où réside sa beauté ; dans cette insaisissable part qui échappera toujours aux statisticiens, aux analystes vidéo ou aux tacticiens qui s'attèlent à en décortiquer tous les aspects.

L'analyse des tirs d'un match permet d'ouvrir en partie l'éventail des possibles. En partant des xG associés à chaque tir, on peut simuler dérouler différents scénarios à partir d'un même match. Par exemple, si un tir a un xG de 0.1, cela veut dire que lors de nos simulations, il provoquera de manière aléatoire un but environ 1 fois sur 10. De l'accumulation des simulations vont progressivement émerger des probabilités pour chacun des résultats possibles.

Prenons comme exemple, le match Marseille - Toulouse de la saison 2019-2020 :

Les tirs de Marseille : 0.72 xG en cumulé

Carte des tirs de Marseille lors de Marseille - Toulouse
Plus le rayon est grand, plus la chance est importante

1 / 12

...et ceux de Toulouse : 1.78 xG en cumulé

Carte des tirs de Toulouse lors de Marseille - Toulouse
Plus le rayon est grand, plus la chance est importante

0 / 10

Si on cumule les xG de chaque côté, Toulouse domine assez largement avec 1.78 xG contre 0.72 pour Marseille. Le score de 1:2 pour Toulouse est le plus probable au regard de ces données. Loin devant la victoire 1:0 pour Marseille, le score réel.
D'après les simulations, celui-ci n'avait que 15 chances sur 1000 de se produire.

Sur les 1000 simulations effectuées avec les tirs de Marseille - Toulouse, seulement 15 ont donné le score effectif de 1:0

Matrice des résultats d'une simulation de Monte-Carlo à partir des xG des tirs de Marseille - Toulouse

Marseille (dom)Toulouse (ext)1417018154111513120764143415316107133002000

Une fois cette mécanique mise en place globalement, on obtient pour chaque match une probabilité de victoire / nul / défaite. Il s'agit maintenant de comparer le cumul de ces probabilités aux points réellement obtenus par chaque équipe afin de déterminer laquelle offre le plus grand écart entre son classement réel et celui établi à partir des simulations.

Marseille a une quinzaine de points en plus dans le classement final (à gauche) par rapport aux simulations (à droite)

Le classement des simulation (à droite) est obtenu en pondérant les points en fonction des probabilités de V/N/D de chaque match

Classement finalClassement simulationsMonaco (40 pts)Marseille (56 pts)Brest (34 pts)Montpellier (40 pts)Nice (41 pts)Angers (39 pts)Dijon (30 pts)Lille (49 pts)Strasbourg (38 pts)Paris Saint Germain (68 pts)Lyon (40 pts)Nantes (37 pts)Amiens (23 pts)Bordeaux (37 pts)Nimes (27 pts)Metz (34 pts)Toulouse (13 pts)Saint-Etienne (30 pts)Reims (41 pts)Rennes (50 pts)Monaco (42.5 pts)Marseille (40.9 pts)Brest (30.6 pts)Montpellier (40.2 pts)Nice (36.1 pts)Angers (38.3 pts)Dijon (31.4 pts)Lille (47.4 pts)Strasbourg (38.4 pts)Paris Saint Germain (65.7 pts)Lyon (46.9 pts)Nantes (35.5 pts)Amiens (33.4 pts)Bordeaux (36.7 pts)Nimes (32.1 pts)Metz (29.1 pts)Toulouse (27.8 pts)Saint-Etienne (32.3 pts)Reims (40.5 pts)Rennes (41.3 pts)

À ce jeu, Marseille apparaît comme le vainqueur. Par ailleurs, Toulouse connaît le plus grand écart dans le sens inverse ; l'équipe passe de 13 points réels à environ 28 points simulés. Rien de remarquable ; la méthode de calcul par pondération va répartir les points distribués à chaque match et ainsi réduire les écarts des équipes aux extrémités. Qui plus est, son classement ne change pas sur les deux classements. En revanche Amiens peut nourrir des regrets au vu de ce nouveau classement. L'équipe y devance 6 équipes, largement suffisant pour rester en Ligue 1.

Il est possible d'aller encore plus loin. Pourquoi ne pas appliquer la même méthode de Monte-Carlo lors du calcul du classement des simulations ? Et ce afin d'obtenir la distribution possible des points plutôt qu'un seul résultat final. Ainsi, plutôt que de faire la somme pondérée des points à chaque match, nous lancerons des simulations afin de désigner aléatoirement un vainqueur à chaque match en fonction des probabilités calculées précédemment. Avec suffisamment de simulations, nous obtiendrons une distribution des possibilités de points pour chaque équipe.

La distribution des points possibles après 200 simulations

En rouge, le bin contenant le nombre réel de points

Paris Saint GermainLyonLilleMonacoMarseilleRennesReimsMontpellierAngersStrasbourgBordeauxNiceNantesAmiensNimesSaint-EtienneDijonBrestMetzToulouse

Chance ou talent ?

Le diagnostic de ces résultats demeure l'étape la plus délicate et n'est pas le sujet de cet article.

Mais pour continuer sur Marseille, l'équipe a surtout marqué plus que prédit par les xG (41 buts contre 36.5 xG). Dans une moindre mesure, l'équipe a également encaissé moins de buts (29 contre 32 xG contre).

Notre modèle est-il biaisé ou trop peu sophistiqué pour capturer les chances réelles de marquer ? Et surtout qu'en est-il du talent ou de la chance ? Une différence chronique entre xG et buts réels est souvent le symptôme d'un des deux phénomènes. À ce stade, rien ne vaut le visionnage des buts.

Comme l'unique but de la rencontre Marseille - Toulouse. L'oeuvre de Payet et accessoirement le but avec le plus faible xG de Marseille cette saison.

Les 5 buts de Marseille avec les plus faibles xG

MatchJoueurxG
Marseille - ToulouseDimitri Payet0.018
Marseille - NantesMorgan Sanson0.025
Monaco - MarseilleDimitri Payet0.028
Amiens - MarseilleDarío Benedetto0.028
Marseille - AmiensMorgan Sanson0.029

Source : understat


Écrit par @n_mondon

© 2020 - serac.io