Les performances des grimpeurs sur le Tour de France
Evolution des puissances de certains cyclistes sur le Tour de France de 1980 à nos jours
Cyril Domanico, Clément Lannuque, Julien Chabrout
Le domaine du sport professionnel représente une zone journalistique intéressante pour l’expérimentation du data journalisme. Les statistiques y sont utilisées depuis les prémices du genre. Scores, temps, pourcentages, autant de termes familiers du grand public. Les données sont de plus en plus nombreuses et offrent de grandes possibilités avec l’évolution des outils de mesures de performances (automatisation, numérisation, algorithmes…). Pour autant, le traitement qui est fait de ces chiffres toujours plus nombreux reste assez basique dans la presse généraliste comme spécialisée. La tendance est à l’instantanéité, l’analyse de la performance à chaud. Aussitôt produites, les données sont consommées, puis finissent aux oubliettes.
Pourtant lors de notre phase de pré-enquête, une constatation logique nous a été confirmée. Le grand public, les médias mais aussi les sportifs professionnels regrettent l’utilisation trop partielle et consumériste qui est faite des diverses statistiques. En cyclisme, l’exemple est frappant. Lors d’un événement comme le Tour de France, les journalistes ont à leur disposition une grande quantité de données : archives d’étapes, temps, palmarès… Beaucoup de chiffres, trop de chiffres pour prendre le temps de dégager à froid de grandes tendances lisibles pour les spectateurs et fans de l’événement. Alors, le journaliste sportif a pris la mauvaise habitude d’utiliser des méthodes de vulgarisation peu appropriée. L’été dernier, l’ascension du col du Tourmalet par le Français Thomas Voeckler a donné lieu à des commentaires prolifiques, sans réelles comparaisons chiffrées avec ses anciennes performances. Et lorsque la confrontation de sa performance a été faite, bien souvent cela ne respectait pas des critères de bases dans l’étude statistique : calculer des valeurs d’une même échelle. Un col ne se monte pas à la même vitesse si le coureur a effectué 220 kilomètres de montagne dans la journée, alors qu’une autre année, sa performance était précédée de 80 kilomètres de plat.
Ce que nous voulons c’est donner de la clarté et du recul à l’analyse des performances cyclistes sur le Tour. Une visualisation qui permettrait de manière simple de voir si tel coureur a, dans des conditions comparables, produit un effort supérieur/inférieur ou égal sur plusieurs années d’écart.
Pour cela, nous utiliserons les données de Frédéric Portoleau, ingénieur spécialisé dans le calcul des puissances sur le Tour de France. Il accepte de mettre à notre disposition ses données. Grâce à un calcul détaillé, ce spécialiste du vélo obtient en Watt la puissance dégagée par un cycliste lors de son effort en montagne. Ce qui permet de comparer aisément les performances d’un ou de plusieurs coureurs durant un même effort.
Concrètement, avec ce jeu de données, nous pourrons comparer la puissance produite par X dans le Tourmalet en 2011, avec son effort en 2007, puis 2004.
Ceci, pour dégager des tendances sur l’évolution des performances physiques de X sur plusieurs années et cols. Des performances que nous nous pourrons approfondir via un texte d’analyse (vieillissement, méforme, chute…) accompagnant le schéma. Mieux encore, il sera possible de comparer les performances de X et Y sur un même Tour, mais aussi sur l’ensemble de leur carrière.
Conscient de la charge de travail d’un tel projet en vue de la multiplicité des données, nous souhaitons limiter notre base de données à une quinzaine de coureurs connus, qui ont quasiment tous remportés le Tour, et une quinzaine d’ascensions clefs car situées en fin d’étape et suffisamment longues. Le but étant de prendre des exemples de référence: Fignon, Armstrong, Contador, Voeckler, à des époques légèrement différentes, pour voir dégager des tendances générales sur l’évolution des performances globales entres les années 1980 et 2010. Cela pourrait être mis dans notre analyse non visuelle en rapport avec l’évolution de la lutte anti-dopage et les avancées technologiques du cyclisme.
En ce qui concerne la partie graphique de notre analyse elle pose quelques problèmes du fait que l’on traite de chiffres en quatre dimensions : coureurs, années, cols, puissance. Inspiré de schémas préexistants (mais très critiquables) sur le site de l’Express, nous pensons pour l’instant à quelque chose de ce type : en abscisse la puissance en watts par kilo, en ordonnées quelques années cibles entre 1985 et 2011. Sur le côté un petit tableau permettrait de (dé)cocher les cyclistes choisis. Lorsque l’on passe la souris sur les points de la courbe de performance, des détails sur la performance en question apparaitraient (temps, température, place). Chaque cycliste serait représenté par une couleur différente. Nous pouvons aussi tracer une courbe moyenne sur la période pour bien montrer l’évolution. Se posera peut-être le problème de la clarté lorsque toutes les données seront sélectionnées.
Enfin, nous aimerions aussi prendre un exemple précis, sur un second petit graphique lié au premier. Plus beau soigné graphiquement car reprenant les données d’un seul coureur, Thomas Voeckler. Sur le même format de graphique incluant peut-être plus d’artifices visuels, nous montrerons l’évolution de ses performances depuis 2004.
Les grands défis de ce projet reposent donc sur la clarté et la compréhension graphique pour un public de non-spécialiste. C’est donc à nous de prendre des valeurs significatives, de bien contextualiser et clarifier cette visu et enfin, de travailler de manière complémentaire avec les programmeurs et graphistes, pour arriver à un résultat qui pourrait intéresser de manière concrète, un public assez large.
Précisions complémentaires
Frédéric Portoleau, est un ingénieur qui est spécialisé dans le calcul des puissances sur le Tour de France. Il a accepté de nous confer son jeu de données. C’est un des trois spécialistes de la question en France, avec Antoine Vayer et Frédéric Grappe. Ce dernier, qui a collaboré avec Datavayes pour la réalisation d’une data sur le Tour, n’a pas accepté de travailler avec nous.
Les données de Frédéric Portoleau nous permettront de calculer la puissance des coureurs en watts par kilo, ce qui est la mesure la plus pertinente.
Pour établir ce calcul, plusieurs paramètres sont à prendre en compte: la longueur du col, la pente, la vitesse des cyclistes, la force et la direction du vent, le poids du coureur et du vélo.