Étude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
BARBUSSE, Alexandre
Auteur moral
France. Autorité de la qualité de service dans les transports
Auteur secondaire
Résumé
<div style="text-align: justify;">"L'étude interroge l’effet de l’évolution entre 1954 et 2019 de certains déterminants supposés de la ponctualité des trains (nombre de jours de grèves, volume des effectifs du transporteur, âge moyen du matériel roulant, âge moyen du réseau ferré, intensité d’utilisation des lignesferroviaires,niveaudutraficen voyageurs-km) sur la ponctualité des trains par service en France. D'après les données de la SNCF, la ponctualité de l’ensemble des services ferroviaires s’est fortement dégradée depuis 1954 en France. Afin d’apporter des éléments d’explications à ce constat, des séries chronologiques décrivant l’évolution des déterminants ont été reconstituées. Ensuite, des modèles statistiques ont été implémentés. Sur la période 1954<span role="presentation">-</span><span role="presentation" style="transform:scaleX(0.909828);">2019</span><span role="presentation" style="transform:scaleX(0.933244);">, la modélisation </span><span role="presentation" style="transform:scaleX(0.962331);">tend à montrer</span> <span role="presentation" style="transform:scaleX(0.938156);">un impact significatif du vieillissement </span><span role="presentation" style="transform:scaleX(0.915768);">de certaines </span><span role="presentation" style="transform:scaleX(0.943256);">catégories du matériel roulant</span> <span role="presentation" style="transform:scaleX(0.919746);">sur la ponctualité des trains en France par service, ainsi </span><span id="page97R_mcid14"><span role="presentation" style="transform:scaleX(0.921818);">que du vieillissement des lignes ferroviaires</span></span> <span role="presentation" style="transform:scaleX(0.910738);">les plus fréquentées du Réseau Ferré National. La </span><span role="presentation" style="transform:scaleX(0.913992);">très </span><span id="page97R_mcid14"><span role="presentation" style="transform:scaleX(0.980911);">forte </span><span role="presentation" style="transform:scaleX(0.94367);">augmentation</span> <span role="presentation" style="transform:scaleX(0.908584);">du </span><span role="presentation" style="transform:scaleX(0.909829);">volume de </span><span role="presentation" style="transform:scaleX(0.907107);">trafic voyageurs</span> et de la fréquentation des trains semble également <span role="presentation" style="transform:scaleX(0.88424);">avoir impacté la ponctualité des trains, en partic</span><span role="presentation" style="transform:scaleX(0.876038);">ulier en Ile</span><span role="presentation">-</span><span role="presentation" style="transform:scaleX(0.911775);">de</span><span role="presentation">-</span><span role="presentation" style="transform:scaleX(0.838805);">France, là où le réseau est le plus </span><span role="presentation" style="transform:scaleX(0.913686);">saturé". Source : ASQT</span></span></div>
Editeur
AQST
Descripteur Urbamet
train
;région
;réseau ferré
;circulation
;grève
;matériel roulant
;âge
;TGV
;voie
;trafic
;fréquentation
;population
;modèle
Descripteur écoplanete
Thème
Transports
Texte intégral
Document de travail :
Etude économétrique sur des
déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Alexandre Barbusse
FEVRIER 2022
SOMMAIRE
1 2 INTRODUCTION METHODOLOGIE
2.1 2.2 Démarche méthodologique et objectifs Données utilisées
4 5
5 7 7 11 35 35 36
2.2.1 Données sur la ponctualité des services ferroviaires depuis 1954 2.2.2 Données sur les déterminants de la ponctualité 2.3 Forme des modèles statistiques testés et implications statistiques 2.3.1 Forme des modèles statistiques testés 2.3.2 Implications statistiques
3.
RESULTATS
3.1 3.2 Note de lecture des résultats des tests statistiques Résultats de la modélisation statistique
37
37 40 40 42 44 50 53
3.2.1 Ponctualité des trains régionaux de province à 5 minutes : 3.2.2 Ponctualité des trains régionaux d'Ile-de-France à 5 minutes : 3.2.3 Ponctualité des trains Grandes Lignes à 15 minutes : 3.2.4 Ponctualité globale (pondérée du nombre de circulations par service) 3.2.5 Synthèse des résultats
4.
CONCLUSION
56 58
58
58 59 60 61 62 64 65 66
ANNEXES
Annexe 1 : Modèles de parc du matériel roulant utilisés
Modèle de parc des locomotives électriques entre 1954 et 1983 Modèle de parc des locomotives Diesel entre 1954 et 1983 Modèle de parc des automotrices électriques entre 1954 et 1983 Modèle de parc des automotrices thermiques (autorails) entre 1954 et 1983 Modèle de parc des locotracteurs entre 1954 et 2008 Modèle de parc des turbotrains thermiques entre 1970 et 1983 Modèle de parc des voitures remorquées TER entre 1954 et 1983 Modèle de parc des voitures remorquées Transilien entre 1954 et 1983
Annexe 2 : Modèles de parc du réseau ferré utilisés
67
Modèle de parc des lignes ferroviaires du RFN entre 1954 et 1995 Modèle de parc des lignes des catégories UIC 2-4 entre 1954 et 1995 Modèle de parc des lignes des catégories UIC 5-6 entre 1954 et 1995
67 69 71
Modèle de parc des lignes des catégories UIC 7-9 (Avec Voyageurs) entre 1954 et 1995 73 Modèle de parc des lignes ferroviaires régionales d'Ile-de-France entre 1954 et 2019 75 Modèle de parc des LGV entre 1981et 1995 78
Annexe 3 : Résultats des modèles utilisés pour préciser l'effet de l'évolution des effectifs de la SNCF sur la ponctualité des trains depuis 1954 79
Modèle utilisant le niveau des effectifs 5 années auparavant 79 Modèle utilisant le niveau moyen des effectifs au cours des 5 années précédentes79
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
3
1 INTRODUCTION
La présente étude interroge l'effet de l'évolution entre 1954 et 2019 de certains déterminants supposés de la ponctualité des trains (nombre de jours de grèves, volume des effectifs du transporteur, âge moyen du matériel roulant, âge moyen du réseau ferré, intensité d'utilisation des lignes ferroviaires, niveau du trafic en voyageurs-km) sur la ponctualité des trains par service en France. D'après les données issues des mémentos statistiques de la SNCF, la ponctualité de l'ensemble des services ferroviaires s'est fortement dégradée depuis 1954 en France. Afin d'apporter des éléments d'explications à ce constat, des séries chronologiques décrivant l'évolution des déterminants supposés de la ponctualité des trains ont été reconstituées à partir de données issues de différentes sources, et de modèles de parcs du matériel roulant et des infrastructures ferroviaires. Ensuite, des modèles statistiques ont été implémentés à l'aide du logiciel R pour tester la significativité statistique de l'impact de ces variables sur l'évolution de la ponctualité des trains en France par services entre 1954 et 2019.
4
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
2 METHODOLOGIE
2.1 Démarche méthodologique et objectifs
L'AQST s'est procurée des versions numériques des mémentos statistiques de la SNCF de 1955 à 20181. Ils contiennent des données annuelles sur la ponctualité des trains en France par services ferroviaires : trains Grandes Lignes, trains régionaux de province correspondant aux actuels services TER - et trains de la banlieue de Paris et d'Ile-de-France, correspondant aux actuels services Transilien. En effectuant un travail d'harmonisation des seuils de retard à l'arrivée des trains à partir de données provenant de différentes sources, il a été possible de reconstituer l'évolution de la ponctualité des trains en France depuis 1954 : - à 5 minutes pour les trains régionaux de province et pour les trains d'Ile-de-France ; - à 15 minutes pour les trains Grandes Lignes. Il apparait que la ponctualité de l'ensemble des services ferroviaires s'est fortement dégradée depuis 1954 en France. Dans le but de savoir si cette dégradation peut en partie s'expliquer par l'évolution de certains déterminants supposés de la ponctualité (comme l'âge moyen des voies ferroviaires par exemple) des données de séries chronologiques sur l'évolution de ces facteurs ont été récoltées à partir de différentes sources, et notamment des mémentos statistiques de la SNCF depuis 19552. Les séries chronologiques portant sur l'âge moyen du matériel roulant et l'âge moyen des infrastructures depuis 1954 étaient parfois incomplètes car les données n'étaient pas renseignées dans les mémentos statistiques de la SNCF sur certaines périodes. Afin de compléter ces séries chronologiques, des modèles de parcs ont été réalisés pour fournir une estimation de l'évolution de l'âge moyen du matériel roulant ou des infrastructures ferroviaires lorsque les données réelles étaient manquantes. Ils ont été calibrés à partir des premières années où les données réelles étaient disponibles. Ensuite, une approche graphique a permis de visualiser si les tendances d'évolution des séries chronologiques de la ponctualité depuis 1954 par service et des déterminants supposés de cette ponctualité étaient similaires ou manifestement différentes.
Les mémentos statistiques de la SNCF numérisés depuis 1955 ont été récupérés grâce au travail de Maxime Gaillard, stagiaire à l'AQST en 2017 2 Une partie des séries chronologiques regroupant les données contenues dans les mémentos statistiques de la SNCF sur divers déterminants supposés de la ponctualité ont été constituées par Sira SIBY, stagiaire à l'AQST en 2018
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 5
1
Enfin, des modèles économétriques simples ont été implémentés pour décrire et interpréter la corrélation éventuelle entre l'évolution de la ponctualité depuis 1954 par service et l'évolution d'un déterminant supposé de cette ponctualité.
6
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
2.2 Données utilisées 2.2.1 Données sur la ponctualité des services ferroviaires depuis 1954
Ponctualité des services Grandes Lignes à 15 minutes :
Les services Grandes Lignes correspondent aux actuels services Intercités et TGV. Avant les années 1990, ces services correspondaient aux « trains rapides et express ». Le seuil retenu pour harmoniser les données de ponctualité à l'arrivée de ces services est 15 minutes. Les données utilisées couvrant la période 1954 à 2008 sont issues des mémentos statistiques de la SNCF. Les données pour les années 2017 à 2019 sont issues de la base de données de l'Autorité de régulation des transports (ART). Pour estimer les valeurs des taux de retard à l'arrivée à 15 minutes des services Grandes Lignes entre 2009 et 2016, une moyenne pondérée des taux des TGV et des trains Intercités a été calculée. La pondération se base sur la part de ces services dans le total annuel des circulations de trains Grandes Lignes de 2015 d'après l'ART :
Part dans les circulations Grandes Lignes en 2015 (ART)
Service
TGV Trains Intercités
68% 32%
Pour estimer les taux de retard à l'arrivée à 15 minutes pour les services TGV et Intercités entre 2009 et 2016, des coefficients multiplicateurs ont été utilisés selon la nature de la donnée de ponctualité disponible et le seuil utilisé :
Seuil de la donnée disponible Composite 5-10-15 10 min Composite 5-10-15 Coefficient multiplicateur passage à 15 min
Service
Période
Source données utilisées coefficient multiplicateur ART : Taux de retard à 15 min 2017 - 2019 AQST : Taux de retard seuil composite 2017 - 2019 ART : Taux de retard à 10 min et à 15 min 2017 - 2019 ART : Taux de retard à 15 min 2017 - 2019 AQST : Taux de retard seuil composite 2017 - 2019
TGV et Intercités
2009 2010 puis 2014 - 2016 2011 - 2013
0,67
Intercités
1/1,42
TGV
2011 - 2013
0,67
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
7
Ponctualité des trains régionaux de province à 5 minutes :
Les trains régionaux de province correspondent aux actuels services TER. Avant la fin des années 1990, ces services étaient désignés comme « services régionaux de voyageurs » (SRV), et avant le milieu des années 1980 comme « services omnibus » ou « trains omnibus ». Le seuil retenu pour harmoniser les données de ponctualité à l'arrivée de ces services est 5 minutes. Les données utilisées couvrant la période 1976 à 2006 sont issues des mémentos statistiques de la SNCF. Les données pour les années 2017 à 2019 sont issues de la base de données de l'Autorité de régulation des transports (ART). Pour estimer les taux de retard à l'arrivée à 5 minutes pour les trains régionaux de province avant 1976, un coefficient multiplicateur a été utilisé :
Seuil de la donnée disponible 15 min Coefficient multiplicateur passage à 5 min 4,44 Source données utilisées coefficient multiplicateur ART : Taux de retard des trains TER par seuil en 2017 et modélisation exponentielle
Service
Période
Trains régionaux de province
1954 - 1976
Ponctualité des trains d'Ile-de-France à 5 minutes :
Les trains d'Ile-de-France aux actuels services RER et Transilien. Dans les années 1990, ces services étaient désignés comme « services régionaux d'Ile-de-France », et avant les années 1990, comme « trains de la banlieue parisienne » ou « trains de la banlieue de Paris ». Le seuil retenu pour harmoniser les données de ponctualité à l'arrivée de ces services est 5 minutes. Les données utilisées couvrant les périodes 1954 à 2002 et 2008 à 2011 sont issues des mémentos statistiques de la SNCF. Les données pour les années 2017 à 2019 sont issues de la base de données de l'ART. Pour estimer les taux de retard à l'arrivée à 5 minutes pour les trains d'Ile-de-France, de 2003 à 2007 puis entre 2012 et 2016, des coefficients multiplicateurs ont été utilisés selon la nature de la donnée de ponctualité disponible et le seuil utilisé :
8
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Service
Période
Seuil de la donnée disponible
Coefficient multiplicateur passage à 5 min
Source données utilisées coefficient multiplicateur SNCF : taux de retard à 5 min en période de pointe et toute la journée sur la période 1991-2002 (utilisation du ratio moyen sur la période) AQST : retard voyageurs à 5 min selon l'indicateur Ile-de-France Mobilités en 2011 et 2017 SNCF : retard des trains à 5 min en 2011 ART : retard des trains à 5 min en 2017 (utilisation du ratio moyen 2011, 2017)
Trains régionaux d'Ile-de-France
2003 2007
5 min en période de pointe
1/1,33
Trains régionaux d'Ile-de-France
2012 2016
Indicateur Ile-deFrance Mobilités retard des voyageurs à 5 min
1/1,077
L'évolution de la ponctualité à l'arrivée des trains depuis 1954 par service a ainsi pu être tracée selon les seuils retenus :
Depuis 1954, les taux de retards des trains ont été multipliés par près de 10 en IDF, par 4 pour les trains Grandes Lignes et par 2 pour les trains régionaux de province.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 9
A noter toutefois que compte tenu de la profondeur des données, de 1954 à 2020, l'évolution couvre un large spectre de méthodes de mesures de la ponctualité. Au cours de cette période, un système de mesure déclaratif manuel a laissé place à un système par balise (brehat), aujourd'hui complété par des localisation GPS. Aussi, l'exhaustivité et la précision de la mesure se sont améliorées au fil du temps. Ponctualité globale pondérée du nombre de circulations par service :
Un indicateur de ponctualité globale des trains de voyageurs, pondéré par le nombre de circulations des trains de voyageur par service, a ensuite été calculé. L'intérêt est d'attribuer à chaque service son poids dans le total des circulations de trains. Pour construire cet indicateur, la méthode suivante a été employée : Nous avons récupéré les données sur le nombre moyen journalier de circulations par service depuis 1983 issues des mémentos statistiques de la SNCF. A partir d'hypothèses détaillées ci-après, nous avons estimé ce nombre moyen journalier de circulations par service sur la période 1983 2019 ; Ensuite nous avons calculé le total des circulations ponctuelles en multipliant pour chaque service les circulations précédemment calculées par la ponctualité de ce service, puis en additionnant les circulations ponctuelles par service ; Enfin, l'indicateur de ponctualité a été obtenu en divisant le total des circulations ponctuelles par le total des circulations. Pour estimer l'évolution du nombre moyen journalier de circulations de trains Grandes Lignes et de trains régionaux de province depuis 1983, nous avons émis l'hypothèse d'un ratio nombre de trains-km/nombre de circulations constant depuis 1983 pour ces 2 services et avons réutilisé la valeur de ce ratio en 1983. L'ensemble des données utilisées proviennent des mémentos statistiques SNCF depuis 1983. Pour estimer l'évolution du nombre moyen journalier de circulations de trains régionaux d'Ile-deFrance, nous avons « redressé » la donnée sur le nombre moyen journalier de circulations de trains d'Ile-de-France de 1983 à partir de l'évolution d'une estimation grossière de ce nombre depuis 1983. Cette estimation est obtenue à partir du calcul suivant : × - -
L'évolution de la ponctualité globale des trains depuis 1954 pondérée des circulations par service, représentée à la page suivante, montre que le taux de retards des trains en France a été multiplié par 3,5 avec une perte de 7 points de ponctualité.
10
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
2.2.2 Données sur les déterminants de la ponctualité
Effectif de personnels de l'EPIC SNCF :
Il est possible qu'un lien de corrélation existe entre l'effectif de personnels de la SNCF et la ponctualité des trains dont elle assure la circulation. Nous avons donc intégré en première approche cette variable à l'analyse des déterminants de la ponctualité depuis 1954 en France. Les données sur l'effectif global du personnel entre 1954 et 2013 sont issues des mémentos statistiques de la SNCF. Les données utilisées pour compléter la série sont issues de l'OpenData SNCF, plus précisément du jeu de données « Effectifs disponibles SNCF depuis 1851 ». La courbe ci-après montre que les effectifs de la SNCF ont diminué progressivement entre 1954 et 2020 : l'effectif global a été divisé par environ 2,5.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
11
Nombre de jours de grève par agent et par année :
Les données utilisées pour prendre en compte l'évolution du nombre de jours de grève par agent et par an sont issues du jeu de données « Journées perdues lors de mouvements sociaux chaque année depuis 1947 » de l'OpenData SNCF.
12
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Le graphique précédent permet de retrouver les années marquées par des mouvements sociaux majeurs des cheminots qui ont impacté la SNCF depuis 1954, dont notamment : - L'année 1968, avec plus de 14 jours de grève par agent, marquée par des grèves qui s'inscrivent dans le mouvement national de contestation de mai 68 ; - L'année 1986, marquée par une grève au mois de décembre contre un projet de nouvelle grille salariale, au cours de laquelle aucune « trêve de Noël » n'avait été respectée ; - L'année 1995, avec une grève de 22 jours entre le 24 novembre et le 15 décembre, qui avait abouti au retrait d'un projet de réforme des régimes spéciaux de retraite ; - L'année 2010, marquée par 2 semaines de grève en avril contre la réorganisation de l'activité de fret, puis par 17 jours de grèves contre la réforme générale des retraites au mois d'octobre ; - L'année 2018, marquée par la grève perlée ferroviaire intersyndicale contre le projet de réforme dans le contexte de la loi « pour un nouveau pacte ferroviaire », mettant notamment fin au statut de cheminot instauré en 1920. Cette grève s'est étalée du 3 avril au 28 juin sur un schéma de 2 jours de grève suivis de 3 jours de travail, pour un total de 41 jours de grève.
L'âge moyen en fin d'année du matériel roulant :
Il est possible qu'un lien de corrélation existe entre l'âge moyen du matériel roulant de la SNCF et la ponctualité des trains dont elle assure la circulation. En effet, un matériel ancien est davantage susceptible de connaitre des pannes au cours d'un trajet. Le matériel roulant peut être divisé en deux catégories : le matériel moteur qui fournit l'énergie motrice utilisée par le train (par exemple des locomotives ou bien des automotrices, rames qui assurent seules leur propulsion) et le matériel voyageur ou matériel remorqué, qui regroupe les voitures et les caisses de trains tractées par le matériel moteurs. Afin de connaitre l'évolution de l'âge moyen d'un constituant donné du matériel roulant de la SNCF par exemple les locomotives électriques ou les rames TGV - nous avons utilisé les données disponibles dans les mémentos statistiques de la SNCF depuis 1954. Les séries étant incomplètes, nous avons ensuite réalisé des modèles de parc pour estimer l'âge du matériel roulant lorsque la donnée n'était pas disponible. Les modèles de parc permettent de suivre l'évolution des effectifs d'un élément constitutif du matériel roulant en service de la SNCF. Sur un pas annuel, nous avons pu estimer l'évolution des effectifs d'un matériel en prenant en compte l'effectif du matériel ancien sortant du parc et l'effectif du nouveau matériel entrant dans le parc ou bien du matériel renouvelé. Nous disposions en effet de séries chronologiques complètes sur l'évolution depuis 1954 des effectifs du matériel roulant par type de matériel, fournies par les mémentos statistiques de la SNCF. En estimant la composition en effectifs du parc d'une part et l'âge des différents effectifs constituant le parc à l'aide d'une pyramide des âges, nous en déduisons une estimation de l'âge moyen du parc en fin d'année sur la période où la donnée réelle n'est pas disponible.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 13
La formule ci-dessous donne le calcul de cette estimation de l'âge moyen en fin d'année du parc : Formule pour le calcul d'une estimation de l'âge moyen : ( qi * âi ) ÷ qi Avec, qi = effectifs du matériel à l'année i âi = âge du matériel à l'année i
Pour chaque élément constitutif du parc du matériel roulant de la SNCF pour lequel nous avons réalisé un modèle de parc, nous avons estimé les effectifs entrants, renouvelés ou radiés chaque année, en nous basant sur : - le solde de l'effectif du parc considéré entre l'année n et l'année n+1 ; - des données portant sur l'achat de matériel roulant, la mise en service d'un nouveau modèle de matériel ou bien la radiation des effectifs d'un modèle de matériel, principalement récoltées sur Wikipédia.
Les modèles de parc du matériel roulant utilisés sont détaillés en annexe 1. Le tableau ci-dessous précise pour les différentes périodes des séries sur l'évolution de l'âge moyen en fin d'année du matériel moteur par type de matériel s'il s'agit d'une donnée réelle ou bien estimée.
Donnée ou estimation de l'âge moyen en fin d'année et source Donnée d'après les mémentos statistiques de la SNCF depuis 1982 Estimation à partir des données sur les effectifs en fin d'année et l'âge moyen par type de matériel et par service issues des mémentos statistiques de la SNCF depuis 1982 Estimation de l'âge moyen en fin d'année par continuité par rapport aux années immédiatement précédentes ou suivantes
Type de matériel moteur Toutes catégories du matériel moteur hors locotracteurs Toutes catégories du matériel moteur Toutes catégories du matériel moteur Locomotives électriques Locomotives thermiques Automotrices électriques Autorails = automotrices thermiques Turbotrains Locotracteurs
Période 1982 2009, 2015 et 2018
2010 2013
2014, 2016 2017, 2019
1954 1981 Estimation d'après modèle de parc AQST 1970 1981 1954 2007
14
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Un tableau similaire est fourni pour le matériel tracté :
Type de matériel tracté (voyageurs) Toutes catégories du matériel tracté Toutes catégories du matériel tracté Voitures TER Voitures Transilien Donnée ou estimation de l'âge moyen en fin d'année et source Donnée d'après les mémentos statistiques de la SNCF depuis 1982 Estimation de l'âge moyen en fin d'année par continuité dans l'hypothèse qu'aucune radiation n'intervient pour le matériel tracté Estimation d'après modèle de parc AQST
Période 1982 2013
2014 2019 1954 1981
L'évolution des effectifs entrants, renouvelés ou bien radiés des voitures des trains régionaux d'Ilede-France (actuels Transilien) a pu être reconstituée avec une précision en utilisant les données du site © trains-europe.fr, qui fournit une rétrospective très complète des mouvements de parcs par type de matériel et par modèle. Nous avons ici utilisé la section consacrée aux voitures de trains : http://trains-europe.fr/sncf/voitures/index.htm En revanche, il n'a pas été possible d'utiliser cette source pour les autres types de matériels soit parce que les modèles constitutifs de ces parcs sont trop nombreux, soit parce que des doutes demeurent sur les effectifs disponibles en 1954 date de début de la modélisation, certains matériels utilisés en 1954 étant très anciens pour ces types de matériels. Pour ces mêmes raisons, aucun modèle de parc n'a été réalisé pour les voitures Grandes Lignes.
Comme dans toute modélisation, l'estimation de l'âge moyen d'un élément constitutif du matériel roulant de la SNCF n'est pas parfaite. Afin de calibrer les modèles réalisés et d'assurer la cohérence globale de l'estimation, nous avons comparé l'estimation de l'âge moyen en fin d'année calculée en sortie du modèle avec sa valeur réelle pour les 2 ou 3 premières années où la donnée était disponible. Pour effectuer cette comparaison, nous avons tenté de minimiser l'erreur quadratique moyenne entre l'estimation et la valeur réelle, donnée par la formule :
Avec : Yi la valeur réelle de l'âge moyen en fin d'année du matériel roulant pour l'année i ; i la valeur estimée de l'âge moyen en fin d'année du matériel roulant pour l'année i. Le tableau ci-dessous détaille l'erreur quadratique moyenne obtenue pour les différents modèles de parc utilisés concernant le matériel roulant :
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
15
Type de matériel Locomotives électriques Locomotives thermiques
Période
1954 1981 Automotrices électriques Automotrices thermiques Turbotrains Locotracteurs Voitures TER Voitures trains régionaux IDF 1954 1981 1970 1981 1954 2007
Erreur quadratique moyenne de l'estimation en années (années prises en compte dans le calcul) 2,2 (1982, 1983) 0,86 (1982, 1983) 1,3 (1982, 1983) 0,23 (1982, 1983) 0,30 (1982, 1983) 0,91 (2008) 0,54 (1982, 1983, 1984) 0,23 (1982, 1983, 1984)
Les modèles semblent cohérents avec les premières données disponibles : l'erreur quadratique moyenne de l'estimation est inférieure à 1 année pour la majorité des modèles, à l'exception des modèles pour les automotrices électriques (1,3 ans) et les locomotives électriques (2,2 ans), qui semblent légèrement moins précis. A partir des séries chronologiques sur l'évolution de l'âge moyen du matériel moteur depuis 1954 par type de matériel et des effectifs de ces différents types matériels, une estimation de l'évolution de l'âge moyen du parc du matériel moteur SNCF a ensuite été calculée en effectuant la moyenne pondérée des effectifs par type.
16
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Age moyen du matériel moteur
Le graphique ci-dessus illustre l'évolution de l'âge moyen des principaux types de matériel moteur de la SNCF depuis 1954 : Les locomotives thermiques (Diesel) ont vieilli entre 1954 et 2005, période durant laquelle ce type de matériel moteur ne semble pas avoir été renouvelé, dépassant près de 40 ans d'âge moyen en 2006 et 2012, puis des radiations des locomotives thermiques les plus anciennes semblent avoir été effectuées ; Les locomotives électriques ont globalement vieilli entre 1954 et 2019, malgré des périodes de renouvellement ou de radiations de matériel au début des années 80 et dans les années 2000 ; Les automotrices thermiques (autorails) ont fortement vieilli jusqu'en 1975 avant de connaitre des grandes vagues de renouvellement et de radiations des effectifs les plus anciens de 1975 à 1982 puis au cours des années 2000. L'âge moyen atteint environ 17 ans en 2019 ; Les automotrices électriques - qui composent une grande part du matériel roulant des trains régionaux de la SNCF ont également vieilli jusqu'en 1975 avant que le parc ne soit en partie renouvelé jusqu'au milieu des années 80. Grâce à des radiations des effectifs les plus anciens et à de nouvelles commandes progressives, l'âge moyen des automotrices électriques a été maintenu sous 18 ans de 1985 à 2019 ; L'âge moyen de l'ensemble du parc du matériel moteur SNCF a vieilli de 1954 à 2002 où il a atteint un pic à 27 ans, avant la mise en place de renouvellements des effectifs dans les années 2000. Il est ainsi redescendu à 16 ans en 2019.
17
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Age moyen du matériel remorqué
Concernant l'évolution depuis 1954 de l'âge moyen des voitures remorquées des trains régionaux en France : Les voitures TER (et assimilés) ont vieilli jusqu'en 1982 atteignant un âge moyen de 36 ans, avant de connaitre une grande vague de renouvellement et de radiations jusqu'en 1993 où l'âge moyen était de 15 ans. L'âge moyen des voitures TER a ensuite augmenté jusqu'en 2019 où il atteint près de 35 ans ; L'évolution de l'âge moyen des voitures des trains régionaux d'Ile-de-France (actuels Transilien) est assez similaire en tendance mais avec un décalage temporel : ce parc a connu un vieillissement jusqu'au milieu des années 1970 avec un pic à 28 ans, puis a été rajeuni au cours d'une vague de radiation et de renouvellement jusqu'au milieu des années 80, avant de vieillir à nouveau jusqu'en 2019 où l'âge moyen des voitures Transilien dépasse 40 ans.
18
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
L'âge moyen des voies ferroviaires en fin d'année :
Il est possible qu'un lien de corrélation existe entre l'âge moyen des voies du réseau ferroviaire et la ponctualité des trains circulant sur ce réseau. En effet, une infrastructure vétuste peut engendrer des incidents comme des défaillances de la voie, et donc des retards. Des retards peuvent également intervenir à cause de ralentissements (limitations temporaires de vitesse) imposés pour préserver la sécurité des installations et des voyageurs, par exemple en cas de fortes chaleurs. Or ces limitations sont plus fréquentes à mesure que le réseau ferroviaire vieillit. Les lignes du réseau ferroviaire peuvent être classées selon la classification de l'Union Internationale des Chemins de fer (UIC). La classification et son application au Réseau Ferré National (RFN) sont présentées par SNCF Réseau dans un article web relatif au débat public sur la Voie Ferrée Centre Europe Atlantique et disponible en ligne3. SNCF Réseau explique notamment que : « Le groupe UIC 1 correspond à des lignes très chargées et, à l'opposé, le groupe UIC 9 correspond à des lignes très faiblement chargées. Les lignes à grande vitesse ainsi que les grandes lignes du réseau ferré national appartiennent en principe aux groupes UIC 1 à 4, à l'exception de certains axes, notamment transversaux, qui relèvent des groupes UIC 5 à 6. Les lignes faiblement chargées des groupes UIC 7 à 9, avec voyageurs (AV) ou sans voyageurs (SV), correspondent en général au réseau capillaire, généralement régional. » SNCF Réseau précise également que « Cette classification UIC permet de définir la politique de maintenance du réseau ferroviaire. » Ainsi, les politiques de renouvellement et de radiations des lignes de chemins de fer peuvent être différentes selon les catégories UIC. Il est donc pertinent de s'intéresser à l'évolution de l'âge moyen des voies selon leurs catégories UIC, et non uniquement à l'évolution de l'âge moyen du RFN. La graphique ci-dessous, obtenu à partir de données de l'ART, précise les longueurs de ligne du réseau en 2018 selon les regroupements de catégories UIC :
Lien vers l'article : https://cpdp.debatpublic.fr/cpdp-vfcea/classification-uic-unioninternationale-chemins-fer-ligne-nevers-chagny.html
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 19
3
2018
Afin de connaitre l'évolution de l'âge moyen des voies par groupes de catégories UIC nous avons utilisé les données disponibles dans le rapport « l'Avenir du Transport ferroviaire » de la mission conduite par Jean-Cyril Spinetta, remis au Premier Ministre le 15 février 2018. Les séries étant incomplètes pour notre étude de la ponctualité depuis 1954, nous avons ensuite réalisé des modèles de parc pour estimer l'âge des voies lorsque la donnée n'était pas disponible. Sur un pas annuel, nous avons pu estimer l'évolution du km de voie cible pour un groupe de catégorie UIC en tenant compte de la longueur de voie sortant du parc chaque année, de la longueur des nouvelles voies, ainsi que des voies renouvelées. Pour cela nous disposions de données dont les sources sont précisées dans le tableau ci-dessous. En estimant la répartition des voies constituant le parc d'un groupe UIC en fonction de leur âge à l'aide d'une pyramide des âges, nous en déduisons une estimation de l'âge moyen du parc en fin d'année, selon la même méthode que pour l'évolution de l'âge moyen du matériel roulant. Les modèles de parc des lignes ferroviaires utilisés sont détaillés en annexe 2. Le tableau ci-dessous précise pour les différentes périodes des séries sur l'évolution de l'âge moyen des voies en fin d'année par groupe UIC et s'il s'agit d'une donnée réelle ou bien estimée.
Groupe de lignes UIC 20
Période
Donnée ou estimation de l'âge moyen en fin d'année et source Données issues du rapport « l'Avenir du Transport ferroviaire » remis au Premier Ministre le 15 février 2018 par la mission conduite par Jean-Cyril Spinetta
RFN UIC 2-4 UIC 5-6 UIC 7-9 (AV) LGV
1993 2017
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
-
RFN UIC 2-4 UIC 5-6 UIC 7-9 (AV) LGV RFN UIC 2-4 UIC 5-6 UIC 7-9 (AV) LGV
2018-2019
Données issues de la base de l'ART
1954 1992
Estimation d'après modèle de parc AQST
1981 1992
Estimation d'après modèle de parc AQST
UIC 2-6 en IDF
1954 2019
Estimation d'après modèle de parc AQST
Pour chaque groupe UIC de voies constitutif du RFN pour lequel nous avons réalisé un modèle de parc, nous avons estimé les longueurs de voie entrant, renouvelées ou radiées chaque année, en nous basant : - Sur le solde de la longueur totale de voie cible du parc considéré entre l'année n et l'année n+1 ; - Sur des données de séries chronologiques des longueurs équivalentes de voie renouvelée en km Gopeq4 issues de différentes sources précisées dans le tableau ci-dessous. Ces séries étant incomplètes, nous avons estimé les longueurs équivalentes de voie renouvelée pour les années où la donnée n'était pas disponible selon une méthode précisée dans le tableau ci-dessous :
Groupe de lignes UIC Global RFN 4
Période 1954 2004 1968 2004
Donnée ou estimation de la longueur totale de voie renouvelée en fin d'année (km Gopeq) et source Données d'après les mémentos statistiques de la SNCF depuis 1954 Données issues du rapport de l'audit sur l'état du Réseau Ferré National français de la mission conduite par Robert Rivier et Yves Putallaz, remis le 7 septembre 2005 Données issues du rapport « l'Avenir du Transport ferroviaire » remis au Premier Ministre le 15 février 2018 par la mission conduite par Jean-Cyril Spinetta
UIC 2-4 UIC 5-6 UIC 7-9 (AV) LGV UIC 2-4 UIC 5-6 UIC 7-9 (AV) UIC 2-4 en IDF
1981 2017
La longueur équivalente de voie renouvelée est mesurée en GOPEQ (Grandes Opérations Programmées Equivalentes), qui traduit le volume de renouvellement, en intégrant différents types d'opérations, et en faisant abstraction de l'évolution des coûts unitaires.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 21
-
UIC 5-6 en IDF Estimation à partir de l'évolution de la longueur totale de voie UIC 2-6 renouvelée entre 1968 et 1980 (données rapport audit Rivier et Putallaz, 2005) et de la part moyenne de la longueur de voie UIC 2-6 renouvelée en IDF dans la longueur totale de voie UIC 2-6 renouvelée sur la période 1981-1983 (données rapport Spinetta, 2018) : Hypothèse que cette part est restée fixe sur la période 1968 1980. Estimation à partir de l'évolution de la longueur totale de voie renouvelée entre 1954 et 1967 sur le RFN (données mémentos statistiques SNCF) et de la part moyenne de la longueur de voie renouvelée par catégorie (UIC 2-4 par exemple) dans la longueur totale de voie renouvelée sur le RFN en 1968 et 1969 (données rapport audit Rivier et Putallaz, 2005) : Hypothèse que la répartition par catégorie des longueurs de voie renouvelées est restée fixe sur la période 1954 1969.
UIC 2-6 en IDF
1968 1980
-
UIC 2-4 UIC 5-6 UIC 7-9 (AV) UIC 2-6 en IDF
1954 1967
Afin de calibrer les modèles réalisés et d'assurer la cohérence globale de l'estimation, nous avons comparé l'estimation de l'âge moyen en fin d'année calculée en sortie du modèle avec sa valeur réelle pour les 3 premières années où la donnée était disponible. Pour effectuer cette comparaison, nous avons tenté de minimiser l'erreur quadratique moyenne entre l'estimation et la valeur réelle. Le tableau ci-dessous détaille l'erreur quadratique moyenne obtenue pour les différents modèles de parc utilisés concernant les groupes UIC de lignes ferroviaires :
Erreur quadratique moyenne de l'estimation en années (années prises en compte dans le calcul) 0,11 (1993 - 1995) 0,36 (1993 - 1995) 0,32 (1993 - 1995) 0,13 (1993 - 1995) 0,31 (1993 - 1995)
Groupe de lignes UIC RFN UIC 2-4
Période
1954 1992 UIC 5-6 UIC 7-9 (AV) LGV 1981 1992
22
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Les modèles semblent cohérents avec les premières données disponibles, l'erreur quadratique moyenne de l'estimation étant inférieure à 1/2 année l'ensemble des modèles. A noter que nous n'avons pas trouvé de données concernant l'âge moyen des voies UIC 2-6 en Ile-de-France. La cohérence du modèle portant sur cette catégorie n'a donc pas pu être évaluée.
Le graphique ci-dessus illustre l'évolution de l'âge moyen des lignes ferroviaires depuis 1954 selon la classification de l'UIC : Le Réseau Ferré National français a vieilli entre 1954 et le milieu des années 90. L'âge moyen des voies du RFN a ensuite stagné entre 1994 et 2004 grâce à des renouvellements de voies. Le réseau a ensuite à nouveau vieilli pour atteindre 33 ans en 2009, avant d'être partiellement renouvelé au cours des dernières années pour atteindre 30 ans d'âge moyen en 2019 ; Entre 1954 et 2019, l'âge moyen des voies UIC 2-4 (les lignes les plus fréquentées) a augmenté moins fortement que celui des voies UIC 5-6 (principalement des lignes transversales moins fréquentées). D'après notre modélisation, les lignes UIC 7-9 avec voyageurs, correspondant aux petites lignes les moins fréquentées des réseaux régionaux, étaient déjà 2 fois plus âgées que les autres lignes en 1954. Elles n'ont été renouvelées que très partiellement à partir de 2010. En 2019, l'âge moyen des voies UIC 2-4 est de 20 ans, celui des voies UIC 5-6 de 26 ans, contre 36 ans pour les UIC 7-9 AV. Ces importantes disparités entre catégories UIC s'expliquent en grande partie par la politique de maintenance et d'investissement adoptée par le gestionnaire du réseau ferré français ;
23
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
En Ile-de-France, les voies ferroviaires appartenant aux catégories UIC 2 à 6 - qui forment le réseau sur lequel circulent les trains régionaux de voyageurs de la région francilienne ont vieilli entre 1954 et 2009, en suivant globalement la même trajectoire que le RFN. Le réseau a été grandement renouvelé à partir de 2010, passant de 33 ans d'âge moyen des voies en 2009, à 24 ans en 2019 ; Depuis la mise en service de la première LGV en 1981 (1er tronçon de la LGV Sud-Est entre Saint-Florentin Lyon et Sathonay-Camp inauguré le 22 mai 1981), l'âge moyen des LGV françaises a augmenté en moyenne jusqu'en 2019, la mise en service progressive de nouvelles lignes LGV engendrant néanmoins des baisses ponctuelles dans son évolution. Il a atteint 19 ans en 2016 avant la mise en 2017 des LGV Sud Europe Atlantique et Bretagne-Pays de la Loire et du contournement de Nîmes et Montpellier sur la LGV Méditerranée. En 2019, l'âge moyen des LGV est de 15 ans. L'intensité d'utilisation des lignes ferroviaires :
L'intensité d'utilisation des lignes ferroviaires se définit comme le rapport du parcours des trains en trains-km sur la longueur de ligne en km. Une intense utilisation des lignes ferroviaires est susceptible d'user les voies. Elle augmente donc le risque d'incidents liés à l'état de la voie à long terme, pouvant entrainer des retards. Lorsque l'intensité d'utilisation approche les limites de capacité des infrastructures, l'exploitation ferroviaire peut devenir difficile, et les retards sont davantage susceptibles de se propager d'un train au suivant par effet de réseau, notamment aux heures de pointe. Afin de tester une éventuelle corrélation entre l'évolution de la ponctualité des trains depuis 1954 par service et l'intensité d'utilisation des lignes ferroviaires par ces services, nous avons retenu différentes variables suivantes :
Variable Intensité d'utilisation du RFN par l'ensemble des services voyageurs SNCF Période Calcul utilisé
- ( ) é
Intensité d'utilisation du RFN par les services Grandes Lignes Intensité d'utilisation du RFN par les services TER Intensité d'utilisation des lignes UIC 2-6 d'Ilede-France par les trains régionaux d'IDF Intensité d'utilisation des LGV par les TGV
1954 2019
- ( ) é
- ( ) é - () 2 - 6
1981 2019
- ()
24
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Les sources de données sur l'évolution des longueurs de ligne exploitées sont précisées ci-dessous :
Variable Longueur totale de ligne exploitée RFN Période Sources 1954-2013 : Mémentos statistiques de la SNCF ; 2015-2019 : base ART ; 2014 : moyenne (2013 ; 2015). 1954-2013 : Mémentos statistiques de la SNCF ; 2015-2019 : base ART ; 2014 : moyenne (2013 ; 2015). 1954 2019 1966-2004 : Mémentos statistiques de la SNCF 1954-1965 : estimation AQST à l'aide du modèle de parc ; 2009, 2013, 2015-2017 : Commissariat général au développement durable (CGDD) du Ministère de la Transition Ecologique ; 2005-2008, 2010-2012, 2014 : Estimation par prolongement linéaire ; 2015-2019 : base ART.
Longueur totale de LGV exploitée
Longueur de ligne en Ile-de-France (UIC 2-6)
Les sources de données sur l'évolution des parcours de trains (trains-km) par service sont précisées ci-dessous :
Variable Total trains-km services voyageurs SNCF Total trains-km services Grandes Lignes Total trains-km services TER
Période
Sources 1954-2013 : Mémentos statistiques de la SNCF ; 2014 : moyenne (2013;2015) 2015-2019 : ART 1954-2013 : Mémentos statistiques de la SNCF ; 2014 : OMNIL 2015-2019 : ART
1954 2019
Total trains-km trains régionaux en Ile-de-France
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
25
L'intensité d'utilisation des lignes ferroviaires exploitées du RFN par l'ensemble des services voyageurs a cru de façon à peu près constante entre 1954 et 2002, avant de se stabiliser autour de 13 000 trkm/km de ligne exploité entre 2003 et 2013. Elle a connu un record au-delà de 15 300 trkm/km en 2015 avant de diminuer pour atteindre environ 13 200 trkm/km en 2019, soit une multiplication par 2,8 entre 1954 et 2019.
26
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
L'intensité d'utilisation du RFN par les services Grandes Lignes a cru de façon à peu près constante entre 1954 et 2002, avant de diminuer à partir de 2015 pour atteindre près de 5100 trkm Grandes Lignes/km de ligne RFN en 2019. Entre 1954 et 2019, elle a été multipliée par 2,2 environ. L'intensité d'utilisation du RFN par les services TER a connu une croissance très soutenue dans les années 90, présentant une tendance exponentielle. Si cette croissance a légèrement ralenti à partir de 2005, sa tendance est globalement constante depuis. L'utilisation du réseau ferré par les services TER a ainsi dépassé celle du réseau par les services Grandes Lignes en 2014, et elle dépasse 6000 trkm TER/km de ligne RFN en 2019, ce qui représente une multiplication par 3,2 par rapport au niveau de 1954.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
27
Depuis la mise en service de la première LGV en 1981, leur intensité d'utilisation par les services TGV a fortement augmenté pour atteindre près de 47 500 trkm/km de ligne en 2019. La série présente une grande volatilité. Il est probable que la mise en service d'une nouvelle LGV fasse chuter l'intensité d'utilisation des lignes l'année de sa mise en service en augmentant la longueur totale de ligne LGV, avant que l'accroissement rapide du nombre de circulations de TGV sur cette même ligne n'entraine une forte augmentation de l'intensité d'utilisation des LGV. L'intensité d'utilisation des lignes ferroviaires d'Ile-de-France par les services Transilien et assimilés a cru très rapidement entre 1954 et 1975. Depuis 1975, elle est globalement restée stable jusqu'en 2019 décrivant un plateau autour de 40 000 trkm/km de ligne. Elle a donc doublé entre 1954 et 2019.
28
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Le niveau du trafic en voyageurs-kilomètres (voy-km) et le niveau de fréquentation des trains :
Un niveau de trafic en voyageurs-kilomètres élevé amène l'exploitant ferroviaire à réduire la durée de l'intervalle entre 2 trains dans sa grille horaire, et peut le contraindre à mener une exploitation proche des limites de capacité des infrastructures sur certaines lignes ou tronçons de ligne du réseau. Davantage de retards liés aux situations de congestion peuvent alors survenir, et ces derniers peuvent impacter davantage de voyageurs du fait de la propagation d'un retard d'un train aux suivants par effet de réseau, notamment aux heures de pointe. Un indicateur de fréquentation (voyageurs-km/trains-km) représentant le nombre moyen de voyageurs transportés par train a également été calculé pour les différentes activités voyageurs. Lorsque cet indicateur augmente, davantage de retards liés aux voyageurs (malaises voyageurs, blocage des portes durant le temps d'échange voyageurs lors d'un arrêt, déclenchement légitime ou non du signal d'alarme par un voyageur entrainant des retards, retards liés aux bagages oubliés, etc.) risquent d'impacter la ponctualité. Les sources de données sur l'évolution des parcours de trains (trains-km) par service ont été précisés dans le tableau au paragraphe précédent consacré à l'intensité d'utilisation des lignes ferroviaires. Les sources de données utilisées sur l'évolution du trafic voyageurs en voy-km sont précisées ciaprès :
Variable Trafic voy-km Grandes Lignes Période Sources 1954-2013 : Mémentos statistiques de la SNCF ; 2015-2019 : base ART ; 2014 : moyenne (2013 ; 2015). 1954-2013 : Mémentos statistiques de la SNCF ; 2015-2019 : base ART ; 2014 : donnée OMNIL. 1972-2013 : Mémentos statistiques de la SNCF 1954-1971 : estimation AQST sous l'hypothèse d'une part constante du trafic voy-km TER dans le trafic voykm tous services voyageurs, égale à la moyenne de cette part sur la période 1972-74 ; Estimation par prolongement linéaire ; 2015-2019 : base ART ; 2014 : moyenne (2013 ; 2015).
Trafic voy-km trains régionaux d'Ile-de-France (hors RER RATP) 1954 2019
Trafic voy-km TER
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
29
Le trafic voyageurs en voy-km a fortement cru depuis 1954 pour les trains régionaux de province comme pour ceux d'Ile-de-France. La croissance du trafic s'est accélérée avec la régionalisation des services TER depuis le 1er janvier 2002. Entre 1954 et 2019, le trafic voyageurs a été multiplié par 3,7 pour les trains régionaux d'Ile-de-France, et par 6,1 pour ceux de province.
30
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Le trafic voyageurs des Grandes Lignes (actuels TGV et Intercités) a également fortement augmenté depuis 1954, malgré une période de ralentissement entre 1990 et 1995. Il a été multiplié par 3,2 entre 1954 et 2019. Le trafic voyageurs dans son ensemble (trains Grandes Lignes et trains régionaux de province et d'Ile-de-France) a été multiplié par 3,5 entre 1954 et 2019. L'indicateur de fréquentation (voy-km/train-km) a connu une croissance irrégulière entre 1954 et 2019 pour l'ensemble des activités ferroviaires de voyageurs. Le nombre moyen de voyageurs par train a ainsi été multiplié par 2,7 pour les TER. Il a cru de 65% pour les trains régionaux d'Ile-de-France, atteignant 244 voyageurs/train en moyenne en 2019.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
31
Concernant les trains Grandes Lignes, la croissance de l'indicateur a d'abord été très irrégulière entre 1954 et 2012, puis elle a été continue et très soutenue depuis 2012. Cette nette accélération de la croissance du nombre moyen de voyageurs par train peut probablement en partie s'expliquer par la suppression et/ou la sortie du périmètre Grandes Lignes de nombreuses lignes Intercités depuis 2012, par la mise en service de nouvelles LGV relativement courtes comme les LGV Rhin-Rhône et Bretagne-Pays de la Loire et de nouvelles rames TGV Duplex à deux niveaux, donc plus capacitaires. Le nombre moyen de voyageurs par train Grandes Lignes a ainsi été multiplié par 2 depuis 1954.
32
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Contexte : évolution de la population de France métropolitaine et de la population francilienne depuis 1954 :
Pour contextualiser davantage ce travail, nous précisons ci-après l'évolution de la population de France métropolitaine et de la population francilienne depuis 1954, qui a probablement influé sur l'évolution du volume de trafic voyageurs-km décrite au point précédent - respectivement pour les activités voyageurs Grandes Lignes et TER, et Transilien en Île-de-France - et dont l'effet sur la ponctualité a été testé dans les modèles économétriques. D'après l'INSEE5, la population de France métropolitaine au 1er janvier a cru de 52% entre 1954 et 2020, passant de 42,9 à 65,1 millions d'habitants sur la période. Cela représente un taux de croissance annuel moyen de 0,6% sur cette période.
Source : 1946-2020 : Insee, Composantes de la croissance démographique, France métropolitaine - https://www.insee.fr/fr/statistiques/1892117?sommaire=1912926
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 33
5
D'après l'INSEE également6, la population francilienne au 1er janvier a cru selon un rythme davantage soutenu encore, de 68% entre 1954 et 2020, passant de 7,3 à 12,3 millions d'habitants sur la période. Cela représente un taux de croissance annuel moyen de 0,8% sur cette période.
Sources : La population des régions de 1851 à 1999, IAURIF, 1999, d'après Recensement général de la population de 1990, Insee, 1990 ; Données harmonisées des recensements de la population à partir de 1968, Insee, 2022
34 AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
6
2.3 Forme des modèles statistiques testés et implications statistiques 2.3.1 Forme des modèles statistiques testés
Des modèles économétriques de régression linéaire multiples ont été implémentés à l'aide du logiciel R pour décrire et interpréter la corrélation éventuelle entre l'évolution de la ponctualité depuis 1954 par service et l'évolution d'un déterminant supposé de cette ponctualité. Deux formes de modèles ont été utilisées : 1. Des régressions linéaires multiples dont la variable expliquée est le taux de retard et les variables explicatives sont les différents déterminants supposés de la ponctualité. Ces modèles prennent la forme suivante (on suppose 1954 année initiale des séries chronologiques retenues) :
= 0 + × , + =1
Avec
la valeur du taux de retard de l'année t (t dans la période 1954 2019) 0 la constante de la régression linéaire , la valeur de la i-ème variable explicative pour l'année t la constante (indépendante du temps) associée à la i-ème variable explicative le résidu (ou terme d'erreur) de l'estimation du taux de retard de l'année t
2. Des régressions linéaires multiples dont la variable expliquée est le logarithme népérien du taux de retard et les variables explicatives sont les différents déterminants supposés de la ponctualité. Ces modèles prennent la forme suivante (on suppose 1954 année initiale des séries chronologiques retenues) :
ln( ) = 0 + × , + , =1
ce que l'on peut réécrire sous la forme suivante :
= × ×, +
=1 Où , 0 , , ,
, représentent les grandeurs introduites en 1. En revanche, le lien entre la variable expliquée et les variables explicatives , n'est plus linéaire mais exponentiel dans
le cas de ces modèles.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
35
2.3.2 Implications statistiques
Dans l'analyse statistique menée pour cette étude, les 65 observations du vecteur
( , 1,, , ... , , ) avec {1954, 2019} sont assimilées à des tirages indépendants des variables aléatoires ( , 1,, , ... , , ), qui ne sont pas traitées comme + séries
temporelles. En effet, les résultats de régressions linéaires sur des séries temporelles ne sont valables que si ces séries temporelles sont stationnaires, c'est-à-dire si sa structure n'évolue pas avec le temps. Or des tests statistiques menés sur les séries temporelles de la variable expliquée (taux de retard) et des variables explicatives (effectifs du personnel SNCF, âge moyen du matériel roulant, âge moyen des voies ferroviaires, intensité d'utilisation des lignes ferroviaires) nous montrent que ces séries temporelles sont non-stationnaires car elles présentent une tendance (ou trend en anglais). Dans une telle situation, le modèle de régression linéaire n'est plus valable du fait de l'autocorrélation des séries temporelles. Cette notion désigne la corrélation de la variable par rapport à une version décalée d'elle-même dans le temps. Par exemple, si le taux de retard de l'année 1980 est corrélé avec celui de l'année 1979, on dit qu'il y a autocorrélation. La modélisation de la corrélation entre des séries temporelles non stationnaires (présentant un trend) nécessite d'utiliser des modèles poussés de type ARIMAX (Auto Regressive Integrated Moving Average with eXternal inputs) qui dépassent le champ de cette étude. Ici, on s'affranchit ici des effets d'autocorrélation et de non stationnarité des séries temporelles étudiées et on considère les 65 observations ( , 1,, , ... , , ) avec {1954, 2019} comme des tirages indépendants de variables aléatoires sans tenir compte de la dimension temporelle sous-jacente. Par conséquent, les éventuelles relations de corrélation mises en évidence par les modèles utilisés doivent être considérées avec prudence et non comme des liens de causalité généraux valables en dehors de la période d'étude [1954-2019].
36
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
3.
RESULTATS
3.1 Note de lecture des résultats des tests statistiques
Pour chaque modèle de régression retenu, des résultats portant sur la significativité du modèle et de l'impact des déterminants supposés de la ponctualité sur cette ponctualité sont fournis dans la section suivante. Un test de Student est utilisé pour décrire la significativité de l'influence d'un déterminant supposé de la ponctualité sur cette ponctualité. Il porte sur la nullité du coefficient
associé au i-ème
déterminant supposé de la ponctualité , , selon l'hypothèse nulle H0 et l'hypothèse alternative H1 suivantes :
0 : = 0 1 : 0
Les résultats du test de Student permettent de savoir si l'on peut rejeter ou non l'hypothèse nulle H0. Si on choisit de rejeter l'hypothèse nulle H0 et d'accepter l'hypothèse alternative H1, on considère que l'effet du i-ème déterminant supposé de la ponctualité sur la ponctualité est significatif. Si on choisit d'accepter l'hypothèse nulle H0, on considère qu'on ne peut pas conclure qu'il y a un effet du i-ème déterminant supposé de la ponctualité sur cette ponctualité d'après le modèle retenu. La p-value associée au test de Student appliqué à un coefficient représente la probabilité de rejeter l'hypothèse nulle H0 de nullité de ce coefficient, alors qu'elle vraie. Ici, plus la p-value est petite, plus la probabilité de faire une erreur en concluant qu'il y a un effet significatif du i-ème déterminant supposé de la ponctualité sur la ponctualité est faible. En pratique, pour savoir si l'on doit ou non rejeter l'hypothèse nulle, on peut comparer la p-value à un seuil de significativité. Si la p-value est inférieure au seuil, on conclut qu'il y a un effet du i-ème déterminant supposé de la ponctualité sur la ponctualité. Dans le cas contraire, on ne peut pas conclure avec certitude à l'existence d'un effet (même très faible) du i-ème déterminant supposé de la ponctualité sur la ponctualité. En pratique, un seuil de significativité de 0,05 est souvent utilisé. Dans le logiciel R, les résultats de la modélisation portant sur les coefficients des différentes variables explicatives du modèle sont présentés sous forme de tableau avec : - En colonne "Estimate" la valeur estimée du coefficient ; - En colonne "Std. Error" l'écart-type de cette estimation ; - En colonne "t value" la statistique du test de Student ; - En colonne "Pr(>|t|)" la p-value associée au test de Student.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
37
Dans le tableau de résultats de la régression modélisée, sont précisés à droite des p-value des codes indiquant le niveau de significativité atteint :
Pour chaque modèle, la significativité du modèle dans son ensemble est caractérisée à l'aide d'un test de Fisher et du calcul du coefficient de détermination R² ajusté, dont les résultats sont également fournis dans la section suivante : Le coefficient de détermination ajusté « R² ajusté » quantifie la part de la variance expliquée par le modèle. Le coefficient de détermination non ajusté « R² » augmente généralement à mesure que l'on ajoute des variables dans le modèle donc des degrés de liberté. Pour s'affranchir de cet effet, on utilise le coefficient de détermination ajusté, qui est corrigé du nombre de degrés de liberté ;
-
Le test de Fisher caractérise la significativité globale du modèle et porte sur la nullité de l'ensemble des coefficients des variables explicatives du modèle, selon l'hypothèse nulle H0 et l'hypothèse alternative H1 suivantes :
0 : 1 :
tous les coefficients sont nuls
un des coefficients au moins est non nul
Les résultats du test de Fisher permettent de savoir si l'on peut rejeter ou non l'hypothèse nulle H0. Si on choisit de la rejeter, on considère que le modèle permet d'expliquer une part significative de l'évolution de la ponctualité des trains en France depuis 1954. Si on choisit d'accepter l'hypothèse nulle H0 et de rejeter l'hypothèse alternative H1, on considère qu'on ne peut pas conclure avec certitude que le modèle retenu permet d'expliquer une part significative de l'évolution de la ponctualité des trains en France depuis 1954. Pour savoir si l'on doit ou non rejeter l'hypothèse nulle, on peut alors comparer la p-value à un seuil de significativité. Si la p-value est inférieure au seuil, on rejette l'hypothèse nulle et on accepte l'hypothèse alternative. Dans le logiciel R, les résultats portant sur la significativité du modèle dans son ensemble sont fournis en-dessous du tableau des coefficients : - "Residual standard error" est la somme des carrés résiduels correspondant à la variabilité non-expliquée par le modèle ; "Multiple R-squared" est le coefficient de détermination R² qui quantifie la part de la variance expliquée par le modèle. Cet indicateur augmente généralement à mesure que l'on ajoute des variables dans le modèle donc des degrés de liberté. Pour s'affranchir de cet effet, on utilise le coefficient de détermination ajusté, présenté ci-après ;
38
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
-
"Adjusted R-squared" est le coefficient de détermination ajusté ou R² ajusté, il s'agit du coefficient de détermination R² corrigé du nombre de degrés de liberté ; "F-statistic" est la statistique du test de Fisher ; "p-value" est la p-value associée au test de Fisher.
-
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
39
3.2 Résultats de la modélisation statistique 3.2.1 Ponctualité des trains régionaux de province à 5 minutes :
Un premier modèle de régression linéaire visant à expliquer l'évolution depuis 1954 du taux de retard à 5 minutes des trains TER a été implémenté. L'influence des déterminants supposés de la ponctualité suivants a été testée : - L'âge moyen des automotrices électriques : d'après les données de l'OpenData SNCF, elles représentent près de 40% du matériel moteur TER en 2019 ; - L'âge moyen des automotrices thermiques : d'après les données de l'OpenData SNCF, elles représentent près de 25% du matériel moteur TER en 2019 ; - L'âge moyen des voitures TER remorquées, principal constituant du matériel remorqué TER ; - L'âge moyen des voies du RFN des catégories UIC 5-6 : ces voies composent la majorité des lignes parcourues par les trains TER ; - L'intensité d'utilisation du RFN par les services TER. Les résultats des tests statistiques effectués pour ce modèle sont synthétisés dans le tableau suivant :
D'après ce modèle, seuls l'intensité d'utilisation du RFN par les services TER et le nombre moyen de voyageurs par TER ont eu un effet significatif au seuil de 5% - et de signe cohérent - sur la ponctualité des trains TER depuis 1954.
40 AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Un second modèle plus performant a été retenu. Il s'agit d'un modèle de régression linéaire dont les variables explicatives sont : - L'âge moyen des automotrices thermiques ; - L'âge moyen des voitures TER remorquées, principal constituant du matériel remorqué TER ; - L'intensité d'utilisation du RFN par les services TER.
D'après les résultats du test de Student de nullité de chaque coefficient, les effets des variables explicatives retenues sont significatifs au seuil de 1%. Près de 55% de la variance du taux de retard annuel des TER sont expliqués par le modèle. D'après les résultats du test de Fisher, on rejette l'hypothèse nulle de nullité de l'ensemble des coefficients au seuil de significativité 0,1%. Selon le modèle retenu, toutes choses égales par ailleurs, un vieillissement de 9 ans du parc des automotrices thermiques a engendré sur la période 1954-2019 une hausse moyenne de 1 point du taux de retard des trains TER. En effet, le risque de panne du matériel moteur augmente à mesure qu'il vieillit. Un vieillissement de 13 ans du parc des voitures remorquées TER a engendré une hausse moyenne de 1 point du taux de retard des trains TER sur la période 1954-2019. Entre 1954 et 2019, le parc des voitures remorquées TER a vieilli de 23 ans d'après notre modèle de parc, engendrant d'après le modèle retenu une hausse du taux de retard de près de 1,8 points. En effet, le risque de dysfonctionnement du matériel remorqué augmente à mesure qu'il vieillit. D'après ce modèle, sur la période 1954-2019, un doublement de l'intensité d'utilisation du RFN par les services TER par rapport au niveau de 1954 a engendré une hausse moyenne de 1,8 points du taux de retard des TER. Entre 1954 et 2019, l'intensité d'utilisation du RFN par les services TER a été multipliée par 3,2 engendrant d'après le modèle retenu une hausse du taux de retard de près de 4
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 41
points. Une intense utilisation des lignes ferroviaires est en effet susceptible d'user les voies. Elle augmente donc le risque d'incidents liés à l'état de la voie à long terme, pouvant entrainer des retards.
3.2.2 Ponctualité des trains régionaux d'Ile-de-France à 5 minutes :
Un premier modèle de régression linéaire visant à expliquer l'évolution depuis 1954 du taux de retard à 5 minutes des trains d'Ile-de-France a été implémenté. L'influence des déterminants supposés de la ponctualité suivants a été testée : - L'âge moyen des automotrices électriques : d'après les données de l'OpenData SNCF, elles représentent près de 84% du matériel moteur Transilien en 2019 ; - L'âge moyen des automotrices thermiques : d'après les données de l'OpenData SNCF, elles représentent seulement 3% du matériel moteur Transilien en 2019 ; - L'âge moyen des voitures Transilien remorquées, principal constituant du matériel remorqué pour les trains régionaux d'Ile-de-France ; - L'âge moyen des lignes ferroviaires en Ile-de-France ; - L'intensité d'utilisation des lignes ferroviaires en Ile-de-France par les services Transilien ; - Le volume de trafic voyageurs-kilomètres ; - Le nombre moyen de voyageurs par train TER. Les résultats des tests statistiques effectués pour ce modèle sont synthétisés dans le tableau suivant :
D'après le signe des coefficients de la régression modélisée, seuls le volume du trafic en voy-km et l'âge moyen des lignes du réseau francilien présentent un effet significatif au seuil 5% sur la
42 AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
ponctualité des trains régionaux d'Ile-de-France et de signe cohérent avec l'intuition. D'après ce premier modèle, l'impact de ces déterminants de la ponctualité est significatif au seuil 0,1%. Un second modèle plus performant a été retenu. Il s'agit d'un modèle exponentiel dont les variables explicatives sont : - L'âge moyen des voitures Transilien remorquées ; - L'âge moyen des lignes ferroviaires en Ile-de-France ; - Le nombre moyen de voyageur par train.
D'après les résultats du test de Student de nullité de chaque coefficient, l'effet de l'âge moyen des voitures Transilien remorquées est significatif au seuil 5%, et ceux des autres variables explicatives retenues le sont au seuil de 0,1%. Près de 91% de la variance du taux de retard annuel des trains régionaux d'Ile-de-France sur la période 1954-2019 sont expliqués par le modèle. D'après les résultats du test de Fisher, on rejette l'hypothèse nulle de nullité de l'ensemble des coefficients au seuil de significativité 0,1%. Selon le modèle retenu, toutes choses égales par ailleurs, un vieillissement de 10 ans du parc des voitures Transilien remorquées sur la période 1954-2019 a engendré en moyenne une multiplication par 1,1 du taux de retard des trains régionaux d'Ile-de-France, soit une augmentation de 10%. En effet, le risque de dysfonctionnement du matériel remorqué augmente à mesure qu'il vieillit. Entre 1954 et 2019, le parc des voitures remorquées Transilien a vieilli de 18 ans d'après notre modèle de parc, engendrant d'après le modèle retenu une augmentation du taux de retard de 19%. D'après ce modèle, sur la période 1954-2019, toutes choses égales par ailleurs, un vieillissement de 10 ans des voies ferroviaires en Ile-de-France a engendré en moyenne une multiplication par 2,3 du taux de retard des trains régionaux d'Ile-de-France. Entre 1954 et 2019, les lignes ferroviaires d'IleAQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954 43
de-France ont vieilli de 14,1 ans d'après notre modèle de parc, ce qui a conduit à une multiplication par 3,3 selon le modèle retenu. En effet, des lignes ferroviaires vétustes peuvent connaitre des défaillances, ou encore nécessiter le recours à des limitations temporaires de vitesse pour préserver la sécurité des voyageurs et des installations, notamment en cas de fortes chaleurs. Le modèle retenu indique également que, toutes choses égales par ailleurs, une hausse du nombre moyen de voyageurs par train Transilien de 10 voyageurs sur la période 1954-2019 a engendré une augmentation moyenne de 17% du taux de retard. Le transport d'un plus grand nombre de voyageurs par train implique un risque supplémentaire d'occurrence d'un retard lié aux voyageurs (malaises voyageurs, blocage des portes durant le temps d'échange voyageurs lors d'un arrêt, déclenchement légitime ou non du signal d'alarme par un voyageur entrainant des retards, retards liés aux bagages oubliés, etc.). Entre 1954 et 2019, le nombre moyen de voyageurs par train Transilien a augmenté d'environ 96 voyageurs/train, engendrant d'après le modèle multiplication par 4,5 des retards.
3.2.3 Ponctualité des trains Grandes Lignes à 15 minutes :
Modélisation sur la période 1954-2019 complète :
Un premier modèle de régression linéaire visant à expliquer l'évolution depuis 1954 du taux de retard à 15 minutes des trains Grandes Lignes a été implémenté. L'influence des déterminants supposés de la ponctualité suivants a été testée : - Le nombre de jours de grève par agents et par année ; - L'âge moyen des locomotives électriques, qui ont constitué une part prépondérante du matériel moteur des services Grandes Lignes sur la période ; - L'âge moyen des locomotives Diesel, qui ont également constitué une part importante du matériel moteur des services Grandes Lignes sur la période ; - L'âge moyen des lignes ferroviaires UIC 2-4 du RFN, qui composent la grande majorité des Grandes Lignes du réseau ; - L'intensité d'utilisation du RFN en Ile-de-France par les services Grandes Lignes ; - Le volume de trafic voyageurs-km pour les services Grandes Lignes ; - Le nombre moyen de voyageurs par train Grandes Lignes. Les résultats des tests statistiques effectués pour ce modèle sont synthétisés dans le tableau suivant :
44
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Selon cette première régression, seul le nombre moyen de voyageurs par train Grandes Lignes présente un effet significatif au seuil 5% sur le taux de retard, et dont le signe ne s'oppose pas à l'intuition.
Un second modèle plus performant a été retenu. Il s'agit d'un modèle exponentiel dont les variables explicatives sont : - L'âge moyen des locomotives électriques ; - L'âge moyen des lignes ferroviaires les plus fréquentées du RFN (UIC 2-4) ; - Le nombre moyen de voyageurs par train Grandes Lignes.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
45
D'après les résultats du test de Student de nullité de chaque coefficient, les effets des variables explicatives retenues sont tous significatifs au seuil de 1%. Près de 73% de la variance du taux de retard annuel des services Grandes Lignes sur la période 1954-2019 sont expliqués par le modèle. D'après les résultats du test de Fisher, on rejette l'hypothèse nulle de nullité de l'ensemble des coefficients au seuil de significativité 0,1%. Selon le modèle retenu, toutes choses égales par ailleurs, un vieillissement de 10 ans du parc des locomotives électriques sur la période 1954-2019 a engendré en moyenne une multiplication par 1,22 du taux de retard des services Grandes Lignes, soit une augmentation de 22%. Entre 1954 et 2019, le parc des locomotives électriques a vieilli de 21,5 ans d'après notre modèle de parc, engendrant d'après le modèle retenu une augmentation du taux de retard de 53%. D'après ce modèle, sur la période 1954-2019, toutes choses égales par ailleurs, un vieillissement de 10 ans des lignes ferroviaires UIC2-4 qui composent la quasi-totalité des grandes lignes en France - a engendré en moyenne une multiplication par 1,33 du taux de retard des trains Grandes Lignes. Entre 1954 et 2019, les lignes ferroviaires UIC 2-4 ont vieilli de 9,9 ans d'après notre modèle de parc, ce qui a conduit à une augmentation d'1/3 du taux de retard selon le modèle retenu. Le modèle retenu suggère également que, toutes choses égales par ailleurs, une hausse du nombre moyen de voyageurs par train Grandes Lignes de 100 voyageurs sur la période 1954-2019 a engendré une augmentation moyenne d'1/3 du taux de retard. Pour les mêmes raisons que celles évoquées au paragraphe précédent pour les trains régionaux d'Ile-de-France, le transport d'un plus grand nombre de voyageurs par train implique un risque supplémentaire d'occurrence d'un retard lié aux voyageurs. Entre 1954 et 2019, le nombre moyen de voyageurs par train Grandes Lignes a doublé, engendrant d'après le modèle une multiplication par 1,9 des retards.
46
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modélisation sur la période 1981-2019 :
La modélisation précédente ne prend pas en compte l'évolution de l'âge moyen des rames TGV, des lignes LGV, de l'intensité d'utilisation de ces lignes par les trains TGV, du volume de trafic voy-km pour les TGV, et du nombre moyen de voyageurs par TGV depuis 1981, date de mise en service de la première LGV. En effet, toutes les variables de la régression doivent couvrir la même période temporelle, et la modélisation précédente avait pour but de décrire l'évolution de la ponctualité des trains Grandes Lignes depuis 1954. Une autre modélisation a donc été réalisée en se restreignant à la période 1981-2019 afin d'intégrer les variables portant sur les LGV et les TGV. Un premier modèle de régression linéaire a été implémenté. L'influence des déterminants supposés de la ponctualité des trains Grandes Lignes suivants a été testée : - Le nombre de jours de grève par agents et par année ; - L'âge moyen des locomotives électriques, représentant près de 22% du matériel moteur Grandes Lignes en 2019 (données OpenData SNCF) ; - L'âge moyen des locomotives Diesel ; - L'âge moyen des rames TGV, représentant 2/3 du matériel moteur Grandes Lignes en 2019 (données OpenData SNCF) ; - L'âge moyen des lignes ferroviaires UIC 2-4 du RFN, qui composent la grande majorité des Grandes Lignes du réseau ; - L'âge moyen des lignes LGV ; - L'intensité d'utilisation du RFN en Ile-de-France par les services Grandes Lignes ; - L'intensité d'utilisation des lignes LGV par les TGV ; - Le volume de trafic voy-km des services TGV ; - Le nombre moyen de voyageurs par TGV. Les résultats des tests statistiques effectués pour ce modèle sont synthétisés dans le tableau cidessous :
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
47
D'après les coefficients de la régression modélisée, et les résultats du test de Student sur ces différents coefficients avec cette première régression, seul le volume de trafic voy-km présente un effet significatif au seuil 5% sur la ponctualité des services Grandes Lignes depuis 1981.
Un second modèle plus performant a donc été retenu. Il s'agit d'un modèle exponentiel dont les variables explicatives sont : - Le volume de trafic des services TGV en voy-km ; - Le nombre moyen de voyageurs par TGV ; - Le nombre annuel de journées perdues par agent SNCF du fait de mouvements sociaux.
48
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
D'après les résultats du test de Student de nullité de chaque coefficient, l'effet du nombre de jours de grève par agent SNCF est significatif au seuil 5%, celui du nombre moyen de voyageurs par TGV l'est au seuil de 1%, et celui du volume de trafic TGV l'est au seuil 0,1%. Près de 88% de la variance du taux de retard annuel des services Grandes Lignes sur la période 1981-2019 sont expliqués par le modèle. D'après les résultats du test de Fisher, on rejette l'hypothèse nulle de nullité de l'ensemble des coefficients au seuil de significativité 0,1%. Selon le modèle retenu, toutes choses égales par ailleurs, une hausse de 10 milliards de voy-km du volume de trafic TGV a engendré en moyenne une hausse de 16% des retards des trains Grandes Lignes sur la période 1981-2019. Entre 1982 (première année complète du service TGV) et 2019, le volume de trafic TGV a cru de 56 milliards de voy-km environ, engendrant d'après le modèle retenu une multiplication par 2,3 du taux de retard. En effet, un niveau de trafic voy-km élevé amène l'opérateur TGV à réduire la durée de l'intervalle entre 2 trains dans sa grille horaire, et peut le contraindre à mener une exploitation proche des limites de capacité des infrastructures sur certaines lignes ou tronçons de ligne du réseau LGV ou du réseau classique. Davantage de retards liés aux situations de congestion peuvent alors survenir, et ces retards se propagent souvent d'un train aux suivants par effet de réseau, notamment aux heures de pointe. D'après ce modèle, toutes choses égales par ailleurs, une hausse du nombre moyen de voyageurs par train Grandes Lignes de 100 voyageurs a engendré sur la période 1981-2019 une augmentation moyenne de 12% du taux de retard. Pour les mêmes raisons que celles évoquées pour les trains régionaux d'Ile-de-France et les trains Grandes Lignes sur la période 1954-2019, le transport d'un plus grand nombre de voyageurs par train implique un risque supplémentaire d'occurrence d'un retard lié aux voyageurs. Entre 1982 et 2019, le nombre moyen de voyageurs par TGV a cru de 121 voyageurs, engendrant d'après le modèle une augmentation de 15% du taux de retard des trains Grandes Lignes.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
49
Le modèle retenu suggère également que, toutes choses égales par ailleurs, une hausse d'1 jour perdu par agent SNCF du fait des grèves a provoqué en moyenne sur la période 1981-2019 une augmentation de 3% des retards. Pour les mêmes raisons que celles évoquées au paragraphe précédent pour les trains régionaux d'Ile-de-France, le transport d'un plus grand nombre de voyageurs par train implique un risque supplémentaire d'occurrence d'un retard lié aux voyageurs. En 2019, 2,6 jours supplémentaires par agent SNCF ont été perdus du fait des grèves par rapport à 1982, engendrant d'après le modèle une augmentation de 9% des retards.
3.2.4 Ponctualité globale (pondérée du nombre de circulations par service)
Un premier modèle de régression linéaire visant à expliquer l'évolution depuis 1954 du taux de retard global pondéré du nombre de circulations par service (ponctualité à 5 min pour les services TER et Transilien et à 15 min pour les services Grandes Lignes) a été implémenté. L'influence des déterminants supposés de la ponctualité suivants a été testée : - Le nombre de jours de grève par agents et par année ; - Les effectifs du personnel de l'EPIC SNCF ; - L'âge moyen du matériel moteur, estimé à l'aide d'une moyenne pondérée des effectifs des différents types constituant le parc (locomotives électriques, rames TGV, automotrices thermiques, etc.) ; - L'âge moyen du Réseau Ferré National ; - L'intensité d'utilisation du RFN par l'ensemble des services voyageurs de la SNCF ; - Le volume du trafic pour l'ensemble des activités voyageurs en voy-km ; - Le nombre moyen de voyageurs par train sur l'ensemble des activités voyageurs. Les résultats des tests statistiques effectués pour ce modèle sont synthétisés dans le tableau suivant :
50
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
D'après le signe des coefficients de la régression modélisée, une augmentation des effectifs de personnel de la SNCF, un vieillissement du parc du matériel moteur ou du RFN ont engendré des baisses du taux de retard des trains en France sur la période 1954-2019, ce qui n'est pas cohérent avec l'intuition quant à l'impact de ces déterminants de la ponctualité. Ils n'ont donc pas été retenus pour la seconde modélisation. Afin préciser plus finement l'existence ou non d'un lien de corrélation entre la baisse des effectifs de l'EPIC SNCF depuis 1954 et l'évolution de la ponctualité des trains en France, nous avons également émis l'hypothèse d'existence d'un retard entre la baisse des effectifs et son impact sur la ponctualité. Nous avons testé cette hypothèse en remplaçant dans le modèle précédent la variable « effectifs du personnel de l'EPIC SNCF » par le niveau de ces effectifs 5 années auparavant, puis par la moyenne du niveau des effectifs sur les 5 années précédentes. De même que précédemment, les résultats de ces nouveaux modèles, présentés en Annexe, indiquent également que la diminution des effectifs de la SNCF a engendré une hausse du taux de retard sur la période 1954-2019, ce qui n'est pas cohérent avec l'intuition quant à son impact sur la ponctualité. En revanche, le signe du coefficient associé à l'intensité d'usage du RFN par l'ensemble des services voyageurs est cohérent avec l'intuition relative à son effet sur la ponctualité, et l'impact de cette variable est significatif au seuil 0,1%.
Un second modèle plus performant a été retenu. Il s'agit d'un modèle linéaire simple dont la seule variable explicative est l'intensité d'usage du RFN par l'ensemble des services voyageurs.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
51
D'après les résultats du test de Student de nullité de chaque coefficient, l'effet de la variable explicative retenue est significatif au seuil de 0,1%, et celui de la constante de régression l'est au seuil 1%. Plus de 83% de la variance du taux de retard globale pondéré sur la période 1954-2019 sont expliqués par le modèle. D'après les résultats du test de Fisher, on rejette l'hypothèse nulle de nullité de l'ensemble des coefficients au seuil de significativité 0,1%. D'après le modèle retenu, sur la période 1954-2019, un doublement de l'intensité d'utilisation du RFN par l'ensemble des services voyageurs de la SNCF par rapport au niveau de 1954 a engendré une hausse moyenne de 3,4 points du taux de retard des trains en France. Entre 1954 et 2019, l'intensité d'utilisation du RFN par les services voyageurs de la SNCF a été multipliée par 2,8 engendrant d'après le modèle retenu une hausse du taux de retard de 6 points. Une intense utilisation des lignes ferroviaires est en effet susceptible d'user les voies. Elle augmente donc le risque d'incidents liés à l'état de la voie à long terme, pouvant entrainer des retards.
52
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
3.2.5 Synthèse des résultats
Le tableau de la page suivante synthétise les résultats des différents modèles retenus. Pour les modèles retenus, la part de la variance du taux de retard sur la période 1954-2019 expliquée par le modèle est comprise entre 55 et 91%. Les modèles portant sur l'évolution de la ponctualité des trains Grandes Lignes entre 1981 et 2019, et sur celle des trains régionaux d'Ile-de-France et de la ponctualité globale pondérée du nombre de circulations par service entre 1954 et 2019 expliquent plus de 80% de la variance. Celui sur l'évolution des trains Grandes Lignes sur la période 1954-2019 en explique 73%. Le modèle portant sur l'évolution de la ponctualité des services TER est le moins « performant », expliquant seulement 55% de la variance. En outre, d'après les résultats des tests de Fisher implémentés, les modèles retenus sont tous statistiquement significatifs. L'ensemble des coefficients des variables explicatives pour les différentes régressions retenues sont significatifs au seuil 5% d'après les résultats du test de Student, et au seuil 1% pour la majorité des variables explicatives. Pour la période 1954-2019, la modélisation montre un impact significatif du vieillissement de certaines catégories du matériel roulant (matériel moteur ou matériel remorqué) sur la ponctualité des trains en France par service, ainsi que du vieillissement des lignes ferroviaires les plus fréquentées du Réseau Ferré National (grandes lignes à l'échelle nationale et lignes régionales en Ile-de-France). En effet, le risque de panne ou de dysfonctionnement du matériel roulant augmente à mesure qu'il vieillit, et des lignes ferroviaires vétustes peuvent connaitre des défaillances, ou encore nécessiter le recours à des limitations temporaires de vitesse pour préserver la sécurité des voyageurs et des installations, notamment en cas de fortes chaleurs. Selon les modèles retenus pour décrire l'évolution de la ponctualité des trains régionaux d'Ile-de-France et des trains Grandes Lignes entre 1954 et 2019, le taux de retard a cru de façon exponentielle à mesure que le matériel roulant et les voies ferroviaires ont vieilli. Dans ces modèles, l'impact d'un vieillissement de 10 ans du parc des principaux constituants du matériel moteur ou remorqué varie entre +10% et +22%. Celui d'un vieillissement de 10 ans de l'âge moyen des lignes ferroviaires exploitées varie entre +33% et une multiplication d'un facteur 2,3 pour les lignes régionales d'Ile-de-France. L'impact de cette dernière variable sur la ponctualité des services Transilien a donc été très important sur la période 1954-2019 d'après le modèle. En revanche, le modèle TGV ne fait pas ressortir l'âge moyen des rames TGV comme déterminant principal de l'évolution de la ponctualité des trains Grandes Lignes sur la période 1981-2019, peut-être pour partie car ces rames sont encore relativement récentes. En revanche, les modèles ne permettent pas de conclure qu'il y a eu un effet significatif de l'évolution du volume des effectifs de personnels de l'EPIC SNCF (ponctualité globale) sur la période 1954-2019.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
53
Service
Type de modèle
Période des données utilisées
R² ajusté régression (p-value test de Fisher)
Variables explicatives
p-value test de Student variables explicatives
Impact sur le taux de retard
Age moyen automotrices thermiques
< 0,01 < 0,01 < 0,001 < 0,05 < 0,001 < 0,001 < 0,01 < 0,001 < 0,01 < 0,001 < 0,01 < 0,05 < 0,001
+1 pt de retard / vieillissement du parc de 9 ans +1 pt de retard / vieillissement du parc de 13 ans +4 pts entre 1954 et 2019 +10% / vieillissement du parc de 10 ans x 2,3 / vieillissement de 10 ans des lignes +17% / 10 voy/train +22% / vieillissement du parc de 10 ans +33% / vieillissement de 10 ans des lignes +33% / 100 voy/train +16% / 10 Mrds voy/km +12% / 100 voy/train +3% / jours de grève/agent SNCF/an +6 pts entre 1954 et 2019
Trains régionaux de province
Régression Linéaire
1954-2019
0,55 (< 0,001)
Age moyen voitures TER Intensité d'utilisation du RFN par les services TER Age moyen voitures Transilien
Trains régionaux d'IDF
Modèle exponentiel
1954-2019
0,91 (< 0,001)
Age moyen lignes ferroviaires IDF Nombre moyen de voyageurs par train Transilien Age locomotives électriques
Trains Grandes Lignes
Modèle exponentiel
1954-2019
0,73 (< 0,001)
Age moyen des lignes UIC 2-4 du RFN Nombre moyen de voyageurs par train Grandes Lignes Volume de trafic TGV en voy-km
Trains Grandes Lignes
Modèle exponentiel
1981-2019
0,88 (< 0,001)
Nombre moyen de voyageurs par TGV Nombre de jours perdus à cause des mouvements sociaux par agent SNCF
Tous services (pondéré du nombre de circulations)
Régression Linéaire
1954-2019
0,83 (< 0,001)
Intensité d'utilisation du RFN par l'ensemble des services Voyageurs de la SNCF
Les modèles relatifs aux trains régionaux d'Ile-de-France et aux trains Grandes Lignes font ressortir la forte influence sur la ponctualité du niveau de fréquentation des trains à travers l'indicateur du nombre moyen de voyageurs par train (voyageurs-km/trains-km). Un élément d'explication possible est que davantage de retards liés aux voyageurs impactent la ponctualité à mesure que la fréquentation des trains augmente (malaises voyageurs, blocage des portes durant le temps d'échange voyageurs lors d'un arrêt, déclenchement légitime ou non du signal d'alarme par un voyageur entrainant des retards, retards liés aux bagages oubliés, etc.). On peut également remarquer que l'effet du nombre de voyageurs par train ressort comme significatif dans les modèles relatifs aux services RER et Transilien d'Ile-de-France et TGV, mais pas dans celui relatif aux services TER. Cela semble cohérent avec des taux d'occupation plus importants constatés dans les TGV et les trains Transilien que dans la moyenne des TER. Néanmoins, il faut noter que le modèle économétrique construit agrège l'ensemble des services TER. Il est possible que les retards liés au nombre de voyageurs impactent certaines lignes TER très chargées (axes majeurs, périurbain des grandes métropoles principalement), sans que cela ressorte avec le modèle agrégé présenté ici. Le modèle relatif aux TGV sur la période 1981-2019 suggère également un impact du volume du trafic (en voy-km). En effet, un volume de trafic très important amène l'exploitant ferroviaire à réduire la durée de l'intervalle entre 2 trains dans sa grille horaire, et peut le contraindre à mener une exploitation proche des limites de capacité des infrastructures sur certaines lignes ou tronçons de ligne du réseau LGV et du réseau classique. Davantage de retards liés aux situations de congestion peuvent alors survenir, et ces derniers peuvent impacter davantage de voyageurs du fait de la propagation d'un retard d'un train aux suivants par effet de réseau, notamment aux heures de pointe. Ce modèle montre également l'impact des mouvements sociaux sur le niveau de ponctualité des trains Grandes Lignes. On observe que cet impact ne ressort comme significatif que dans le modèle consacré aux TGV (post-1981). Pour les autres services voyageurs, il est possible que les grèves se traduisent davantage par des annulations que par des retards, les annulations étant peut-être plus difficiles à concéder pour l'opérateur TGV. En particulier, il est possible que l'opérateur TGV concède des retards de trains afin de maintenir des correspondances sans suppression de train en cas de grève d'ampleur. Or, de telles opérations d'exploitation en mode dégradé sont peut-être plus rares pour les autres activités voyageurs. Enfin, entre 1954 et 2019, l'intensification de l'utilisation des lignes ferroviaires du RFN par l'ensemble des services voyageurs de la SNCF semble avoir eu un impact significatif sur la ponctualité des trains en France. Selon les modèles retenus, cette intensification de l'utilisation des lignes a engendré une hausse du taux de retard de 4 points pour les services TER entre 1954 et 2019, et de 6 points pour l'ensemble des services voyageurs de la SNCF. En effet, sans renouvellement des voies par ailleurs, une intense utilisation des lignes ferroviaires est susceptible d'user les voies. Elle augmente donc le risque d'incidents liés à l'état de la voie à long terme, pouvant entrainer des retards.
4.
CONCLUSION
L'AQST s'est procurée des versions numériques des mémentos statistiques de la SNCF de 1955 à 2018. Ils ont permis de reconstituer l'évolution de la ponctualité des trains en France depuis 1954 : - à 5 minutes pour les trains régionaux de province et pour les trains d'Ile-de-France ; - à 15 minutes pour les trains Grandes Lignes. Il apparait que la ponctualité de l'ensemble des services ferroviaires s'est fortement dégradée depuis 1954 en France7. Dans le but de savoir si cette dégradation peut en partie s'expliquer par l'évolution de certains déterminants supposés de la ponctualité, comme l'âge moyen des voies ferroviaires, des données de séries chronologiques sur l'évolution de ces facteurs ont été récoltées à partir de différentes sources. Afin de compléter ces séries chronologiques, des modèles de parcs ont été réalisés lorsque les données réelles de certaines années étaient manquantes. Des modèles économétriques simples (régressions linéaires, modèles exponentiels) ont été implémentés à l'aide du logiciel R pour décrire et interpréter la corrélation éventuelle entre l'évolution de la ponctualité depuis 1954 par service et l'évolution des déterminants supposés de cette ponctualité. Dans le cadre de cette étude, l'autocorrélation et la non-stationnarité des séries temporelles étudiées n'ont pas été pris en compte et on a considéré les 66 observations de la période 1954-2019 comme des tirages indépendants de variables aléatoires sans tenir compte de la dimension temporelle sous-jacente. Les éventuelles relations de corrélation mises en évidence par les modèles utilisés doivent donc être considérées avec prudence et non comme des liens de causalité généraux valables en dehors de la période d'étude. Sur la période 1954-2019, la modélisation tend à montrer un impact significatif du vieillissement de certaines catégories du matériel roulant sur la ponctualité des trains en France par service, ainsi que du vieillissement des lignes ferroviaires les plus fréquentées du Réseau Ferré National. En effet, le risque de panne ou de dysfonctionnement du matériel roulant augmente à mesure qu'il vieillit, et des lignes ferroviaires vétustes peuvent connaitre des défaillances. Ces incidents entrainent bien souvent des retards, ce qui pourrait expliquer les corrélations identifiées. Entre 1954 et 2019, la très forte augmentation du volume de trafic voyageurs et de la fréquentation des trains semble également avoir impacté la ponctualité des trains, en particulier en Ile-de-France, là où le réseau est le plus saturé. Le transport d'un plus grand nombre de voyageurs par train implique un risque supplémentaire d'occurrence d'un retard lié aux voyageurs. Parallèlement, il amène les opérateurs ferroviaires à réduire la durée de l'intervalle entre 2 trains dans leurs grilles horaires, les contraignant à mener une exploitation proche des limites de capacité des infrastructures sur certaines lignes ou A noter toutefois que compte tenu de la profondeur des données (de 1954 à 2020), l'évolution couvre un large spectre de méthodes de mesures de la ponctualité. Aussi, l'exhaustivité et la précision de la mesure se sont améliorées au fil du temps.
7
tronçons de ligne du réseau. Davantage de retards liés aux situations de congestion peuvent alors survenir, et ces retards se propagent souvent d'un train aux suivants par effet de réseau, notamment aux heures de pointe. Ces phénomènes de congestion du réseau expliquent probablement pour partie l'impact de l'intensification de l'utilisation des lignes ferroviaires du RFN par l'ensemble des services voyageurs de la SNCF depuis 1954 sur la ponctualité des trains. En outre, sans renouvellement des voies par ailleurs, une intense utilisation des lignes ferroviaires provoque l'usure des voies. Elle augmente donc le risque d'incidents liés à l'état de la voie à long terme, pouvant entrainer d'autres retards. Enfin, le modèle retenu pour les trains Grandes Lignes depuis 1981 (année de mise en service du TGV) confirme l'impact des mouvements sociaux sur le niveau de ponctualité de ces services.
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
57
ANNEXES
Annexe 1 : Modèles de parc du matériel roulant utilisés
Modèle de parc des locomotives électriques entre 1954 et 1983
Modèle de parc des locomotives Diesel entre 1954 et 1983
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
59
Modèle de parc des automotrices électriques entre 1954 et 1983
60
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modèle de parc des automotrices thermiques (autorails) entre 1954 et 1983
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
61
Modèle de parc des locotracteurs entre 1954 et 2008
62
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
63
Modèle de parc des turbotrains thermiques entre 1970 et 1983
64
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modèle de parc des voitures remorquées TER entre 1954 et 1983
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
65
Modèle de parc des voitures remorquées Transilien entre 1954 et 1983
66
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Annexe 2 : Modèles de parc du réseau ferré utilisés
Modèle de parc des lignes ferroviaires du RFN entre 1954 et 1995
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
67
68
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modèle de parc des lignes des catégories UIC 2-4 entre 1954 et 1995
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
69
70
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modèle de parc des lignes des catégories UIC 5-6 entre 1954 et 1995
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
71
72
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modèle de parc des lignes des catégories UIC 7-9 (Avec Voyageurs) entre 1954 et 1995
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
73
74
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Modèle de parc des lignes ferroviaires régionales d'Ile-de-France entre 1954 et 2019
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
75
76
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
77
Modèle de parc des LGV entre 1981et 1995
78
AQST Etude économétrique sur des déterminants de la ponctualité des trains de voyageurs en France depuis 1954
Annexe 3 : Résultats des modèles utilisés pour préciser l'effet de l'évolution des effectifs de la SNCF sur la ponctualité des trains depuis 1954
Modèle utilisant le niveau des effectifs 5 années auparavant
Modèle utilisant le niveau moyen des effectifs au cours des 5 années précédentes