Estimation de l'état du parc de logements par classe de performance énergétique
BABA-MOUSSA, Wissem
Auteur moral
Auteur secondaire
Résumé
"Depuis 2013, l'Ademe collecte l'ensemble des diagnostics de performance énergétique (DPE) réalisés en France métropolitaine. Cette base fournit des informations importantes sur la performance énergétique des logements, mais n'est pas représentative de l'ensemble du parc car les DPE ne sont produits, sauf exception, qu'à l'occasion des transactions (y compris des logements neufs) et des mises en location. Cette base présente donc un biais en faveur de la construction neuve moins énergivore et également des biens mis en location, non représentatifs du parc dans son ensemble. Dans ce contexte, la base ne peut être directement mobilisée pour décrire l'état du parc selon les classes de consommation énergétique et d'émissions de gaz à effet de serre. Elle peut en revanche être utilisée dans le cadre d'une modélisation visant à produire des estimations statistiques et à prédire les étiquettes DPE sur l'ensemble du parc de logements. La méthode d'estimation se fonde sur une extrapolation de la base des DPE de l'Ademe pour les logements construits avant 2022, après correction et redressement de cette base, et un vieillissement du parc sur les années 2022, 2023 et 2024 à partir des DPE observés pour les logements neufs". Source Wissem BABA-MOUSSA , auteur
Descripteur Urbamet
diagnostic de performance énergétique
Descripteur écoplanete
Thème
Énergie - Climat
Texte intégral
Estimation de l?état du
parc de logements par
classe de performance
énergétique
Novembre 2025
NOTE MÉTHODOLOGIQUE
2 Estimation de l?état du parc de logements par classe de performance énergétique
Résumé
Depuis 2013, l?Ademe collecte l?ensemble des diagnostics de performance énergétique (DPE)
réalisés en France métropolitaine. Cette base fournit des informations importantes sur la
performance énergétique des logements, mais n?est pas représentative de l?ensemble du
parc car les DPE ne sont produits, sauf exception, qu?à l?occasion des transactions (y compris
des logements neufs) et des mises en location. Cette base présente donc un biais en faveur
de la construction neuve moins énergivore et également des biens mis en location, non
représentatifs du parc dans son ensemble.
Dans ce contexte, la base ne peut être directement mobilisée pour décrire l?état du parc
selon les classes de consommation énergétique et d?émissions de gaz à effet de serre. Elle
peut en revanche être utilisée dans le cadre d?une modélisation visant à produire des
estimations statistiques et à prédire les étiquettes DPE sur l?ensemble du parc de logements.
La méthode d?estimation se fonde sur une extrapolation de la base des DPE de l?Ademe pour
les logements construits avant 2022, après correction et redressement de cette base, et un
vieillissement du parc sur les années 2022, 2023 et 2024 à partir des DPE observés pour les
logements neufs.
Auteur
Wissem BABA-MOUSSA (SDES)
3 Estimation de l?état du parc de logements par classe de performance énergétique
I. Construction d?une base d?études de DPE ..................................................................... 4
II. Recalage sur la structure du parc total - appariement avec le répertoire Fidéli ....... 4
III. Modélisation ................................................................................................................ 5
IV. Simulation des DPE et vieillissement du parc ......................................................... 5
V. Limites et incertitudes ....................................................................................................... 6
Sommaire
4 Estimation de l?état du parc de logements par classe de performance énergétique
Cette étape consiste à construire à partir des bases téléchargées depuis l?outil de requêtage
de l?Ademe, la base d?étude contenant les diagnostics relatifs aux logements antérieurs à
2022 (pour pouvoir réaliser la deuxième étape d?appariement avec le répertoire Fidéli). Des
variables géographiques (catégorie d?agglomération, zone de tension immobilière?) ou
permettant des imputations en cas de non-réponse (zone climatique, altitude) sont
également ajoutées. Une base de données brutes complète est ainsi créée, avec les
principales variables utiles précisées dans le dictionnaire des variables.
Cette base brute connait ensuite une étape de nettoyage avec l?exclusion des DPE hors
champ (DPE « tertiaire », DPE « immeuble » et DPE réalisés dans les DOM) et de correction
(suppression des doublons, traitement des erreurs manifestes).
Lors de la réalisation du DPE d?un immeuble d?habitation collectif (DPE « immeuble »), le
diagnostiqueur a la possibilité d?établir, sous certaines conditions, les DPE individuels de
l?ensemble des appartements le constituant sans visiter l?ensemble de ces logements.
L?évaluation de l?étiquette du logement est alors obtenue à partir des informations
collectées ou calculées pour la réalisation du DPE de l?immeuble, éventuellement
complétées d?informations accessibles depuis l?extérieur des appartements. Les DPE
« appartements » issus des DPE collectifs sont ainsi souvent très homogènes au sein d?un
même immeuble.
Afin d?éviter une potentielle sur-représentation d?appartements de mêmes types, les
appartements non visités dans le cadre des DPE « immeubles » ont été exclus de la base
d?étude (environ 66 % des appartements concernés par un DPE « immeuble »). Pour cette
nouvelle estimation, 36,1 % de la base nettoyée (DPE hors champ exclus) ont été générés à
partir des données DPE immeuble.
La base exhaustive utilisée pour décrire le parc de logements est le répertoire Fidéli1, géré
par l?Insee, qui regroupe les informations fiscales issues de la taxe d?habitation, de la taxe
foncière et de l?impôt sur le revenu. Cette base est celle utilisée pour estimer la distribution
par classe de performance énergétique de l?ensemble du parc de logements.
Dans un premier temps, un appariement entre les observations DPE réalisées entre octobre
2024 et mars 2025 et Fidéli 2022 a été effectué afin de constituer la base permettant de
modéliser les diagnostics DPE en fonction des caractéristiques du logement. En l?absence
d?identifiant du logement, cet appariement est réalisé en rapprochant le logement pour
lequel a été établi le DPE au logement de Fidéli le plus proche géographiquement et
partageant des caractéristiques similaires (surface, période de construction2, type de
logement).
1 Fichiers démographiques sur les logements et les individus : ce répertoire, constitué par l?Insee, regroupe diverses données,
notamment d?origine fiscale, afin d?améliorer la connaissance du parc de logements et de la démographique résidente.
2 Pour ces nouvelles estimations, l?appariement est effectué sur la période de construction et non plus sur l?année de
construction, comme dans les précédentes estimations, car l?année de construction n?est plus renseignée de manière
systématique dans les bases DPE.
I. Construction d?une base d?études de DPE
II. Recalage sur la structure du parc total -
appariement avec le répertoire Fidéli
5 Estimation de l?état du parc de logements par classe de performance énergétique
Cette méthode d?appariement ne permet pas d?associer toujours exactement le bon
logement, ni de connaître parfaitement le ménage y résidant au moment du diagnostic.
L?échantillon des DPE géocodés et appariés à Fidéli est constitué d?environ 1,1 million de
diagnostics.
III. Modélisation
Pour les résidences principales, la modélisation est faite de façon séparée suivant le type de
logement (individuel ou collectif) et l?énergie principale de chauffage (électricité, gaz de ville,
fioul, bois et réseau de chaleur). Un modèle logit multinomial permet de calculer pour
chaque logement et chaque énergie de chauffage les probabilités d?être classé A, B, [?], G.
Afin d?améliorer la qualité du modèle par rapport à l?estimation précédente, une procédure
de sélection de variables stepwise a été conduite en partant du modèle antérieur et en
intégrant les nouvelles variables envisagées. Ainsi le modèle mobilise les variables suivantes
:
? la période de construction, utilisée en tranches en suivant l?évolution des
réglementations thermiques au fil du temps (RT 1974, RT 1988, RT 2000, RT 2005 puis
RT 2012) ;
? la tranche de surface, définie de manière distincte pour les appartements et les
maisons ;
? des variables liées au bâti : valeur locative (en tranches), présence de gaz, présence
d?un chauffage central ;
? des variables géographiques : zone climatique ou département, catégorie urbaine,
altitude moyenne de la commune ;
? une variable binaire indiquant si le DPE a été attribué dans le cadre d?un DPE
« immeuble ». Cette variable permet de tenir compte des spécificités liées au calcul
des DPE « appartements » à partir de ce DPE immeuble et de corriger le biais
potentiel lié à son utilisation assez fréquente dans le parc social.
Les résultats des estimations montrent un fort effet explicatif des périodes de construction
et des tranches de surface sur la classe de DPE. Les variables géographiques permettent de
tenir compte de potentiels effets fixes régionaux.
Pour les résidences secondaires et les logements vacants, l?énergie de chauffage n?est pas
prise en compte dans la modélisation, faute de statistiques fiables sur l?ensemble du parc
des résidences secondaires et des logements vacants. Le nombre de variables explicatives
est également réduit.
IV. Simulation des DPE et vieillissement du parc
Les modèles ainsi estimés sur les diagnostics effectivement réalisés sont ensuite reproduits
sur l?ensemble du parc de logements.
L?information sur l?énergie principale de chauffage des résidences principales n?est pas
disponible dans la base Fidéli. Une méthode de duplication des logements est alors mise en
place, chaque logement représentant des logements chauffés par différentes énergies au
prorata de la probabilité que chaque logement soit effectivement chauffé de cette manière
; ces probabilités sont basées sur les réponses au recensement de la population (RP), recalées
sur la structure globale des énergies de chauffage. Pour cette nouvelle estimation, les
6 Estimation de l?état du parc de logements par classe de performance énergétique
vecteurs énergétiques ont été récupérés dans les chiffres du recensement de la population
2020.
Pour chaque logement (résidence principale), on obtient ainsi la probabilité de chaque classe
énergétique (A, B, C?) comme suit :
??(?????? = ??) = ? ??????(é????????????).????????????(?????? = ??/é????????????)
é????????????
Le nombre de passoires énergétiques est alors calculé comme la somme des probabilités
d?observer ces étiquettes pour l?ensemble des résidences principales.
Pour obtenir une image du parc au 1er janvier 2025, les hypothèses de vieillissement du parc
ont été mis à jour afin d?être conformes aux résultats de la campagne 2025 de l?estimation
annuelle du parc de logements (EAPL) de l?Insee. Ces hypothèses sont faites en considérant
que les réallocations de logements entre le parc des résidences principales, secondaires et
les logements sont neutres.
Ainsi pour cette nouvelle estimation, on considère qu?il y a 45 000 destructions nettes de
résidences principales par an (réparties de manière uniforme sur les logements construits
avant 1948) et 307 000 résidences principales neuves par an (dont les étiquettes A, B et C
sont réparties selon la distribution observée des DPE réalisés entre octobre 2024 et mars
2025 pour les logements construits en 2022 et 2025). Considérant une répartition uniforme
sur l?ensemble des étiquettes, les nombres de résidences secondaires et de logements
vacants ont été calés directement sur les chiffres de l?EAPL.
Le modèle permet d?estimer la distribution des classes DPE parmi l?ensemble des logements
et de la détailler relativement à différentes caractéristiques et à des niveaux géographiques
fins, par exemple à l?échelle départementale. Des précautions sont toutefois à prendre dans
l?interprétation ces statistiques désagrégées à des niveaux géographiques fins, notamment
car la modélisation ne permet pas de rendre compte de programmes locaux spécifiques de
rénovation.
V. Limites et incertitudes
Comme tout travail de modélisation, il reste une part d?incertitude dans les résultats, difficile
à quantifier.
Tout d?abord, le redressement statistique s?appuie sur des DPE réalisés par des
diagnostiqueurs avec une méthode normée mais présentant elle-même une part
d?incertitude dans les mesures réalisées et les caractéristiques observées du logement.
L?appropriation par les diagnostiqueurs de certaines normes (par exemple la classification
des logements superposés dans de petits immeubles, en maison ou en appartement, ou la
codification des valeurs par défaut) n?a été pas immédiate après la mise en oeuvre du
nouveau DPE en juillet 2021 et a pu évoluer au fil du temps.
Par ailleurs, les seuils de consommation primaire définissant les étiquettes DPE ont un impact
sur la distribution effective des DPE. Comme cela avait déjà été observé pour les
précédentes estimations, la distribution des DPE n?est pas lisse mais affiche une plus forte
concentration de DPE pour les consommations primaires immédiatement inférieures aux
seuils des classes DPE (graphique 1). Cela suggère que de nombreux logements se situent à la
limite entre deux classes.
7 Estimation de l?état du parc de logements par classe de performance énergétique
Graphique 1 : Nombre de logements selon la tranche de consommation d?énergie primaire
conventionnelle au sein de chaque classe DPE
Lecture : parmi les logements classés D, environ 44 000 sont dans le décile supérieur de consommation d?énergie
conventionnelle de la classe D.
Source : Ademe, base des DPE octobre 2024-mars 2025. Calculs et retraitements SDES
Enfin, les informations sur le statut d?occupation des logement (propriétaire occupant,
locataire, résidence secondaire, vacant) sont issues de Fideli 2022, donc sont connues au 1er
janvier 2022. L?estimation ne tient donc pas compte d?éventuels changements d?usage, liés
en particulier aux interdictions de location de passoires thermiques.
Plus généralement, les estimations restent tributaires des hypothèses considérées et
présentent de l?incertitude liée aux données utilisées, à la modélisation statistique et aux
limites de l?appariement.
0
5000
10000
15000
20000
25000
30000
35000
40000
45000
50000
A B C D E F G
0-10% 10-20% 20-30% 30-40% 40-50% 50-60% 60-70% 70-80% 80-90% 90-100%
Commissariat général au développement durable
Service des données et études statistiques (SDES)
Sous-direction des statistiques de l'énergie
Tour Séquoia - 92055 La Défense cedex
Courriel : diffusion.cgdd@developpement-durable.gouv.fr
www.statistiques.developpement-durable.gouv.fr
http://www.statistiques.developpement-durable.gouv.fr/
I. Construction d?une base d?études de DPE
II. Recalage sur la structure du parc total - appariement avec le répertoire Fidéli
III. Modélisation
IV. Simulation des DPE et vieillissement du parc
V. Limites et incertitudes