Guide du Recensement de la population, 2021
Annexe 1.7 ‒ Utilisation de données administratives pour imputer les ménages non répondants des régions où les taux de réponse sont faibles

Introduction

Plusieurs adaptations ont été introduites dans le plan de collecte de données du Recensement de 2021 afin d’atténuer l’incidence de la pandémie de COVID-19 et d’autres risques. Statistique Canada a dressé de manière proactive un plan de contingence statistique basé sur l’utilisation sécuritaire, responsable et appropriée des données administratives afin d’appuyer le Recensement de 2021 en cas de perturbations dans la collecte de données. Étant donné que les données du recensement sont souvent la seule source d’information pour certaines sous-populations et petites régions, il était important de maximiser la qualité des données aux endroits où les taux de réponse sont faibles afin d’atteindre l’objectif du recensement de produire des données de grande qualité pour les niveaux géographiques inférieurs. Des données administratives couplées provenant de sources de données fédérales et provinciales ont été utilisées pour améliorer l’imputation des ménages non répondants à l’étape de l’imputation après la collecte de données du Recensement de 2021. Cela a été fait dans les régions où les taux de réponse étaient faibles et pour les logements pour lesquels des données administratives de bonne qualité étaient disponibles. Malgré un recensement généralement fructueux en 2021, certaines régions du pays ont affiché des taux de réponse plus faibles que prévu. Ce plan d’imputation a contribué à l’amélioration de la qualité des chiffres de population et des logements.

Objectifs du plan d’imputation

L’imputation est une méthode statistique qui vise à réduire les biais introduits par la non-réponse. Pour ce faire, les valeurs des personnes ou des ménages qui présentent des caractéristiques semblables à celles de l’enregistrement incomplet sont déterminées et utilisées pour fournir les réponses manquantes ou corriger les réponses erronées. Le plan d’imputation a été conçu pour utiliser les données administratives couplées de manière sécuritaire, responsable et appropriée en vue d’imputer les données du recensement relatives aux ménages non répondants dans les régions où les taux de réponse étaient faibles, et pour les logements pour lesquels des données administratives de bonne qualité étaient disponibles. L’objectif était de s’assurer de la grande qualité des chiffres de population et des logements dans les régions où la collecte de données avait été perturbée par la COVID-19, une catastrophe naturelle ou de faibles taux de réponse, et d’appliquer la stratégie uniformément et équitablement dans toutes les régions du Canada.

Élaboration du plan d’imputation

Statistique Canada compte de nombreuses années d’expérience dans l’utilisation de données administratives pour assurer la grande qualité que la population canadienne attend des données du recensement. Par exemple, il utilise des données administratives de l’Agence du revenu du Canada (ARC) depuis 2006 pour améliorer l’exactitude des données sur le revenu. Plus récemment, pour procéder au Recensement de 2016, Statistique Canada a utilisé des données administratives pour dénombrer la subdivision de recensement de Wood Buffalo et sa municipalité de Fort McMurray, en Alberta, même si les résidents étaient évacués à cause d’un feu de forêt. Au cours des préparations ayant précédé le Recensement de 2021, Statistique Canada a réalisé une étude pour simuler un plan de contingence statistique au moyen des données du Recensement de 2016. La recherche a utilisé des données administratives pour imputer certains ménages non répondants, comparée à l’utilisation de la méthode habituelle d’imputation par donneur pour tous les ménages non répondants. Pour cette recherche, des modèles statistiques ont été créés afin de déterminer un « ménage » à partir des données administratives et de comparer la qualité des ménages ainsi produits avec les ménages réels du recensement.

Résultats des tests d’imputation fondés sur des données administratives

Les résultats ont montré que l’utilisation de données administratives pour imputer certains ménages non répondants a amélioré la qualité des données relatives aux principaux indicateurs de population et démographiques, comparativement à la méthode habituelle d’imputation par donneur. Par exemple, l’imputation de ménages entiers (IME) à l’aide de données administratives a amélioré la qualité des chiffres de population et des logements par âge, par sexe à la naissance et à divers niveaux géographiques comparativement à la méthode traditionnelle d’imputation de ménages entiers, qui est basée sur l’imputation par donneur. Les gains dans la qualité des données produits par l’utilisation de données administratives ont été plus prononcés dans les régions géographiques où les taux de réponse étaient inférieurs à 90 %. Des données administratives de bonne qualité, laquelle qualité est mesurée en fonction de la cohérence prévue de ces données par rapport aux réponses du recensement, étaient disponibles pour environ la moitié des ménages non répondants dans la simulation.

Mise en œuvre du plan d’imputation fondé sur des données administratives

D’après les données probantes tirées de la recherche et de la mise à l’essai du plan d’imputation, Statistique Canada a déterminé que des données administratives couplées devraient être utilisées pour appuyer la méthode traditionnelle d’imputation des ménages en entier dans certaines circonstances. Des données administratives couplées ont été utilisées pour maximiser la qualité des données pour les ménages non répondants selon les critères suivants :

Les calculs utilisés pour déterminer le nombre de résidents habituels étaient aussi fondés sur des répartitions selon la taille du ménage provenant de l’Enquête sur la classification des logements dans les secteurs d’envoi par la poste et de listage/livraison. Autrement, ce nombre est déterminé par imputation par donneur. Comme les ménages qui ont répondu au recensement, les ménages imputés ont été couplés aux données fiscales de l’ARC pour obtenir des caractéristiques de revenu.

Nous avons publié sur notre site Web des renseignements au sujet du plan d’imputation et de l’utilisation de données administratives pour appuyer le recensement. Le plan a aussi été inclus dans le Supplément à l’Évaluation générique des facteurs relatifs à la vie privée de Statistique Canada relatif au Recensement de la population de 2021 en mars 2021.

Données administratives

Les données administratives utilisées pour imputer les ménages non répondants provenaient de sources de données fédérales et provinciales déjà fournies à Statistique Canada, comme les données de l’ARC, d’Immigration, Réfugiés et Citoyenneté Canada, les fichiers provinciaux de statistiques de l’état civil (naissances et décès), les fichiers de permis de conduire provinciaux et le Registre des IndiensNote 1 . En l’absence de réponse directe d’un logement dans une région où les taux de réponse étaient faibles, des données administratives de bonne qualité ont été utilisées pour imputer les variables comme la date de naissance, le sexe à la naissance et le nombre de résidents habituels dans le logement.

Date de référence

Pour le Recensement de 2021, la date de référence pour la déclaration de données est le 11 mai 2021. Quant aux ménages non répondants imputés au moyen de données administratives, diverses sources de données administratives ont été utilisées avec une date de référence aussi près que possible du 11 mai 2021 pour simuler une réponse le jour du recensement.

Portée de l’application du plan d’imputation

Le Recensement de 2021 a été un succès, 98 % des Canadiens y ayant répondu. Cependant, comme certaines régions du pays ont affiché des taux de réponse nettement inférieurs au taux national, des données administratives ont été utilisées pour appuyer l’imputation des ménages non répondants dans ces régions. Environ 1 045 UC (sur les quelque 49 000 au Canada) ont obtenu un taux de réponse en deçà de 90 %, disposaient de données administratives de bonne qualité et étaient donc dans la portée de ce plan d’imputation. Approximativement 12 000 ménages non répondants ont été imputés au moyen de données administratives, ce qui représente moins de 0,1 % des logements privés occupés au Canada. Le plan d’imputation était basé sur des données déjà fournies à Statistique Canada et répondait aux normes les plus élevées en matière de protection de la vie privée, de confidentialité et de sécurité des données.

Qualité des données

Pour les chiffres de population et des logements dans les régions où le plan d’imputation fondé sur des données administratives a été mis en œuvre, les données ont été soumises aux mêmes évaluations de la qualité, validations et certifications que l’ensemble des données du recensement. Des mesures supplémentaires ont été prises pour veiller à ce que les chiffres de population et des logements dans les régions où des données administratives ont été utilisées pour l’imputation répondaient aux normes élevées de qualité que l’on attend de toutes les données du recensement. Toutes les variables de recensement obtenues au moyen du questionnaire abrégé et du questionnaire détaillé ont été rigoureusement validées. Pour chaque question du recensement, le taux d’imputation combiné pour l’imputation à l’aide de données administratives et l’imputation traditionnelle par donneur seront présentés à divers niveaux géographiques (voir le chapitre 9 sur l’évaluation de la qualité des données).


Date de modification :