Perfectionner ses méthodes et innover

La demande sociale pour des statistiques fiables et robustes va croissante, et elle porte sur des sujets variés et complexes. Pour y répondre, l’Insee ne cesse de faire progresser ses méthodes. L’institut expérimente l’apport de nouvelles données et élabore des traitements statistiques pour les exploiter au mieux. Il s’attache également à optimiser les protocoles de collecte des données de ses enquêtes. Ces actions sont menées en collaboration étroite avec les services statistiques ministériels mais aussi par le biais de partenariats avec des acteurs privés ou publics.

Témoignage

Christel COLIN

Directrice de la méthodologie et de la coordination statistique et internationale.

Christel_Colin_Direction_INSEE

« En 2020, nous avons poursuivi les travaux engagés sur les données de téléphonie mobile. En plus de permettre une meilleure appréhension de la mixité sociale, celles-ci nous ont été très utiles pour rendre compte des mouvements de population à l’annonce du premier confinement. En parallèle, l’Insee a continué à miser sur l’amélioration des protocoles de collecte des enquêtes en gagnant en réactivité et en développant la collecte sur liste et le multimode, c’est-à-dire le recours pour une même enquête à plusieurs supports de réponse (face-à-face, internet, téléphone ou courrier). »

aeroport

Mesurer la mixité sociale à l’aide des données de téléphonie mobile

Les données de téléphonie mobile anonymisées, issues de l’activité des antennes-relais, permettent d’approcher la position des utilisateurs de téléphone portable. Elles offrent ainsi la possibilité de connaître la répartition de la population à différents instants de la journée et d’analyser, par exemple, la mixité sociale au-delà des seuls lieux de résidence par lesquels elle est traditionnellement appréhendée.

Lire la suite de l'article

En effet, les personnes à hauts ou à bas revenus se côtoient dans les villes à différents moments de la journée, que ce soit sur le lieu de travail, dans les commerces, ou encore dans les lieux culturels et sportifs. Les données téléphoniques utilisées étant anonymes, un quartier de résidence est attribué aux utilisateurs de téléphone mobile à partir des localisations détectées par le réseau durant la nuit. Les données de niveau de vie agrégées au carreau de 500 m de côtés du lieu de résidence d’un utilisateur permettent d’estimer sa position dans l’échelle des niveaux de vie et, ainsi, son appartenance éventuelle aux groupes des hauts ou des bas revenus. Cette approche permet alors d’estimer, à différents instants de la journée, l’intensité des rencontres entre les différents groupes sociaux dans l’espace. Dans les agglomérations de Paris, Lyon et Marseille, la mixité sociale est plus importante en journée, entre 10 heures et 18 heures, lorsque les personnes sont en dehors de leur lieu de résidence. Au contraire, la mixité sociale est moindre la nuit, lorsque les personnes sont majoritairement localisées dans leur quartier de résidence. Bien que la mixité sociale augmente lors des déplacements journaliers, les personnes à bas revenus restent majoritaires dans le nord-est de l’agglomération parisienne ; il en est de même pour les personnes à hauts revenus dans l’ouest parisien. La différence entre le jour et la nuit est toutefois plus prononcée à l’ouest qu’à l’est de Paris. Si, de façon générale, la ségrégation est moindre dans la journée, c’est en raison des déplacements de la population.

Cependant, deux facteurs au moins limitent la circulation entre le centre et la périphérie de chaque agglomération : la morphologie des villes et l’offre de transport. Les personnes à bas revenus habitent plus fréquemment dans des espaces où il est plus difficile de se déplacer (le centre-ville à Marseille, très étendu et disposant d’une densité de transports en commun moindre, la périphérie à Lyon et à Paris).

Témoignage

Élise Coudin

Cheffe du SSP Lab, l’unité de veille, d’animation, d’innovation et d’expérimentation en matière de science des données et de nouvelles sources de données pour la statistique publique

Elise Coudin

« Les données de téléphonie mobile ont été utilisées pour analyser les mouvements de population précédant le premier confinement. »

Comment utiliser les données de téléphonie mobile ?

À la différence de celles des enquêtes, ces données ne sont pas collectées dans le but premier de produire une information statistique. Les travaux d’expertise doivent donc évaluer la qualité de l’information qui peut en être tirée et établir des méthodes de traitement statistique dans le respect de la vie privée

Cnis et Comité du label : une procédure réactive en temps de crise

Les passages devant la commission thématique du Conseil national de l’information statistique (Cnis) puis le Comité du label de la statistique publique constituent une étape importante dans le parcours de toute enquête de la statistique publique.

Lire la suite de l'article

La crise sanitaire a conduit le Comité et le Cnis à accélérer leurs procédures sans transiger sur la qualité statistique des projets d’enquête présentés. Tout d’abord, un caractère de nécessité et d’urgence leur étant reconnu, plusieurs enquêtes visant à assurer un suivi de la crise sanitaire, dont EpiCov, l’enquête sur la prévalence du virus dans la population et ses conséquences sur le quotidien et la santé des individus, ont été jugées opportunes sur décision  du Président du Cnis, sans examen en commission thématique du Cnis, comme cela est prévu dans les textes. Ensuite, le Comité du label a travaillé sur la base de dossiers partiels, complétés au fur et à mesure de l’instruction, en délivrant des avis d’examen favorables plutôt que des avis de conformité pleins et entiers, les contraintes de concertation et de tests du questionnaire étant partiellement allégées. Il a aussi formulé des demandes de compléments, pour s’assurer de la qualité des redressements et des traitements ex post.

PCS 2020 : les avantages de la collecte sur liste

En 2020, l’Insee a travaillé à la mise en œuvre de la nomenclature statistique des professions et catégories socioprofessionnelles rénovée (PCS 2020) dans l’enquête Emploi. L’une des nombreuses innovations contenue dans la PCS 2020 est la collecte sur liste. Désormais, au fur et à mesure que l’enquêté précise sa profession, des suggestions de libellés issus d’une liste de plusieurs milliers lui sont faites.

Lire la suite de l'article

Avec un libellé choisi dans cette liste et les réponses à deux questions, la PCS 2020 peut être codée à son niveau le plus fin, la profession. Ce protocole permet une collecte et une codification plus facile et plus précise de la PCS que par le passé mais aussi des usages plus importants.

En effet, les libellés collectés peuvent aussi être rassemblés à façon (par exemple pour définir les métiers du numérique). Ils permettent également une codification de la classification internationale type des professions (CITP) du bureau international du travail (BIT). À terme, l’ensemble des enquêtes informatisées réalisées par le service statistique public et le secteur privé ont vocation à utiliser la collecte sur liste pour la PCS 2020. 

Le défi de la gestion du multimode dans l’enquête EpiCov

L’enquête EpiCov a été mise en place au début du premier confinement par l’Inserm et la Drees, avec l’appui de l’Insee et de Santé publique France. Son objectif : mesurer la dynamique de propagation de l’épidémie de la Covid-19 et son impact sur les conditions de vie. 

epicovid
Lire la suite de l'article

Pour faire face aux contraintes de collecte en contexte de crise sanitaire, l’équipe d’EpiCov a fait le choix d’un protocole multimode. Certaines personnes sélectionnées pour l’enquête ont été particulièrement motivées pour répondre, car elles souhaitaient mieux comprendre la situation sanitaire ou simplement avoir accès à un test de dépistage à une période durant laquelle les tests étaient très peu disponibles. Cela a généré un premier biais dit « d’auto-sélection », en d’autres termes le fait que les personnes se sentant particulièrement concernées par le thème de l’enquête ont été plus enclines que les autres à participer. Très rapidement, les experts ont également mis en évidence un effet de mode pesant sur les symptômes déclarés par les enquêtés : les personnes répondant sur internet ont déclaré plus de symptômes que celles répondant par téléphone, à caractéristiques sociodémographiques similaires. Il n’existait, ni à l’Insee, ni dans la littérature spécialisée, de correction permettant de neutraliser ces biais. En s’appuyant sur les différences observées entre les individus ayant répondu sur internet et ceux ayant répondu par téléphone, l’Insee a développé une méthode basée sur une modélisation permettant de corriger efficacement le biais d’auto-sélection. EpiCov a ainsi constitué un puissant catalyseur d’innovations méthodologiques.

Lire également sur le blog de l’Insee : « EpiCov : cinq questions sur une enquête inédite à propos de la crise sanitaire », François Beck et  Patrick Sillard

Témoignage

Emmanuelle BASCHERI

Cheffe de la section collecte par internet à la direction des statistiques d’entreprises

Emmanuelle Bascheri-DETLAT

Témoignage

Anne HUSSEINI-SKALITZ

Experte en conception de e-questionnaire à la direction de la méthodologie et de la coordination statistique internationale.

Anne Husseini-Skalitz-DETLAT

« La collecte des enquêtes auprès des entreprises accorde une place importante et croissante à internet… »

Quels sont les modes de réponses proposés aujourd’hui par l’Insee aux entreprises ?

« La collecte des enquêtes auprès des entreprises accorde une place importante et croissante à internet. En avril 2011, l’un des objectifs des Assises nationales de la simplification administrative était de « dématérialiser à 100 % les enquêtes de la statistique publique » afin d’alléger la charge statistique des entreprises. »

POUR EN SAVOIR PLUS

Partagez cette page