Open Access
ARTICLE
Diagnostic qualité et apurement des données de mobilité quotidienne issues de l’enquête mixte et longitudinale Mobi’Kids
1. Université Grenoble Alpes, CNRS, Science Po Grenoble, PACTE, 14 av.
Marie Reynoard, 38100 Grenoble, France
{sylvestre.duroudier ; sonia.chardonnel ; iandre ; estelle.ployon ;
kamila.tabaka}@univ-grenoble-alpes.fr
2. UMR ESO, CNRS/Université Rennes 2, Place du recteur Henri Le Moal,
35043 Rennes Cedex, France
{boris.mericskay ; sandrine.depeau ; arnaud.lepetit ;
nicolas.pelletier}@univ-rennes2.fr
3. Alkante, 4 rue Alain Colas, 35530 Noyal sur Vilaine
olivier.bedel@alkante.fr
4. Laboratoire d’informatique LIFAT, 3 place Jean Jaurès, 41000 Blois
thomas.devogele@univ-tours.fr ; laurent.etienne@isen-ouest.yncrea.fr ;
clement.moreau@univ-tours.fr
Revue Internationale de Géomatique 2020, 30(1), 127-148. https://doi.org/10.3166/rig.2020.00105
RÉSUMÉ
Cet article a pour objectif de présenter la méthodologie de diagnostic qualité et d’apurement des données, expérimentée à partir d’une enquête de mobilité individuelle (programme Mobi’Kids). Une première partie revient sur la démarche suivie et pointe l’enjeu de l’évaluation de la qualité de données hétérogènes issues d’une méthode mixte et longitudinale de collecte (suivis GPS, enquêtes, observations). Une deuxième partie établit un diagnostic qualité selon l’origine (GPS, algorithme, enquête) et la nature des erreurs (complétude, précision, cohérence). Ces typologies permettent, dans une troisième partie, de définir d’une chaîne de traitements reproductible visant à améliorer la qualité interne et externe des données.Abstract
This paper aims at proposing a data quality diagnosis and cleansing data methodology experimented on an individual mobility survey (Mobi’Kids program). The first section presents the theoretical approach to highlight the issue of a data quality diagnosis applied to heterogeneous data collected from mixed methods (GPS tracks, surveys, observations). Secondly, two typologies of major errors are discussed according to their origin (GPS, algorithm, survey) and their nature (completeness, accuracy, consistency). A processing chain is thirdly defined to improve both internal and external data quality in order to the perspective of a replicable methodology.MOTS CLÉS
Keywords
Cite This Article
This work is licensed under a Creative Commons Attribution 4.0 International License , which permits unrestricted use, distribution, and reproduction in any medium, provided the original work is properly cited.