Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Escuela de Graduados de la Facultad de Ciencias Económicas Universidad Nacional de Córdoba DOCTORADO EN DEMOGRAFÍA Producción de datos en los censos de población y vivienda argentinos: análisis del proceso de captura del Censo 2010 Escuela de Graduados de la Facultad de Ciencias Económicas Universidad Nacional de Córdoba DOCTORADO EN DEMOGRAFÍA Por: Lic. Rubén David Nigita Tesis doctoral presentada para optar al grado de Doctor en Demografía Director: Dr. Leandro De La Mota Córdoba, Argentina, 10 de marzo de 2023 iii AGRADECIMIENTOS A la memoria de Ana María Edwin que fue artífice para que yo pueda acceder a este doctorado, y hoy estaría orgullosa de ver este trabajo concluido. A las autoridades de la Universidad Nacional de Córdoba y especialmente a Dora Celton por el apoyo constante y la generosidad con las que me abrieron las puertas a esta honorable casa de estudios. Agradezco profundamente a Lina Marcela Salamanca, esposa y amor de mi vida, que conocí justamente gracias al estudio sobre temáticas censales. A ella mi agradecimiento por el apoyo, la dedicación, la ayuda invalorable sin la cual, este trabajo no hubiese sido posible. A mis hijas Luana y Maia que quizás sin saberlo siempre son el motor para que uno humildemente trate de mejorar y superarse día tras día. Al Instituto Nacional de Estadísticas y Censos (INDEC), institución a la cuál debo todo lo que soy como profesional. Y a todos aquellos que de una u otra forma colaboraron de manera desinteresada, para que este trabajo sea posible. A todos, mi profundo agradecimiento. Rubén David Nigita iv TABLA DE CONTENIDO ÍNDICE DE TABLAS vi ÍNDICE DE FIGURAS vii ABREVIATURAS viii RESUMEN x ABSTRACT xi 1. INTRODUCCIÓN 12 1.1 Síntesis general 12 1.1.1 Justificación 12 1.1.2 Objetivos 14 2. MARCO TEÓRICO Y CONCEPTUAL 15 2.1 Procesos censales 15 2.2 El proceso de captura de datos. 20 2.3 Tecnologías de captura de la información 29 2.4. Los censos en Latinoamérica y el proceso de captura de datos 39 2.5 El proceso de captura por escáner en Latinoamérica en la ronda 2010 50 3. ANTECEDENTES Y CONTEXTO ACTUAL 53 3.1 Los censos de población y las rondas censales 53 3.2 Los censos de población en Latinoamérica 60 3.3. Los censos de Argentina y el proceso de captura de datos 62 4. METODOLOGÍA 94 4.1 Línea metodológica general 94 4.2 Fuentes de datos 95 4.3 Diseño de estudio, tipo de investigación y unidad de análisis 98 5. RESULTADOS: EL PROCESO DE CAPTURA DE DATOS DEL CENSO 2010 EN ARGENTINA 100 5.1 Introducción 100 5.2 Actores que participaron en el proceso de captura 102 5.3 El proceso de captura en el Censo 2010 de Argentina 104 6. DISCUSIÓN DE RESULTADOS 6.1 Introducción 156 156 6.2 Análisis de los inconvenientes más recurrentes al momento de la captura de datos en el Censo 2010. 157 v 7. CONCLUSIONES 173 7.1 Sugerencias 180 8. BIBLIOGRAFÍA 182 9. ANEXOS 196 Anexo 1. Generalidades de los Censos 196 Anexo 2. Descripción de los procesos posteriores a la captura de datos 223 Anexo 3. Las rondas censales posteriores a la del 2010 233 Anexo 4. Los Censos de población en América Latina y el proceso de captura 240 Anexo 5. Principales diferencias metodológicas y conceptuales de los últimos Censos argentinos 296 vi ÍNDICE DE TABLAS Tabla 1. Ventajas y desventajas de los métodos de captura censales ................................................................. 26 Tabla 2. Tipología de tecnología empleadas en los censos ................................................................................. 30 Tabla 3. Censos de población de Latinoamérica y el Caribe: por tecnología empleada ....................................... 34 Tabla 4. Latinoamérica. Características del desarrollo del aplicativo para DMC. ................................................. 46 Tabla 5. El proceso de captura por escáner de Argentina, Chile, Ecuador y Colombia (Ronda 2010) ................... 52 Tabla 6. Ronda 2010: Censos realizados entre 2005 y 2014 por continente/región. ........................................... 56 Tabla 7. Censos periodo proto estadístico de Argentina .................................................................................... 69 Tabla 8. Censos de población periodo estadístico en Argentina. Censos de 1869 hasta 1967 en Argentina. (Previo a la creación del INDEC) .................................................................................................................................... 81 Tabla 9. Censos de población periodo estadístico en Argentina. Censos modernos en Argentina de 1968 hasta la actualidad ........................................................................................................................................................ 93 Tabla 10. Fuentes de información por capítulos de la investigación ................................................................... 97 Tabla 11. Cantidades de material censal distribuido a las provincias antes del relevamiento ........................... 119 Tabla 12. Argentina. Estado de avance por provincia del armado y acondicionamiento de cajas con cédulas censales. 16 mayo de 2011 ............................................................................................................................. 127 Tabla 13. Argentina. Porcentaje del armado y acondicionamiento de cajas con cédulas censales por Provincia. Del 1 de marzo al 26 mayo de 2011 ................................................................................................................ 128 Tabla 14. Cajas con formularios reelaborados por provincia ............................................................................ 130 Tabla 15. Volúmenes de impresión y cantidad proyectada a capturar de material censal................................. 137 Tabla 16. Argentina. Estado de avance por provincia del escaneo. 26 mayo de 2011 ....................................... 138 Tabla 17. Argentina. Porcentajes del escaneo de cajas con cédulas censales. Del 1 de marzo al 16 mayo de 2011 ...................................................................................................................................................................... 139 Tabla 18. Tasas mínimas de reconocimiento con Corrección Automática de Caracteres en campos alfabéticos proyectadas ................................................................................................................................................... 141 Tabla 19. Argentina. Estado de avance por provincia del control de calidad. 26 mayo de 2011 ........................ 145 Tabla 20. Argentina. Porcentajes del control de calidad de las cajas con cédulas censales. Del 1 de marzo al 16 mayo de 2011 ................................................................................................................................................ 147 Tabla 21. Argentina. Porcentajes del control de completitud de cajas con cédulas censales. Del 1 de marzo al 16 mayo de 2011 ................................................................................................................................................ 149 Tabla 22. Lectura por escáner: Tasas de error en el archivo censal proyectadas y reales. Argentina (Censos 2010 y 2022) Colombia (Censo 2005) y Uruguay (Censo 1996) ................................................................................. 163 Tabla 23. Censos de población y vivienda en América Latina por tipo de modalidad de enumeración .............. 203 Tabla 24. Cuadro comparativo tipo de Censos y criterios básicos .................................................................... 215 Tabla 25. América latina: Características de la etapa precensal y programación de los Censos ronda 2020 según la segunda encuesta de la división estadística de las Naciones Unidas sobre el impacto del COVID-19 ............. 237 vii ÍNDICE DE FIGURAS Figura 1. Censos de población y vivienda en América Latina, por método de captura principal según ronda censal ........................................................................................................................................................................ 32 Figura 2. Censos de población y vivienda en América Latina, por método de captura secundario según ronda censal............................................................................................................................................................... 33 Figura 3. Número de países que realizan un Censo en la ronda de 2010 ............................................................ 56 Figura 4. Porcentaje de países según los mayores obstáculos que enfrentan en el uso de nuevas tecnologías durante la ronda del Censo 2010 ...................................................................................................................... 59 Figura 5. Artículo 39. Constitución de la Confederación Argentina..................................................................... 68 Figura 6. Carátulas de segmento de viviendas particulares Cuestionario Ampliado, básico y viviendas colectivas ...................................................................................................................................................................... 105 Figura 7. Planilla del Jefe de Radio -R2 y R2F ................................................................................................... 107 Figura 8. Cuestionario Ampliado (A), Básico (B) y de Viviendas Colectivas (C) .................................................. 110 Figura 9. Interrelación entre el proceso de captura y los macroprocesos y procesos censales Censo 2010. Argentina ....................................................................................................................................................... 115 Figura 10. Subprocesos del Proceso de captura de datos censales Censo 2010. Argentina ............................... 117 Figura 11. Foto de recepción de material ........................................................................................................ 121 Figura 12. Foto del control y clasificación del material censal (Ordenamiento en pallet del material censal) .... 122 Figura 13. Foto Almacenamiento 1 del material censal.................................................................................... 124 Figura 14. Foto armado y acondicionamiento de cajas con cédulas censales ................................................... 125 Figura 15. Foto reelaboración de cédulas censales .......................................................................................... 130 Figura 16. Foto Guillotinado ........................................................................................................................... 131 Figura 17. Foto almacenamiento 2 y preparación del material liberado ........................................................... 132 Figura 18. Foto control de la segmentación mediante el software SAYCO ........................................................ 135 Figura 19. Tablero de control – Imágenes – Censo 2010 .................................................................................. 151 Figura 20. Argentina. Evolución de las imágenes capturadas. Diciembre de 2010-Mayo 2011 .......................... 152 Figura 21. Tablero de control - Provincias ....................................................................................................... 153 Figura 22. Acumulado de cajas totales entregadas y cajas aprobadas .............................................................. 154 Figura 23. Cronograma del proceso de captura ............................................................................................... 155 Figura 24. Censos de población y vivienda en América Latina por Modalidad de enumeración según ronda censal ...................................................................................................................................................................... 201 Figura 25. Censos de población y vivienda en América Latina por tipo de cuestionario según ronda censal...... 206 Figura 26. Comparación de las estructuras operativas de los Censos de población y vivienda de 1991, 2001, 2010 y 2022 ............................................................................................................................................................ 303 viii ABREVIATURAS ATE - Asociación de Trabajadores del Estado BOLDT - Empresa que se dedica a la prestación de servicios de procesamiento de datos y soluciones de tecnología de la información. CANCEIS - Canadian Census Edit and Imputation System CAPI - Computer-Assisted Personal Interview (entrevista personal asistida por computador) CASI - Computer-Assisted self Interview (auto empadronamiento asistido por computadora) CATI - Computer-Assisted Telephone Interview (entrevista telefónica asistida por computador) CAWI - Computer Assisted Web Interview (entrevista web asistida por Computador) CELADE - Centro Latinoamericano y Caribeño de Demografía CEPAL - Comisión Económica para América Latina DANE - Departamento Administrativo Nacional de Estadística (Colombia) DCD - Dispositivo Móvil de Captura DIGESTYC - Dirección General de Estadística y Censos de El Salvador FLACSO - Facultad Latinoamericana de Ciencias Sociales GPS - Global position system IBGE - Instituto Brasileño de Geografía y Estadística ICR - Reconocimiento Inteligente de caracteres IMR - Reconocimiento inteligente de marcas INDEC - Instituto Nacional de Estadística y Censos INE - Instituto Nacional de Estadística INEC - Instituto Nacional de Estadística y Censos (Ecuador) INEGI - Instituto Nacional de Estadística y geografía (México) INEI - Instituto Nacional de Estadística e Informática (Perú) JICA - Agencia de Cooperación Internacional del Japón NEA - Noreste argentino NOA - Noroeste argentino OCR - Reconocimiento óptico de caracteres ODS - Objetivos de desarrollo sostenible OMR - Reconocimiento óptico de marcas ONU - Organización de las Naciones Unidas ix PAPI - Paper questionnaire with face to face interview (Entrevista cara a cara con cuestionario en papel) PASI - Paper questionnaire with self enumeration (auto empadronamiento con cuestionario en papel) PDA - Personal Digital Assistant REDATAM - Software que permite analizar las bases de datos de Censos y encuestas, desarrollado por CELADE - División de Población de la CEPAL SAYCO - Sistema de Apoyo y Control a la Gestión del Censo SIG - Sistema de información geográfica SIVAC - Sistema de Verificación de Avance y Cobertura (México) SMCC - Sistema de Monitoreo y Control Censal (Colombia) TIC - Tecnología de la Información y Comunicación UNAM - Universidad Nacional Autónoma de México UNFPA - Fondo de Población de las Naciones Unidas UNSD - División de Estadísticas de las Naciones Unidas x RESUMEN La República Argentina ha realizado once Censos Nacionales de Población, Hogares y Viviendas, y si bien los resultados han sido oportunamente publicados, en relación a la documentación de los diversos procesos censales, no se han elaborado informes exhaustivos sobre sus respectivos procesos de captura de datos, encontrándose un vacío de información de esta etapa fundamental para la obtención de los resultados finales de un censo. Este trabajo propone un estudio descriptivo del proceso de captura de datos en el Censo Nacional de Población, Hogares y Viviendas realizado en la República Argentina en el año 2010, analizando cada uno de los subprocesos que lo componen; y describiendo los principales inconvenientes que se han suscitado y de qué manera han sido resueltos. Para ello se han utilizado fuentes de datos primarias, secundarias y terciarias. Asimismo, este trabajo aborda brevemente las implicancias y limitaciones del uso de la tecnología en operativos censales, concluyendo que las soluciones tecnológicas adquieren relevancia si se las diagrama e incorpora como parte de un sistema integrado a las distintas etapas del operativo censal. Palabras clave: Censos - Resultados - Procesos de captura de datos - Subprocesos Tecnología en procesos censales. xi ABSTRACT The Argentine Republic has conducted eleven National Population, Household and Housing Censuses, and although the results have been published in a timely manner, in relation to the documentation of the various census processes, no exhaustive reports have been prepared on their respective data capture processes, and there is a lack of information on this fundamental stage for obtaining the final results of a census. This paper proposes a descriptive study of the data capture process in the National Census of Population, Households and Dwellings conducted in Argentina in 2010, analyzing each of the subprocesses that compose it; and describing the main problems that have arisen and how they have been solved. Primary, secondary and tertiary data sources have been used for this purpose. Likewise, this paper briefly discusses the implications and limitations of the use of technology in census operations, concluding that technological solutions become relevant if they are diagrammed and incorporated as part of an integrated system to the different stages of the census operation. Keywords: Census - Results - Data capture processes - Sub-processes - Technology in census processes. 12 1. INTRODUCCIÓN 1.1 Síntesis general 1.1.1 Justificación En este documento se pretende analizar la producción de datos en los censos de población argentinos, poniendo especial énfasis en el proceso de captura de datos durante el Censo 2010; procedimiento que fue llevado a cabo posteriormente al relevamiento censal realizado el 27 de octubre de 2010. El proceso o método de captura de datos puede definirse como el proceso de entrada, ingreso o digitalización de los datos censales, proceso que puede realizarse durante o después de la enumeración, dependiendo del método utilizado durante el operativo (CEPAL, 2021b, pág 1213). En el caso del Censo 2010 se realizó posteriormente, dado que el método de captura empleado fue el escaneo y la interpretación de caracteres de las cédulas censales (lectura óptica). En nuestro país se han realizado once censos nacionales. Todos han sido censos de hecho, a excepción del último que se realizó durante el año 2022. Si bien el INDEC y la comunidad académica cuentan con información de cada uno de ellos, la misma refiere en general a los resultados obtenidos y a lineamientos generales del operativo. Existe información dispersa en cuanto a la cartografía y la logística, pilares fundamentales de cualquier operativo censal que se considere exitoso. Y algo similar ocurre con los procesos de captura de datos, dado que no existe actualmente registros ni bibliografía específica para el caso de los censos argentinos. Si bien la tecnología actual propone modernos sistemas de logística y capturas de datos, que se ofrecen como una solución rápida y confiable a la hora de llevar a cabo este decisivo proceso; debemos ser cuidadosos al pensar que la tecnología actual - por sí sola - resolverá todas las cuestiones vinculadas con la captura de datos. Esta premisa adquiere cuerpo y forma si se piensa al censo como un operativo integral, que no solo es el operativo nacional más importante que el Estado Nacional desarrolla en tiempos de paz, sino que requiere de una organización sistemática y operativa previa, en la cual ningún proceso posterior puede quedar enajenado del sistema estadístico nacional, ni de las experiencias previas de censos pasados. 13 Al respecto pareciese que actualmente no existiesen lecciones aprendidas, o enseñanzas previas que orienten la planificación de la captura de datos. El éxito de un censo quizás no dependa del uso o no de las nuevas tecnologías, sino de planificar y organizar previamente cada una de sus etapas, teniendo en cuenta que la calidad del dato censal es la consecuencia de la calidad de todos los procesos anteriores a su registro en la base de datos final. En este punto la tecnología es una herramienta que posibilita acelerar los tiempos de procesamiento mejorando la oportunidad del dato, pero de ninguna manera garantiza por sí sola la calidad de la información. Si bien las oficinas de estadística pretenden aprovechar los avances tecnológicos actuales, al analizar la implementación de un cambio tecnológico en los censos es necesario considerar tanto los aspectos metodológicos como los logísticos y realizar las pruebas necesarias para evitar problemas durante la implementación de cada uno de los procesos censales. Todas estas consideraciones deben ser producto de un análisis minucioso, que se llevará a cabo en los capítulos siguientes. El propósito de este trabajo refiere a la imperiosa necesidad de documentar cada una de las etapas del proceso de captura de datos censales a partir de la experiencia del Censo 2010, considerando que es una etapa censal fundamental en el proceso de producción de datos, y la primera consistencia a la que es sometida la información recabada en campo. En ese sentido la calidad y consistencia de la información censal está vinculada a los procedimientos censales inmediatamente posteriores al relevamiento censal; cabe señalar el proceso de repliegue del material censal, el acondicionamiento de las cédulas censales junto al control de la segmentación cartográfica, y el posterior escaneo supervisado por los procesos de graboverificación, control de calidad y control de completitud que se realizan posteriormente a la captura de datos. Documentando este proceso, analizando cada una de sus etapas, y describiendo cuáles han sido los problemas más recurrentes y cómo han sido resueltos, posibilitará evaluar – por un lado - integralmente la calidad de la información censal, lograr mejoras en la captación de los datos en censos posteriores, como asimismo reducir el tiempo necesario de este proceso (qué en el Censo 2010 llevó entre 5 y 6 meses) para lograr un dato oportuno, que luego será un insumo fundamental para la implementación de políticas públicas que permitan mejorar la calidad de vida de los habitantes de nuestro país. 14 Y por el otro lado la documentación y el análisis de este proceso, permitirá sistematizar esta etapa censal hasta ahora inédita en Argentina, logrando integrarla y vincularla con etapas censales anteriores (Diseño Conceptual del cuestionario censal, por ejemplo), y con etapas censales posteriores (análisis de calidad y consistencia de la información producida). Este es un aspecto fundamental, dado que hasta la fecha muchos procesos censales se configuran como compartimentos estancos, y se limitan sus vinculaciones a cuestiones de índole informática, que no son menores, pero que no se agotan en ello. A modo de ejemplo se puede decir que el diseño del cuestionario censal está vinculado al proceso de captura en la calidad del papel utilizado o en los “anclajes” que figuran en cada hoja del cuestionario; también en el tipo de lápiz y de caligrafía a utilizar por el censista; pero su vinculación no se agota en estas cuestiones materiales, ya que también la cantidad de variables a registrar, y la modalidad de las preguntas en el cuestionario inciden significativamente en la complejidad del proceso de captura de datos. Y dado que nuestros censos contienen en general un número considerable de variables, se debe prever que a mayores preguntas alfanuméricas, los tiempos de captura serán más largos y contarán con mayores inconvenientes. Tal complejidad podría atentar contra la oportunidad del dato, por ello la necesidad de analizar este proceso de captura y documentarlo. 1.1.2 Objetivos De acuerdo al propósito manifestado en la introducción, se entiende que la investigación se vehiculizará, con el cumplimento de los siguientes objetivos. -Objetivo General: Analizar el proceso de captura de datos en el Censo Nacional de Población, Hogares y viviendas realizado en la República Argentina en 2010. -Objetivos específicos: ● Analizar y documentar los subprocesos que conforman la captura de datos. ● Realizar una representación gráfica de la interacción e interrelación de los distintos subprocesos de la captura de datos. ● Analizar cuáles han sido los inconvenientes más relevantes y recurrentes durante dicho proceso y cómo han sido resueltos. 15 2. MARCO TEÓRICO Y CONCEPTUAL 2.1 Procesos censales Un proyecto censal es el resultado de una planificación que consiste en un conjunto de fases, procesos, actividades y tareas interrelacionadas y coordinadas, que se encuentran estructuradas dentro de un presupuesto y periodo de tiempo, los cuales se han definido previamente1. Según Massé, el desafío que se presenta es poder integrar dichas acciones y controlar de manera apropiada los factores intervinientes que pueden llegar a poner en riesgo el objetivo primordial del Censo en cuanto a su cobertura y/o la oportunidad y calidad de sus datos. Un aspecto a destacar es poder evaluar el impacto que ejerce la decisión adoptada en términos metodológicos respecto de la estimación presupuestaria que se ha elaborado. El impacto se asocia directamente con la relación costo-beneficio que es necesario justificar. El éxito de un proyecto, en este caso el censal, es la medida de su impacto en función de los objetivos propuestos (Masse, 2011). Las etapas o fases del Censo son: etapa precensal; etapa censal, de empadronamiento o de relevamiento; y finalmente etapa postcensal. Estas fases suelen ser secuenciales, donde la fase anterior se completa esencialmente antes del comienzo de la siguiente fase, aunque pueden ocasionalmente superponerse. (Naciones Unidas 2021). En este capítulo se hará un mayor énfasis en esta última etapa que en las etapas anteriores. 2.1.1 Etapa precensal La etapa precensal corresponde a todas los procesos y actividades preparatorias que se realizan antes del empadronamiento. Esta etapa comprende fundamentalmente en primer lugar el diseño estratégico del Censo cuyo objetivo es el estudio de alternativas de acción en las diferentes actividades que involucra el proyecto y en segunda medida la preparación del Censo. La cual se realiza antes del operativo censal, realizando un conteo previo de viviendas y personas (pre-Censo) para la sectorización del territorio y así cuantificar los recursos humanos a capacitar, recursos físicos, tecnológicos y materiales. Esta fase incorpora, además, la actualización cartográfica, la realización de pruebas censales y el levantamiento de un Censo experimental. (FLACSO, CELADE, INE, 2018). En general la extensión de esta fase 1 Para más detalle sobre este tema, se puede consultar en el anexo 1, en donde se especifican las generalidades de los Censos como el tipo de Censos, las recomendaciones internacionales, descripción de la metodología tradicional y de otras técnicas censales, entre otros. 16 tiene una duración prolongada e involucra una serie de actividades, interrelacionadas e interdependientes y que, además, se llevan a cabo mediante tareas que se realizan de manera simultánea (Naciones Unidas, 2001). La elaboración del Plan General del Proyecto permite plantear cómo y cuándo va a llevarse a cabo el desarrollo de los principales procesos y actividades, con sus interrelaciones y secuencias para su realización. El primer eslabón en la estructuración de un Proyecto Censal Confiable, es la realización de un diseño conceptual y metodológico robusto desde todo punto de vista, el cual se constituye en la bitácora para el desarrollo e implementación de procesos básicos de éxito. En el diseño conceptual se establecen las características que le dan su identidad como operación estadística, los principios y orientaciones estratégicas; las fases, procesos y actividades que son necesarias desarrollar para llevar a cabo el proyecto; el contenido temático; la realización de presupuestos equilibrados y el diseño de toda la plataforma tecnológica que permita el acceso adecuado y oportuno de la información censal. Así mismo se prepara y construye toda la documentación necesaria para ejecutar el operativo censal, como los diseños y preparación de instrumentos de las diferentes actividades. De esta forma se establecen los lineamientos y productos de las siguientes actividades 2: ● Actualización cartográfica: Esta actividad censal permite planificar, organizar, ejecutar el relevamiento y analizar los resultados a partir de su distribución espacial, buscando que todas las áreas del país lleguen a estar cubiertas y subdivididas a partir de un mismo criterio. Dentro de sus tareas sobresalen la actualización planimétrica, el listado y/o conteo de viviendas, segmentación de las áreas censales y la preparación de todos los planos cartográficos (Masse 2011). ● Cuestionario censal y formularios de control, conceptos y definiciones: Selección de temas, diseño de cuestionarios y pruebas. En cada ronda censal los países proponen ajustes y nuevas preguntas al cuestionario o innovaciones por mejores desarrollos conceptuales teniendo en cuenta la realidad social y política actual, destacándose en los últimos censos la manera de identificar la discapacidad, la inclusión de enfoque étnico y de género, llegando a ajustar preguntas sobre la jefatura de hogar o el estado conyugal o sobre el uso y acceso a las tecnologías de información y comunicación (TICs), entre otras. 2 Estas actividades se listaron con base en información disponible en las páginas web de las oficinas de estadística, así como de la ponencia de Gladys Masse, documento metodológico guía para la elaboración de un proyecto censa, (Masee, 2011) y la guía para asegurar la calidad de los datos censales (CEPAL 2011b). 17 ● Conteo previo o recuento de edificaciones ● Planificación de la logística operativa: Diseño del operativo de Campo, organización de la logística, diseño de distribución del material censal y de elaboración de formatos operativos, etc ● Organización Administración del Censo ● Formación de un comité técnico ● Diseño de capacitación y construcción de instrumentos (manuales, videos, etc) ● Diseño de selección de personal ● Campaña de sensibilización y/o plan de publicidad: Esta actividad incluye la elaboración de campañas de publicidad, el desarrollo de instrumentos promocionales y de estrategias de implementación. (Naciones Unidas 2021) ● Concertación con grupos étnicos ● Diseño de captura, codificación, consistencia y de procesamiento de los datos ● Plan de aseguramiento de la calidad y realización del plan de pruebas Pruebas del reclutamiento, selección y capacitación del personal, Pruebas de Diseño Conceptual, Encuestas de Validación, Pruebas específicas de instrumentos, diseño de indicadores de monitoreo y control, Evaluación de calidad de materiales y productos adjudicados por licitación, Pruebas piloto, Censo experimental. ● Plan de difusión de resultados 2.1.2 Etapa censal La fase de relevamiento remite a todos los trabajos de implementación de un Censo de Población y vivienda. En esta fase, la información de cada una de las viviendas, hogares y personas, en un área específica, se recoge e incorpora en un cuestionario, ya sea en papel o en PDA, por un encuestador especialmente contratado y capacitado para realizar el relevamiento; la cobertura y calidad de esta información se verifica en terreno y luego esta información se transmite a centros especializados de recolección. El éxito de esta etapa estará condicionado a la calidad de la realización de las actividades precensales. Esta fase es el período más corto y el sustantivo del Proyecto censal Su extensión en tiempo varía entre uno (Censos de hecho) y noventa días de duración (Censos de derecho). (Masse 2011). Esta fase contempla las siguientes actividades: ● Producción, distribución y control de materiales, insumos, bienes y servicios 18 ● Selección y vinculación del personal operativo ● Capacitación del personal operativo ● Recolección de información censal ● Revisitas ● Transmisión y retroalimentación de la información (Caso de uso de PDA) ● Recuperación y conservación de materiales ● Control cobertura y calidad en terreno-Actividades de Monitoreo y control de calidad: Se realiza en los casos de censos de derecho en los cuales se extiende el tiempo de recolección de información censal (Naciones Unidas 2011). Esta actividad busca acompañar el desarrollo del Censo en los diferentes niveles de coordinación censal. Se realiza mediante el monitoreo del relevamiento, el control de cumplimiento de los plazos del trabajo de campo, la detección de las dificultades, implementación de correctivos y evaluación de la oportunidad de obtención de resultados. (Naciones Unidas 2011). Como ejemplo de sistemas de control de cobertura y calidad en las rondas 2000 y 2010 tenemos los realizados por Brasil el sistema de indicadores de gestión censal para la recolección de datos efectuado en 2000 por el IBGE; el sistema de verificación de avance y cobertura (SIVAC) desarrollado por el INEGI de México en 2005 y el Sistema de monitoreo y control censal (SMCC) elaborado por el DANE para controlar las actividades del Censo General 2005. La implementación de estos sistemas fue posible gracias a la disponibilidad de computadoras portátiles y/o PDA, así como a la posibilidad del acceso a internet (Naciones Unidas 2011). o Monitoreo y control: La magnitud y complejidad propias de los censos de población y vivienda requieren que para su desarrollo sean concebidas y cumplimentadas diversas etapas, las cuales incluyen actividades específicas, interrelacionadas entre sí y en algunas instancias simultáneas en el tiempo, que permiten obtener determinados productos censales (parciales y totales). El desafío que se presenta es lograr integrar dichas acciones y controlar de manera apropiada los posibles factores intervinientes que pueden llegar a poner en riesgo el objetivo primordial del Censo en cuanto a su cobertura o bien la oportunidad y calidad de sus datos (Cepal, 2011c) 19 El monitoreo se relaciona directamente con la gestión administrativa del proyecto censal y consiste en un examen continuo o periódico que se efectúa durante la implementación del mismo. Examina de manera continua o periódica el desarrollo de las actividades programadas, de manera de optimizar los procesos, a partir de detectar tanto cumplimientos o retrasos respecto de los tiempos originalmente programados, como diferencias en la cantidad, calidad y costo de los productos censales que se ha previsto obtener en cada etapa (CEPAL, 2004). Un aspecto por demás primordial es evaluar el impacto que ejerce la decisión adoptada en términos metodológicos respecto de la estimación presupuestaria elaborada. El impacto se asocia directamente con la relación costo/beneficio que es necesario evaluar. El éxito de un proyecto, en este caso el censal, es la medida de su impacto en función de los objetivos propuestos (CEPAL, 2011c). El monitoreo censal ha evolucionado en los últimos años con las innovaciones tecnológicas, y ha logrado transformar los antiguos procesos manuales en sistemas automatizados, integrados y dinámicos. Como consecuencia, la supervisión del avance en terreno ha mejorado, también, la gestión del personal y el monitoreo de indicadores de desempeño y demográficos, permitiendo un mayor control de la calidad de los datos durante el operativo (CEPAL, 2021b). 2.1.3 Etapa postcensal La etapa postcensal o período posterior al empadronamiento refiere a todas las actividades requeridas para compilar, evaluar, analizar y difundir los datos censales. Se considera que su extensión sea de corta duración si se la compara con las etapas previas, debido a que no solo se busca generar resultados de calidad sino oportunos (Naciones Unidas 2011b). De esta forma, esta fase tiene como objetivo evaluar los resultados censales en términos de cobertura, calidad de contenido, oportunidad y costo. La fase postcensal presenta tres grandes procesos que son el procesamiento y análisis de datos, difusión de resultados y evaluación de resultados (Naciones Unidas 2008). a. Procesamiento de datos censales Una vez que se ha efectuado el repliegue del material censal, y se han reunido todos los datos recolectados, estos deben ser codificados, captados, revisados y tabulados. Este proceso “producirá bases de datos de micronivel y de macronivel (Naciones Unidas 2011a). El 20 procesamiento de datos comprende según naciones Unidas y otras fuentes de información las siguientes actividades: ● Consolidación de Base de Datos: Esta actividad es la responsable de la recopilación y transmisión de datos de toda la información recolectada en campo, consolidándola y almacenándola para su procesamiento. Se aplica en el caso de Censo virtual o por dispositivos móviles de captura. ● Captura de datos ● Codificación (ver en anexo 2) ● Revisión de datos (ver en anexo 2) b. Difusión de resultados (Ver en anexo 2) c. Evaluación (Ver en anexo 2) d. Documentación y archivo (Ver en anexo 2) 2.2 El proceso de captura de datos. El Proceso de captura de datos (sea mediante graboverificación, lectura por escáner o captura por dispositivo móvil): Es el conjunto de actividades tendientes a la definición de los procesos y procedimientos para lectura e interpretación de los datos consignados en el formulario censal, lo mismo que para la verificación de datos leídos y conformación a las estructuras de los archivos censales. (CPV 2005) El. Handbook on the Management of Population and Housing Censuses define la captura de datos como el sistema utilizado para capturar la información del formulario censal y crear archivos de datos digitales asociados (Naciones Unidas 2021a). Dentro de los sistemas de captura de datos se tienen los siguientes: 1. Captura desde el papel La recolección de información censal con cuestionarios en papel es el método más tradicional que los INEs han utilizado en Latinoamérica. Estos métodos de captura se ejecutan posteriormente la recolección, no complejizando el operativo censal en terreno. Dentro de los métodos de captura desde el papel se encuentran las siguientes opciones: - Entrada manual o digitación: La digitación consiste en ingresar a mano los cuestionarios censales a una base de datos mediante el teclado; de esta forma se ingresan todas las respuestas del cuestionario lo más aproximado posible a como están en el papel, por lo que en este proceso de 21 digitación no se requiere efectuar ninguna consistencia en los datos ingresados, más allá de la verificación de los distintos valores que presentan las variables. (CEPAL 2021b). Este método de captura puede clasificarse en dos tipos: numérica y alfanumérica. La primera implica solo el uso del teclado numérico; por lo tanto, las preguntas abiertas (migración, ocupación, rama de actividad y otras) deben haber sido previamente codificadas. En cambio, en la digitación alfanumérica, las preguntas abiertas son capturadas en forma textual, quedando de manera similar a como se respondieron en terreno. En una etapa posterior, dichas respuestas son codificadas mediante un proceso semiautomático (CEPAL, 2021b). - Reconocimiento óptico (Escaneo): El escaneo óptico es otro método utilizado a menudo por las agencias del Censo para capturar los datos del formulario del Censo en los sistemas informáticos. En este método de captura, la gran mayoría de las páginas del cuestionario en papel son transformadas en imágenes, por medio de dispositivos de lectura digital (escáner) y, luego, esas imágenes pasarán por una etapa de interpretación automática, que las convierte en marcas, números y caracteres (CEPAL, 2021b). Los formularios del Censo se procesan a través de escáneres, que toman una imagen de cada página del formulario del Censo, dando como resultado archivos de imágenes. Una vez que se capturan las imágenes de todos los formularios, se cargan en el almacenamiento en la red y la recopilación de datos de ellos puede comenzar. Las formas físicas se almacenan, mientras que las imágenes se transfieren al almacenamiento nearline y copia de seguridad fuera del sitio. (Naciones Unidas, 2021a) Este tipo de reconocimiento óptico es, por tanto, una combinación entre Reconocimiento Óptico de Marcas (OMR, Optical Mark Recognition), usado en censos desde los años 80, y Reconocimiento Óptico de Caracteres (OCR, Optical Character Recognition) es decir, letras y números, utilizado para los censos de la ronda 2000. Las OMR leen las respuestas al tipo de casilla de verificación preguntas en formularios especialmente diseñados. Sólo la presencia o ausencia de una marca es detectada por la máquina y cualquier respuesta escrita a mano debe ingresarse manualmente o codificarse posteriormente mediante métodos asistidos por computadora. La combinación de 22 técnicas OMR y OCR se conoce también en la literatura especializada como Reconocimiento Inteligente de Caracteres o ICR (Intelligent Character Recognition) y como Reconocimiento Inteligente de Marcas o IMR (Intelligent Mark Recognition). (CEPAL 2021b). Los ICR interpretan números y letras respuestas de caracteres a partir de imágenes electrónicas de formularios escaneados. De esta forma, la tecnología ICR interpreta las respuestas definidas en ubicaciones específicas en los formularios y transforma lo escrito en datos de salida. (Naciones Unidas 2021) 2. Dispositivos móviles de captura La captura de datos con DMC es ejecutada, directamente, por los propios censistas durante el operativo, ya sea usando computadoras de mano (palmtops), tabletas, celulares o netbooks (modelos menores que los notebooks y laptops). Estos dispositivos, apoyados en programas instalados (apps) y hechos a la medida, almacenan en sus archivos las respuestas dadas por los entrevistados (CEPAL, 2021b). De esta forma, se programa el formulario del Censo en una aplicación de ingreso de datos, reemplazando el formulario tradicional en papel con una serie de preguntas secuenciales que aparecen en el formulario electrónico. El censista o encuestador lee las preguntas tal como aparecen en la pantalla e ingresa la respuesta, ya sea seleccionando una respuesta predefinida o ingresando un valor. (Naciones Unidas 2021) La transmisión de datos debe permitir, de forma rápida y segura, el traspaso de información desde los DMC o las oficinas censales hacia los servidores centrales. Este procedimiento no solo permite una mayor oportunidad para las fases de procesamiento y análisis, sino que también para el seguimiento y monitoreo durante el operativo, permitiendo a su vez procesos de retroalimentación, recapacitación y otras medidas previamente planificadas y/o soluciones a nuevos imprevistos. En cualquiera de las formas de transmisión de datos que se emplee se debe asegurar su encriptación para cautelar la privacidad de la información, junto con asegurar su integridad. Este proceso, si no ha sido bien probado, puede inducir a errores por la “transformación del dato” y la pérdida de información. (CEPAL, 2021b) 23 3. Autoenumeración o autoempadronamiento vía web (e-Censo) Esta metodología está creciendo, aunque se aplica junto con otros métodos. Este tipo de captura es similar a la de una computadora de mano, aunque es común que las preguntas aparezcan una página a la vez o secuencialmente. La captura de datos de Internet es única porque es autoadministrada, lo que significa que el encuestado completa el formulario sin la ayuda de un empadronador. (Naciones Unidas, 2021a). En este método es la misma población a censar quien llena sus cuestionarios, de esta manera, se evita tanto los errores de interpretación de los censistas. Al igual que en los dispositivos móviles de captura, el programa dirige el flujo de las preguntas y su consistencia, permite versiones diferentes del cuestionario por idioma y diseños con enfoque diferencial para personas con discapacidad. Esta estrategia, como método complementario al método principal de recolección de datos, es considerada altamente positiva, en especial para disminuir la omisión de personas, el número de rechazos y mejorar la captación de viviendas con moradores ausentes (CEPAL, 2021b). Por otra parte, esta metodología puede tener algunas dificultades como la no finalización del cuestionario censal por parte de los entrevistados, no cubriendo la totalidad de las preguntas que se presentan en la cédula censal. Otro problema está relacionado con el entendimiento de los conceptos fundamentales del cuestionario. Esto puede deberse a dificultades en los instructivos, falta de pedagogía o por falta de comprensión de las personas que auto completan el formulario. El Instituto Brasilero de Geografía y Estadística (IBGE) en la Ficha de Sistematización de Experiencias para Países de América Latina y el Caribe afirmaba que las personas que van a completar el cuestionario web carecen de un entrenamiento o capacitación para entender todas las preguntas, como sí la tienen los censistas; entonces es fundamental que se genere un conjunto de herramientas para auxiliar a los informantes en caso de duda, así como invertir en una central de apoyo telefónico (CEPAL, 2021b). Finalmente, se encuentran las dificultades relacionadas con la asignación geográfica de las personas y hogares encuestados al existir casos donde la información del formulario censal no puede ser vinculada a un hogar específico. La rápida expansión en conectividad móvil y el rápido progreso en la innovación tecnológica en general (como la nube computación, dispositivos móviles inteligentes, 24 GPS, SIG web), brindan nuevas oportunidades para aumentar la calidad y la velocidad con la que se pueden recopilar los datos del Censo. La recopilación de datos con el auto empadronamiento asistido por computadora (CASI) con el uso de Internet y con entrevista personal asistida por computadora (CAPI) en tabletas o computadoras portátiles se han convertido en un sustituto cada vez más atractivo para el uso de cuestionarios en papel, administrado por un entrevistador (PAPI) o autoadministrado (PASI) (Naciones Unidas, 2019) 4. Entrevista telefónica asistida por computadora (CATI) Una alternativa poco considerada, que se había utilizado básicamente como mecanismo de recuperación en los censos de población y vivienda es la computer assisted telephone interview -CATI, el cual consiste en entrevistas usando el teléfono como medio de comunicación para la recolección de datos. Al utilizar esta metodología, los entrevistadores trabajan conectados a un “centro de llamadas” (call center) e ingresan las respuestas con la ayuda de un computador programado de una manera similar a la digitación, DMC o aplicativo Web. Se trata de una transferencia de información usando computadoras que tendrán las mismas ventajas y desventajas que se encuentran asociadas al uso de un programa de captura (CEPAL, 2021b). 5. Combinación de métodos (mixtos) En la actualidad varios INEs en la región han considerado usar más de un método de captura de información de forma simultánea y secuencial, con el fin de garantizar una buena cobertura y minimizar la tasa de no-respuesta en el Censo. La combinación simultánea, paralela o concurrente ofrece al usuario la opción de una de las alternativas para responder al Censo, a través de un método presencial o un cuestionario en línea; de esta forma no hay un método dominante, sino que todos son tratados por igual (CEPAL, 2021b). En los últimos años los censos de Colombia (2018), México (2020), Venezuela (2021) y Brasil (2022), utilizaron la combinación de métodos de captura secuenciales. A continuación, en la Tabla 1 se presentan las ventajas y desventajas de cada uno de los métodos de captura en la cual sobresalen aspectos como el costo, capacitación y tipo de personal requerido y contratación, insumos, calidad, oportunidad, entre otros. En el caso del escaneo se destaca algunas ventajas a comparación de la digitación son mejores se 25 hace una comparación, aunque se requiere mejores insumos como el papel de los cuestionarios, la capacitación de los censistas (tipo de letra) y la gestión el material a escanear (Tabla 1) La combinación de métodos secuenciales: en esta alternativa es posible elegir un método principal, el que se considere más adecuado a la gran mayoría de la población. Este método debería usarse en su máxima potencialidad, mientras que los otros métodos pueden ser usados como opciones auxiliares o para grupos específicos de la población. En general, el diseño secuencial tiene efectos menos marcados sobre la diferencia de calidad entre los métodos (CEPAL, 2021b). . 26 Tabla 1. Ventajas y desventajas de los métodos de captura censales 27 28 Fuente: Elaboración propia con base del documento “Lineamientos generales para la captura de datos censales” (Cepal, 2021b) 29 2.3 Tecnologías de captura de la información Según Naciones Unidas el proceso de captura de datos se define como el sistema3 utilizado para convertir la información recopilada en el Censo a un formato que permita su lectura a un computador (Naciones Unidas 2009), refiriéndose de esta forma específicamente a las tecnologías utilizadas para la recolección y sistematización de la información censal. Históricamente, los censos han utilizado las boletas de papel para la captura de la información. El ingreso manual de los datos captados mediante esas boletas a los sistemas informáticos ha dejado paso al uso de cuestionarios de marcas que son capturadas mediante escáneres especializados e interpretadas por el programa correspondiente, ya sea para decodificar las marcas o para el reconocimiento de caracteres —Optical Caracter Recognition (OCR)—, o ambas cosas. En las últimas rondas se han comenzado a utilizar los dispositivos electrónicos de captura —Personal Digital Assistant (PDA) o Smarthphones—, en los que el enumerador ingresa directamente la información, que luego es descargada y transmitida a la base de datos central del Censo (Cepal 2014) Independientemente de la modalidad de enumeración (Jure o facto) que se implemente todos los censos se componen de tres etapas que están interrelacionadas entre sí, en la que se aplican dichas tecnologías: ● La primera etapa es la selección de unidades geográficas y asignación de sitios de la entrevista (Cartografía): En esta etapa inicia con la definición del área geográfica a censar y la ubicación de las unidades, que generalmente son las viviendas asignándoles una única coordenada en un mapa quedando esta unidad georreferenciada previamente. ● La segunda etapa es el registro de la información durante la entrevista (Captura de datos): En esta etapa, una vez entregada la ubicación geográfica (UG) de la unidad censal al censista, éste deberá llegar al sitio asignado y llevar a cabo la entrevista con la cédula censal a cada uno en los hogares. ● La tercera etapa es el almacenamiento de la información (Transferencia de datos): 3 El término “sistema” se refiere específicamente a las tecnologías empleadas para la recolección y sistematización de la información censal, que se conocen como “tecnologías de captura de datos”. (Perfit, J T. Russel, M. Moncada, G. Muñoz Ayala, J. E..,2012) 30 Luego de la verificación y crítica de la información recolectada con el formulario censal, esta se encripta en un base de datos (Perfit, J T. Russel, M. Moncada, G. Muñoz Ayala, J. E..,2012) En la siguiente tabla se presenta la tipología para clasificar las tecnologías de captura de datos aplicadas en la región en la cual se evidencia la transformación y la evolución de las tecnologías de captura de datos: Tabla 2. Tipología de tecnología empleadas en los censos Fuente: Seminario “Aspectos conceptuales de los censos de población y vivienda: desafíos para la definición de contenidos incluyentes en la ronda 2020”. (CEPAL, 2019) En la tabla 2 se observan cuatro generaciones, a saber: ● En la primera generación se utiliza tecnología análoga basada en el uso de mapas (cartografía de aproximación), cuestionarios de papel y codificación de la información mediante la digitación manual. ● La segunda generación se basa en la implementación de la cartografía de precisión, la cual emplea imágenes satelitales y fotografías aéreas que se pueden digitalizar y georreferenciar. Esta tecnología permite el uso de GPS. Así mismo para el almacenamiento de la información emplea papel que cuenta con especificaciones técnicas para que los datos puedan ser registrados por un scanner o lector óptico. ● La tercera generación agrupa las tres etapas a través de un dispositivo móvil de captura, los cuales pueden incorporar mapas, el cuestionario censal y GPS y permite almacenar la información durante la entrevista. ● La cuarta generación se basa en el uso de cartografía digital y el autoempadronamiento (e-Censo) como estrategia para empadronar a la población a través del internet (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). 31 Las labores de actualización cartográfica, el propio uso de la cartografía y la captura y transferencia de datos se han beneficiado de la constante innovación tecnológica en las últimas décadas, generando cambios estructurales en los censos. El primer cambio se produjo entre 1999 y 2003, en el período correspondiente a la ronda de censos de 2000, durante el cual muchos países adoptaron la tecnología de segunda generación, donde se vio un incremento significativo del uso de escáneres para la recolección de datos y los primeros vestigios del uso de técnicas de cartografía digital (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). El segundo cambio estructural se inició (para la ronda de 2010) entre 2009 y 2010. Este cambio estructural se caracterizó por la adopción de la tecnología de tercera generación (cuestionarios y cartografía digital) y una mayor utilización de escáneres, tendencia que contrasta con una considerable reducción de la tecnología de primera generación (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Finalmente, para la ronda 20204 se observa con la información preliminar recolectada de los institutos nacionales de estadística el inicio de la implementación de la tecnología de cuarta generación, e incluso la combinación de esta tecnología de tercera. Se espera que con el tiempo este tipo de tecnología (cartografía digital y auto empadronamiento) vaya tomando mayor relevancia en futuras rondas censales. A partir de la información sobre los censos de los diferentes países latinoamericanos se caracterizaron las cuatro últimas rondas de censos de población en función de la tecnología utilizada. En la Figura 1 se presentan las tecnologías empleadas en cada uno de ellos en las cuatro décadas, mientras que en la Tabla 3 se da a conocer la información agregada de Latinoamérica, Sudamérica, comparada con la información de los censos de Argentina. En esta tabla, en celeste se encuentran resaltados en la columna de países, los que hacen parte de Sudamérica y en verde los métodos de captura utilizados en la última ronda censal (Tabla 3). Al analizar en la Figura 1 se puede observar que la tecnología de primera generación fue la más utilizada como método de captura principal en la ronda de 1990, pero a medida que pasan las décadas esta opción va disminuyendo. En el caso de la tecnología de segunda generación 4 En el Anexo 3 se hace un breve análisis de la ronda 2020 y de la implementación de tecnologías en los Censos durante este periodo. 32 se puede observar que fue la más usada en la ronda del 2000 y que en las siguientes rondas ha disminuido su implementación. Figura 1. Censos de población y vivienda en América Latina, por método de captura principal según ronda censal Fuente: Elaboración propia con base de la encuesta sobre el uso de tecnología en los censos de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponible en las páginas w eb de las oficinas de estadística y de la Cepal, del documento "Lineamientos generales para la captura de datos censales" (Cepal, 2021b) y del artículo "Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en los censos de población de América Latina y del Caribe" (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Por otra parte, la tecnología de tercera generación aumentó de manera considerable su implementación en las dos últimas décadas. Finalmente, en la ronda de 2020, se puede ver de manera incipiente el uso de la cuarta generación como método de captura primordial, siendo una posible alternativa en futuras rondas censales, junto a otras tecnologías de captura. En la Figura 2 se observa que, más países están planificando una mayor combinación de métodos secundarios de captura, para mejorar la cobertura y acceder a un mayor número de viviendas al ofrecer diversas formas para censarse. De esta forma, vemos que en la región en la ronda de 2010 se utilizaron varias alternativas adicionales al método de captura principal, sobresaliendo la tecnología de primera generación, aunque se vio algunos casos en donde se utilizó también tecnología de segunda y cuarta generación; mientras que en la ronda de 2020 la tecnología de captura secundaria que está siendo más utilizada es la de cuarta generación con la autoenumeración por medio de e-Censo como alternativa para complementar la recolección de información censal. Así mismo es interesante ver que entre la ronda de 2010 y 33 la de 2020 el número de países que han optado por utilizar tecnologías mixtas ha venido aumentando. Figura 2. Censos de población y vivienda en América Latina, por método de captura secundario según ronda censal Fuente: Elaboración propia con base de la encuesta sobre el uso de tecnología en los censos de población y vivienda de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponi ble en las páginas web de las oficinas de estadística y de la Cepal, del documento “Lineamientos generales para la captura de datos censales” (Cepal, 2021b) y del artículo “Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en los censos de población de América Latina y del Caribe” (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Es importante tener en cuenta que la incorporación de métodos mixtos de captura, en modo secuencial o simultáneo, complejiza el proceso censal, ya que surgirán diversos tipos de errores originados desde cada uno de los métodos. Indiscutiblemente, resulta necesario desarrollar más de un sistema, además de unificar e integrar la información. En dicho contexto, constituye un desafío la operacionalización en terreno, el control cuantitativo de la recolección, el o los sistemas de análisis y monitoreo de la información recolectada para generar reportes oportunos por niveles geográficos, minimizando así el riesgo de generar resultados distintos por la utilización de un método u otro (CEPAL, 2021b). 34 Tabla 3. Censos de población de Latinoamérica y el Caribe: por tecnología empleada 35 Fuente: Elaboración propia con base en la encuesta sobre el uso de tecnología en los censos de población y vivienda de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponible en las páginas web de las oficinas de estadíst ica, del documento "Lineamientos generales para la captura de datos censales" (Cepal, 2021b) y del artículo "Estimaciones de algunos efectos y determinantes del uso de distintas tecnol ogías en los censos de población de América Latina y del Caribe" (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012), paginas CEPAL (CEPAL sfa y CEPAL, sfb) 36 En la ronda de 1990 la mayoría de los países (Latinoamérica 65% y Sudamérica 80%), utilizaban tecnología de primera generación (cartografía análoga, papel y digitación manual) y solo tres países, Argentina (1991), Chile (1992) y República dominicana (1993) que migraron a la tecnología de segunda generación. (Tabla 3) Esta situación contrasta con la registrada en la ronda de 2000, en la que un 40% de los países de América Latina utilizaron tecnología análoga (1ª generación) y un 45% tecnología cartografía digital, papel y escáner (2a generación. Dentro de la región, el cambio tecnológico en materia de censos ha sido más acelerado en los países de América del Sur que, en su mayoría (70%), ya habían comenzado a usar escáneres en la ronda de censos de 2000. La implementación de los dispositivos móviles de captura (tercera generación) se inició solo en la ronda de 2010 en los censos de Colombia (2005) y el Brasil (2010), países que fueron los primeros en aplicar esta tecnología en sus proyectos censales. Posteriormente, la utilizó Uruguay (2011) y Venezuela (2011), Paraguay (2012) y Perú (2017). De esta manera la ronda de 2010 finalizó en Latinoamérica con un 35% de censos realizados con tecnología de primera generación (completamente análoga), un 30% con tecnología de segunda generación (con escáneres) y un 25% con dispositivos móviles de captura, mientras que en los países Sudamericanos la proporción fue muy baja (10%) en la tecnología de primera generación, un 40% de tecnología de segunda generación y un 50% de tercera generación. En esta ronda algunos países de la región implementaron métodos de captura mixtos, destacándose Brasil y México, quienes aplicaron el autoempadronamiento como el e-Censo como una nueva alternativa de recolección de datos. Para la ronda de 20205 Guatemala optó por utilizar tecnología de primera generación y Argentina con tecnología de segunda generación como métodos de captura principales, aunque ambos países lo complementan con el e-Censo como una forma secundaria de método de captura. Por otra parte, de los 11 países que han optado por DMC, 9 han definido también utilizar otro método adicional de captura. En este caso se resaltan los casos de México (e-Censo, digitación y CATI) y Colombia (e-Censo, digitación y escáner) que utilizaron más de 5 Los datos referentes a la década de 2020, se refieren en algunos casos a las planificaciones e ideas que tienen los respectivos INEs, antes de marzo de 2020, sobre el futuro Censo y no corresponden, necesariamente, a la solución final implementada. 37 un método de captura secundario para recolectar la información censal. Finalmente, Venezuela fue el único país que utilizó como método de captura principal a la tecnología de cuarta generación y la completó con la DMC. Esto configura un nuevo panorama tecnológico en la región que se desglosa de la siguiente forma: Un 5% en la implementación de tecnología de primera generación, un 25% de segunda generación, 55% de tercera generación y 5% de cuarta generación y el uso en un 55% de los países de tecnología de captura mixta, de los cuales un 72% de los países de América latina optaron por el e-Censo. En general, se observa en la región una tendencia a ir avanzando desde censos realizados en papel hacia censos con dispositivos móviles de captura (DMC), pasando o no, por diferentes combinaciones entre censos de hecho o derecho con digitación, uso de escáner para la captura óptica de datos, DMC y mixtos con autoenumeración por medio de eCenso. A la vez, se observa que, una mayor cantidad de países están planificando una combinación de métodos secundarios de captura, para mejorar la cobertura y acceder a un mayor número de viviendas al ofrecer diversas formas para censarse (CEPAL, 2021b). Con respecto a los factores determinantes de la elección de nuevas tecnologías para la realización de censos de población en la región, según el estudio Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en los censos de población de América Latina y del Caribe (Perfit, J T. Russel, M. Moncada, G. Muñoz Ayala, J. E.,2012) el proceso de elección de tecnología de primera y segunda generación presenta grandes similitudes. Al parecer, cuando se trata de elegir entre las tecnologías de primera y segunda generación el único factor determinante son las diferencias de remuneración promedio del personal del Censo, la productividad laboral diaria (medida por el número de personas censadas en un día por cada encuestador) y la duración del trabajo de campo. Por otro lado, al comparar la tecnología de la primera y segunda generación con la tercera generación se observa un mayor número de determinantes. Al parecer, los institutos nacionales tienden a escoger esta última, quizás porque consideran que les permite incorporar un mayor número de preguntas al cuestionario, con un costo menor, y que eleva la productividad del personal contratado. Ambas percepciones concuerdan con las observaciones sobre la aplicación de criterios destinados a minimizar los costos por los que se han regido los institutos. No obstante, ambas ejercen una enorme influencia en la modalidad de relevamiento, ya que los obligan a realizar censos de derecho, lo que significa prolongar por varios meses las operaciones en el 38 terreno y subdividirlas en varias etapas (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). La comparación de los costos de las distintas tecnologías aportó información según la cual los censos en los que se emplean dispositivos móviles son más baratos que los de primera y segunda generación. Esta comparación es mayor si se tiene en cuenta la “paralización” favoreciendo el uso de dispositivos móviles y el auto empadronamiento si lo que interesa es minimizar costos, tanto directos como indirectos (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Por otro lado, según la tipología tecnológica creada por CELADE respecto a los censos latinoamericanos, en el caso de argentina, los primeros censos llevados a cabo en nuestro país entrarían en la categoría 1era generación, mientras que los censos de la ronda 1990, 2000 y 2010 estarían en la categoría 2da generación. De esta forma, en Argentina en estos tres censos habría estado implementando tecnologías de segunda generación. En el caso del Censo 2010 se realizó la captura de los datos censales por escáner a través de un programa de tecnologías OMR (programa de lectura óptica de marcas) y herramientas ICR (programa de reconocimiento inteligente de caracteres). Se hizo control de la segmentación mediante el software SAYCO (Sistema de Apoyo y Control a la Gestión del Censo), desarrollado por INDEC (UNFPA, 2014). Un aspecto definitorio en la elección del método de enumeración (entrevista directa o autoempadronamiento) y de captura de datos es la modalidad de enumeración (Jure o facto). La migración hacia la 3era generación no sería posible, sin cambiar la modalidad de enumeración, pasando de un Censo de hecho a un Censo de derecho, así como la implementación del empadronamiento en terreno durante un periodo más prolongado, subdividiendo el operativo censal en etapas. Con respecto a la cuarta generación, el Censo de la ronda de 2020 aunque está implementado el auto empadronamiento por internet, junto con tecnología de segunda generación (papel y escáner). Finalmente es importante destacar que, si bien en algunos países latinoamericanos existen documentos de evaluación de la calidad de los procesos de captura de datos, en los que se da cuentas de cuáles han sido los problemas más recurrentes, las ventajas y las desventajas de tal o cual tecnología; en la República Argentina no es posible hallar demasiada información 39 al respecto. No han sido documentados adecuadamente estos procedimientos, encontrando algunos escritos dispersos y a veces inconclusos, de áreas temáticas vinculadas al Censo como el Diseño Conceptual, Cartografía, Logística, Capacitación e Informática. Ninguna de estas áreas realizó una evaluación global del proceso censal, sino que analizaron momentos específicos del operativo, y producen de esta manera una “división del trabajo” que lleva a que se pierda de vista la cohesión y la calidad de todos los procesos anteriores al registro del dato en la base censal definitiva. 2.4. Los censos en Latinoamérica y el proceso de captura de datos6 En los países de América Latina, la tendencia ha sido transitar hacia procesos de modernización e innovación tecnológica al buscar afrontar los retos de una sociedad más exigente, que requiere datos, cada vez más oportunos, de mejor calidad y más detallados. Esta modernización también la ha tenido que sobrellevar los distintos INEs en las rondas de 2000, 2010 y 2020, al momento de planear y ejecutar operaciones estadísticas como los censos de población y vivienda; introduciendo diferentes innovaciones tecnológicas en la recolección y/o captura de la información y en algunos casos implementando métodos mixtos de manera secuencial o simultánea, con el fin de mejorar la calidad y oportunidad de los datos censales. La adopción de nuevas tecnologías ya sea para la captura de los datos censales, afecta de manera importante la planeación del Censo, entendiendo por método de captura el proceso de entrada, ingreso o digitalización de los datos censales, proceso que puede realizarse durante o después de la enumeración, dependiendo del método utilizado durante el operativo: electrónico con DMC, e-Censo o papel con digitación y escaneo (lectura óptica) (CEPAL, 2021b). De esta forma, la incorporación de un nuevo método de captura requiere una serie de actividades, pruebas, riesgos y desafíos que, también, deben incluirse en la planificación y gestión del Censo (CEPAL, 2021b) Es así que los INEs han tenido que tomar decisiones sobre la elección de las tecnologías en las diferentes etapas del Censo, al ser esta una decisión estratégica para el diseño e implementación de sus próximos proyectos censales. De esta forma, la tecnología se ha ido 6 En el anexo 4 se hace una descripción de la metodología de los dos últimos Censos de población y vivienda de algunos países de la región (Brasil, Chile, Colombia, Ecuador, México, Uruguay y Venezuela) y de la tecnología que utilizaron para la captur a de datos 40 incorporando, paulatinamente tanto en la recolección, captura y procesamiento de los datos, como en la planificación, gestión y control de los procesos censales. En ese sentido los países al analizar un cambio en la tecnología deben “considerar entre otros, los aspectos de (i) infraestructura de la institucionalidad, (ii) económicos, (iii) metodológicos, (iv) de capacitación, y (v) logísticos. Así mismo, otros factores a considerar en la decisión sobre el uso de tecnología en cualquiera de sus fases son el tipo de Censo que el país va a implementar, la infraestructura tecnológica del país, el nivel educacional de la población, entre otros (FLACSO-Chile, CELADE-CEPAL e INE-Chile, 2018). Los países han venido tomando decisiones sobre el modo de recopilación de datos al principio de la etapa de planificación del Censo, basándose en los objetivos estratégicos del Censo, la experiencia previa en recopilación de datos, los recursos disponibles, las características de la población como las tasas de alfabetización y la cobertura de los servicios de telefonía e Internet, y la disponibilidad de marcos (por ejemplo, el marco de dirección para los cuestionarios enviados por correo). (FLACSO-Chile, CELADE-CEPAL e INE-Chile, 2018). De esta forma, la definición del método de recolección depende de factores como la definición del tipo de Censo, los niveles de calidad, cobertura y oportunidad, factores institucionales, tecnológicos, económicos, sociales, culturales, entre otros (Naciones Unidas, 2019). Es así que no existe un método único que pueda recomendarse, sino que es conveniente considerar y evaluar los múltiples factores y situaciones en que están insertos los INE de la región, especialmente, en lo relativo a las grandes brechas de capacidad tecnológica instalada en los institutos; algo que, ocasionalmente, se puede transformar en un factor de éxito del proyecto. No obstante, es importante mencionar que, a pesar de lo anterior, el tipo de Censo que se realice (de hecho o de derecho) sigue siendo un gran condicionante en la decisión del método de captura que utilizan los países de la región (CEPAL, 2021b). En el análisis de la “Encuesta sobre el estado de avance de los censos de 2020 e identificación de las necesidades nacionales” realizada por CEPAL a los países de la región, se observó que “el uso de tecnologías de nuevas generaciones es un cambio importante tanto en la actualización cartográfica como en la captura y procesamiento de la información (CEPAL, 2017b). A partir de la evaluación de esta encuesta, CEPAL recomienda a los Institutos Nacionales de Estadística (INE’s en adelante) enfocarse en lograr productos de calidad y no en la tendencia reinante de enfocarse solo en los instrumentos o innovaciones tecnológicas 41 (CEPAL, 2017b). Es por eso que es necesario tener presente que la tecnología es una herramienta que contribuye a mejorar la calidad de la información censal, pero que no es el único factor, por lo que se deben estructurar equipos multidisciplinarios comprometidos con el logro de los objetivos propuestos (FLACSO-Chile, CELADE-CEPAL e INE-Chile (2018). Según Chackiel (2002) existen numerosas innovaciones tecnológicas que son aplicables en las etapas censales de preparación, de empadronamiento y en la etapa post-censal. Es así que en los operativos de los censos se avanza en la utilización de la cartografía digital acompañados en algunos casos de imágenes satelitales (anteriormente mapas de papel), lo que permite la actualización de datos, reproducción de archivos a diferentes escalas y construcción de sistemas SIG. También hace referencia a las herramientas de capacitación, la tecnología de captura en los lectores de imágenes o escáner, y los sistemas de indicadores de la gestión censal para la recolección de datos, así como a creación de bases de microdatos al igual que los sistemas en línea, (REDATAM - Recuperación de datos para áreas pequeñas por microcomputador) (Chackiel, 2002). A lo largo del presente capítulo se ha podido observar las diferentes elecciones de tecnología de captura que algunos países de América latina utilizan o planean usar durante la recolección censal y el procesamiento de la información capturada en el operativo de campo, tanto en la ronda 2010 como en la de 2020, y como la decisión del uso de tecnología e instrumentos usados impacta directa o indirectamente en todos los procesos, entre los que destaca la captura. De esta forma, el modo de captura de los datos utilizada por los INEs varía según las experiencias particulares e intereses propios de cada país, optando por usar un método de captura de datos específico o una combinación de dos o más modos en una operación censal. El documento “Principles and Recommendations for Population and Housing Censuses Revision 3”, describe dos métodos principales para la captura de datos en un Censo tradicional: En el método de entrevista directa, la información para cada persona (en un Censo de Población) y vivienda (en un Censo de vivienda) es recopilada e ingresada en el cuestionario por un funcionario del Censo (censista) designado para realizar esta operación en un área específica (en Argentina denominada segmento censal). Y en el método de autoenumeración, en el cual la principal responsabilidad de ingresar la información se le da a una persona designada o elegida dentro del hogar, aunque el cuestionario puede ser distribuido, recopilado y verificado por un funcionario del Censo (Naciones Unidas, 2017). En 42 cada uno de estos métodos se pueden utilizar diferentes instrumentos de captura de datos. En el caso de tener un entrevistador se puede usar cuestionario en papel (PAPI), un dispositivo móvil de captura DMC (CAPI) o entrevista telefónica asistida por computador (CATI). En otro caso se usa un cuestionario auto administrado, puede ser un cuestionario en papel, recibido por correo o entregado personalmente, (PASI) o un cuestionario electrónico a través de una aplicación internet (CASI) (CEPAL, 2021b). Estos instrumentos ofrecen una posibilidad para complementar las entrevistas directas a través de una variedad de combinaciones de métodos de captura (método multimodo). Los países de la región, que han incorporado el uso del papel y la captura de la información tanto por digitación manual de los cuestionarios, o por lectura óptica, han planteado como un elemento fundamental contar con una visión integral del proceso, estableciendo diferentes tipos de acompañamientos y controles en cada etapa del proceso con el fin de poder asegurar la calidad de la información censal. Estos métodos de captura están plenamente definidos de antemano, y se llevan a cabo luego del operativo, sin comprometer tanto el operativo censal en terreno –dado que el manejo, la revisión, el empaquetado y la entrega de los cuestionarios impresos al centro de captura implican mayor carga de trabajo para la estructura operativa– y pudiendo hacerlo con debida calma, siempre y cuando los tiempos vinculados a la entrega de resultados lo permitan (CEPAL, 2021b). Algunas de las razones que tuvieron peso en los diferentes INEs para elegir estas opciones (digitación y lectura óptica) fueron la experiencia que han tenido tanto en las encuestas como en censos anteriores con este tipo de metodología; en otros casos la modalidad de enumeración o los altos costos de implementación de otros métodos de captura como DMC y el control del proceso por parte del equipo técnico del Censo. La digitación, la cual consiste en ingresar manualmente la información de los cuestionarios censales en papel a una base de datos mediante el teclado numérico y/o alfanumérico, se utiliza cada vez con menor frecuencia en la región. En la década de 2010, siete países usaron este método de captura y, si bien, en México y Colombia realizaron la digitación de los cuestionarios captados en papel, este método no fue el método principal para la captación de información (CEPAL, 2021b), por lo que, en la presente década (2020), solo Guatemala (2018) ha informado que realizará la captura por medio de la digitación. De esta forma, los países han ido migrando hacia métodos más tecnológicos con el fin de mejorar las desventajas de la 43 digitación en términos de calidad y oportunidad, aunque si es utilizada como una alternativa de contingencia frente a las dificultades que se puedan presentar frente a los otros métodos de captura, debido a que los INES tienen experiencia previa, a que su ejecución es relativamente sencilla y a los bajos costos de su implementación. Otro aspecto que se debe analizar con sumo cuidado a la hora de aplicar este método de captura es el mecanismo de validación del ingreso de datos, recomendando que se haga una doble digitación; es decir, que un mismo cuestionario sea digitado dos veces y, luego por procesos de validación automatizada, se opte por el “correcto. (CEPAL, 2021b). El reconocimiento óptico (Escaneo) es el método de captura, en donde las páginas del cuestionario en papel son transformadas en una imagen por medio de máquinas de lectura digital (escáner) y, luego, esas imágenes pasan por una etapa de interpretación automática, que las convierte en marcas, números y caracteres. Este tipo de reconocimiento óptico es, por tanto, una combinación entre Reconocimiento Óptico de Marcas (OMR, Optical Mark Recognition), el cual ha sido utilizado a partir de los censos desde los años 80, y el Reconocimiento Óptico de Caracteres (OCR, Optical Character Recognition), es decir, letras y números, el cual se implementó de manera importante en los censos de la ronda 2000. La combinación de técnicas OMR y OCR es conocida también como Reconocimiento Inteligente de Caracteres o ICR (Intelligent Character Recognition) y como Reconocimiento Inteligente de Marcas o IMR (Intelligent Mark Recognition) (CEPAL, 2021b). El uso de escáneres como método de captura es un método mucho más rápido que la digitación y permite guardar la imagen a color de manera que sea un fiel reflejo del cuestionario en papel y mantener un archivo digital de consulta más eficiente ante posibles errores, sin necesidad de mantener en bodega por mucho tiempo los cuestionarios físicos. De igual modo, este método requiere de menos personal y, por ende, se puede tener personal más capacitado en menos espacio físico; asimismo, posibilita la captura de campos adicionales, que tradicionalmente no se digita, como la lista de integrantes del hogar sin mayores costos monetarios o de tiempo. Todos estos factores redundan en una mayor calidad en la captura de datos, ya que involucra un grado mucho mayor de estandarización y menor incidencia del factor humano, el cual actúa solamente en la estación de verificación de los casos donde la interpretación del escaneo no fue capaz de “traducir” la imagen en un código, número o letra apropiado (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). 44 Por otra parte, el proceso de reconocimiento si bien puede considerarse un avance respecto a estandarizar un proceso de digitalización del papel, no soluciona el problema de la construcción de una base relacional validada, en este sentido es necesario establecer criterios de control de calidad que aseguren los supuestos básicos (contabilización de persona y reconstrucción de viviendas y hogares) con los que funcionan los algoritmos una vez recibida la base desde la empresa (CEPAL, 2021b). Por otro lado, el escaneo necesita de un papel con unas especificaciones particulares lo cual puede subir los costos. De esta forma es necesario considerar diversos aspectos como el gramaje del papel, la tinta de impresión, el pegado del cuestionario, los anclajes, la dimensión de los espacios para las marcas y escritura, la incorporación de códigos especiales como un código de la barra único para el seguimiento y control durante el procesamiento y el lápiz y goma a utilizar (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). Algunas recomendaciones que han hecho los INES en la implementación de tecnologías de captura como la lectura óptica, están relacionadas con el tema de las pruebas. El INE de Chile recomienda que el Censo experimental se realice con la misma empresa o método de lectura óptica a utilizar en el operativo censal. Así mismo el INE de Ecuador ratifica que deben ser probados con todos los elementos metodológicos e infraestructura física y tecnológica diseñados para el Censo definitivo (Cepal, 2021b). Por otra parte, la captura de datos con DMC es llevada a cabo, directamente, por los propios censistas durante el operativo, ya sea usando computadoras de mano (palmtops), tabletas, celulares o netbooks (modelos menores que los notebooks y laptops). Estos dispositivos, apoyados en programas instalados (apps) y hechos a la medida, almacenan en sus archivos las respuestas dadas por los entrevistados (FLACSO-Chile, CELADE-CEPAL e INEChile,2018). Este instrumento tiene muchas ventajas por ser un mecanismo de captura de datos instantánea que permite el control de errores de digitación en el lugar mismo de la entrevista, así como ayuda a reducir los tiempos de procesamiento y permite un mayor control del quehacer de los encuestadores al mejorar los métodos de supervisión. Sin embargo, hay que considerar el costo de este instrumento, que deben existir pruebas del funcionamiento, programación y usabilidad de los DMC, una mayor calificación de los encuestadores, así como 45 la necesidad de contar con un sistema de soporte tecnológico (telefónico y web) para enfrentar fallas durante la recolección (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). Los INES que han innovado con el uso de DMC como método de captura en sus procesos censales, centran sus principales recomendaciones en tres aspectos. El primero de ellos es la necesidad de integrar todos los sistemas que se utilizan a lo largo del proceso censal, desde la visualización geográfica, el seguimiento de la recolección, el monitoreo, hasta la información para la fase de procesamiento y análisis. El segundo aspecto refiere a incluir pruebas de sistemas, dispositivos, volumen y transferencia de datos, elementos de seguridad de datos como el hacking ético y, posteriormente, la integración de distintos equipos técnicos que forman parte del proceso censal. Finalmente, acerca del DMC, los países recomiendan considerar soluciones y herramientas de cuarta generación y planificar, investigar y consolidar un presupuesto para su adquisición. En definitiva, el éxito de la implementación de mayor tecnología en la captura de datos debe pasar, necesariamente, por un proceso integral de análisis y decisiones, donde no solo se consideren los aspectos tecnológicos y su potencial de mejora en calidad y oportunidad del dato (CEPAL, 2021b). Es así que en el instituto de estadística de Colombia (DANE), teniendo en cuenta su experiencia en el manejo de DMC en sus dos últimos censos recomiendan hacer suficientes pruebas para determinar la robustez de software y la resistencia del hardware, utilizar para el monitoreo el uso de GPS u otros instrumentos de localización para controlar los recorridos y asegurar a los equipos de trabajo, con un adecuado plan de datos para los envíos de información a través de internet. Por otra parte, el INEGI quien también ha utilizado este tipo de tecnología en varios censos hace varias recomendaciones para su implementación, entre las que sobresalen también el tema de las pruebas, al reafirmar la necesidad de un plan de pruebas que contenga pruebas de sistema, pruebas de volumen y pruebas de hackeo (Cepal, 2021b). Asimismo, plantea la necesidad de contemplar diferentes aspectos como cuidarse en las especificaciones que se hacen en el proceso de licitación y en definir una estrategia informática para sistematizar el resto de los procesos del proyecto censal. En la siguiente tabla se muestra un panorama diverso respecto del desarrollo del aplicativo desarrollado por los diferentes países que optaron por esta opción: 46 Tabla 4. Latinoamérica. Características del desarrollo del aplicativo para DMC. Fuente: Lineamientos generales para la captura de datos censales. Revisión de métodos con miras a la ronda de censos 2020. (CEPAL, 2021b). Diseño del Proceso de Captura y sus Aplicativos Censo General 2005 – CGRAL (DANE 2004). Proyecto Censal Censo de Población, Hogares y Viviendas 2023. (INE- Uruguay, 2021). En la Tabla 4 se observa la tendencia de los países a desarrollar un aplicativo a través de un desarrollo propio (in-house) en las diferentes experiencias censales, permitiendo a los INEs un mayor control sobre las funcionalidades y usabilidad del aplicativo. Por otro lado, actualmente, existe una diversidad de software para comercialización masiva que resolvería la implementación del aplicativo de recolección de datos. Sin embargo, si se decide utilizar alguno de ellos, se debe considerar que la mayoría de dichos programas no ha sido implementada en ningún operativo a gran escala como lo es un Censo de Población y Vivienda; por lo cual, sigue siendo necesario llevar adelante la mayor cantidad de pruebas sucesivas previo a su implementación (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). El eCenso se relaciona con la posibilidad de responder las preguntas del Censo de manera autónoma y sin la necesidad de un censista. En su versión de captura de datos en línea vía Internet (eCenso), el informante se conecta, directamente, al servidor de Internet que ha implementado el instituto para estos fines y responder el cuestionario. (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). En el caso de la recolección de información a través de internet “se observa una mayor intención por parte de los INE de la región para implementar sistemas de eCenso (autoempadronamiento web) con el objeto de facilitar las respuestas de los diferentes grupos poblacionales, en especial para aquellos con más difícil acceso para los encuestadores, sea por razones de seguridad, apatía o ausencia de moradores, a lo cual se 47 suma, además, la necesidad del distanciamiento social impuesto por la pandemia del COVID 19. Por otra parte, y en relación con la implementación del eCenso, en la región, se observa su uso como método alternativo de captura, con muy bajas tasas de respuesta en los países que lo han utilizado (a excepción de argentina que tuvo una participación mayor del 50% en el Censo 2022), por lo que no debiese ser considerado aún como un método único de captura plausible de implementar para futuros censos en los países de la región, al menos en la ronda 2020. Esto se debe a diferentes razones, las que van desde la baja cobertura de internet — que existe en algunos de los países, método que no ha sido totalmente probado—, y su incorrecta aplicación por parte del informante que podría comprometer los resultados de la operación censal; por ejemplo, al contestar solo por una persona generando un aumento erróneo de los hogares unipersonales, además de las dificultades que implica lograr conectar la ubicación geográfica de la vivienda con el cuestionario y la posibilidad de invisibilizar los segundos hogares (CEPAL 2021b). Para este método es indispensable que la población objetivo tenga un alto nivel de confianza y aceptación tanto con la herramienta como con el operativo censal. Para ello es fundamental implementar una estrategia de comunicación y sensibilización robusta, que incluya el envío de identificadores únicos que les permita a las personas ingresar y mantener sus datos seguros. Este método exige desarrollar programas de captura de alta seguridad vía Internet, así como, efectuar un control estricto los informantes por esta vía, siguiendo los casos de las entrevistas que no son respondidas o que están incompletas. Igualmente es necesario implementar diferentes ayudas para los entrevistados a partir del desarrollo de un portal de gestión y monitoreo con el correspondiente apoyo a las dudas y problemas que presenten las personas, lo que implica tanto un apoyo virtual y telefónico con personal capacitado que pueda guiar virtualmente a los encuestados para completar el Censo de manera apropiada. (FLACSOChile, CELADE-CEPAL e INE-Chile,2018). Un aspecto por considerar es que el diseño del formulario en papel, como para DMC y el eCenso, ya que tienen objetivos distintos y están dirigidos a poblaciones específicas diferentes. Afortunadamente, existen muchas herramientas y tecnologías de diseño e implementación de formularios para autoenumeración como JavaScript y CSS, entre otros, 48 habiendo incrementado sus usos y opciones de implementación, como consecuencia de la pandemia por COVID-19. (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). Con respecto a países como Brasil que han tenido experiencias con este tipo de método, recomienda invertir mucho en publicidad si la intención es tener una participación masiva de la población, así como la creación de un conjunto de herramientas que ayuden a la población a resolver las dudas que se le presenten mientras contestan el cuestionario (CEPAL, 2021b). Por otra parte, la decisión de considerar el uso de un método mixto de captura ya sea simultáneo o de manera secuencial para la recopilación de datos, está basado principalmente en las tasas de costo y respuesta. El enfoque multimodo típico consiste en utilizar un método menos costoso para el contacto inicial, y un modo más costoso para el seguimiento con aquellos que no responden, como el uso de un método PAPI, CAPI o PASI con seguimiento telefónico sin respuesta (esto es conocido como diseño secuencial). El uso de modos múltiples a menudo produce una tasa de respuesta más alta al ofrecer medios alternativos para responder, por lo que los encuestados pueden elegir el modo que les resulte más conveniente; por ejemplo, algunos hogares pueden preferir responder a través de Internet en lugar de completar un cuestionario en papel (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). El uso de un método mixto de captura complejiza el proceso de recopilación de información, dado que se debe controlar el avance del Censo (cobertura) aplicando diversos métodos y convivir con fuentes de error que tienen diferente comportamiento, según el método de captura de origen, entre otros factores. De manera que, el uso de un método mixto debe estar condicionado por la capacidad de control, seguimiento y procesamiento de cada INE. (CEPAL, 2021b) Dada las características de la región, algunos países latinoamericanos desde la ronda censal pasada han venido usando diferentes métodos de captura, lo cual constituye un reto en los casos que ha habido una transición hacia el uso de nuevas tecnologías, debido a que hay que integrar métodos y tecnologías diferentes y se debe anticipar de qué manera podría cambiar el proceso censal. En el Censo de la ronda 2010 países como Argentina (2010), Ecuador (2010), Bolivia (2012) utilizaron papel para el levantamiento de datos, y la lectura óptica para el procesamiento. 49 Asimismo, otros países como Colombia (2005), Brasil (2010), Uruguay (2011), Venezuela (2011), Paraguay (2012), y Chile (2017) utilizaron DMC para la recolección y captura de la información censal. Mientras para la ronda de 2020 los INEs han contemplado implementar el escaneo (Argentina- 2022, Bolivia -2022, Chile -2024, Ecuador -2022, Paraguay -2022 y Perú -2017) y el uso de DMC (Brasil -2022, Colombia -2018 Y Uruguay -2023) o la implantación de métodos mixtos al utilizar el auto empadronamiento por vía web como una estrategia adicional de captura de información. Es así que se observa que varios casos se mantendrían los sistemas de captura de información utilizados en sus últimos censos para el operativo censal de la ronda 2020, pero incluirían la introducción de métodos secundarios que complementan la captura de los datos. Entre los países sobresale Venezuela quienes en el 2011 implementaron el uso de DMC y para el 2021 utilizaron tecnología de cuarta generación como medio de captura principal al utilizar el Censo virtual. En la región algunos métodos de captura se han utilizado en forma adicional al método principal para recuperación de la información censal. Este es el caso de Chile que utilizó el papel como medio de recolección principal, pero contó con un cuestionario web de recuperación censal. En este caso los censistas que se encontraban con moradores ausentes dejaban una citación que señalaba la posibilidad de ir a un local censal o usar la plataforma web para completar los datos censales. Es importante señalar que aproximadamente un tercio de la recuperación de información censal proviene del sistema web. Este sistema de recuperación web considera además complejidades distintas al levantamiento en papel. Entre ellas se puede señalar: • El diseño de las preguntas debía modificarse de modo que hicieran referencia al momento del Censo y no al momento en que se estaba llenando el formulario (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). • Era necesario implementar controles de forma que los informantes tuvieran la posibilidad de completar los datos en distintos momentos, es decir, que pudieran ingresar más de una vez a la misma sesión (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). • Era importante guardar todos los datos que iba ingresando la persona durante el llenado del cuestionario, de forma de no perder la información si es que el usuario no completaba el cuestionario. (FLACSO-Chile, CELADE-CEPAL e INE-Chile,2018). 50 Independientemente al método de captura que se decida implantar, es necesario garantizar los apoyos institucionales que se requieran para utilizar cualquier tipo de innovación tecnológica, así como el tiempo y los recursos financieros necesarios para poder evaluarlo y la capacidad institucional del INE para garantizar la integración del método seleccionado teniendo en cuenta las implicaciones que este puede llevar en cada etapa del proceso censal. De esta forma, es importante identificar y fortalecer las habilidades y capacidades requeridas en los recursos humanos, generando la integración que se requiere de los equipos de tecnologías de información en cada una de las áreas del Censo, siendo esta integración fundamental para potenciar las ventajas que ofrece el uso de cada método y así asegurar el éxito del proceso censal. 2.5 El proceso de captura por escáner en Latinoamérica en la ronda 2010 En la ronda de 2010 varios países de América Latina implementaron como método principal de captura el uso de escáneres. Estos países son Argentina y Ecuador en 2010, Bolivia en 2012 y Chile en 2017, los cuales implementaron como método de captura principal. Por otra parte, Colombia en 2005 utilizó como método secundario de captura de los cuestionarios de papel tanto la digitación como el uso de escáneres. De esta forma, estos países establecieron diferentes actividades para llevar a cabo el procesamiento asociado a la captura de datos censales. Como se puede observar en la Tabla 5, con el fin de poder hacer un mejor análisis de este proceso, se unificó las diferentes actividades del proceso de captura de los distintos países en subprocesos o macro actividades, las cuales tienen como objetivo reconocer las coincidencias que cada uno de los países tienen. Los subprocesos identificados son los siguientes: 1. El repliegue del material 2. Preparación del material censal 3. Escaneo 4. Verificación y control de calidad y cobertura 5. Salida En el primer subproceso (repliegue del material) los países analizados tienen actividades similares las cuales reciben y organizan el material. En el segundo proceso (Preparación del 51 material censal) algunos países como Ecuador presentan prefieren dividir este subproceso en dos partes: la preparación y el guillotinado. El tercer subproceso (Escaneo) no presenta mayores diferencias entre los países. Por otro lado, el cuarto proceso (Verificación y control de calidad y cobertura) presenta diferencia en el orden de algunas las actividades. Finalmente, la salida es el final del proceso de captura, entregando las bases de datos con la información escaneada. 52 Tabla 5. El proceso de captura por escáner de Argentina, Chile, Ecuador y Colombia (Ronda 2010) Fuente: Elaboración propia con base en los lineamientos generales para la captura de datos censales Revisión de métodos con miras a la ronda de censos de 2020 y en el diseño del proceso de grabación, digitalización y procesamiento de imágenes del Censo General 2005 53 3. ANTECEDENTES Y CONTEXTO ACTUAL 3.1 Los censos de población y las rondas censales Los censos de población y vivienda figuran entre los ejercicios más amplios y complejos que una nación puede realizar en tiempos de paz, llevándose a cabo en prácticamente todos los países con fines administrativos, de planificación y obviamente estadísticos (Valente. Paolo, 13 de septiembre de 2019). Por definición, un Censo de Población y vivienda consiste en la enumeración total de la población de un determinado país, que ofrece datos sobre la cantidad de personas, su distribución espacial, su estructura por edad y sexo, sus condiciones de vida y otros rasgos socioeconómicos (UNFPA 2017), convirtiéndose en la piedra angular de las estadísticas oficiales nacionales. La importancia para describir y evaluar el progreso general y los cambios en el país, así como para proporcionar estadísticas más detalladas, impulsa a las Naciones Unidas a movilizar y persuadir a todos los países para que realicen cada 10 años censos de población y vivienda, y generar estadísticas detalladas de las áreas más pequeñas (Mrkić, Srdjan, 27 de marzo de 2020). Este operativo estadístico es una de las principales fuentes de datos necesarios para formular, implementar y monitorear políticas y programas orientados al desarrollo socioeconómico inclusivo y la sostenibilidad ambiental. (Programa Mundial de censos de Población y Vivienda, 2016) Por tanto, los censos son una herramienta imprescindible para asegurar la visibilidad estadística de los diferentes grupos poblacionales y a su vez para intentar dar respuestas a las demandas de información actuales, y para sobre todo para proveer evidencia confiable a los gobiernos en la planificación de políticas públicas en línea con la Agenda 2030 de Desarrollo Sostenible (Sabrina Juran -UNFPA AGENDA 2030, 2021). La necesidad de garantizar las nuevas demandas de información ha hecho que se evalúen e incorporen nuevas innovaciones metodológicas y tecnológicas con el fin de proporcionar una mejor calidad y oportunidad de los datos censales, sin perder de vista el cumplimiento de sus características principales: la enumeración individual, el territorio limitado, el tiempo determinado y la periodicidad definida. De esta forma los operativos de recolección de 54 información continuaron llamándose Censo de Población en la medida en que respetaran dos elementos clave. Primero, que la información pueda desagregarse geográficamente y por grupos demográficos para la generación de indicadores de áreas pequeñas. Y segundo, que la información censal pueda ser un insumo base para realizar marcos muestrales y proyecciones de población (Mejía Guerra, José Antonio, 2021). La introducción de la tecnología aporta beneficios en el proceso de planificación y en el operativo de campo, a su vez una gestión más eficiente de datos por medio de la transacción y corrección más próxima a la recopilación, junto con una mayor velocidad de procesamiento (Sabrina Juran -UNFPA AGENDA 2030, 2021). Asimismo, las tecnologías innovadoras han comenzado a modernizar las operaciones censales a través de sistemas automatizados de feedback y control de la calidad, en especial, en la fase de operaciones sobre el terreno y de recopilación de los datos. No obstante, estos sistemas modernos e innovadores requieren inversiones iniciales en nuevas capacidades técnicas que podrían estar lejos del alcance de las ONE’s (Oficinas Nacionales de Estadísticas) (UNFPA 2017). Por tanto, son variadas las experiencias de países con diferentes grados de desarrollo que introdujeron cambios e innovaciones metodológicas en sus censos de población con el objetivo de mejorar la cobertura y la calidad de la información (Sabrina Juran -UNFPA AGENDA 2030, 2021). Si bien estos avances son importantes para poder estimar cantidades de población, no sustituyen a los datos completos sobre los distintos rasgos poblacionales que se generan mediante un Censo tradicional (UNFPA 2017). En las últimas rondas censales se han venido incorporando diversas innovaciones tecnológicas, entre las cuáles resaltan dos componentes principales en los procesos de innovación: la introducción de tecnología y los sistemas de información georreferenciada informáticos de geografía (Sabrina Juran -UNFPA AGENDA 2030, 2021). Es así que las experiencias internacionales dan cuenta del valor de las alternativas de introducción de tecnologías para lograr mayor velocidad de procesamiento; asimismo, para una mayor exactitud en la demarcación y la segmentación de las áreas de enumeración, el uso de sistemas de información geográfica, y el uso de las imágenes satelitales de muy alta resolución para mejorar la cobertura y la localización de hogares (UNFPA, MERCOSUR, INDEC, mayo de 2021). 55 En el caso de América latina, históricamente los censos no han mostrado grandes cambios en la metodología, siendo protagonistas las discusiones sobre la modalidad de enumeración (Censos de hecho y Censos de derecho). (Mejía Guerra, José Antonio, 2021). Por otro lado, en la región la captura de datos ha evolucionado desde hace varias décadas pasando del tecleado manual de los datos, al uso de tecnologías de escaneo mediante captura de imágenes, para finalmente pasar sin soporte de papel a través de cuestionarios electrónicos, generando experiencias en el autoempadronamiento por medio de internet. De esta forma, el procesamiento de datos censales ha evolucionado para incluir avanzadas técnicas de análisis y software de visualización, plataformas de difusión electrónica y herramientas interactivas basadas en la web para la difusión y el análisis (UNFPA 2017). Desde la ronda de 2000 (censos realizados entre 1995 y 2004), se han producido mejoras graduales en la generación, la difusión y la utilización de los datos censales por parte de los gobiernos nacionales y locales, las organizaciones académicas y la sociedad civil en general. La rotación y la carencia de personal han tenido un impacto en los conocimientos especializados sobre los censos dentro de las instituciones nacionales de estadística, limitando quizás el uso de los datos y la explotación plena de los resultados (UNFPA 2017). Al analizar la ronda 2010 de censos de población y vivienda (censos realizados entre 2005 y 2014) se observa que esta ha registrado la cobertura mundial más amplia hasta la fecha. Aproximadamente, abarcó a un 93 % de la población mundial, en 214 de 235 territorios nacionales y zonas geográficas. Sólo 21 de los territorios nacionales y zonas geográficas, principalmente de África y los países árabes, no participaron (Figura 6). Esta cobertura ha supuesto una mejora fundamental respecto a los censos de la ronda 2000, en la que un total de 26 países, territorios o zonas no llevaron a cabo un Censo (UNFPA 2017). 56 Tabla 6. Ronda 2010: Censos realizados entre 2005 y 2014 por continente/región. Fuente: United Nations Statistics Division Programme in Support of the 2020 Round of Population and Housing Censuses (Srdjan Mrkić, 2019) La siguiente figura proporciona información sobre la distribución de censos realizados entre 2005 y 2014. Aplazamientos en el levantamiento del Censo tuvo como consecuencia que el pico en la enumeración del Censo cambió de 2010 a 2011.El único año con mayor número de censos fue 2011, cuando 60 países llevaron a cabo un Censo de Población. (Figura 3) Figura 3. Número de países que realizan un Censo en la ronda de 2010 Fuente: The 2010 round of population and housing censuses (2005–2014) (Juran, sabrina/ Pistiner, Arona L., 2017) 57 A partir de las lecciones aprendidas identificadas en las Conferencias de Evaluación de Necesidades organizadas por el Fondo de Población de las Naciones Unidas y la información de la UNSD, así como del informe de la Oficina del Censo de los EE. UU. sobre la ronda de censos de 2010, se definió que los principales desafíos que enfrentaron los países en la ronda de censos de 2010 fueron la falta o ausencia de recursos financieros, la inestabilidad social y política, la escasa experiencia técnica, problemas y tipos de errores asociados con la adopción de nuevas tecnologías de información, mayor preocupación por la privacidad y presión para una publicación más rápida de los resultados. (Juran, Sabrina/ Pistiner, Arona L., 2017). Asimismo, se estableció que el enorme costo del Censo era el desafío principal más alegado por los gobiernos (UNFPA 2017). Algunos países en desarrollo no pudieron participar en la ronda de censos de 2010, principalmente debido a problemas de financiación. Si no se puede asegurar el financiamiento para todo el Censo, no se puede garantizar la calidad y la oportunidad, y tanto el análisis como la difusión se verán comprometidos; y todo esto retrasa y reduce el valor del Censo para los usuarios. Las estrategias de movilización de recursos deben integrarse en una etapa temprana y planificarse adecuadamente (Juran, Sabrina/ Pistiner, Arona L., 2017). Por otra parte, a medida que los países se esfuerzan por cumplir los requisitos de una producción oportuna de datos censales, necesitan invertir en nuevas capacidades y tecnologías (UNFPA 2017). La introducción de tecnologías de información emergentes, incluidos los equipos, tiene un costo inicial inevitable, tanto desde el punto de vista financiero como logístico (Juran, Sabrina/ Pistiner, Arona L., 2017). Asimismo, esta ronda censal ha sido pionera en un amplio abanico de soluciones tecnológicas para la recopilación, análisis y difusión de los datos censales. Estas soluciones incluyen el uso de internet, portátiles, ordenadores de mano o tabletas, sistemas de información geográfica (GIS) y sistemas de escaneo y reconocimiento. Los países señalaron que los beneficios de las tecnologías automatizadas incluyeron mejoras en la calidad de la captura de datos, la difusión oportuna de los datos y la reducción en el costo de las operaciones de campo (Naciones Unidas, 2012). Una mayoría de países que utilizaron cuestionarios en papel en la ronda de 2010 están ahora planificando la incorporación de dispositivos digitales de mano, portátiles o internet en sus censos de la ronda 2020 (UNFPA 2017). 58 Según los resultados de la revisión del programa de 2010, el 64 % de todos los países hizo uso de Sistemas de información Geográfica (SIG) en apoyo a las actividades del Censo. Con respecto a las tecnologías de escaneo refinadas, 49 % de los países que respondieron al cuestionario utilizaron codificación asistida por computadora, 42% reconocimiento óptico de caracteres (OCR) y 33 % de reconocimiento óptico de marcas (OMR). Y solo el 38 % informó sobre otros métodos de escaneo (Juran, Sabrina/ Pistiner, Arona L., 2017). Según el informe realizado por Sabrina Juran y Arona Pistiner, sobre la ronda de 2010, los países aseguraron que los mayores obstáculos que enfrentaban con el uso de la tecnología eran los recursos/experiencia del personal, los recursos financieros y la reingeniería/infraestructura. Los obstáculos menores que se enfrentan con el uso de la nueva tecnología de la información son la difusión de datos y las preocupaciones sobre la privacidad y la confidencialidad de las partes interesadas (Juran, Sabrina/ Pistiner, Arona L., 2017). Esta información parece en sintonía con el informe realizado por Mrkić Srdjan, quien hace un análisis por continente de los obstáculos de los países con el uso de nuevas tecnologías durante la ronda del Censo de 2010 (Srdjan Mrkić, 2019). En el siguiente gráfico se observa que tanto en África como en norte y centro América, los recursos/experiencia del personal son el mayor obstáculo que enfrentan con el uso de la nueva tecnología de la información, mientras que la reingeniería/infraestructura son los menores. Por otra parte, Sudamérica presenta una tendencia diferente al resto de los continentes al ser el mayor obstáculo la reingeniería/infraestructura que los recursos/experiencia del personal y los recursos financieros. 59 Figura 4. Porcentaje de países según los mayores obstáculos que enfrentan en el uso de nuevas tecnologías durante la ronda del Censo 2010 Fuente: United Nations Statistics Division Programme in Support of the 2020 Round of Population and Housing Censuses (Srdjan Mrkić, 2019) Igualmente, según UNFPA se observó que los Institutos nacionales de estadísticas han experimentado una alta rotación y bajos niveles de retención del personal técnico cualificado durante las distintas etapas del Censo. Históricamente, esta deficiencia ha contribuido a una planificación operativa reducida, a conocidas demoras en la publicación de los resultados censales, y a una limitación de los análisis de calidad y consistencia de los datos. La limitación de las capacidades restringe los resultados potenciales de los Institutos Nacionales de Estadística, puesto que el foco se coloca solamente en la recopilación de los datos y su procesamiento para generar un informe censal primario. Con demasiada frecuencia, las limitaciones en las capacidades del personal también tienen como resultado la implementación de un Censo sin una estrategia específica y presupuestada para garantizar el procesamiento, análisis y diseminación completos. Estas limitaciones impiden la explotación plena de los datos censales y restringen el potencial para un uso integrado de los censos con encuestas de hogares, datos de registros civiles y estadísticas vitales por parte de analistas independientes, planificadores locales y activistas públicos, puesto que es posible que los datos no se hayan procesado adecuadamente para su publicación (UNFPA 2017). 60 3.2 Los censos de población en Latinoamérica Desde mediados del siglo XX la región ha venido acumulado diversas experiencias, lecciones aprendidas y conocimientos en la preparación de los censos de población y vivienda. A partir de la década de los 90s y durante la ronda de 2010 se presentaron progresos significativos en la inclusión de nuevas temáticas o preguntas censales, acorde a los cambios y dinámicas sociales de la época, así como la inclusión de tecnología para la captura de datos, el mejoramiento de los mecanismos de participación y de los procesos técnicos de gestión y control. Para la ronda de 2020, con la llegada de la pandemia de COVID-19 y la situaciones políticas y sociales que se han venido presentado, se han generado nuevos desafíos, lo cuales se centran en la interdependencia de los diferentes procesos censales, la inclusión de nuevas temáticas en los cuestionarios, la reducción del rechazo por parte de la población, el mejoramiento de los operativos censales y del control sobre la calidad del proceso, la oportunidad en la difusión de los resultados, entre otros. Estos desafíos están obligando a los institutos de estadísticas de los diferentes países de la región a investigar formas alternativas para implementar el Censo, dando cabida a nuevos desarrollos tecnológicos que ofrecen oportunidades para modernizar sus operaciones censales, en especial en la construcción de mapas, captura y validación de datos censales y difusión de resultados. Este nuevo contexto ha hecho que se resalte la importancia de la interrelación entre procesos censales, centrándose en que ninguno de estos procesos reviste un carácter autónomo en su desarrollo, sino que todos son interdependientes y forman parte de un sistema integrado, al que cada uno aporta con sus productos específicos. Los productos de unos procesos son insumos para otros procesos y todos, de manera directa o indirecta, aportan al logro del Censo de Población y Vivienda. El uso de la tecnología se ha convertido en una parte integral de muchos procesos censales críticos para mejorar los costos, la calidad (cobertura, precisión, oportunidad) y eficiencia del Censo, teniendo un alto impacto en todo el proceso censal la decisión de cambiar el método de captura para recolectar datos censales, mediante innovación tecnológica. Es por eso que esta decisión se debe tener en cuenta en la etapa precensal, a inicios de la planificación y organización del proyecto censal, al implicar una transformación en la manera como se lleva 61 a cabo el operativo del Censo y demás procesos censales, así como la gestión general del proyecto. Es así que la implementación de nuevas tecnologías para recolectar datos en los censos de población y vivienda, representan una gran oportunidad para mejorar, significativamente, la eficiencia de las operaciones y la calidad de los datos y productos. No obstante, su incorporación conlleva una serie de actividades, pruebas, riesgos y desafíos que, también, deben incluirse en la planificación y gestión del Censo, con implicaciones para las áreas operativas, metodológicas y tecnológicas involucradas en este proceso (CEPAL 2021b). De esta forma, se ha visto en los últimos años una tendencia a transitar hacia censos con metodología de derecho, con el uso de tecnología de tercera generación como los dispositivos móviles de captura (DMC), así como la implementación de métodos mixtos en modo secuencial o simultáneo, como el uso del autoempadronamiento por medio del Censo electrónico o virtual (eCenso), como complemento al método de captura principal, sea este en papel o con DMC. Por otra parte, los países que planean usar cuestionarios de papel avanzan también hacia el uso de escáner para la captura óptica de los datos censales. Así mismo, tanto el monitoreo, cómo el control de la recolección censal ha evolucionado hacia sistemas automatizados, integrados y dinámicos, algo que ha llevado a mejoras en la supervisión del avance en terreno, gestión de personal y monitoreo de indicadores demográficos y de desempeño. En este sentido, las innovaciones tecnológicas efectuadas en la cartografía geoespacial figuran hoy como herramientas imprescindibles para el monitoreo de la recolección censal (CEPAL 2021b). Los responsables de estos cambios tecnológicos son los institutos nacionales de estadísticas, encargados de decidir si los incorporan en el proyecto censal, teniendo en cuenta las condiciones técnicas, humanas, organizacionales, presupuestarias y legales, entre otras variables, para adoptar dicha tecnología e implementarla de forma sostenible durante y posteriormente al Censo, siendo el criterios de minimización de costos un factor muy importante para definir qué tecnología utilizar para la recopilación de datos con calidad y oportunidad. Los institutos nacionales suelen optar por la tecnología que, con un menor costo, garantice la recopilación de datos de calidad y oportunos (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). 62 3.3. Los censos de Argentina y el proceso de captura de datos La historia de la estadística en Argentina ha tenido un largo proceso de desarrollo y evolución, pasando diferentes etapas que van desde la recolección simple de datos poblacionales, hasta las diversas y rigurosas estadísticas que se aplican el día de hoy. Los gobernantes en los diferentes momentos de la historia se han visto en la necesidad de hacer recuentos para obtener datos sobre la población y su contexto con el fin de visualizar y conocer la situación de los territorios que gobiernan, evidenciando que las estadísticas de cada Estado son testimonio de las problemáticas sociales, como de los interese e inquietudes que se tengan en un determinado momento. De esta forma, la producción estadística se desarrolla de manera estrecha y de forma paralela con el proceso de consolidación del Estado nacional. Los cambios socioeconómicos y el desarrollo del país han estado siempre acompañados y sustentados en información proveniente de los censos de población. Los gobiernos de turno, en todas las divisiones político administrativas del país, aún en las más pequeñas, se han apoyado en la formulación de políticas, las cuales se basan en la información estadística, principalmente en los censos de población. Los censos, como práctica administrativa y herramienta de conocimiento y de representación de la población, son un objeto de estudio e investigación histórica (Estrada, 2016), observándose desde el punto de vista conceptual y metodológico, que han sido reflejo de cada momento histórico y social (Dirección General de Estadística y Censos, 2010). Hernán Otero en su libro Estadística y Nación manifiesta que los censos se presentan no solo como fuente en primer grado (irremplazable para estudiar la población en un momento determinado) sino también como fuente de segundo grado, es decir, en tanto producción intelectual que da testimonio de las concepciones intelectuales y políticas de sus autores o de una época en particular. (Otero, 2016). En Argentina el diseño del cuestionario censal se ha ido modificando a través del tiempo, debido a que en cada periodo se generaron distintos objetivos, intereses y nuevos fenómenos los cuales se han ido captando a través de esta operación estadística; esto se puede ver a través de evolución de la formulación de las preguntas y secciones que se han ido incluyendo en los diferentes cuestionarios censales a través de la historia de los censos. De este modo, los censos presentan una tendencia de largo plazo a la complejización de los cuestionarios 63 censales y, a través de ellos, del concepto de población (Dirección General de Estadística y Censos, 2010). Ciro F. S. Cardoso y Héctor Pérez Brignoli hacen un análisis de la historia demográfica en “Los Métodos de la Historia” en donde establecen los parámetros de cada una de sus etapas: el periodo pre estadístico (para el cual no existen datos estadísticos seguidos y confiables), el periodo proto estadístico (caracterizado por la posibilidad de recolectar o reconstituir materiales estadísticos organizables en series continuas más o menos largas, y el periodo plenamente estadístico (Cardoso, C; Pérez, 1976). La característica más importante para pasar de un estado pre o proto estadístico a otro estadístico no es, como comúnmente se cree, la veracidad o exactitud de los datos, sino más bien la manera de tomarlos, la organización de técnicas de elaboración primaria de ellos, y la forma de presentarlos (CELADE, 1983). En este capítulo se busca analizar el proceso de configuración de los censos de población en Argentina desde la colonia hasta la actualidad, señalando las principales características y algunas singularidades del procesamiento de la información. Por otro lado, en una segunda parte, se busca exponer algunas diferencias metodológicas entre los tres últimos censos, haciendo énfasis en el proceso de captura de la información. Asimismo, poner exponer algunas problemáticas se enfrentaron para realizar estas operaciones estadísticas. La historia de la información estadística en Argentina se puede dividir en tres grandes etapas. Gladys Massé en su artículo "Fuentes útiles para estudios de población argentina” indica que la primera se ubica en el momento de conquista y colonización del Río de la Plata, extendiéndose hasta el año 1868 (Massé, 1997). Por lo tanto, la información existente para este período era de distinta naturaleza y se encuentra disponible de manera muy fragmentada. Este periodo, según la clasificación de Cardoso, se denominaría etapa proto estadística (Cardoso 1976). La segunda etapa en la historia argentina comienza en el año 1869, con el Primer Censo de la República Argentina e iría hasta 1967 (Massé, 1997). Este Censo pudo llevarse a cabo con éxito sólo en. virtud de que en la República ya existía una suficiente experiencia estadística, y que desde al menos quince años atrás se venían reuniendo antecedentes variados y estimables, se disponía de oficinas, de personal experimentando, jefes capaces y con visión 64 de su cometido, así como de publicaciones regulares donde exponer los resultados (Maeder, 1968). Finalmente, el tercer y último período iniciaría en el año 1968, con la creación del Instituto Nacional de Estadística y Censos (INDEC), de manera conjunta con el Sistema Estadístico Nacional. Este período se extiende hasta la actualidad. (Tisnés, Velázquez, 2016) 3.3.1 El periodo proto estadístico en Argentina La etapa colonial, (1580-1809), está ligada a la conquista y colonización del territorio por parte de los españoles. Este período incluye el progresivo afianzamiento de la región a partir de la creación en 1776 del Virreinato del Río de la Plata, que erigió al área urbana de Buenos Aires como su ciudad capital (Massé, 2012). La información que existe durante la época de la conquista y de la colonia es escasa, pero se pueden identificar algunos hechos puntuales de registro, empadronamientos, censos y relevamiento estadísticos, previos a la realización de censos nacionales de Argentina. Los datos estadísticos de este primer periodo se refieren a la necesidad del gobierno español de conocer el estado de la población, así como la evolución del comercio exterior (Massé 1997). Es así que el antiguo Virreinato del Río de la Plata, tuvo numerosos recuentos de los habitantes de diversas ciudades, colonias y provincias, los cuales no permitían conocer la población total de su territorio (República de Argentina, 1898). Los relevamientos poblacionales que se llevaron a cabo en esta época buscaban hacer mediciones para poder controlar, reclutar y tributar (Otero, 2006). Ninguno de los recuentos, censos, parciales o totales, realizados en la colonia cumplió cabalmente premisas tales como: 1) que la operación censal se verifique simultáneamente en la totalidad del territorio abarcado y en un breve espacio de tiempo, 2) que en todos los lugares en que la encuesta se realice se pregunten los mismos datos y que también los métodos de recolección, de elaboración primaria y de presentación, sean iguales, y 3) que haya una sola institución encargada responsablemente de efectuar la operación, de modo que los propósitos del censo sean también singulares y no se vean interferidos por intereses distintos. Casi ninguno de los censos generales de la época colonial, ni tampoco los primeros de la era republicana, resultaron de un relevamiento censal realizado puerta por puerta, por 65 encuestadores, sino más bien de la simple compilación de los últimos datos disponibles en las parroquias del territorio abarcado. Por este motivo, su confección corrientemente duró largo tiempo (CELADE 1983). El otro problema era el subregistro ya que la subnumeración de los datos era doble, por una parte, motivado a partir del ocultamiento de población, y por la otra, de las grandes áreas geográficas no censadas (CELADE 1983). En este periodo tanto el Estado como la Iglesia dieron origen a la información demográfica. El estado con informes, crónicas y documentos, visita de tierras, empadronamientos de tributaries, recuentos, censos, etc. los cuales se realizaban con el fin de mantener un estricto control e inventario de los recursos materiales y humanos con que contaban (CELADE 1983), y la iglesia a través de los libros parroquiales, donde registraba bautismos, defunciones y matrimonios e informes sobre la población de las diócesis. De esta forma en la Argentina, la estadística tuvo su origen en los rudimentarios e incompletos registros eclesiásticos y en los diversos empadronamientos y censos que, en diferentes lugares y épocas, emprendieron las autoridades que 'en nombre del monarca español regían las colonias de América (Dirección Nacional de Estadísticas y Censo, sf). Así mismo, es importante tener en cuenta al analizar las fuentes de información que el territorio argentino es el resultado de un proceso largo y complejo, al ser una amalgama de jurisdicciones integradas inicialmente al virreinato del Perú (1567-1776) y más tarde al del Río de la Plata (1776-1810). En ese sentido, su historia debe tomar en cuenta lo que ocurrió en regiones que hoy están fuera de los límites de la Argentina actual, tales como la Banda Oriental (República Oriental del Uruguay), Rio Grande do Sul (Brasil), Paraguay y aún el alto Perú (Bolivia), ya que su relación con esos territorios - por cuestiones obviamente políticas fue muy estrecha durante ese largo período. Otra región, como Cuyo, poblada y administrada por Chile, se separó de aquella capitanía para integrarse al virreinato en 1776. A su vez, vastas comarcas como el Chaco, la Patagonia y aún la Pampa, permanecieron sin ocupación efectiva y en poder del indio, y suscitaron luego delicadas cuestiones de límites entre los países desgajados del imperio indiano (Maeder, 2018). Los primeros antecedentes estadísticos de nuestro territorio de los que se tiene registro son los recuentos de soldados y familias dispuestos por Juan de Garay al fundar la Ciudad de Santa Fe en 1573, el recuento que realizó Don Lorenzo Juárez de Figueroa en 1577 en la 66 Ciudad de Córdoba y en 1580 Don Juan de Garay cuando refundó la Ciudad de Buenos Aires. (INDEC, 2022c). En 1744 se realizó el primer empadronamiento de la provincia de Buenos Aires (República de Argentina, 1898) la cual comprendía en esa época parte de la actual provincia de Santa Fe. Así mismo, en las actas del Cabildo, tanto de 1751 como de 1756, 1759 y 1766, se conoce la existencia de padrones (aunque en algunos casos se han perdido en su totalidad y en otros de forma parcial) (Wainer, 2010). El Rey Carlos III ordenó la creación del Virreinato del Río de la Plata con Buenos Aires como su capital en 1776, para preservar íntegramente las posesiones conquistadas y colonizadas en el cono sur americano y, lograr expandir y recuperar los territorios perdidos en poder de los portugueses. De esa forma, modernizar y centralizar el poder político y mejorar las finanzas y los ingresos fiscales reales (Maeder, 2018). Así mismo, dictaminó realizar censos anuales en las colonias españolas (Wainer, 2010). Durante el gobierno del virrey Juan José de Vértiz y Salcedo (novohispano, gobernador y capitán general de Río de la Plata, Argentina) se llevó a cabo el primer empadronamiento o Censo de 1778 (Tabla 7). (Wainer, 2010). El total de población estimada para el territorio argentino era de 420.900 habitantes (INDEC 2022c) (Velásquez y Tisnés, 2016). Por otra parte, ha existido un desacuerdo sobre el total de la población en el Censo de 1778 de la ciudad de Buenos Aires, aunque las divergencias encontradas entre las distintas estimaciones no son muy significativas. De acuerdo con Alberto Martínez, la población censada en 1778 fue de 24.205 habitantes, mientras José Luis Moreno la calcula en 24.363. Por su parte, Besio Moreno estima 26.165 personas (Wainer, 2010). Para finales del siglo XVIII con Azara, en su obra "Viaje por América Meridional" en donde da numerosas cifras correspondientes a los últimos años del siglo XVIII, conocida como “el Censo de 1797”, el cual se llevó a cabo con el propósito de conocer el número de habitantes que poblaban parte del Virreinato del Río de la Plata (Dirección Nacional de Estadísticas y Censo, sf) (Tabla 7). Las cifras dadas por Azara comprenden parte de lo que es hoy la ciudad y provincia de Buenos Aires, las provincias de Santa Fe, Entre Ríos y Corrientes, la República Oriental del Uruguay y parte del Paraguay y Brasil. La población de la parte visitada por Azara que hoy integra la República Argentina, sumaba 127.430 habitantes así distribuidos, según la actual división política del país (Dirección Nacional de Estadísticas y Censo, sf) 67 Durante la primera década del siglo diecinueve se realizaron los empadronamientos de los años 1806 y 1807, siendo estos algunos ejemplos de los últimos recuentos realizados durante la época colonial. Por otra parte, se da inicio a la etapa política independiente, entre la revolución de mayo de 1810 y los inicios de la década de 1880, momento en que la provincia de Buenos Aires se convierte en una entidad autónoma de primer nivel político y administrativo y pasa a contar con una ciudad capital propia, La Plata (Massé 2012), siendo 1810 la fecha que marca o anuncia este cambio. En ese año se efectuaron dos relevamientos, ambos padrones tuvieron un objetivo militar: el primero en abril, bajo el mandato del virrey Cisneros, y el segundo en agosto, por orden de la Junta Provisional Gubernativa e inspirado por el Dr. Mariano Moreno. Del primer empadronamiento (abril), se han extraviado la mayor parte de los registros, pero del empadronamiento realizado por iniciativa de Moreno (Wainer, 2010), solo pudo verificarse en la ciudad de Buenos Aires (República de Argentina, 1898), y se conservaron catorce cuarteles sobre un total de veinte (Wainer, 2010). Arrojando una población para la ciudad de 28.258 personas (Wainer, 2010). En 1813 la asamblea constituyente decretó la formación de un Censo de todos los pueblos, pero este se implementó sólo en Buenos Aires y Santa fe. Los reglamentos provisorios de 1815 y 1817, así como las constituciones de 1819 y 1826, establecieron como un deber ineludible la necesidad de levantar el Censo general, para arreglar a él el número de diputados de que se compondría la cámara de representantes (República de Argentina, 1916). El artículo 12 de la constitución de 1826 ordenaba realizar el Censo general y llevarlo a cabo cada ocho años. Con esto se demuestra el interés que existía sobre la realización de un Censo general, pero inconvenientes de orden político, generó que se presentaran varios intervalos de tiempo sin poder realizar este tipo de empadronamientos a nivel nacional (República de Argentina, 1916); realizándose solo a nivel provincial o local como los recuentos en la ciudad y en la provincia de Buenos Aires en 1822 y 1936. (República de Argentina, 1898). En la constitución de 1853, se dispuso en el artículo 35, el cual indicaba que para la segunda legislatura deberá realizarse el Censo general, y arreglarse a él el número de diputados; pero este Censo sólo podrá renovarse cada diez años (Constitución 1853) (Figura 5). 68 Figura 5. Artículo 39. Constitución de la Confederación Argentina Fuente: Constitución de la Confederación Argentina. Así mismo, no habiéndose aún federalizado la ciudad de Buenos Aires, y estando dividido el país, el Congreso de Paraná, reunido en esa capital provisoria de la Confederación Argentina, dicta el 2 de diciembre de 1854 una ley mediante la cual recomienda al Poder Ejecutivo levantar un Censo (Novick, Susana, 2002). En cumplimiento de este precepto constitucional en 1857 el gobierno de la confederación (durante el mandato de Justo José Urquiza) ordenó que se proclamara la primera norma que legitima la necesidad de levantar un Censo para cumplir con el mandato constitucional en relación con la Cámara de Diputados (Novick, Susana, 2002) (Tabla 7). Es así que en 1858 se realizó el Censo de la Confederación, que se publicó en forma parcial a partir de 1865 (INDEC, 2022). Este Censo sólo logró enumerar población de ocho de las trece provincias confederadas (Santa fe, Entre Ríos, Corrientes, Córdoba, San Luis, Santiago, Mendoza y Tucumán (República de Argentina, 1872), cuyos resultados se publicaron de manera incompleta en resúmenes. El 14 de junio de 1867 un incendio hizo desaparecer todos sus testimonios, junto con un abundante material estadístico de otra índole allí reunido. La desaparición total de esa gran masa de información cerró así la posibilidad de estudiar más a fondo el material reunido por aquellas comisiones censales. De ese modo quedó solo la posibilidad de reproducir los cuadros de población conocidos, y establecer las conclusiones generales que de ellos se desprenden (Maeder, 1968). A pesar de que la disposición constitucional ordenaba levantar un Censo cada 10 años, fue solo hasta 1869 que se llevó a cabo en el primer Censo nacional argentino, iniciando una nueva etapa en la historia de estadísticas argentinas. 69 Tabla 7. Censos periodo proto estadístico de Argentina Fuente: Elaboración propia con base en INDEC, 2022b 3.3.2 El periodo Estadístico Argentina es, en el contexto latinoamericano, uno de los países que durante los siglos XIX, XX y XXI han llevado a cabo varios censos nacionales de población. En este período se realizaron 11 censos nacionales, el primero en 1869 y el último, que se está llevando a cabo en 2022. Todos los censos a excepción del Censo de 2022 se han realizado con la modalidad de enumeración de facto o hecho. Una mirada general sobre los censos realizados nos muestra que al analizar la periodicidad de su realización también se pueden distinguir las mismas etapas identificadas por Gladys Massé en el periodo estadístico en Argentina (Massé, 1997). Desde el primer Censo (1869), hasta la creación del INDEC en 1968 los censos no tenían ningún tipo de periodicidad (Tabla 8), pero a partir de la década del 60 y con la creación del INDEC en 1968, se empezó a implementar la recomendación hecha en naciones unidas y el precepto constitucional de realizarlo cada 10 años. De esta forma, y durante el resto del siglo XX se empezó a realizar los censos de población y vivienda de manera periódica (Tabla 9). A continuación, tenemos algunas descripciones de los censos nacionales realizados en Argentina: a. Los censos de 1869 hasta 1967 en Argentina (Previo a la creación del INDEC) En los últimos años del siglo XIX y primeros del siglo XX, Argentina tenía un modelo económico Agroexportador, el cual promovía un desarrollo capitalista basado en el capital y mano de obra extranjera, que asociados a las tierras argentinas producían alimentos para satisfacer la demanda de los países industrializados (Masse, 1997). Es así que los censos de 1895 y 1914 reflejan los intereses de esta época que mostraba un interés particular en las estadísticas de población, los recursos naturales y comercio exterior (Giusti, 2007). Los tres primeros censos de esta etapa se caracterizaron por contener un diseño conceptual en el cual se encontraban 70 solo preguntas abiertas, y por haber sido completadas por caracteres manuscritos (Masse 1997). Cabe destacar que los primeros censos nacionales no fueron anónimos, -como lo serían desde 1960 en adelante-, ya que consignaron las respuestas con nombre y apellido (Alvarado, 2022). La caída del comercio a partir de la crisis de 1929 frena la estrategia agroexportadora del país y hace que surja una nueva estrategia para hacer frente al mercado internacional a partir de la industrialización. A partir de este momento el Estado Nacional transforma su liberalismo en intervencionismo y busca garantizar la eficiencia social extendiendo los controles y normando minuciosamente la conducta de sus habitantes. Sin embargo, desde el punto de vista de la estadística demográfica oficial, es escasa o nula la participación del estado argentino en la implementación de censos de población durante la década de los veinte y los treinta (Masse 1997). El triunfo del Justicialismo marca un resurgir de las estadísticas argentinas a partir de la creación de la Dirección Nacional de investigaciones, estadísticas y censos y de la realización del Censo de 1947, el cual se destacó por ser uno de los mejores de la historia nacional, o como afirma Massé, de mayor calidad que los dos siguientes, tanto el de 1960 como el de 1970. (Masse 1997). ● Primer Censo de la República de Argentina- 1869 Después de medio siglo de vida independiente, se realizó el primer Censo Nacional de la República Argentina entre el 15 y el 17 de septiembre del año 1869, bajo la presidencia de Domingo Faustino Sarmiento, siendo dirigido por Diego de la Fuente (Cámara argentina de comercio y servicios, 2019) (Tabla 8). Este Censo se adecuó a los criterios que definen a los censos modernos: la existencia de un organismo único encargado de su desarrollo, la uniformidad y universalidad de las preguntas para todos los censados, la simultaneidad del levantamiento y la ausencia de consideraciones extra estadísticas de tipo religioso, fiscal o militar. Tres meses después de su levantamiento, se aprobaron los resultados (Ley n° 565) y se determinó la población de la Argentina: 1.877.490. (INDEC, 2022c). Este Censo alcanzó al total de la población de las 14 provincias del entonces denominado Estado nacional (INDEC, 2022b), pero no incluyó al ejército que operaba en el Paraguay, entonces en guerra con la Argentina, Brasil y Uruguay, ni a la población indígena no asimilada a la vida 71 civilizada (Dirección Nacional de Estadísticas y Censo, sf). Hacia 1869 una enorme porción del territorio se hallaba fuera del control del Estado nacional que mantenía una frontera móvil y conflictiva con las tribus de indios no sometidos. A pesar de que el relevamiento censal de estas poblaciones en guerra con la sociedad blanca escapaba en buena medida a las posibilidades reales del Estado, los indios fueron evaluados por censistas. Este Censo se limitó a la evaluación del número total de indios con el fin político explícito de estimar la población militarmente activa. El valor estratégico de la información demográfica de los pueblos indígenas se vio reforzada por el hecho práctico de que la misma fuera levantada, a diferencia de la del resto de la población por los comandantes y jefes militares de la frontera (Otero, 1998). Para el relevamiento de los datos se utilizó el método de entrevista directa, con la aplicación de un mismo cuestionario que no era individual para cada censado sino una planilla con 8 preguntas, de esta forma los censistas contaron con una ficha en la que anotaron los nombres y apellidos de cada una de las personas censadas y sus características sociodemográficas como ser: sexo, edad, estado civil, nacionalidad, provincia de nacimiento, profesión, oficio, ocupación o medio de vida, alfabetismo, y condiciones especiales de la población (INDEC, 2022b). A medida que llegaban los datos provinciales, se iban arreglando por secciones, enviándolos a un encuadernador para formar volúmenes que facilitarán su manejo. Posteriormente se realizaba un índice fijando en globo la población que contenía, distribuida por empadronadores. Después pasaban a rectificadores que salvaban los errores y faltas más notables cometidas por los empadronadores. Posteriormente pasaban a la liquidación de los ciudadanos que participaron en el Censo, pasando luego los volúmenes a manos de los compiladores y rectificadores que controlaban, contrastaban y examinaban todos los datos haciendo notar o corrigiendo los errores en que pudieran haberse incurrido (República de Argentina, 1872). Finalmente, los datos definitivos fueron publicados en el año 1872 (INDEC, 2022c). 72 ● Segundo Censo de la República de Argentina -1895 El 10 de mayo de 1895 (Ley n° 3.073) se realizó el último Censo de Población del siglo XIX, bajo la presidencia de José Evaristo Uriburu, el cual también es conocido como el segundo Censo de la República de Argentina (Tabla 8). En este nuevo relevamiento, que tuvo un día de duración, la cobertura fue mayor que en el Censo anterior, ya que se concretó luego de la unificación territorial del país, incorporándose zonas que no habían sido censadas en 1869 (INDEC, 2022c). Desde el punto de vista técnico las operaciones estadísticas de 1869 y 1895 constituyen censos solamente para el caso de población de los territorios controlados por el Estado (principal pero no exclusivamente población blanca) y sólo estimaciones en lo que se refiere a la estimación en territorios no controlados (principalmente pero no exclusivamente indígena) (Otero, 1998). El cuestionario censal contó con 16 preguntas (INDEC, 2022b), y se incorporaron preguntas sobre religión, fecundidad, propiedad de los inmuebles y nacionalidad (Cámara argentina de comercio y servicios, 2019). En forma simultánea, también se realizó un recuento agropecuario e industrial, pero, al igual que en el Censo anterior, no se realizó un recuento de viviendas (INDEC, 2022b). El Censo Industrial formó parte del operativo, y es considerado el primer Censo económico de cobertura nacional. Fue la primera vez que se llevó a cabo un inventario general de esa clase (INDEC, 2022c). Por aquel entonces también se había masificado la inmigración europea: uno de cada cuatro habitantes era extranjero, mayoritariamente de origen italiano y español, y se registraron más varones extranjeros que nativos de entre 30 y 59 años (INDEC, 2022b). La compilación del Censo se realizó con un equipo de 100 personas después de haberse llevado a cabo el empadronamiento en todo el territorio nacional. De esta forma, comenzaron a llegar a la oficina central establecida en la ciudad de Buenos Aires, los documentos relativos a diversas provincias y territorios para proceder a su compilación (República de Argentina, 1898). Los documentos llegaron entre junio y diciembre de 1895 y solo hubo una provincia que pudo enviar los resultados recién en mayo de 1896. La compilación terminó el 31 de diciembre de 1897, es decir después de dos años y siete meses de comenzada. (República de Argentina, 1916). La impresión de los resultados de 73 este segundo Censo, terminó el 8 de febrero de 1899, es decir, casi a los cuatro años de realizado el Censo (República de Argentina, 1916). En mayo de 1895 se organizó la oficina central de compilación con 100 funcionarios (que fueron disminuyendo paulatinamente con el pasar de los meses) bajo la dirección de la comisión directiva. Este personal compiló la información censal a través de un sistema llamado fichas, según el cual los datos relativos a cada individuo se anotan en una tarjeta azul o blanca para los argentinos y roja o amarilla para los extranjeros, empleando un color para cada sexo, obteniendo después el resumen por su simple recuento, cuyo resultado se anota en formularios impresos, especialmente preparados para cada investigación (República de Argentina, 1898). La población censada en todo el país alcanzó a 3.954.911 personas, sin incluir la población que se omitió, cuyo número se estimó entonces en 60.000 personas, y a los indígenas no incorporados de Tierra del Fuego, la zona cordillerana de los territorios patagónicos y la región central de Chaco y Formosa, que se estimaron en 30.000 (INDEC, 2022c). Después de 1895 y hasta 1914 se levantaron censos de población en varias jurisdicciones, entre los que se menciona particularmente los de 1905 y 1912 para la población de los territorios nacionales y los de 1904 y 1909 para la de la ciudad de Buenos Aires (Dirección Nacional de Estadísticas y Censo, sf). ● Tercer Censo Nacional 1914 Habían pasado 19 años desde el último censo cuando se dio la orden de levantar un nuevo Censo Nacional de Población (Ley n° 9.108 de 1913), el primero del siglo XX (Tabla 8). Se estableció que el levantamiento de la información debía realizarse durante un día el 1 de junio de 1914. En el tercer Censo de Población se dejó de lado la lista nominativa (planillas) por la utilización de fichas individuales para la realización del cuestionario (Cámara argentina de comercio y servicios, 2019), con 16 preguntas. Se incluyeron preguntas sobre la situación educativa para conocer si los niños y niñas entre 6 y 14 años iban a la escuela o si recibían instrucción en sus casas y la cantidad de grados cursados en la primaria. También se incluyó una pregunta que indagaba si las personas nacidas en otro país se habían naturalizado como argentinos (INDEC, 2022b). En 1914 una parte de la población india es censada y el resto fue estimada (Otero, 1998). En comparación con 74 los dos primeros censos nacionales, se redujo el radio de acción de cada empadronador (lo que hoy día se denomina segmento censal), esto tanto la innovación de las nuevas cédulas censales, permitió que mejorara la recolección y el procesamiento de los datos (INDEC, 2022b). Dentro de las dificultades que se presentaron en este Censo se resalta las que procedían de la falta de buenos planos de las provincias, por departamentos, con la especificación de sus divisiones administrativas y con detalles topográficos completos, que pudieran ser auxiliares eficaces e ilustrativos de las omisiones y de los empadronadores para hacerles conocer con exactitud del terreno en que debían actuar. También tuvo problemas climáticos con los que hubo que lidiar; tanto lluvias persistentes como inundaciones, que obviamente dificultaron el movimiento en algunos partidos o departamentos, y generaron muchas contrariedades para formar al personal competente para el trabajo que necesitaba (República de Argentina, 1916). La compilación del Censo comenzó el 8 de junio de 1914 y terminó el 10 de enero de 1916, es decir que la ejecución de este trabajo llevó 19 meses. La composición tipográfica de este Censo, comenzó el día 7 de agosto de 1915, y 14 meses después, se dieron a luz los cuatro primeros tomos de la obra (República de Argentina, 1916). Según el documento de resultados del Censo de 1914 se organizó el trabajo del archivo de la siguiente forma: 1. Se agruparon los armarios por Censo y por provincias, y se clasificaron los de cada provincia, por departamento o partido, lo que permitió registrar en los libros de existencia en qué armario y estante se encontraba archivado el material censal (República de Argentina, 1916). 2. Como operación previa se procedió a archivar en el lugar designado para cada departamento o partido, de cada uno de los censos separadamente, el material recibido, previa verificación de todo los cuarteles, pedanías, distritos, secciones o partidos (República de Argentina, 1916). 3. Se procedió a la comprobación del número de fichas y de libretos recibidos, correspondientes a cada Censo, y se verificó en el de población, si todos los 75 empadronadores habían cumplido con su deber; qué número de individuos de la población rural habían censado, a los efectos, esto último, de la liquidación de sus honorarios (República de Argentina, 1916). 4. En los libros de los archivos, que se denominaban ''Libros de existencia", en lo, que se anotó el material por Censo, clasificado por provincias, departamentos o partidos, con especificación de distritos, cuarteles, pedanías, secciones y partidos, se registró el número de fichas y de libretos, lo que permitió que se tuviera una base, es decir, un Censo previo, que sirvió de comprobación para los trabajos resultantes de la compilación y, al mismo tiempo, un estado del material recibido (República de Argentina, 1916). Además del trabajo de compilación y de manera independiente de éste, la comisión organizó otro, consistente en la depuración o examen del material censal que debía ser entregado a las mesas compiladoras. Las fichas del Censo de Población fueron sometidas a un control exhaustivo y riguroso; y así, cuando aparecía un empadronado que declaraba tener 80 o más año de edad o una mujer casada o viuda que manifestaba haber tenido un número considerable de hijos, se procedía a una investigación para constatar si eran exacto o no los hechos declarados, por medio de empleados del Censo en la capital de la República y por medio de las autoridades, departamentales o policiales en el resto del país (República de Argentina, 1916). La falta de una imprenta nacional, a la que pudiera encargar las numerosas impresiones que necesitaba (reproducción de las cédulas censales), sin someterse a los engorrosos trámites de las licitaciones impuestas por la ley, y al deseo de lucro, que a veces degenera en abuso, de la industria privada, fue también, por fin, otra causa no pequeña, de demoras y de dificultades (República de Argentina, 1916). Este Censo arrojó una población de 7.905.502 habitantes, sin contar la población indígena - estimada en 18.425 -, las personas no censadas por vivir en zonas alejadas - la mayor parte de Formosa, con una suma estimada de 20.000 - y las omisiones - calculadas en 118.582. 76 ● Cuarto Censo General de la Nación -1947 El Cuarto Censo General de 1947 (Decretos - Leyes n° 10.784/43 y 24.833/44) se llevó a cabo bajo la presidencia de Juan Domingo Perón y relevó información demográfica, agropecuaria y económica (Tabla 8). Su diseño implicó una ruptura con los tres censos anteriores, ya que se volvió a introducir el concepto de familia. De esta forma, incluyó nuevas unidades de observación a partir de cuatro tipos de cuestionarios censales: individuales, de familia, de vivienda y de convivencia (INDEC, 2022b). Las cédulas individuales eran de carácter personal y se estructuraron con 30 preguntas. El Censo estuvo programado para realizarse los días 19, 20 y 21 de abril en las zonas situadas al sur del paralelo 42°, y los días 10, 11 y 12 de mayo para las zonas situadas al norte. Sin embargo, finalmente el relevamiento se realizó en solo dos días: el 19 de abril y el 10 de mayo de 1947, gracias a la participación de 300.000 censistas (Cámara argentina de comercio y servicios, 2019). Con el Censo de 1947 se utilizó la computadora por primera vez, inaugurándose el uso de medios mecánicos para el procesamiento de los datos censales, en vez de los métodos manuales que se venían utilizando antaño. Se emplearon 20 máquinas perfoverificadoras de tarjetas y 6 clasificadoras, con una dotación de cerca de 180 personas (INDEC, 2022b). Según las memorias del Censo de 1947 las tareas de compilación de los datos obtenidos con el levantamiento del Censo comprendieron las siguientes etapas: 1) Recepción del material y preparación de los resúmenes generales provisionales: Los censistas debían entregar el material, una vez terminado su cometido, a sus respectivos jefes. Estos últimos debían controlar que los censistas cumplieran todo el recorrido asignado y, realizar una primera revisión del trabajo, para detectar omisiones de información y algunos errores en la forma de contestar las preguntas. Posteriormente, el material era remitido a la dirección General del Censo en la Capital Federal, por las delegaciones del interior y las 166 concentraciones del Gran Buenos Aires. Al mismo tiempo se comunicaban telegráfica y telefónicamente los resultados parciales, lo cual permitió, en breve plazo, anunciar los resultados provisionales totales y por provincias y territorios. Una vez reunida la documentación se formaban legajos (de 25 cédulas cada 77 uno) y se procedía a su numeración. Los resúmenes generales provisionales, se basaron en los resúmenes de radios tanto urbanos o rurales. De esa manera se pudo dar un resultado provisional al poco tiempo de levantado el Censo. Este resultado contenía los totales de la población por jurisdicciones y departamentos; su crecimiento a partir de 1869, y al momento de cada uno de los cuatro censos, el sexo, masculinidad y zona de residencia, y el número y población de los centros urbanos. Los resultados provisionales tuvieron poca diferencia con los definitivos (Dirección Nacional de Estadísticas y Censo, sf). 2) Revisión y codificación de la información contenida en las cédulas: La revisión de los legajos de las cédulas del Censo de Población requirió la capacitación de 45 días de los empleados destinados a tal tarea. Con tal fin se capacitó a 200 personas en la técnica de la revisión y codificación de toda la información contenida en las cédulas, destinando 80 personas a la primera de dichas tareas y 120 a la segunda. Luego de ser revisadas, las cédulas pasaron a la oficina de codificación, en la que los empleados volcaban en planillas especiales la información de las cédulas debidamente codificadas. (Dirección Nacional de Estadísticas y Censo, sf). Los errores más comunes fueron los siguientes: ● Lugar del nacimiento: poner, para los argentinos, el país (Argentina) en lugar de la provincia o territorio, como se pedía, y para los extranjeros. poner la provincia. ciudad o pueblo del nacimiento en lugar del país (Dirección Nacional de Estadísticas y Censo, sf). ● Ocupación: el confundir la categoría de empleado por la de obrero y la de indicar en lugar de la rama de la actividad el nombre de la empresa o casa donde trabajaba el censado (Dirección Nacional de Estadísticas y Censo, sf). ● Parentesco: no respetar la formación de las familias poniendo. muchas veces como hijo a aquellas personas que por ser casada formaban familia aparte de la de sus padres (Dirección Nacional de Estadísticas y Censo, sf). ● Instrucción (educación): contestar al mismo tiempo la pregunta referente a los estudios que el censado cursaba en el momento del Censo con la referente a los que ya había terminado, como, por ejemplo, poner en la primera columna, para los que han terminado, "sexto grado primario". También poner en los estudios o 78 aprendizajes de carácter práctico, tales como electricidad, carpintería, taquigrafía, dactilografía, electrotécnica, química, traductor, etc., dicha especialidad sin especificar si ella era de carácter primario (escuelas de artes y oficios) o secundario (escuelas industriales) o aun universitario, o si se trataba de simples cursos en instituciones particulares sin control oficial, o por correspondencia (Dirección Nacional de Estadísticas y Censo, sf). Los encargados -de la revisión obviaron en gran parte estos inconvenientes valiéndose de las informaciones de carácter complementario que obtenían en la misma cédula, por comparación, por ejemplo, la edad del censado y la instrucción que estuviera recibiendo, o el tipo de ocupación o estudio y la ocupación o estudios acusados por los restantes miembros de la familia (Dirección Nacional de Estadísticas y Censo, sf). Otro factor que dificultó la revisión fue que algunos censistas consideraron como personas ausentes del lugar, a aquellas que en el momento del Censo se encontraban transitoriamente fuera del hogar o domicilio, por hallarse en reuniones propias de los días no laborables, en paseos, visitas, etc., y, a la inversa, como presentes esas mismas personas en los domicilios en que se encontraban transitoriamente (por ejemplo, de visita). También entran en esta categoría los miles de personas que se incluyeron en las provincias de Corrientes y Santiago del Estero como ausentes del domicilio en el momento del Censo y que por razones de trabajo tenían fijado otro domicilio, principalmente en las jurisdicciones limítrofes de Tucumán, Córdoba y Chaco y en la Capital Federal (Dirección Nacional de Estadísticas y Censo, sf). 3) Proceso mecánico: Las tareas mecánicas se realizaron con un equipo de 20 máquinas perfoverificadoras y de 6 clasificadoras. El equipo de perforadores estuvo compuesto por 80 personas, seleccionadas rigurosamente entre 150 aspirantes. El trabajo se realizó en cuatro turnos de cuatro horas de duración. Las perfoverificaciones de tarjetas se hizo en 20 meses. El personal trabajaba en turnos de 4 horas, con lo que se evitó la fatiga que normalmente, se produce después de 79 dicho lapso. Todo el trabajo se efectuó por clasificación directa, a cuyo efecto las clasificadoras estaban provistas de los correspondientes contadores, y sólo se tabuló la parte correspondiente a los oficios, pues al comprender esta información un campo de cuatro columnas resultaba un proceso demasiado lento el despojo hecho por clasificación directa (Dirección Nacional de Estadísticas y Censo, sf). 4) Preparación de los cuadros finales (Dirección Nacional de Estadísticas y Censo, sf). La población censada alcanzó a 15.893.827 habitantes, mientras que se estimó que quedaron afuera del relevamiento unas 161.938 personas (INDEC, 2022c). ● Quinto Censo Nacional de vivienda- 1960 El Censo de Población, vivienda y agropecuario de 1960 fue realizado durante la presidencia de Arturo Frondizi (Tabla 8). Este Censo se llevó a cabo el 30 de septiembre de 1960 en la zona norte del país y “en las provincias de Rio Negro, Neuquén, Chubut, Santa Cruz y territorio nacional de tierra del fuego el Censo se llevó a cabo el 4 de noviembre de 1960”. (Dirección Nacional de Estadísticas y Censo, 1965), la Antártida y las islas del atlántico sur. El día del Censo se estableció como feriado con el propósito de reducir todo tipo de traslado o movimiento de los habitantes para facilitar que los censistas localizaran y entrevistaran a toda la población en una primera y única visita (Velázquez, G.A. y Celemín, J. P., 2020). Este Censo no ofrece ni contiene el mismo nivel de desagregación ni la misma cantidad de variables que sus predecesores (Velázquez, G.A. y Celemín, J. P., 2020). La cédula censal incluyó 31 preguntas sobre población, entre las que se encuentran el estado civil, el lugar de nacimiento, alfabetización, asistencia escolar, motivos de deserción en la escuela primaria, ocupación, religión, e impedimento físico de carácter permanente. La pregunta sobre hijos nacidos vivos se realizaba a las mujeres casadas, viudas, separadas o divorciadas. En materia de familia, se destacó por incorporar las “uniones de hecho”, ya que anteriormente solo se consideraba al “estado civil” (Cámara argentina de comercio y servicios, 2019). Cabe destacar, que fue el primer relevamiento que indagó sobre el lugar 80 de residencia habitual en un determinado período anterior a la fecha del Censo (INDEC, 2022b). Este Censo utiliza como medio para el procesamiento los equipos convencionales de la época, que ingresan la información a través de tarjetas perforadas (Giusti, 2007). De esta forma, tanto la revisión y codificación, así como la perforación y verificación se iniciaron en el primer semestre de 1961 y culminaron a inicios de 1964. De esta forma los tabulados y confección y análisis de los cuadros estuvieron listos en el primer semestre de 1965. 81 Tabla 8. Censos de población periodo estadístico en Argentina. Censos de 1869 hasta 1967 en Argentina. (Previo a la creación del INDEC) Fuente: Metodologías censales de 1869, 1895, 1914, 1947, 1960 82 b. Los censos modernos en Argentina de 1968 hasta la actualidad Los censos de este período desde 1970 hasta 2001 se llevaron a cabo en medio de crisis sociales y económicas o de procesos no democráticos, los cuales influyeron tanto en los resultados, difusión de este y su uso de resultados (Giusti, 2007). El Censo de 1979 y 1980 se hizo bajo los regímenes militares de Levinstong y Videla. El Censo de 1991 con Menem ya con la democracia recuperada, pero con un periodo de hiperinflación. Y el Censo de 2001 durante el gobierno de De la Rúa en medio de la crisis económica, política y social (Giusti, 2007). Así mismo, estos censos se realizaron con el país integrado geográficamente (provincia y departamento) y con una estructura censal (Fracción, radio y segmento), y se caracterizan por tener una modalidad de enumeración de facto o hecho (a excepción del 2022), así como por generar de un decreto o ley que estipulaba que el día del Censo fuera feriado, también por implementar como método principal de enumeración la entrevista directa, y finalmente, con respecto a la cobertura temática, incorporar prácticamente las mismas variables en el campo de población y vivienda, siguiendo las recomendaciones internacionales. (Giusti, 2007) ● Sexto Censo Nacional de Población, Familias y Viviendas- 1970 El sexto Censo nacional de Población, Familias y Viviendas fue realizado durante el gobierno de facto del Gral. Roberto Marcelo Levingston y fue también el primero organizado por el INDEC (creado el 25 de enero de 1968, mediante la ley n° 17.622), dando inicio al cumplimiento de la periodicidad recomendada por Naciones Unidas. (Cámara argentina de comercio y servicios, 2019) (Tabla 9). La cédula censal tenía 22 preguntas de población y 12 de vivienda. (INDEC, 1973) Este relevamiento fue exclusivamente de población y vivienda, y no incluyó los conteos específicos en las áreas agropecuaria y económica. (INDEC, 2022b) La novedad de este Censo fue la introducción de computadoras y lectoras de caracteres manuscritos para el procesamiento de los datos. (Cámara argentina de comercio y servicios, 2019). De esta forma se utilizó por primera vez lectura óptica para procesar los resultados del Censo, en reemplazo del procedimiento mecánico que se usó hasta el anterior, pero el procedimiento reportó fallas que impidieron su procesamiento integral. (INDEC, 2022b). Los datos disponibles surgieron del procesamiento, mediante 83 computadoras, de muestras de los cuestionarios recogidos (INDEC, 2022c). Las cédulas censales fueron provistas por una empresa y las máquinas lectoras por otra compañía, que resultaron incompatibles. (Cámara argentina de comercio y servicios, 2019). Las lectoras ópticas que se incorporaron para el procesamiento del Censo no funcionaron y fueron un buen y masivo banco de pruebas para las compañías internacionales. La tecnología de captura no pudo interpretar la letra de los maestros argentinos. (Giusti 2007). Los resultados definitivos se completaron después de 1977 (INDEC, 2022c) y terminaron estimándose a partir de una proyección. (Cámara argentina de comercio y servicios, 2019). La población censada alcanzó los 23.364.431 habitantes. (INDEC, 2022c) ● Séptimo Censo Nacional de población y Viviendas- 1980 El 22 de octubre de 1980, durante el gobierno de facto de Jorge Rafael Videla, se realizó el séptimo Censo Nacional de Población y Vivienda (Tabla 9). Durante este relevamiento se implementó, por primera vez, la técnica por muestreo como complemento del registro censal. Para ello se utilizaron dos cuestionarios: uno “básico” para toda la población y uno “ampliado” para la muestra. (Cámara argentina de comercio y servicios, 2019). Se resolvió aplicar el muestreo en las áreas más pobladas: la Capital Federal; las provincias de Buenos Aires, Córdoba, Entre Ríos y Santa Fe; y las ciudades de otras provincias con poblaciones estimadas en más de 100.000 habitantes A través del relevamiento, se conoció que la Argentina tenía 27.949.480 habitantes (INDEC, 2022c). La adopción de equipos de ingreso de datos que registraban directamente la información marcada en el cuestionario por el censista significó un cambio metodológico de gran importancia que permitió la publicación de cifras definitivas a pocos meses de la fecha del relevamiento (INDEC, 2022b). El ingreso de la información censal a la computadora se realizó mediante lectoras ópticas de marcas que grababan en cintas de las cuales se obtuvieron posteriormente las tabulaciones. Fueron utilizados cinco equipos de lectura, leyéndose un promedio cercano a las 300.000 hojas por día (INDEC, 1983). Con respecto a la evaluación del contenido de la información, para poder destacar y evaluar posibles errores en la información relevada se realizaron tanto pruebas de consistencia interna como una comparación de los datos censales con información procedente de otras fuentes. Para probar la consistencia se hizo cruces de respuestas relacionadas entre sí, y se comparó los resultados obtenidos en una jurisdicción dada por 84 parte de personas censadas respectivamente con cuestionario A y con cuestionario B. Recurriendo a otras fuentes se ha verificado, por ejemplo, la coherencia entre las estadísticas del Ministerio de Educación Y los datos relevados por el Censo sobre población que asiste a establecimientos de enseñanza; y la concordancia de las cifras dadas por los registros civiles con el número de nacidos vivos en el último año, declarados por las madres (INDEC, 1983). El ingreso de la información se efectuó mediante lecturas ópticas que registraron directamente las marcas registradas por los censistas en los cuestionarios (Massé 1997). Antes de tabularse los cuadros programados, la información contenida en las cintas fue depurada, utilizándose programas especiales de análisis de consistencia y reparo de información. Estos programas, cuya utilización es recomendada por los organismos internacionales, asignan la información faltante o anotada erróneamente por el censista, mediante criterios estadísticos que aseguran la coherencia de la información ingresada al computador (INDEC, 1983). Puede mencionarse los siguientes ejemplos: o El lugar de nacimiento: Este dato se preguntó de dos maneras en los cuestionarios. Una sintética (pregunta 4) con cuatro alternativas precodificadas de respuestas: en esta provincia, en otra provincia, en país limítrofe y en otro país; y otra abierta y más detallada: ¿cuál es la localidad y provincia o país extranjero donde nació? Se comprobó que las respuestas a la pregunta 5 son más confiables que las registradas bajo la pregunta 4. Por ello se decidió dar preferencia a aquélla para el procesamiento de los datos, corrigiendo la pregunta 4 cuando no coincidía con la 5 (INDEC, 1983). o En otros casos se ha comparado las respuestas a preguntas muy relacionadas entre sí para comprobar su coherencia como la fuerte relación que hay entre la pregunta 11 (ocupación, oficio o clase de trabajo) y la 13b (a qué se dedica el establecimiento o lugar en que trabaja), se realizó un análisis de las combinaciones de respuestas a ambas preguntas. Se pudo determinar que la pregunta 11 presentaba respuestas más aceptables, pero sólo se corrigió la otra en los casos de evidente inconsistencia. Igualmente, la comparación entre alfabetismo con nivel de instrucción; grupo de ocupación con nivel de instrucción; grupo de ocupación con categoría ocupacional y edad con cantidad de hijos tenidos (INDEC, 1983). 85 Para errores u omisiones no reparables por el computador, se recurrió a otros medios. Así, se remarcó manualmente ciertos cuestionarios con marcas ópticas débiles que no eran leídas adecuadamente por los equipos de ingreso de datos (INDEC, 1983) ● Octavo Censo Nacional de población y Viviendas -1991 El Censo Nacional de Población y Viviendas del año 1991 se realizó bajo la presidencia de Carlos Menem y se llevó a cabo un año después de lo pautado, ya que la crisis económica que experimentaba el país obligó a postergar la fecha de realización (Tabla 9). (Cámara argentina de comercio y servicios, 2019). El Censo Nacional de Población y Vivienda de la Argentina de 1991 debió realizarse en agosto de 1990 pero, ante la emergencia económica y financiera del momento, fue prorrogado por decreto presidencial hasta un año más tarde. Se mantuvo la experiencia de 1980 relacionada al uso de la técnica de muestreo en las localidades de más de 100.000 habitantes, con la aplicación de un Cuestionario Básico y otro ampliado (INDEC, 2022b). La indagación sobre cobertura de salud y la situación previsional de la población, fueron dos de las modificaciones más importantes incorporadas en este Censo. La población total censada sumó 32.615.528 personas (INDEC, 2022c). El procesamiento de datos comprendió varias actividades como “ingreso de datos, control y corrección, obtención de resultados básicos, codificación, ponderación de la muestra y obtención de resultados. El ingreso de datos se realizaba por medio de lectoras ópticas sensibles a las marcas hechas con lápiz. En un primer paso se leyeron los datos precodificados contenidos en las cédulas censales A y B y se obtuvo un archivo del que se seleccionaron todas las variables comunes de ambas cédulas. Luego se realizaron controles de calidad de las respuestas. (INDEC, 1993). La codificación de las respuestas abiertas de la cédula ampliada se efectuó manualmente. Esta información se incorporó a los registros de la computadora a través de las lectoras de marcas. Una vez expandidos los resultados de la muestra de la cédula ampliada para las localidades donde se aplicó el muestreo, se genera la base de datos con la información completa de las cédulas A (INDEC, 1993). Se tuvieron previstos dos tipos de controles: 86 o El control de cantidades y totales: Este tipo de control verificaba las cantidades de personas y viviendas por lugar, confrontándolas con cifras de referencia como las del Censo anterior, convenientemente actualizadas con otras fuentes de información existentes en el INDEC (INDEC, 1993). o El control de calidad de las respuestas: Este tipo de control consistía en el análisis de consistencia y coherencia de las características de la población y de las viviendas (INDEC, 1993). Los datos erróneos detectados con esos controles se corrigieron mediante programas especiales de análisis de consistencia y reparación de información (INDEC, 1993). Casi todas las variables registraron problemas que se ubicaron dentro de los umbrales de tolerancia establecidos por el mismo Censo. Sin embargo, se hicieron visibles variables y jurisdicciones provinciales en donde los errores fueron más notables (INDEC, 1997). En provincias del NOA y del NEA hubo niveles de error más altos; y las provincias patagónicas en general tuvieron resultados mejores. Pero el hallazgo tal vez más importante, lo constituye el hecho que las provincias más grandes y desarrolladas han hecho un aporte importante al error total, no tanto porque su volumen poblacional pesa mucho, sino básicamente porque los errores registrados tienden a ser altos o ubicarse en niveles intermedios como Córdoba, Santa fe y Buenos Aires; la excepción la constituyó Mendoza (INDEC, 1997). ● Noveno Censo Nacional de población y Viviendas 2001 El Censo Nacional de Población, Hogares y Viviendas de 2001, estaba programado para llevarse a cabo en el 2000 pero fue postergado un año por la emergencia económica nacional. Este Censo se realizó los días sábado 17 y domingo 18 de noviembre durante la presidencia de Fernando de la Rúa y a diferencia del Censo de 1991, se utilizó un mismo y único cuestionario para relevar la información (Tabla 9). Durante este Censo se indagó sobre discapacidad, descendencia o pertenencia a los pueblos originarios y equipamiento tecnológico del hogar. (Cámara argentina de comercio y servicios, 2019). Se incorporaron nuevas herramientas tecnológicas en términos de la captura de la información ya que se utilizaron (16) escáneres de marcas y de caracteres. (INDEC, 2022b). El INDEC llevó a cabo una licitación para la contratación de la impresión de formularios, la captura (lectura óptica) y el procesamiento de la información. La empresa 87 que ganó esta licitación fue BOLDT S.A. bajo el control de calidad y completitud del INDEC para garantizar que no se omita o se capte dos veces un cuestionario. (La Nación. 2002) La captura de los datos se basó en técnicas de reconocimiento inteligente de la información registrada tanto con marcas como por caracteres manuscritos. Se aplicaron software diseñados para reconocer las imágenes de los cuestionarios captados por los escáneres de alta resolución. El diseño gráfico de los cuestionarios estuvo adaptado a los requerimientos técnicos necesarios para este fin. La lectura e interpretación de los caracteres alfanuméricos contenidos en los cuestionarios se evaluaron mediante un control de calidad que garantizó el cumplimiento de ciertos estándares expresados en tasas máximas de error según tipo de respuesta (marca, número y texto). Se aplicó sistemáticamente la confrontación entre imágenes de una muestra de cuestionarios y la base de datos, registrándose a través de esa comparación la coincidencia o divergencia del ingreso de los datos censales (INDEC, 2006). El Censo de 2001 fue el primer relevamiento censal que se pudo consultar desde la página web del INDEC mediante una base de datos en línea realizada con el programa Redatam+SP. A partir de esa innovación, los usuarios pudieron procesar sus propios cuadros estadísticos. (INDEC, 2022b) La población total censada sumó 36.260.130 personas (INDEC, 2022c). ● Décimo Censo Nacional de población y Viviendas 2010 Este Censo Nacional de Población, Hogares y Viviendas, que fue realizado durante el gobierno de Cristina Fernández de Kirchner, retomó la convención de efectuarlo durante el primer año de la década. (Cámara argentina de comercio y servicios, 2019). (Tabla 9) El Censo de 2010, se realizó el 27 de octubre y fue llamado “Censo del Bicentenario”. retomó la técnica de muestreo utilizada en 1980 y 1991, con la aplicación de un Cuestionario Básico y otro ampliado. El Cuestionario Ampliado, que se aplicó en todas las viviendas situadas en localidades con menos de 50.000 habitantes, y en el 10% de los segmentos de las localidades con 50.000 y más habitantes. Este cuestionario se utilizó además para censar los segmentos ubicados en barrios cerrados-countries, villas, asentamientos y asentamientos con población indígena; el Cuestionario Básico, aplicado al 90% restante de los segmentos con localidades de 50.000 y más habitantes; el Cuestionario de Viviendas Colectivas, el cual se utilizó para relevar las viviendas 88 colectivas y todas las personas que en ellas se encuentren (Dirección General de Estadística y Censos Argentina, 2010). En el capítulo 5 se realizará una revisión detallada y minuciosa de todo el proceso de captura del Censo 2010, pero con el fin de realizar una comparación con los otros censos argentinos realizaremos un pequeño resumen de este proceso. En este Censo el procesamiento de los datos censales inicia con la captura, el cual se realiza mediante el escaneo de todas y cada una de las hojas de los cuestionarios censales y el posterior reconocimiento inteligente de los caracteres contenidos en las mismas, lo que permite generar la base de datos primarios del Censo de Población (INDEC 2013). La empresa que ganó la licitación para llevar a cabo la impresión de formularios, la captura (lectura óptica) y el procesamiento de la información fue BOLDT S.A. bajo la supervisión de equipos técnicos del INDEC. Con el fin de controlar el proceso y garantizar la oportunidad de la información se conformó un Centro de acopio y procesamiento donde se instalaron los escáneres de última generación y un Centro de cómputos con las características necesarias para el cumplimiento de los cronogramas de trabajo. De esta forma en este proceso se utilizaron 23 escáneres y el Centro de cómputos contó con un sistema de almacenamiento con una capacidad superior a los diez terabytes y una red de datos con alrededor de 265 puestos de trabajo (INDEC, 2013). Los equipos técnicos del INDEC, se encargaron de supervisar el proceso de captura, el control de calidad y asegurar que la captura fuera completa. Se apoyaron en información de distintas fuentes como segmentación, datos de la carátula del censista, resultados del ingreso de las planillas de resumen del Jefe de Radio, entre otras (INDEC, 2013) y se llevaron a cabo tareas de análisis a nivel de segmento censal para garantizar que la captura fuera completa (INDEC, 2013). La captura comprendió el empleo de tecnologías OMR (Programa de Lectura Óptica de Marcas) que permitieron detectar la presencia de las marcas registradas en las preguntas cerradas del cuestionario, así como herramientas ICR (Programa de Reconocimiento Inteligente de Caracteres), las cuales posibilitaron interpretar los textos o números manuscritos registrados en las preguntas abiertas (INDEC, 2013). Se creó un equipo técnico de Control de Calidad de captura con el fin de garantizar la calidad de los datos resultantes de este proceso. Este grupo realizaba inspecciones por 89 muestreo, confrontando la información de las imágenes de los cuestionarios frente a la información de la base de datos primarios, permitiendo asegurar la confiabilidad de la información capturada dentro de las tasas de error aceptables (INDEC, 2013). El Censo 2010 obtuvo datos procesados y publicados a los dos meses de haberse realizado. Para el Censo 2010 se previeron dos tipos de controles: control de cantidades y totales y el control de la calidad de respuesta. El primer tipo de control verifica cantidades de personas y viviendas para diversas desagregaciones geográficas, confrontándolas con cifras de referencia tales como las del Censo anterior, convenientemente actualizadas con otras fuentes de información existentes en el INDEC, mientras que el control de la calidad de respuesta consiste en el análisis de consistencia y coherencia de las características de la población y de las viviendas. (INDEC 2013). Se utilizó un software desarrollado específicamente por profesionales del INDEC, en combinación con el programa CANCEIS (CANadian Census Edit and Imputation System), desarrollado por la Oficina de Estadísticas de Canadá (Statistics Canada) y utilizado por la mayoría de los Institutos Nacionales de Estadística para estas actividades para llevar a cabo estas tareas. (INDEC 2013). Por segundo Censo consecutivo, se volvió a poner a disposición de los usuarios los resultados en la base Redatam+SP para procesamientos a medida. (INDEC, 2022b). La población total del país se calculó en 40.117.096 (INDEC, 2022c). ● Censo Nacional de población y Viviendas 2022 El INDEC había programado el Censo para el 28 de octubre de 2020 (Tabla 9). Este se iba a tratar de un Censo de hecho en que se utilizaría un Cuestionario Básico en todos los hogares y un formulario ampliado en una muestra. Se emplearía papel y captura por escáner, así como personal docente y estudiantil de cada zona de empadronamiento que llevarían a cabo entrevistas cara a cara. El 18 de marzo de 2020 el Instituto Nacional de Estadística y Censos de la Argentina (INDEC) suspendió totalmente el operativo de campo debido a la pandemia de COVID-19. El cambio de gobierno a fines de 2019 y las elecciones legislativas previstas para 2021 también influyeron de alguna manera en los ajustes presupuestales y en la ejecución del cronograma.” (CEPAL 2021c) Finalmente, el Censo Nacional de Población, Hogares y Viviendas 2022 (Decreto 726/2020) se llevó a cabo bajo la presidencia de Alberto Fernández. Como principal 90 novedad se encuentra que es el primer Censo que implementará la modalidad de derecho por la cual las personas serán contabilizadas según su lugar de residencia habitual, es decir, en el que pasan la mayor parte del tiempo durante la semana (INDEC 2022). Otra novedad que se presentó en este Censo se encuentra relacionada con el método de enumeración, al implementar un operativo bimodal de relevamiento (autoempadronamiento a través del Censo virtual y el barrido territorial por medio de entrevista directa). De esta forma, a partir del 16 de marzo de 2022 se llevó a cabo el Censo digital, el cual fue un auto empadronamiento vía web, en el cual la población tuvo la oportunidad de completar el cuestionario censal en lugar de la entrevista presencial. (INDEC, 2022a). Por otra parte, el barrido territorial tuvo entrevistas presenciales en las zonas urbanas, rurales, barrios populares, viviendas colectivas y a personas en situación de calle. Para este recorrido, se estableció el día del Censo a mitad de semana (el miércoles 18 de mayo), definido como feriado nacional para minimizar el desplazamiento de la población. (INDEC, 2022a). Se planificó que para verificar los cuestionarios realizados por autoempadronamiento de manera virtual, los censistas el día del Censo, al hacer el barrido territorial con visita a cada vivienda, solicitaron “el código para constatar la información proporcionada en el eCenso, y con ello se realizará el proceso de geolocalización de la vivienda. Si la información no se puede verificar, se aplicará el cuestionario en papel que posteriormente se leerá mediante escáner. El censista contó también con un dispositivo móvil para el control operativo. Pasada esta jornada hubo siete días más de trabajo de campo para llevar a cabo la recuperación de cobertura”. (CEPAL 2021c) El relevamiento en viviendas particulares rurales* y en viviendas colectivas comenzó diez días antes del Día del Censo, y la noche del 16 de mayo se llevó a cabo el operativo de población en situación de calle en grandes aglomerados urbanos.” (INDEC, 2022a). Se implementó un cuestionario censal único con 37 preguntas. Este cuestionario se utilizó tanto de manera digital para ser completado de manera virtual, y en papel para ser utilizado por los censistas de manera presencial en su recorrida por todo el territorio nacional. 91 Se implementó un “Sistema de Gestión y Monitoreo digital que permitió mayor eficiencia y agilidad en la coordinación y el monitoreo de la estructura censal en todo el territorio” (INDEC, 2022a) y por primera vez, la capacitación de la estructura censal se realizó de manera virtual. Un aspecto sumamente novedoso, cuyos resultados, fortalezas y debilidades se podrán analizar en un futuro, a la luz de una evaluación de la calidad de la información censal definitiva. Se estipuló que los primeros resultados provisorios se entregarían horas después del día del Censo (Total de viviendas y de población por sexo), los resultados básicos preliminares a los 30 días de esta fecha, los resultados básicos definitivos a los 8 meses y los resultados ampliados definitivos 13 meses después del 18 de mayo. (INDEC, 2022a). El INDEC llevó a cabo una licitación que tuvo como “objeto contratar la provisión de productos y servicios de impresión de cuestionarios censales (30 millones de cuestionarios con un total de 56 páginas cada uno), kits para censistas (1.023.442 kits de útiles compuestos por un lápiz, una goma de borrar y un sacapuntas.); captura, identificación de marcas y caracteres alfanuméricos y entrega de base de datos para ser procesadas por el citado Instituto Nacional para el “Censo Nacional de Población, Hogares y Viviendas de la República Argentina, Ronda 2020” (Decisión Administrativa 89 de 2022). Se presentaron a esta licitación cuatro empresas con ofertas que iban desde los $4 mil millones hasta los más de $8 mil millones. Finalmente, la empresa que se le adjudicó dicho contrato fue KOLLOR PRESS IMPRESORA DE PUBLICACIONES Y EDICIONES S.A. por la suma total de pesos cuatro mil trescientos sesenta y tres millones ($4.363.000.000.) (Decisión Administrativa 89 de 2022), (Informe técnico licitación pública 27-0001-LPU21. Dictamen del INDEC 2021). (Memo, 2021) Según el pliego de especificaciones técnicas del Censo nacional de población, hogares y viviendas ronda 2020, la captura por escáner de las cédulas censales involucra la totalidad de los trabajos necesarios para generar las bases de imágenes y de datos finales. Este proceso comprende las siguientes actividades: o “Preparación de materiales para la captura o Tratamiento de las imágenes o Reconocimiento inteligente de marcas y caracteres o Corrección automática de caracteres o Validación y control de todos los procesos (impresión y captura) 92 o Corrección manual de caracteres” (INDEC, 2021). El mismo pliego determina que el proceso de captura se llevará a cabo en forma centralizada y constará de los siguientes pasos: (1) Guillotinado de las cédulas censales. (2) Escaneo de las cédulas censales, previamente completadas durante el trabajo de campo por el INDEC, y generación de las imágenes correspondientes. (3) Reconocimiento de los datos de las imágenes, ya sean códigos de barras, marcas, caracteres numéricos o alfabéticos. (4) Generación de la base de datos resultante de los pasos anteriores con niveles de tasas de error máximo (3) Entrega de bases de datos finales (totalización de datos) (INDEC 2021). Se planeó usar registros administrativos como complemento a los efectos de la validación y la coherencia. El INDEC estaría trabajando en la elaboración del registro estadístico de población a partir de registros administrativos. Según la CEPAL dicho registro estaría listo antes del Censo para probarlo con la información recogida en campo y crear la línea de base para futuros censos (CEPAL 2021c, 27). En el anexo 5 se hace una descripción de las principales diferencias y similitudes conceptuales y metodológicas de los últimos cuatro censos de población y vivienda argentinos. En él se compara diferentes aspectos, criterios y procesos de las fases precensal, censal y postcensal. 93 Tabla 9. Censos de población periodo estadístico en Argentina. Censos modernos en Argentina de 1968 hasta la actualidad Fuente: Metodologías censales de 1970, 1980, 1991, 2001, 2010, 2022. 94 4. METODOLOGÍA En función de la definición del objetivo general y los objetivos específicos del presente trabajo, la estrategia metodológica que se implementó se fundamentó en decisiones que serán planteadas a continuación: 4.1 Línea metodológica general La metodología de la presente tesis está encaminada a aprovechar y explotar al máximo las diferentes fuentes de información disponibles para cumplir los objetivos planteados en el Capítulo 1. La línea metodológica general es de tipo deductivo. Se buscó reconstruir el proceso de captura del Censo 2010 a partir de la revisión bibliográfica de los censos en Latinoamérica y en Argentina, además de aportar la experiencia personal del tesista en las distintas operaciones censales durante los censos 2001 y 2010 y sus respectivas pruebas piloto y censos experimentales, así como también aquella adquirida como coordinador del proceso de captura de datos del Censo 2010. Esta investigación, tuvo distintas etapas o momentos para su elaboración. En primer lugar, se procedió a realizar la delimitación del problema de estudio, en donde se definió el objeto de estudio y se escogió una metodología adecuada para abordarlo. En un segundo momento, se realizó una revisión bibliográfica de las fuentes secundarias de información para poder establecer el estado del arte, centrándose tanto en el proceso de captura de los censos argentinos (en especial el Censo 2010) como en otros países de la región. Con respecto a los censos argentinos se realizó una revisión histórica, tratando de identificar cómo se realizó la captura de la información en cada uno de ellos, desde el primer Censo de 1869 hasta la actualidad. Asimismo, se indagó sobre las diferentes recomendaciones internacionales al respecto y cuáles fueron acogidas por los diferentes INE’s. Las mismas se encuentra consignadas en los anexos. En una tercera etapa, se realizó un análisis de la información primaria del Censo 2010, sobre la base de informes diarios de avance y correos electrónicos que detallan el estado de situación del proceso de captura, así como la información del tablero de control del proceso de captura que estuvo a cargo de la empresa BOLDT. Esta fue una de las fuentes de información que más alimentó el análisis central de esta tesis. Posteriormente, se realizó un análisis deductivo a partir de la información recolectada en la revisión de las diferentes fuentes y el desarrollo de procesos basados en la propia experiencia 95 en la participación de operativos censales. Finalmente, se organizó la información con el fin de poder inferir sobre el proceso de captura del Censo 2010. 4.2 Fuentes de datos Para cumplir con los objetivos, la presente tesis se basa en una amplia y diversa información de partida. En este sentido, se realizó una revisión bibliográfica sobre diversos documentos que tratan sobre censos, procesos censales y en especial sobre el proceso de captura, tanto en Argentina como a nivel mundial, para después centrarse especialmente en el proceso de captura del Censo 2010. De esta forma, se ha desembocado en una búsqueda importante de diversos tipos de fuentes, en especial de fuentes secundarias sobre este tema. Fundamentalmente, se consultaron cuatro tipos de documentos durante la presente tesis: ● Informes técnicos (internos): Este tipo de información fue primordial para los capítulos relacionados con el proceso de captura del Censo 2010, ya que a partir de la revisión de dichos informes se pudo reconstruir cómo se llevó a cabo el proceso de captura y los resultados que este arrojó. ● Correos electrónicos: Este tipo de información sirvió para detallar aún más el proceso de captura del Censo 2010. ● Libros y publicaciones académicas y técnicas de diversos autores y organizaciones internacionales: Se realizó una extensa revisión bibliográfica de los principales autores en Argentina y Latinoamérica, así como de diversas organizaciones internacionales que hacen recomendaciones y publicaciones sobre las diferentes rondas y procesos censales. Esta información fue fundamental tanto en el marco teórico como en los antecedentes de la presente investigación. Igualmente, sirvió para complementar los anexos que hacen parte de esta tesis y que profundizan en algunos temas. ● Artículos de prensa sobre censos: Este tipo de fuente de información permitió mostrar el contexto argentino en el que se desarrollaron algunos temas tratados en esta tesis, así como la realización de los censos en países latinoamericanos. A continuación, se especifican los tipos de fuentes primarias, secundarias y terciarias que se utilizaron para realizar este documento: 96 4.2.1 Fuentes primarias (Fotografías, Informe internos y correos electrónicos) Se hizo una revisión exhaustiva de los diferentes informes y correos electrónicos del proceso de captura del Censo 2010 de Argentina, así como de los resultados del sistema de control de los subprocesos del proceso de captura. Estas fuentes son de suma importancia en el desarrollo de la tesis, ya que no existen publicaciones específicas sobre este proceso de censos anteriores. Además, se anexan fotografías realizadas por el INDEC durante ese proceso censal. 4.2.2 Fuentes secundarios (Documentos y artículos académicos y técnicos) Las fuentes secundarias se basaron en el análisis de los censos de la región haciendo énfasis en especial en sus procesos de captura y la documentación respectiva. Esta actividad se realizó con el fin de determinar el estado del arte. Estas fuentes fueron elaboradas por diferentes tipos de instituciones, como los institutos de estadística de Argentina (INDEC), y de otros países y de algunas organizaciones internacionales como UNFPA, CEPAL, CELADE, etc. Asimismo, se citó a varios autores reconocidos a nivel nacional como internacional que han trabajado sobre estos temas a través de su carrera académica y laboral. Se consultaron autores de renombre en el ámbito censal tanto en Argentina como en la región latinoamericana, además de publicaciones institucionales de prestigio como ONU, CEPAL, CELADE, UNFPA, CENTROESTAD, FLACSO-Chile, entre otras. ● Autores consultados: Gladys Massé, Hernán Otero, Magda Ruiz,Juran, Sabrina, Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A, Mrkić, Srdjan, Mejía Guerra, José Antonio., Aguilera, M. ,, M., Cecchini, S. Demirci, Meryem; Del Popolo, F.; González D y Ortiz, Vidal, R, Chackiel, Juan.; Giusti, Alejandro;.Maeder, Ernesto; Novick, Susana; Sacco. Nicolás; Wainer, Luis;Velázquez, Guillermo/ Tisnés, Adela; entre otros ● Otras instituciones o agencias consultadas: CEPAL - CELADE, UNFPA, CENTROESTAD, FLACSO-Chile, entre otras 4.2.3 Fuentes terciarias (Artículos sobre los censos) Se investigó sobre diversos artículos de difusión sobre censos argentinos y de la región latinoamericana que permitieran ampliar el análisis de las temáticas que se desarrollan en esta tesis. 97 Tabla 10. Fuentes de información por capítulos de la investigación Fuente: Elaboración propia Se decidió tomar la información de los INE’s de la región, así como de las agencias de Naciones Unidas (CEPAL – CELADE - UNFPA), dado que es la organización internacional más reconocida que genera información censal, resulta veraz y se constituye en un elemento constitutivo del proceso de validación. Por otra parte, la elección de ciertos países latinoamericanos se fundamenta en su reconocimiento a nivel internacional como el IBGE (Brasil) o el INEGI (México), o por la utilización del escaneo en sus respectivos procesos de captura (primario o secundario) como es el caso de Ecuador, Chile, Bolivia y Colombia. En el caso de Argentina se decidió realizar una revisión histórica de las operaciones censales, buscando conocer como llevaron a cabo la captura de la información en dichos censos, siendo este un insumo fundamental para el desarrollo posterior del estudio. 98 Fue determinante la decisión de revisar los informes de avance del proceso de captura (inéditos), y otros informes internos elaborados por el INDEC. Asimismo, se revisaron todos los correos electrónicos entre el coordinador del proceso de captura y las máximas autoridades de INDEC. Y los correos electrónicos entre INDEC y BOLDT sobre la información del tablero de control. 4.3 Diseño de estudio, tipo de investigación y unidad de análisis Este es un estudio transversal, un momento único en el cual se concentra el proceso de captura del Censo 2010. De manera que a los fines del presente trabajo se definió un solo momento del Censo 2010 que corresponde al proceso de captura. Por otro lado, es una investigación descriptiva, basada en la recopilación, análisis y presentación de información recopilada, buscando identificar las características y resultados del proceso de captura. La unidad de análisis es el proceso de captura de datos del Censo 2010. 4.4 Comentarios generales sobre problemas y facilitadores para la implementación de la tesis y del Censo. El principal problema fue la carencia de información sobre el proceso de captura de los censos en Argentina anteriores al Censo 2010. Existe en particular una característica en la documentación de los diferentes procesos censales en Argentina, ya que generalmente quedan documentados aspectos relacionados con el diseño conceptual de los cuestionarios censales, y parte del análisis de calidad y consistencia de la información censal; pero otros procesos (anteriores) como el diseño de la captura de datos, no son documentados adecuadamente, o en todo caso, se documentan de manera fragmentada e incompleta. En la biblioteca de INDEC, sólo es posible encontrar una referencia breve al proceso de captura del Censo 2010, escrita por el autor de esta tesis. Una de las cuestiones que facilitó la organización y el acceso a la información sobre el proceso de captura del Censo 2010, fue la participación del tesista como coordinador de dicho proceso de trabajo, lo que facilita el acceso a los informes diarios de avance de tareas cuyo destinatario eran las máximas autoridades de INDEC. Se suele suponer que el proceso de captura es simplemente un escaneo de la información que proviene del campo, a la cual se le toma una foto que es una copia fiel del original; sin 99 vislumbrar o tener en cuenta que en ese proceso es necesario tomar decisiones que incidirán en las etapas posteriores a la captura. Hasta este punto se consolida el supuesto, pero la cuestión empírica es mucho más compleja. Hay decisiones técnicas, metodológicas y políticas que complejizan ese esquema inicial, y conllevan a que el proceso de captura se transforme en la primera evaluación de calidad y consistencia a la que se somete la información censal. Es decir que, en ningún documento institucional o metodológico en Argentina, se especifica cómo se ha desarrollado dicho proceso, cuáles fueron los inconvenientes y qué decisiones se llevaron a cabo para resolverlos. Además, los recursos humanos que suelen llevar a cabo esta tarea no vuelven a realizarla hasta diez años más tarde; su documentación permitiría no empezar de cero en cada preparación censal nueva sin el conocimiento de las dificultades que se pueden suscitar durante esta etapa de trabajo, agilizando tiempos y economizando recursos. Para Naciones Unidas la aplicación de las lecciones aprendidas para la planeación de un censo depende de una documentación completa de los censos realizados anteriormente. Dado la periodicidad de los censos, los institutos de estadística deben prestar especial atención a la continuidad del conocimiento entre un censo y otro, ya que es probable que la brecha intermedia entre ambos relevamientos provoque la pérdida de memoria y desgaste del personal calificado. De esta forma, es importante realizar la documentación integral de los distintos procesos y actividades de la operación censal mientras estos se lleven a cabo, así como capacitación de personal más joven para crear un grupo de expertos junto con personas con experiencia. Dicha documentación debe estar al menos disponible internamente. (Naciones Unidas, 2020a, Pag 101) 100 5. RESULTADOS: EL PROCESO DE CAPTURA DE DATOS DEL CENSO 2010 EN ARGENTINA 5.1 Introducción En este capítulo se procederá a analizar y documentar los subprocesos que conforman la captura de datos. Asimismo, se realizará una representación gráfica de la interacción e interrelación de los distintos subprocesos que conforman el proceso de captura de datos. El proceso de producción de datos del Censo 2010, se inició luego de la publicación de los datos definitivos del Censo 2001. En esa instancia se buscó comenzar a reflexionar y diagramar en base a las lecciones aprendidas, las fortalezas y debilidades de la experiencia censal anterior. Asimismo, se buscó en experiencias internacionales, mejoras y actualizaciones en vistas a mejorar y adecuar la producción de datos al contexto regional. Argentina hasta el año 2010 siempre realizó censos de hecho o facto. La modalidad censal siempre ha sido un motivo de discusión cuando se planea un futuro Censo. En el caso del Censo 2010, se buscó mantener comparabilidad con los censos argentinos anteriores, así como aprovechar la experiencia del INDEC en la realización de este tipo Censo con el fin de garantizar el éxito en las diferentes fases censales. El Censo como hecho social o político requiere de la coordinación y sistematización de diversas áreas del conocimiento estadístico, y no solo la suma de compartimentos estancos. Es decir que si bien, los procesos inmediatamente posteriores al relevamiento de datos, están vinculados más a cuestiones logísticas, cartográficas e informáticas, es sumamente conveniente y relevante el trabajo interdisciplinario; dado que permite comprender en su real magnitud, que operaciones logísticas tales como el repliegue del material censal, su reacondicionamiento y el control cartográfico (entre otras), son la primera consistencia real a la que se someten a los cuestionarios con información censal. Es importante tener en cuenta que cada uno de los procesos censales son fundamentales para garantizar el éxito del proyecto, y es necesario entender que no se pueden contemplar cada uno de estos procesos de manera aislada, sino orgánica, es decir integrando cada uno de los procesos censales. Suele ocurrir que los problemas o inconvenientes que se presentan (y no 101 se resuelven) durante la ejecución de cada etapa, afectarán drásticamente el desarrollo de los procesos posteriores, y como fatal consecuencia, los resultados censales finales. En este sentido, uno de los procesos que mayor interacción tiene con todos los demás, es el proceso de captura de datos; ya que depende en gran medida tanto de actividades de la fase precensal (el diseño de cuestionario censal o de los formatos operativos, etc.) como de la fase post-censal (el relevamiento censal, la recuperación y conservación de materiales, etc.). En este sentido influye de manera directa y definitiva en el análisis de calidad y consistencia de los datos, e incluso en la difusión de los resultados, tanto provisionales como definitivos. Si bien casi todas las etapas censales poseen una historia y una reflexión de sí mismas, los procesos posteriores al día del Censo, no siempre se documentan adecuadamente, ni se piensa en ellos como parte integrante fundamental para garantizar la calidad y la consistencia de la información obtenida luego en una primera base de datos (que en la jerga se denomina “base sucia”). La necesidad de realizar una minuciosa documentación, detallando cada uno de los procesos, los problemas y soluciones que se presentaron durante cada una de las fases, no solo es una herramienta para la planificación de cada uno de los procesos censales futuros, sino que permite que cada uno de ellos se vincule y se integre con los demás procesos, al evidenciar sus interrelaciones de una manera más clara y precisa y así poder observar y medir la incidencia que tiene sobre cada uno de ellos. En relación a la participación de recursos humanos con experiencia previa de este proceso de trabajo, tanto en el Censo 2010 como en el Censo 2022 tuvo escasa o nula participación el personal técnico y profesional que había participado en censos anteriores, lo que conlleva a una pérdida importante de memoria institucional, y a su vez imposibilita la generación de informes técnicos longitudinales, históricos de los procesos de captura de datos en los diversos censos de población y vivienda. Para Naciones Unidas la experiencia acumulada de censos anteriores es invaluable en los preparativos de un censo de población y vivienda. La retención del conocimiento institucional y la memoria institucional ganada durante las operaciones censales es fundamental debido al largo intervalo entre censos (generalmente 10 años). Igualmente es más probable que el personal con mayor experiencia se traslade a otros campos de la estadística o que se jubilen durante el período comprendido entre dos censos consecutivos. Por lo tanto, un INE suele estar expuesta a la pérdida de personal cualificado, y sus conocimientos y experiencia podría no estar disponible en el momento del siguiente censo. (Naciones Unidas, 2020a, Pag 91 92) 102 5.2 Actores que participaron en el proceso de captura Para la realización del proceso de captura del Censo 2010, el INDEC preparó equipos técnicos propios y además realizó un convenio con el Correo Argentino que se encargaría de aspectos de logística. A su vez el Correo subcontrató mediante licitación a la empresa BOLDT que ya había participado en el Censo 2001 realizando la misma actividad, es decir, impresión de cuestionarios y diversos formularios, captura de imágenes (lectura óptica) y procesamiento de información. De esta manera la empresa BOLDT ya contaba con amplia experiencia previa adquirida durante el Censo anterior. A continuación, se detallan los diferentes actores que participaron en este proceso: 1. Correo Argentino: Para la distribución, armado y repliegue del material censal se firmó un convenio para disponer de los servicios del Correo Argentino, empresa postal del Estado Nacional que posee una estructura a nivel nacional que llega a varias partes del país y una gran experiencia en el manejo de distribución de paquetería. Adicionalmente, ya el correo argentino anteriormente había manejado estas actividades en el Censo 2001 también a través de un convenio, siendo esta una experiencia positiva que se decidió volver a implementar para el Censo 2010. 2. BOLDT: Para la impresión y digitalización de cuestionarios se realizó una convocatoria la cual fue otorgada a BOLDT S.A. Esta empresa ya había realizado estas actividades en el Censo 2001, siendo esa experiencia un punto positivo para el proceso de captura censal. 3. Equipos técnicos de INDEC: Dentro del proceso de captura participaron diferentes áreas del INDEC y funcionarios para garantizar el adecuado desarrollo de las diferentes actividades de cada uno de los subprocesos. De esta forma, el área de logística contó con personal técnico que tenía experiencias censales anteriores y con una vasta trayectoria en el Instituto. En el área de informática ocurrió algo similar, profesionales con experiencia censal, a los que se sumaron equipos técnicos nuevos con formación profesional en la temática. A su vez el área de Cartografía participó con personal técnico que poseía experiencia previa desde el Censo 1991 en adelante. Continuando con la conformación de equipos técnicos, para monitorear y controlar la calidad de las actividades del proceso de captura, la Dirección Nacional de Estadísticas Sociales y de Población contó con la participación de personal con amplia experiencia en esa tarea; sin embargo, cabe señalar un aspecto no técnico al respecto de la conformación de equipos de trabajo en esta área. 103 Esta Dirección Nacional dejó de lado algunos profesionales con experiencia previa al Censo 2010, dada la presencia de conflictos técnico-políticos respecto a una supuesta manipulación del Índice de Precios al Consumidor (IPC) que produce mensualmente el Instituto. Si bien la Dirección Nacional de Estadísticas Sociales y de Población es ajena al producto estadístico IPC, parte de su personal participó activa y gremialmente en las protestas realizadas en la puerta del INDEC; lo que llevó a un desencuentro evidente entre la Dirección del INDEC y la Directora de esa área, lo que trajo como consecuencia la migración de algunos profesionales que se habían desempeñado en el Censo 2001. Si bien este hecho condicionó la presencia de profesionales con experiencia de dicha área, no fue un hecho fortuito ni producto del conflicto que vivió el INDEC. Lamentablemente para la Administración Pública y, en este caso, para la generación de estadísticas públicas, es algo que sucede a menudo. Actualmente en el Censo 2022 no están participando acorde a sus experiencias previas, algunos profesionales y técnicos que se desempeñaron activamente en diferentes procesos de trabajo durante el Censo 2010. Desconocer este hecho y exponer la cuestión cómo lo ha expresado en su momento la Asociación de Trabajadores del Estado (ATE) o ciertos medios hegemónicos, no hace otra cosa que victimizar a un sector minoritario, en vistas de lograr réditos políticos y económicos. No tomar en cuenta la experiencia o trayectoria de profesionales y técnicos (en este caso con relación a censos de Población y Vivienda), es una mala práctica tan habitual. Pese al conflicto mencionado, participaron profesionales y técnicos de diversas áreas que tenían experiencia desde el Censo de 1991. En términos numéricos cerca de 150 trabajadores del INDEC participaron tanto en el área de logística y armado, como en los controles de calidad posteriores al escaneado. Aquellos que poseían mayor experiencia ocuparon puestos de coordinación. El resto (que no poseía experiencia censal previa) realizó actividades relativamente simples, para las cuáles se les brindó la capacitación pertinente. Más adelante se detallan cada una de esas etapas. Para realizar este proceso de trabajo, BOLDT puso a disposición una planta industrial ubicada en Don Torcuato. Allí se llevaron a cabo tanto la elaboración de los datos provisionales, como así también el proceso de repliegue de material, su acondicionamiento, el proceso de captura de datos y sus controles correspondientes, hasta llegar a la base de datos primaria, o como 104 se denomina en la jerga “la base sucia o no consistida”. Aunque esta base aún no ha transcurrido por los procesos de edición de datos, sí recibió cierto grado de consistencia durante el proceso de captura de datos como se detalla más adelante. 5.3 El proceso de captura en el Censo 2010 de Argentina 5.3.1 Material censal a capturar La captura del material censal se realizó mediante el escaneo de todas y cada una de las hojas de los formularios, y el posterior reconocimiento inteligente de los caracteres contenidos en las mismos, generando de esta manera la base de datos primarios del Censo Nacional de Población, Hogares y Viviendas. Esto se logró a partir del diseño gráfico de las carátulas de censistas, los cuestionarios censales y las planillas utilizadas en el operativo censal, los cuales cumplieron de manera adecuada con los requerimientos técnicos pertinentes que permitieran optimizar el proceso de captura de la información. Por otra parte, tanto la información escaneada de las carátulas como los resultados del ingreso de las planillas Resumen del Jefe de Radio permitieron que llevarán a cabo tareas de análisis a nivel de segmento censal que garantizaron que la captura fuera completa. A continuación, se especificará el material operativo que fue escaneado: 5.3.1.1 Carátulas de segmento Se escanearon las carátulas de segmento con el fin de que su información sirviera posteriormente al realizar el control de completitud (o cobertura) de la información censal. (Figura 6). a. Carátulas de segmento de Viviendas Particulares y colectivas Esta carátula permite conocer las características del área de trabajo asignada al censista. Sirve para registrar los datos resumen de cada segmento y localizar territorialmente la información recogida durante el relevamiento censal. Y de esta forma, obtener información sobre las características de la zona donde está ubicada la vivienda haciendo referencia a tres cuadras a la redonda. La carátula se completa en la primera vivienda censada (INDEC, 2010a, P.10, 63). Las carátulas de segmento eran de viviendas particulares- Cuestionario Ampliado (A), carátulas de segmento de viviendas particulares- Cuestionario Básico (B) y carátulas de segmento de viviendas colectivas (C) y estaba compuesta por una página de tamaño oficio. (INDEC 2010a, P 4-5) 105 Figura 6. Carátulas de segmento de viviendas particulares Cuestionario Ampliado, básico y viviendas colectivas Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. La carátula de segmento de viviendas particulares se completa en tres momentos: antes de salir a terreno, durante el recorrido del segmento y al finalizar el trabajo de campo. Estas carátulas constan de las siguientes partes: 1. Ubicación geográfica del segmento: En este ítem se completó estos datos antes de comenzar a censar, en la Sede del operativo, transcribiéndolos del Croquis del Segmento. 2. Entorno e infraestructura del segmento: Este recuadro está conformado por 15 ítems, divididos en dos grupos: ● Las primeras nueve preguntas se formularon al primer hogar censado ● Los últimos seis ítems se marcaban por observación considerando la situación predominante del segmento y eran completados antes de que el censista se retirara de la vivienda. 3. Resumen del segmento: La información de este punto se obtenía a partir de la Planilla de Resumen del Censista (C2A). Incluía el total de población especificado por sexo, el último número de la vivienda del segmento y el total de cuestionario entregados. (INDEC, 2010c, pp. 63-64) (Figura 6) 106 Las preguntas de esta carátula indagaban sobre el entorno de las viviendas haciendo énfasis en el registro de inundaciones en los últimos 5 años, la presencia de basural permanente a menos de 300 metros (3 cuadras), la existencia de servicio de cloacas, de servicio de agua de red (agua corriente), de servicio de gas de red (gas natural), de energía eléctrica por red domiciliaria y de un Servicio regular de recolección de residuos (al menos 2 veces por semana). Otras preguntas indagaban sobre la existencia de transporte público a menos de 300 metros y la presencia de teléfono público, semipúblico o locutorio a menos de 300 metros (3 cuadras). También hacía referencia sobre la ubicación en las villas (de emergencia) o asentamiento, en barrio plan o monoblock o en un country o barrios cerrados. Igualmente se observaba la existencia de pavimento, la presencia de al menos una boca de tormenta o alcantarilla y de alumbrado público (INDEC, 2010c, 97-98). Por un lado, las carátulas de viviendas particulares se escanearon y sirvieron como control posteriormente en el análisis de completitud o cobertura. Por otro lado, las carátulas de viviendas colectivas - aunque también se escanearon – su información no fue utilizada en ninguna etapa del proceso de captura de datos. 5.3.1.2 Planillas operativas Para el Censo 2010 se diseñaron diferentes planillas operativas, las cuales eran completadas por distintos miembros de la estructura censal. En lo que atañe al proceso de captura, las planillas que es preciso comentar son las siguientes: La planilla de Resumen del Jefe de Radio (R2) y la planilla de Resumen de Viviendas Colectivas a Nivel Fracción R2F. Ambas estaban compuestas por 2 páginas de tamaño oficio tal como se pueden apreciar en la Figura 7 (INDEC 2010a, P 4-5). 107 Figura 7. Planilla del Jefe de Radio -R2 y R2F Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC Planilla R2 (Resumen del Jefe de Radio) La plantilla R2 permitió resumir, a nivel de Radio, la información sobre la cantidad de entrevistas tanto que se realizaron como las que no se realizaron, de viviendas y la población censada por sexo (INDEC, 2010d, p 10). Esta planilla era completada por el Jefe de Radio. La información recolectada a partir de las Planillas R2, permitió leer a gran velocidad los datos y asegurar la obtención de los resultados provisionales para diversas áreas geográficas en muy breve plazo. Esta planilla constaba de 8 campos que se describen a continuación: 1. Ubicación Geográfica: Se obtenían a partir de la Cartografía de Radio. 2. Completado con: En todas las Planillas R2 se debía marcar con una «X» en C2A y/o C2B. 3. Numerar Planilla 4. Resumen del operativo: Segmento Nº (columna b): Se colocan los números de los Segmentos de su Radio en orden correlativo y creciente. Si contaba con Segmentos del Cuestionario A y Cuestionario B, registrará primero todos los de Cuestionario B y luego todos los de Cuestionario A. Cantidad de Entrevistas (columna c): Para cada Segmento, se volcaba los totales correspondientes a entrevistas realizadas y entrevistas no transcribiéndolos del Ítem 5 (columna d) de la Planilla C2A y/o C2B. realizadas, 108 Total de Viviendas (columna d): Se debía transcribir, para cada Segmento, el último número de vivienda del segmento que figura en el Ítem 6 de la primer Planilla C2A o C2B. Para cada Segmento: Se debía consignar los datos correspondientes al Total de Población, Varones y Mujeres, transcribiéndolos del Ítem 5 - Total, columnas (e) (f) y (g) de la primera Planilla C2A o C2B. El número de la caja que los contiene: en la columna (a). 5. Subtotal: Totales de los datos de las columnas desde (c) hasta (g) en cada una de las Planillas R2 que hayan utilizado. 6. Total: En la primera planilla se totalizaba los datos que resultaban de la suma de los subtotales de las columnas (c) hasta (g) de todas las planillas utilizadas. 7. Total de Cajas: En la primera planilla se consignaba el último Nº utilizado para numerar las cajas de la columna (a). 8. Firma Planilla R2F (Resumen de Viviendas Colectivas a Nivel Fracción) La planilla R2F totalizaba por Radio, la cantidad de entrevistas realizadas y no realizadas, de Viviendas Colectivas y la población por sexo censada en ellas. Era completada por el Jefe de Fracción (INDEC, 2010e, p 8). Las Planillas R2F, al igual que la R2, constaba de 8 campos: 1. Ubicación Geográfica 2. Completado 3. Numerar Planilla 4. Resumen del operativo: Cantidad de cajas: cajas con el material correspondiente a ese Radio. Cantidad de entrevistas (columna c): totales de entrevistas realizadas y entrevistas no realizadas Total de viviendas (columna d) Total de Población por sexo 5. Subtotal 6. Total 7. Total de Cajas 8. Firma 109 A partir de la información contenida en la planilla operativa R2, que también fue escaneada, se obtuvieron los resultados provisionales. El tratamiento dado a la elaboración de los datos provisionales durante el Censo 2010, fue similar al de otros censos realizados anteriormente en el país al utilizar las mismas planillas operativas para tal fin. En general no se encontraron problemas significativos con el completamiento de la planilla operativa R2, sin embargo, en algunos casos debido al extravío de esta, se utilizó la planilla F2. El completamiento de esta planilla corresponde al Jefe de Fracción, que realiza esta tarea con la sumatoria de todas las planillas R2 de los Jefes de Radio que están a su cargo. La decisión de publicar oportunamente los datos provisionales obedeció a la importancia que las autoridades del Instituto le dieron a este aspecto de la calidad de los datos, fue una decisión político-técnica y a su vez de propaganda estadística para con el organismo. El INDEC publicó en apenas 15 días los resultados provisionales tratándose de un tiempo bastante acotado en comparación con censos anteriores. A respecto es interesante comentar que de haberse podido implementar El Plan de Acción que elaboró el tesista durante su estadía como becario de la Agencia de Cooperación Internacional del Japón (JICA), al respecto de la carga de datos, hubiese sido posible lograr los mismos resultados con mayor celeridad7. Si bien la tecnología vigente en el año 2010 era innovadora, no fue posible informatizar la planilla R2. Lo que si se logró fue informatizar la planilla F2 y la experiencia resultó muy interesante. En este punto es válida una breve explicación del mecanismo de completamiento de las planillas operativas que se están comentando: La planilla R2 es un insumo totalizante que genera el Jefe de Radio al finalizar el operativo, y que se nutre de la planilla C2 del censista. Esta planilla (C2) es completada por el censista al final de su jornada laboral, cuando ya se encuentra visiblemente agotado, lo que produce que, en general, se trate de una planilla que contiene errores de sumas. Estos errores son heredados y trasladados por el Jefe de Radio al completar la planilla R2. Por ende, esta metodología atenta contra la calidad de los datos provisionales. Con ese mismo criterio se puede reflexionar sobre la planilla del Jefe de Fracción (F2). Esta planilla no solo arrastra los errores cometidos por los censistas, sino que se le suman los cometidos por los Jefes de Radio. Sin embargo, teniendo en 7 El tesista durante su estadía como becario de la JICA en Japón, cursó una especialización sobre Censos de Población y como producto resultante de aprobación de dicho curso, elaboró un Plan de Acción que tenía como tema central la informatización de la planilla operativa R2. El objetivo de este Plan de Acción fue dar celeridad a la primera publicación de datos provisorios a la vez que evitar errores de sumas manuales y en papel, como consecuencia secundaria estaba el hecho de economizar recursos informáticos, ya que hubiera existido la necesidad de utilizar escáneres. 110 cuenta que la utilidad de la información censal es directamente proporcional a su rápida disponibilidad y acceso (oportunidad del dato), mediante el proceso de captura se lograron entregar a los 60 días posteriores al Censo, los datos preliminares sobre cantidad de población por sexo, cantidad de viviendas y número de hogares, a nivel de total del país, provincia y departamento; todos ellos obtenidos a partir de la información escaneada de las planillas operativas. 5.3.1.3 Cuestionarios censales El Censo 2010 tuvo tres cuestionarios censales: Cuestionario Ampliado (A), Cuestionario Básico (B) y Cuestionario de Viviendas Colectivas (C), (Figura 8) los cuales se detallan a continuación: Figura 8. Cuestionario Ampliado (A), Básico (B) y de Viviendas Colectivas (C) Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. a. Cuestionario Ampliado (A) El Cuestionario Ampliado aplicado a una muestra probabilística de viviendas contiene bloques que profundizan las temáticas de Características habitacionales del hogar, Migraciones y Empleo. Además, indaga sobre otros aspectos de la población tales como Fecundidad, Pertenencia a pueblos originarios, Población Afrodescendiente, Previsión social y Cobertura de salud, entre otras. Estas temáticas podrán ser estimadas a niveles más agregados (Total Nacional, Provincial, etc.), ya sea directamente utilizando las técnicas usuales de estimación 111 a partir de muestras probabilísticas, o aplicando otras herramientas estadísticas, diseñadas para obtener estimaciones a nivel de pequeños dominios (INDEC, 2012). Este formulario se aplicó al 10% de las localidades con más de 50.000 habitantes y al 100% de localidades de menos habitantes. El Cuestionario Ampliado era de tamaño oficio y estaba compuesto por 16 páginas, 8 hojas, anverso y reverso, la primera referida a Vivienda/Hogar y las 7 siguientes a Población. (INDEC, 2010a) El Cuestionario Ampliado contó con 67 preguntas numeradas aplicadas a los seleccionados por muestreo. Cada cuestionario estaba conformado por cinco partes o bloques de preguntas las cuales se señalan a continuación: 1. Ubicación geográfica: Donde se registraban los datos que permitían localizar cada vivienda censada. Constaba de 10 preguntas sin numeración. 2. Vivienda: Se indaga acerca del tipo de vivienda, si se encontraba o no habitada y la cantidad de hogares en la vivienda. Este bloque estaba compuesto por 3 preguntas. 3. Lista de personas: Registraba los nombres de las personas que pasaron la noche de referencia del Censo en la vivienda y su parentesco o relación con el jefe o jefa del hogar. También se incluyó dos preguntas que indagaban por la existencia de personas indígenas o descendientes de pueblos indígenas y por personas afrodescendientes o con antepasados afrodescendientes. 4. Características habitacionales del hogar: En este bloque se obtuvo información sobre los materiales, infraestructura y servicios de la vivienda y el hogar. Esta parte tenía 22 preguntas. 5. Características de la población: Se indagó por características sociodemográficas y socioeconómicas de cada persona. Cada Cuestionario tiene 6 bloques de preguntas de población, exactamente iguales, uno para cada persona listada. Estaba compuesto por 39 preguntas. (INDEC, 2010c, P 37, -59), (Nigita Ruben, 27-30 de octubre de 2014, p3) (Figura 8) b. Cuestionario Básico (B) El Cuestionario Básico recogía información de…. que permitieron determinar la estructura sociodemográfica de la población y obtener los principales indicadores en el país (Sexo, Edad, Nivel Educativo, Características Básicas de la Vivienda, Condición de Actividad de las 112 personas, etc). Se aplicó en las localidades con más de 50.000 a la mayor parte de la población. (INDEC, 2010c, P 7) El Cuestionario Básico era de tamaño oficio y estaba compuesto por 8 páginas, 4 hojas, anverso y reverso, la primera referida a Vivienda/ Hogar/ Población y las siguientes a Población. (INDEC 2010a, P 4-5) El Cuestionario Básico compuesto por 35 preguntas elementales que se aplicaron a la mayor parte de la población. Este cuestionario también estaba compuesto por las mismas cinco parte o bloques del Cuestionario Ampliado pero el número de preguntas en cada uno de ellos era menor.: 1. Ubicación geográfica Este bloque estaba compuesto por 10 preguntas sin numeración. 2. Vivienda: Se indaga acerca del tipo de vivienda, si se encontraba o no habitada y la cantidad de hogares en la vivienda. Constaba de 3 preguntas. 3. Lista de personas: Solo incluía el listado de las personas y su relación de parentesco con el jefe del hogar 4. Características habitacionales del hogar: Esta parte contenía 15 preguntas. 5. Características de la población: Estaba compuesto por 16 preguntas. (Nigita Ruben, 27-30 de octubre de 2014, p 3, 31) (Figura 8) c. Cuestionario de Viviendas Colectivas (C) Este cuestionario recogía información de las viviendas colectivas, las cuales son aquellas en donde las personas conviven bajo un régimen institucional como cárceles, hospitales, geriátricos y conventos (INDEC, 2010c, P. 7). Se imprimieron en tamaño oficio y estaban compuestos por 16 páginas, 8 hojas, anverso y reverso, la primera referida al Tipo de Vivienda Colectiva y las siguientes a la población residente en ellas (INDEC 2010a, P 4-5). El Cuestionario de Viviendas Colectivas tuvo 11 preguntas aplicadas al total de viviendas colectivas del territorio nacional. Está conformado por cuatro partes o bloques de preguntas las cuales se presentarán a continuación: 1. Ubicación geográfica Este bloque estaba compuesto por 10 preguntas sin numeración. 2. Vivienda: Constaba de una pregunta, la cual indagaba sobre el tipo de vivienda colectiva (hogar de ancianos, hogar de menores, colegio/internado, campamento, hospital prisión, cuartel, hogar religioso, hotel turístico y otros). 113 3. Lista de personas: Incluía el listado de las personas que pasaron la noche del martes al miércoles en esta vivienda 4. Características de la población: Estaba compuesto por 9 preguntas, las cuales se encuentra sexo, edad, fecha de nacimiento, país de nacimiento, cobertura en salud, analfabetismo, asistencia escolar, nivel educativo y si completo el ultimo nivel educativo. (Nigita Ruben, 27-30 de octubre de 2014, p. 3, 31) (Figura 8) 5.3.2 Interacción del proceso de captura con los otros procesos censales El Censo de Población es una operación estadística que está compuesta por etapas, macroprocesos, procesos, subprocesos, actividades y tareas. Tanto las macro actividades como los procesos están interconectados conformando un sistema que generan interrelaciones, flujos de información y productos que son resultados de la interrelación de los mismos procesos y que a la vez alimentan a otros, con el fin de generar resultados censales con calidad y oportunidad. La Figura 9 muestra las etapas precensal, censal y postcensal, así como los macroprocesos que conforman cada una de estas etapas. Como el objetivo es poder identificar las interacciones y productos que alimentan el proceso de captura, se procedió a evidenciar únicamente los procesos que conforman el macroproceso de procesamiento, en el cual se encuentran los procesos de captura y el de análisis de la información censal. En la etapa precensal se encuentra el macroproceso de diseño conceptual y metodológico (en rojo), el cual está alimentado por los diferentes requerimientos de información que requiere el país a nivel nacional, provincial, departamental y municipal, así como la experiencias censales y recomendaciones nacionales e internacionales. De este proceso salen diferentes productos que nutren al proceso de captura de datos censales, entre los que se encuentran los siguientes: ● Diseño conceptual y metodológico del censo ● Cuestionarios censales, carátulas de segmento, planillas operativas diseñados ● Cartografía actualizada ● Diseño del relevamiento ● Diseño de la distribución de materiales ● Convenios y licitaciones ● Manual de operaciones de la captura 114 ● Diseño de las bases de datos censal ● Diseño del software de captura ● Indicadores de calidad y cobertura ● Resultados de las pruebas y del Censo Experimental En la etapa censal, la cual está de color verde, está el macroproceso de relevamiento de la información, el cual genera una interacción directa con el proceso de captura y produce como resultados el material censal (cuestionarios censales, carátulas de segmento, planillas operativas) completado en las diferentes provincias, para ser replegado y posteriormente capturado. En azul se encuentra el macroproceso de procesamiento, en el cual se encuentra los procesos de captura y el proceso de análisis. El proceso captura de la información a partir de los subprocesos que la componen (Figura 9) recibe los resultados tanto de la fase precensal, para poder ejecutar sus diferentes sub procesos y actividades. Asimismo, también recibe, organiza, captura, consolida y almacena el material censal que viene del relevamiento, generando bases de datos listas para ser validadas y consistidas durante el proceso de análisis. El análisis fue realizado por el equipo de Diseño Conceptual y género como resultado la información censal digitalizada, validada y consistida y la base de datos expandida del Censo Ampliado. En el macro proceso de evaluación (color naranja) se determina la calidad del censo en términos de su cobertura y calidad, a partir de la conciliación censal basándose en procedimientos demográficos que permiten identificar los errores de omisión que presenta la información censada, generando como producto la población conciliada. . 115 Figura 9. Interrelación entre el proceso de captura y los macroprocesos y procesos censales Censo 2010. Argentina Fuente: Elaboración propia con base en la metodología del Censo 2010 116 Finalmente, el área de Difusión (morado) prepara la información para ponerla a disposición del público de manera confiable, oportuna y a través de herramientas que sean de fácil acceso. De esta forma, este macroproceso genera los siguientes resultados: ● Resultados censales Censo básico y Censo ampliado ● Publicaciones ● Indicadores ● Bases de datos ● REDATAM ● Mapas temáticos ● Estudios postcensales Finalmente hizo falta incluir un último proceso denominado documentación, el cual garantiza documentar cada una de las diferentes etapas, macroprocesos, procesos, subprocesos y actividades del proyecto censal, con el fin de dejar un insumo importante para las futuras operaciones censales. 5.3.3 Subprocesos y actividades del proceso de captura En el proceso de captura del Censo 2010 se consolidaron y almacenaron los datos generados a partir de las planillas operativas y formularios censales, para su posterior procesamiento. Basado en la propia experiencia laboral en el Censo 2010, y en la documentación interna del proceso de captura (mail, informes, etc) se realizó un diagrama que intenta sintetizar cómo se llevó a cabo este proceso y cuáles fueron sus componentes y flujos. De esta forma, este proceso consta de 5 subprocesos (Repliegue de material censal, Preparación del material censal, Escaneo, Verificación y Salida) y 18 actividades que hacen parte de cada uno de esos subprocesos (Figura 10). En azul, se aprecia el primer subproceso denominado repliegue del material censal, al cual llegan desde el relevamiento, el material censal de las diferentes provincias del país. Este subproceso tiene una actividad que es la recepción del material. 117 Figura 10. Subprocesos del Proceso de captura de datos censales Censo 2010. Argentina Fuente: Elaboración propia basada en la documentación interna del proceso de captura del Censo 2010 118 El segundo subproceso, el cual se encuentra en color rojo, es la preparación del material que consta de seis actividades: ● Control y clasificación del material censal ingresado (Ordenamiento en pallet del material censal) ● Almacenamiento 1 del material censal por provincia y departamento (a la espera de reproceso) ● Armado y Acondicionamiento de cajas con cédulas censales ● Reelaboración de cédulas censales ● Guillotinado ● Almacenamiento 2 y preparación del material liberado a procesar Las actividades de los subprocesos de repliegue y preparación están monitoreadas a partir del sistema de control de segmentación mediante el software SAYCO. Por otra parte, en verde está el tercer subproceso del proceso de captura es el escaneo, el cual posee dos actividades que son la digitalización del material censal y reconocimiento e interpretación de campos. El cuarto subproceso es el de verificación al cual llegan las imágenes el cual consta de cuatro actividades que son la graboverificación, el control de Calidad del Escaneo, el re-escaneo y el control de completitud de los resultados. Las imágenes llegan tanto a control de calidad como a graboverificación. En control de calidad algunas imágenes al ser revisadas pueden ir a reescaneo y cuando son re-capturadas vuelven a control calidad. Por otra parte, las imágenes que llegaron y pasaron por la actividad de grabo verificación van a control de calidad. La información pasa de control de calidad y de allí a control de completitud. Finalmente, el quinto y último subproceso es el de salida, en el cual las imágenes de la información censal salen digitalizadas para ser validadas, analizadas y consistidas. En este subproceso se contemplan dos actividades que son la consolidación de la base de datos y envío al equipo de diseño conceptual del INDEC, y el envío a almacén definitivo de los pallets con cajas escaneadas con material censal. Las actividades de los subprocesos de escaneo, verificación y salida están supervisadas a partir del tablero de control de las imágenes escaneadas, el cual fue creado por BOLDT para este fin. A continuación, se describen cada uno de los subprocesos y actividades llevados a cabo en el proceso de captura del Censo 2010: 119 5.3.3.1 Repliegue del material censal: Este subproceso estuvo a cargo del Correo Argentino en coordinación con la Dirección de Logística Operativa del INDEC. Comenzó dos semanas después de realizado el operativo censal. Se realizó desde 2.200 puntos del país. Se enviaron 330.000 cajas con material censal. El operativo de repliegue estuvo relacionado con los siguientes subprocesos fundamentales en el manejo de materiales entre el INDEC y las Direcciones Provinciales de Estadística (se menciona solo a título ilustrativo, dado que en este capítulo referimos a actividades relacionadas con el proceso de captura) las cuales hicieron parte del macroproceso de relevamiento y del proceso de producción, distribución y control de materiales: a) Distribución de los materiales para la capacitación: enviados en sobres identificados según el puesto en la estructura de capacitación b) Distribución de materiales operativos: los Cuestionarios, las planillas operativas, los elementos de escritura, las cajas, sobres para la devolución de materiales, etc. Los dos subprocesos anteriores manejaron los siguientes volúmenes de materiales operativos los cuales se muestran en la Tabla 11. Tabla 11. Cantidades de material censal distribuido a las provincias antes del relevamiento Fuente: (INDEC 2010a) Por otra parte, la recuperación de los materiales de las provincias hasta Buenos Aires también fue realizada por el correo argentino, dando paso al repliegue de material censal. Esta actividad se realizó desde 2.200 puntos del país, de donde se enviaron 330.000 cajas con material censal. a. Recepción del material Según el Manual de operaciones de repliegue y captura del Censo 2010 (INDEC, 2010b, p 45) utilizado por el Correo Argentino el repliegue del material censal se llevó a cabo de la siguiente manera: 120 La sede central de recepción del material fue BOLDT Panamericana, compuesta por 1 depósito que sumaba un total de 1.480 m2 cubiertos, con capacidad de almacenamiento de 1.360 posiciones de Rack Selectivos a 5 niveles. El ámbito cuarentena (deposito numero 3) disponía de un metraje de aprox. 350 m2, descontadas las áreas de cómputos, escaneo, etc. Se contó además con 2 depósitos adicionales: Uno (anexo) de 410 m2 con capacidad de 250 pallets adicionales, y otro (depósito 1) 650 m2. Todos ellos con rampas para recepción en playa. Además, se instaló una carpa para trabajo de piso (no almacenamiento) de 440 m2. Totalizando todo lo anterior en 1610 posiciones disponibles y 3330 m2. 2010 (INDEC, 2010b, p.3) La recepción de las provincias de menor cantidad de habitantes se realizó en Flow Garín (Provincia de Buenos Aires) hasta su solicitud por parte de INDEC. Aquí se contó con un adicional de 1000 posiciones. Este centro se encontró operativo para recibir y almacenar material censal a partir del martes 9 de noviembre de 2010 (INDEC, 2010b, p.3) El operativo de repliegue se realizó en la mayoría de los casos, por vía terrestre. Este es un aspecto poco estudiado y considerado a la hora de diagramar políticas censales. Si bien, durante el repliegue del Censo 2010 la mayoría de los cuestionarios llegaron en buenas condiciones, algunos de ellos sufrieron las inclemencias del clima y las grandes distancias, y debieron ser reacondicionados mediante la presencia de un escribano público, y personal capacitado al respecto. Respecto a este punto, luego en el capítulo 6 se desarrolla brevemente, una propuesta alternativa para la captura de datos, que buscaba federalizar el proceso de captura en distintas zonas del país, logrando por un lado que las Direcciones Provinciales de Estadística tengan incidencia y aportes al proceso de captura de datos, y por el otro evitar el desplazamiento del material hasta Buenos Aires. En el año 2008, el sociólogo y becario de la JICA Lic. Diego Ventrici, realizó un plan de acción vinculado a este punto en particular. Es interesante ponerlo en relieve, porque propone la reflexión sobre aspectos censales que no siempre son considerados en su real dimensión como es el caso de la dimensión territorial del país. En líneas generales, el repliegue de material es la primera etapa del proceso de captura de datos de los cuestionarios censales. La primera captura de datos se realiza a partir de las planillas operativas, en especial la R2. Esta captura se procede con el fin de conformar los resultados preliminares. 121 El INDEC determinó e informó al Correo Argentino las prioridades de procesamiento por Provincia de forma de direccional al almacenamiento del material. Aquellos que tenían una alta prioridad ingresaron a BOLDT Panamericana, y aquellos con menor densidad poblacional fueron almacenados en la planta de Garín prevista para el proyecto. El material censal se recibió en pallet (si procedía del Interior del país o de CABA) o a granel en el caso de Gran Buenos Aires. En los casos que se recibían pallets, éstos fueron almacenados en forma temporaria sin procesar, mientras que aquellos departamentos que se recibieron a granel, se paletizaron ordenando por fracción censal. Si la caja no poseía ninguna identificación se paletizó por separado con el resto de las cajas con esa condición, para que luego el personal de INDEC analizara el destino de estas. Para realizar esta actividad fue necesario un control exhaustivo de la cantidad de cajas recibidas, y se generó un archivo con esa información, la cual fue fundamental para poder visualizar el material faltante. (INDEC, 2010b, p.3-5). Figura 11. Foto de recepción de material Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC Este subproceso se llevó a cabo de 3 al 30 de noviembre de 2010 y tuvo una duración de 20 días hábiles, el cual se llevó a cabo a través de dos turnos de 8 horas cada uno. El personal requerido para llevar a cabo este subproceso estuvo conformado por auto elevadoristas, personas para control y recepción (3 x turno) y personal administrativo (1 x turno). Así mismo el equipamiento necesario para llevar a cabo estas actividades se tenía 4 autoelevadores, 2 zorras eléctricas (INDEC, 2010b, p.3-5). A continuación, se especifican los volúmenes y la productividad de este subproceso: 122 Volumen: ● Pallets IN + 1000 posiciones en eI Flow. Capacidad definida de recepción x día: entre 150 y 200 pallets. (INDEC, 2010b, p.3-5). Productividad: ● Recepción 75/100 pallets x día x turno ● Capacidad de descarga de camiones 12 pallets x hora (INDEC, 2010b, p.3-5). Respecto a la finalización de la recepción de material censal, la fecha expresada da cuentas del tiempo transcurrido para el repliegue de la mayoría del material. Como se verá más adelante (en el capítulo 6 donde se analizarán los inconvenientes y errores del proceso), se recibió material hasta el mes de marzo de 2011 de algunas fracciones y radios censales, que no habían sido retirados por el correo. 5.3.3.2 Preparación del material censal: Este subproceso tiene siete actividades, las cuales se detallan a continuación: a. Control y clasificación del material censal (Ordenamiento en pallet del material censal): Esta actividad se llevó a cabo a partir del 3 de noviembre al 30 de octubre de 2010 y tuvo una duración de 20 días hábiles, los cuales se trabajaron en dos turnos de 8 horas cada uno. (INDEC, 2010b, p.4-5) Figura 12. Foto del control y clasificación del material censal (Ordenamiento en pallet del material censal) Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. La clasificación de la información censal se realizó a partir de las prioridades de procesamiento establecidas por el INDEC se desplegó el material en el piso en forma ordenada por provincia/ 123 departamento / fracción / radio / segmento, paletizando un total de 120 cajas ordenadas según las agujas del reloj. (INDEC, 2010b, p.4-5) Un pallet no debía contener más de un departamento, y las cajas debieron estar orientadas de forma tal de poder leer el código de barras. Asimismo, se realizó la lectura de los Códigos de Barras y se almacenó la información en los sistemas del INDEC (SAYCO) (INDEC, 2010b, p.45). A partir de este momento el material tuvo 2 destinos posibles, almacenado transitorio o enviado al proceso de armado y acondicionamiento de cajas de cuestionarios censales, previo al guillotinado. El personal requerido para llevar a cabo esta actividad fue 8 equipos de 4 personas para el control y clasificación, autoelevadoristas y administrativos. Así mismo el equipamiento utilizado durante el ordenamiento en pallet fue 2 Zorras eléctricas, 4 Autoelevadores eléctricos (tipo Apiladora para 1.500 Kg.), 4 Colectores de Radiofrecuencia (tipo HandHeld) y Racks con 1520 posiciones de almacenamiento selectivas de hasta 1.500 Kg. (INDEC, 2010b, p.4-5) A continuación se especifican los volúmenes y la productividad en esta actividad: Volumen: ● 1.764 pallets IN + 1000 posiciones en I Flow; Capacidad definida de recepción x día: entre 150 y 200 pallets. (INDEC, 2010b, p.4-5) Productividad: ● Control y Clasificación 188 cajas x equipo x hora. ● Capacidad de movimiento de auto elevadores eléctricos 15 pallets x hora x equipo (INDEC, 2010b, p.4-5) b. Almacenamiento 1 del material censal (a la espera de reproceso): Una vez que fue emitida la etiqueta de identificación del pallet, se procede a la locación del mismo. Para esta actividad en donde el pallet tiene un estado de Retenido (dado que faltaba el acondicionamiento y reproceso de estas), se utilizaron las ubicaciones en las posiciones más bajas y accesibles del depósito. Esto hizo que un autoelevadorista pudiese tomar físicamente el pallet y procediera a almacenar el producto donde el sistema le indique, una vez posicionado, el operario con su colector de radiofrecuencia escaneaba el pallet y la posición 124 donde lo colocó para cerrar el proceso, y asegurarse que lo ubicó correctamente. (INDEC, 2010b, p.5) El almacenamiento del material censal 1, el cual estaba a espera del reproceso se llevó a cabo del 3 al 30 de noviembre de 2010 teniendo una duración de 20 días, los cuales se trabajaron en dos turnos de 8 horas cada uno. Para llevar a cabo esta actividad se requirió a autoelevadoristas y personal administrativo. Asimismo, el equipamiento necesario que fue utilizado durante el almacenamiento del material 1 fue 4 autoelevadores (2 eléctricos tipo Apiladora para 1.500 Kg.), 2 Zorras eléctricas, 6 Colectores de Radiofrecuencia (tipo HandHeld) y Rack con posiciones de almacenamiento selectivas hasta 1.500 Kg. (INDEC, 2010b, p.5-6). Por otra parte, tanto los volúmenes movidos como la productividad de esta actividad se detallan a continuación: Volumen movido: ● 1.764 pallets IN + 1000 posiciones en I Flow; Capacidad definida de recepción x día: entre 150 y 200 pallets. (INDEC, 2010b, p.5-6) Productividad: ● Almacenamiento de pallets: 15 pallets x hora x autoelevador. (INDEC, 2010b, p.5-6) Figura 13. Foto Almacenamiento 1 del material censal Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. 125 c. Armado y Acondicionamiento de cajas con cédulas censales: El armado y acondicionamiento de cajas con cédulas censales fue la tercera actividad del subproceso de preparación del material censal, el cual se llevó a cabo del 29 de noviembre de 2010 al 23 de mayo de 2011, trabajando en 2 turnos de 8 hs. De esta forma, el INDEC realizó controles del material censal al ingreso, antes del guillotinado (re acomodando el mismo y re encajándolo y/o re etiquetándolo). Para ello se le proveyó oficinas especialmente acondicionadas para tal efecto en el predio donde se desarrolló el proceso (BOLDT Panamericana). (INDEC, 2010b, p.6-7) Si bien se recibieron 330.000 cajas con material censal al momento del repliegue, no todas ellas contenían cuestionarios censales completados. Por una cuestión normativa y de organización, todo el material utilizado (y asimismo el que no se ha utilizado en el día del operativo censal) se devuelve en cajas, que son las mismas en las cuáles se guardan los cuestionarios completados. (INDEC, 2010b, p.6-7) Al llegar a la sede en la cual se realizará la captura de datos, se reemplazan cada una de las cajas que contienen las cédulas censales completas, y se desechan aquellas que traen material sin utilizar. Las cajas que traen planillas operativas se guardan, dado que servirán para realizar los primeros controles de consistencia de la información. Asimismo, las cajas se agrupan siguiendo el orden establecido por la cartografía censal, que como hemos mencionado anteriormente, se trata de segmento, radio, fracción, departamento, provincia. (INDEC, 2010b, p.6-7) Figura 14. Foto armado y acondicionamiento de cajas con cédulas censales Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. 126 En esta actividad de reemplazo y acondicionamiento de las cajas, se prepararon 270.000 nuevas cajas. Este trabajo fue realizado de manera integral por personal de la Dirección de Logística Operativa de INDEC. El personal del INDEC determinó que pallet se requiere para el rearmado según sus prioridades. (INDEC, 2010b, p.6-7). A continuación, se especifican las tareas que se realizaron para llevar a cabo esta actividad: ● Se abre la caja que contienen las cédulas censales. ● Se retiran las bolsas plásticas. ● Se determina si se usa la misma caja o una nueva. ● Se incorpora el material dentro de la caja pudiéndose almacenar más formularios dentro de la misma caja, además de incorporar las carátulas de caja y en algunos casos como R2 y R2F las de departamento. ● Se le incorpora la etiqueta del repliegue con la identificación de la provincia ● Se hace la lectura del nuevo Código de Barras. ● Cambio de estado lógico del pallet en el sistema (con alta o modificación de números o cantidades de cajas por el rearmado) Esto se realiza con el sistema de WMS WARP, y el estado en el que se transforma es: Apto G (lista para guillotinar) (INDEC, 2010b, p.6-7). De esta forma, todo el manejo In House del proceso fue manejado a través de un Sistema de Warehouse Management Sistems (WMS) denominado WARP específico para este tipo de Operatorias. El personal del INDEC entregó los pallets nuevos con las cajas rearmadas al depósito, estos pudieron tener dos destinos, de esta manera pudieron ir directamente a guillotinarse o fueron a un almacenamiento transitorio. En esta actividad se requirió a 4 equipos de 8 personas para el control y clasificación y a autoelevadoristas y personal administrativo. Como equipamiento necesario para realizar las diferentes tareas que hacen parte de esta actividad se utilizó 4 Autoelevador eléctrico (2 tipo Apiladora para 1.500 kg), 2 zorras manuales / eléctricas y 4 Colectores de Radiofrecuencia (tipo HandHeld). (INDEC, 2010b, p.7). Por otra parte, los volúmenes manejados durante esta actividad fueron los 48 pallets por día. De esta manera, la productividad de esta actividad fue de 90 cajas x equipo x hora (equivalente a 0,75 pallets). El cierre de la actividad del armado y acondicionamiento de cajas con cédulas censales se realizó 23 mayo de 2011 con un total de 268.698 cajas las cuales corresponden a los 533 127 departamentos de las diferentes provincias argentinas (Tabla 12). De esta forma se acondicionaron el 100 % de las cajas que llegaron a Buenos Aires. Tabla 12. Argentina. Estado de avance por provincia del armado y acondicionamiento de cajas con cédulas censales. 16 mayo de 2011 Fuente: Estados de situación en el proceso de captura de datos 2011 128 Tabla 13. Argentina. Porcentaje del armado y acondicionamiento de cajas con cédulas censales por Provincia. Del 1 de marzo al 26 mayo de 2011 Fuente: Estados de situación en el proceso de captura de datos 2011 En la Tabla 13 se observa la evaluación de la actividad de armado y acondicionamiento de cajas con cédulas censales desde el 1 de marzo al 23 mayo de 2011, fecha en que esta actividad finalizó en su totalidad. La gran mayoría de las cajas fueron acondicionadas hasta el 5 de enero de 2011 pero algunos remanentes se recibieron hasta el 16 mayo, fecha en que se completó el inventario de cajas. Para el 1 de marzo se tenía armado y acondicionado el 59,6% de las cajas a nivel nacional. Para esa fecha las provincias de Catamarca, La Pampa y Santiago del Estero ya se habían 129 completado. Para el 15 y 31 de marzo el total de país en esta actividad estaba en un 72% y el 85% respectivamente, completándose el 100% del armado y acondicionamiento en las provincias de la Rioja y Capital Federal, Córdoba, Corrientes, Mendoza, San Juan y Santa fe. El 15 de abril el porcentaje en armado y acondicionado era de 98,6%, completándose las provincias del Chaco, Chubut, Entre Ríos, Jujuy, Neuquén, Salta, Santa Cruz y Tucumán. El 16 de mayo se llegó casi al 100, completándose todas las provincias menos el resto de Buenos aires para ser finalmente completado todo el país. Al analizar la actividad por regiones se observa que las provincias del NOA, NEA, la región pampeana y Cuyo se completaron completamente el 15 de abril mientras que el Gran Buenos Aires y la Patagonia la mayoría fue completada el 16 de mayo, siendo las últimas provincias en armarse y acondicionarse. d. Reelaboración de cédulas censales Esta actividad estuvo a cargo de BOLDT y se realizó hasta mediados del mes de mayo de 2011. El equipo de reelaboración recibe los materiales censales con problemas descubiertos a partir de las actividades de escaneado. A partir de la revisión y corrección de los errores detectados los materiales reingresan a la instancia de escaneado para la consolidación de la información. En esta actividad trabajaron 30 personas en turno diurno y nocturno, con una carga promedio de 10 cajas por día (INDEC, 2011). El personal que desempeñaba esta actividad llevaba a cabo las siguientes tareas: ● Reposición de hojas faltantes en los cuestionarios ● Traspaso de los datos de cédulas con marcas ilegibles. ● Verificación de coincidencia y corrección entre los números de caja, caratula y cédulas censales 130 Figura 15. Foto reelaboración de cédulas censales Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. El personal que realizó esta actividad trabajó en un espacio cercano al escaneo que presentaba características adecuadas para llevar adelante las tareas previstas. En este ámbito complementario se llevarían adelante solo las tareas de reposición de hojas faltantes en los cuestionarios y traspaso de los datos de cédulas con marcas ilegibles para el escáner. El personal incorporado para realizar esta actividad recibió capacitación general respecto a operativos censales y se reforzó con actividades permanentes de supervisión y consultas. Del 3 de marzo al 17 de mayo de 2011 se reelaboraron 46 cajas con cédulas censales de 12 provincias, 38 departamentos y 46 fracciones como se especifica en la siguiente tabla. Tabla 14. Cajas con formularios reelaborados por provincia Fuente: Elaboración propia 131 e. Guillotinado de cuestionarios: El Guillotinado se llevó a cabo después del intercambio de cajas y de su ordenamiento según la cartografía. Esta actividad inició en el mes de noviembre de 2010 y terminó el 26 de mayo de 2011. De esta manera, se procedió a guillotinar cada cuestionario censal, de manera que quedará ordenado en hojas separadas, para poder posteriormente escanearlo. Este es un procedimiento de extremo cuidado, dado la cantidad y el volumen de la información, a lo que se le suma el correcto uso de la guillotina, dado que un corte descuidado haría perder información valiosa y confidencial. (INDEC, 2010b, p.7). En función del detalle de cada provincia y por departamento se corren pedidos en el Sistema WMS WARP para el envío ordenado del material a esta actividad donde mediante un corte serán separados los distintos formularios y reacomodados en sus cajas. Esta actividad se llevó a cabo siempre por pallet completo; asimismo se le realizó un cambio de estado lógico, pasando de Apto G a Disponible (listo para escanear). Esto permitió la disposición de los mismos para enviarlo al subproceso de escaneo. Una vez que se prepararon los pallets, estos pudieron tener dos destinos, ir directamente a la zona de captura (escáner) o volver a las estanterías. (INDEC, 2010b, p.7) Figura 16. Foto Guillotinado Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. En esta actividad se requirió autoelevadoristas, preparadores de pedidos, controladores y personal administrativo. Igualmente, para llevar a cabo las tareas relacionados con esta actividad se utilizó 2 Zorras eléctricas, 4 Autoelevador (2 eléctrico tipo Apiladora para 1.500 kg), 2 Equipos de guillotinado, Colectores de Radiofrecuencia (tipo HandHeld) y Rack con posiciones de almacenamiento selectivas hasta 1.500 kg. La productividad de esta actividad se midió por capacidad de armado la cual fue de 137 cajas x hora y por capacidad de 132 movimiento de autoelevadores eléctricos, la cual fue de 15 pallets x hora x equipo. (INDEC, 2010b, p.7). f. Almacenamiento 2 y preparación del material liberado (a procesar): El almacenamiento del material liberado (a procesar) se desarrolló entre el 29 de noviembre y el 23 de mayo de 2011, constando de 2 turnos cada uno de 8 horas. Una vez leída la etiqueta de pallet se procedió a la ubicación del mismo. Operativamente este proceso consistió en escanear la etiqueta del pallet y posicionarlo. Luego se bajaba la información al sistema. (INDEC, 2010b, p.7-8) Para llevar a cabo esta actividad se requirió de autoelevadoristas y personal administrativo, así como de 4 Autoelevadores (2 eléctricos tipo Apiladora para 1.500 kg), 2 Zorras eléctricas, 4 Colectores de Radiofrecuencia (tipo HandHeld) y Racks con posiciones de almacenamiento selectivas hasta 1.500 kg. (INDEC, 2010b, p.8). Esta actividad manejó volúmenes de 12 pallets por día y la productividad se midió por almacenamiento de pallets, el cual fue de 15 pallets x hora x autoelevador, y por capacidad de movimiento de autoelevadores eléctricos, que fue de 15 pallets x hora x equipo. (INDEC, 2010b, p.8) Figura 17. Foto almacenamiento 2 y preparación del material liberado Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. 133 Monitoreo de las actividades de los subprocesos de Repliegue y Preparación del material censal: Control de la segmentación mediante el software SAYCO La Dirección de Informática de INDEC, en conjunto con el departamento de cartografía diseñó un software mediante el cual fue posible realizar un control exhaustivo sobre la cantidad de segmentos (unidad desagregada menor de la cartografía censal) en cada radio, radios en fracciones y así sucesivamente. Esto con el fin de tener un control preciso y conciso de que tanto la Dirección Provincial de Estadística, como los subprocesos de repliegue y preparación a cargo del Correo Argentino, hicieran llegar el material correspondiente, y de que no se encontraran faltantes. El SAYCO tuvo su primera versión en el Censo 2001, desarrollado íntegramente por la Dirección de Informática del INDEC. Luego se mejoró y se actualizó para ser utilizado durante el Censo 2010. En líneas generales abarca todo el monitoreo logístico, desde la producción de cajas con cédulas censales y lotes (conjunto de cajas), con su respectiva numeración y ubicación geográfica, hasta su devolución durante el proceso de repliegue, y su reacondicionamiento. Fue sumamente importante su utilización en la logística del operativo, para poder contar con información precisa de la ubicación de todos los materiales, de todas las piezas que conforman los materiales censales. Esta aplicación contaba de los siguientes módulos:  Control de Calidad de Impresión de los Cuestionarios Censales: Permitía supervisar el grado de avance de la producción y recepción de las cédulas censales y demás documentos que fueron utilizados en la captura de los datos completados por los censistas e identificaba aquellos lotes de producción que no reunían los requerimientos mínimos necesarios del relevamiento en campo y/o del software del proceso de captura.  Distribución de los materiales para el operativo en campo: Facilitaba los instrumentos para registrar el despacho desde el centro logístico del INDEC y la correspondiente recepción en los destinos determinados en cada provincia, de la totalidad de los materiales utilizados en operativo censal, dando seguimiento y detectando eventuales irregularidades en alguna jurisdicción, posibilitando su pronta reparación. 134  Monitoreo del avance del operativo en campo: Brindaba los medios pertinentes a fin que el día del Censo, cada Censista registrara la información resumida del producto de su trabajo cumplimentado en campo, de modo tal de conocer en forma actualizada el progreso del relevamiento a nivel total país, provincia, departamento, fracción o radio, conforme los permisos otorgados por la autoridad competente para acceder a la información pertinente.  Acondicionamiento, entrega al Centro de Captura y posterior recepción de los cuestionarios completados por los censistas: Proporcionó las facilidades para registrar el rearmado del material remitido por cada jurisdicción, una vez finalizado el relevamiento, y el acondicionado del lote físico apto para su captura, identificando los datos del continente y contenido de la unidad de lectura. Permitió realizar los reclamos pertinentes ante eventuales faltantes de material. Registró el movimiento de los lotes de captura entre el INDEC y el Centro de Captura, posibilitando la supervisión de la logística del flujo y ubicación del material censal.  Control de Calidad de captura: Proveyó los recursos necesarios para identificar aquellos lotes de captura cuyos datos no alcanzaban los requerimientos mínimos de calidad establecidos por el Instituto, a los efectos de su pronto reproceso y corrección.  Control de la Completitud de la información resultante del proceso de captura: Suministró las herramientas apropiadas a los efectos de garantizar que los datos censales producto del relevamiento y posterior procesamiento en el Centro de Captura, hayan sido validados a la ubicación geográfica adecuada, conforme lo previsto en las correspondientes tablas cartográficas, detectando y corrigiendo eventuales inconsistencias.  Generación de las bases de datos a nivel provincia/departamento completo: Posibilitó generar las bases de datos a nivel provincia/departamento completo, una vez cumplimentados los procesos de control de calidad y completitud de captura, a utilizar como insumo en los procesos de análisis de calidad y edición de los datos, y tabulación de la información del Censo.  Pago a los integrantes de la estructura censal: Facilitó los mecanismos adecuados para la gestión y el control del pago a la totalidad de los integrantes de la estructura censal, acorde a la función desempeñada. 135 No se ha podido encontrar un registro preciso sobre la cantidad de material faltante en esta etapa, pero en líneas generales fue mínima, y se reclamó oportunamente y el reclamo resultó satisfactorio. Se trató en general de personas censadas fuera de término, cuya información llegó posteriormente. En términos porcentuales no llegaría ni al 1% de la población total. Figura 18. Foto control de la segmentación mediante el software SAYCO Fuente: Censo Nacional de Población y Viviendas 2010 - INDEC. 5.3.3.3 Escaneo: La metodología censal tiene una vinculación directa con respecto a la captura de datos. No sería prudente, por ejemplo, pensar en un Censo de hecho utilizando DCM (Dispositivos de Captura Móvil), por la sencilla razón de que la cantidad de censistas necesarios para el relevamiento en un solo día elevaría enormemente los costos económicos para la obtención de los DCM. Dado que el Censo 2010 fue un censo de hecho que se realizó en un día, se optó por un proceso de captura mediante escaneo de marcas (OMR) y reconocimiento de caracteres (ICR). A continuación, se especifican las actividades de digitalización y Reconocimiento e interpretación de campos que hacen parte de este subproceso: a. Digitalización del material censal Esta actividad se llevó a cabo entre el 29 de noviembre de 2010 y el 26 de mayo de 2011, en dos turnos de 8 horas. (INDEC, 2010b, p.8). A medida que van saliendo las cajas con material censal del guillotinado, se enviaban los pallets a la zona de escaneo, emitiendo la documentación necesaria (hoja de transferencia del sistema / remito). Dicho depósito se encontraba separado del almacenamiento y contaba con un sector para la guarda de los pallets a procesar. Es oportuno aclarar que los pallets debían entrar completos y no salir de este sector hasta no estar 100% procesados. Sin embargo, como se explicará en el Capítulo 6, una 136 ínfima cantidad de cajas que no habían sido escaneadas en su totalidad por errores humanos, trajo muchos inconvenientes y retrasos. En líneas generales, una vez acondicionado todo el material censal (cambio de caja, etiquetado, guillotinado, control mediante el software SAYCO para verificar material faltante), se agrupaban las cajas en pallets. Cada pallet contenía alrededor de 40 cajas, que aproximadamente se trata de un segmento censal. Cada caja admitió un máximo de 400 hojas de papel. A partir de ese momento el material estaba preparado para el escaneo. A partir de este momento, y hasta finalizar el proceso de escaneado, la Unidad de Control estuvo conformada aproximadamente por un pallet. Para llevar a cabo esta actividad se necesitó la participación de autoelevadoristas, dos personas para control y bajada de pallets y dos administrativos, uno por turno. Por otro lado, con relación al equipamiento se requirieron dos autoelevadores, dos zorras eléctricas y cuatro Colectores de Radiofrecuencia (tipo HandHeld). A partir de estos insumos, se manejaron volúmenes de 2.200 pallets / Capacidad definida de lectura x día: 30 pallets. (INDEC, 2010b, p.8) La productividad de esta actividad se midió por la capacidad de movimiento de autoelevadores eléctricos, los cuales fueron de 15 pallets x hora x equipo, y por la capacidad de escaneo, la cual fue de 30 pallets al día. (INDEC, 2010b, p.8) . La digitalización estuvo a cargo de la empresa BOLDT, y en líneas generales contó con los siguientes insumos a saber: ● 22 escáneres de alta velocidad. ● Velocidad de lectura de 90 hojas por minuto (180 imágenes por minuto). ● 3 mil millones de caracteres leídos. ● 183 millones de imágenes escaneadas. La velocidad de los escáneres era superior a 80 hojas o 160 imágenes por minuto, en modo dúplex, papel tamaño oficio y orientación vertical, con una definición de 200 dpi. Capturaban de manera simultánea de anverso y reverso de cada hoja y tenían un funcionamiento continuo durante 8 horas sin necesidad de paradas para mantenimiento con un ciclo de producción diario mayor a 70.000 hojas. Se realizaban paradas para mantenimiento diario inferiores a 1 hora. (INDEC, 2010a, P 2). Asimismo, el escaneo contaba con un sistema de monitoreo del flujo de procesamiento que monitoreaba el flujo de trabajo para asegurar un procesamiento seguro y ordenado de los lotes de documentación, el cual permitió visualizar las distintas colas de trabajo y posibilite la reasignación de prioridades (INDEC, 2010ª, P 3). Para dimensionar este proceso de captura de datos, a modo ilustrativo se exponen los volúmenes de impresión 137 de materiales físicos a escanear en la Tabla 15. Tabla 15. Volúmenes de impresión y cantidad proyectada a capturar de material censal Fuente: INDEC, Especificaciones técnica de la Impresión de cuestionarios, captura de datos y provisión de materiales y servicios conexos para el Censo Nacional de Población, Hogares y Viviendas del año 2010 El cierre del escaneo de cédulas censales de todos los departamentos de las diferentes provincias argentinas se realizó 26 mayo de 2011 (Tabla 16). De esta forma, se escanearon el 100 % de las cajas que llegaron a Buenos Aires. 138 Tabla 16. Argentina. Estado de avance por provincia del escaneo. 26 mayo de 2011 Fuente: Elaboración propia sobre el estado de situación en el proceso de captura de datos 2011 En la Tabla 17 se observa la evaluación de la actividad de digitalización de las cédulas censales desde el 1 de marzo al 26 mayo de 2011, fecha en que esta actividad finalizó en su totalidad. Se observa que para el 1 de marzo el 50,6% de las cajas del país estaba escaneadas, habiendo finalizado este subproceso las provincias de Catamarca, La Pampa y Santiago. Por otra parte, para el 15 y el 31 de marzo las cajas a nivel nacional se habían digitalizado en un 60,9% y 79,4% respectivamente, terminando este subproceso para esas fechas las provincias de la Rioja, Córdoba, Corrientes, Mendoza y San Juan. Para el 15 de abril el subproceso de escaneo estaba en un 94,9%, habiendo finalizado la digitalización Santa fe y Tucumán, mientras que el 16 de mayo el subproceso estaba en 99,7%con la mayoría de 139 las provincias con el material escaneado a excepción de Rio Negro y Salta, las cuales se terminaron de completar días después, el 26 de mayo. Tabla 17. Argentina. Porcentajes del escaneo de cajas con cédulas censales. Del 1 de marzo al 16 mayo de 2011 Fuente: Elaboración propia sobre el estado de situación en el proceso de captura de datos 2011 140 Al analizar la información de las provincias por regiones se observa que la primera región que escaneó el material censal fue la de Cuyo el 31 de marzo, mientras que para el 15 de abril se terminaron las provincias del NOA y la región Pampeana. Por otra parte, NEA y Gran Buenos Aires terminaron este subproceso el 16 de mayo. Finalmente, La Patagonia cerró el escaneo el 26 de mayo, siendo la provincia de Rio Negro la última provincia en completar la digitalización. b. Reconocimiento e interpretación de campos El reconocimiento e interpretación de campos se realizó a través del software de reconocimiento y lectura de códigos de barra. De esta forma se extraen los datos de las imágenes de los cuestionarios censales y con esa información se construye una base de datos inicial que fue posteriormente procesada. Para el reconocimiento óptico de caracteres, se aplicaron los siguientes programas: ● ICR (Reconocimiento Inteligente de Caracteres): Esta tecnología proporciona la habilidad de convertir caracteres en letra manuscrita (no cursiva) en caracteres capaces de ser interpretados o reconocidos por una computadora. Así, las imágenes de caracteres en letra manuscrita son extraídas de un mapa de bits de la imagen reproducida por el escáner. ● OCR (Reconocimiento óptico de Caracteres): El OCR proporciona la habilidad de convertir imágenes de caracteres en letra de máquina, en caracteres capaces de ser interpretados o reconocidos por una computadora. Así, las imágenes de caracteres en letra de máquina son extraídas de un mapa de bits de la imagen reproducida por el escáner. ● OMR (Lectura Óptica de Marcas): Este programa detecta la ausencia o presencia de una marca. ● Lectura de Código de Barras. Asimismo, se disponía de funciones de identificación automática de cada uno de los diseños de las páginas del documento. Se aplicaban mecanismos de corrección automática de caracteres mal o no reconocidos con la ayuda de diccionarios, configurables conforme la característica de cada campo, ya sea por parámetros o por código. (INDEC, 2010ª, P 2-3) Con respecto al tratamiento de imágenes, los escáneres realizaban la compresión y el agrupamiento de múltiples imágenes y tenían el empleo del sistema Drop Out o de 141 herramientas de software para eliminar los contornos de las cajas y cuadrículas de los datos de las imágenes (INDEC, 2010ª, P 2-3) Con respecto a la calidad de la captura se establecieron tasas mínimas de reconocimiento con Corrección Automática de Caracteres en campos alfabéticos, con el fin de lograr una mejor digitalización de la información (INDEC, 2010ª, P 3), así como una tasa máxima de error Final, a nivel campo completo, las cuales se presentan a continuación en la siguiente tabla: Tabla 18. Tasas mínimas de reconocimiento con Corrección Automática de Caracteres en campos alfabéticos proyectadas Fuente: INDEC, Especificaciones técnica de la Impresión de cuestionarios, captura de datos y provisión de materiales y servicios conexos para el Censo Nacional de Población, Hogares y Viviendas del año 2010 5.3.3.4 Verificación En este subproceso se revisa la calidad y cobertura del material censal escaneado realizando diferentes actividades que permiten garantizar que la información censal sea óptima, para el posterior análisis llevado a cabo por el equipo de diseño conceptual. A continuación, se detallan las actividades del subproceso de verificación. a. El proceso de Grabo verificación: La actividad inmediata posterior al escaneo es la graboverificación y se llevó a cabo entre el 2 febrero y el 26 de mayo de 2011. Esta actividad estuvo a cargo exclusivamente de personal contratado por la empresa BOLDT. Para ello contrató a cerca de 200 ingresadores de datos, los cuáles trabajaron en turnos rotativos. La metodología de trabajo es la siguiente: la tarea (a diferencia del control de calidad) se realiza de manera individual, leyendo los caracteres contenidos en los cuestionarios (variables abiertas/de escritura como edad, migración o situación laboral) que fueron completados por los censistas de manera poco legible, o no respetando la letra imprenta mayúscula indicada en la capacitación. 142 Para comprender mejor este subproceso, debe pensarse que no es posible (aún en el siglo XXI) que un escáner de última generación, sea capaz de interpretar sin dificultad y por sí solo, la caligrafía de 650.000 censistas. Si bien en las capacitaciones llevadas a cabo semanas antes del operativo censal, se hizo especial énfasis en el tipo de letra para completar el cuestionario, lo mismo en el rellenado de las burbujas, aún en condiciones óptimas los escáneres presentaron dificultades que se detallarán oportunamente en el capítulo siguiente, y que estuvieron relacionadas con el completamiento de los cuestionarios en campo, como así también con el proceso de escaneo. El proceso de graboverificación se realizó de forma manual, y necesitó del entrenamiento de personal que sea capaz de leer e interpretar los caracteres (palabras) de aquellas imágenes que el ICR no fue capaz de interpretar. Cómo se ha detallado más arriba, durante el Censo 2010, cerca de 200 operarios contratados por la empresa BOLDT, corrigieron manualmente los caracteres que no fueron interpretados por las lectoras de los escáneres. Los porcentajes de cantidad de cuestionarios que debieron pasar por el proceso manual de graboverificación fue variable. Hubo días que un 15% de las imágenes escaneadas pasó a graboverificación, y otros en que este porcentaje no alcanzó el 3%. Las variaciones porcentuales tienen motivos ajenos al proceso de captura (censista con letra ilegible, por ejemplo), y otros que son propios del proceso de captura de datos (desgaste del escáner, por ejemplo). Pero los porcentajes más significativos, estuvieron asociados a inconvenientes propios del proceso de captura de datos, como se verá más adelante. b. Control de Calidad del Escaneo: El Control de Calidad del Escaneo estuvo a cargo de personal del INDEC, y se llevó a cabo a partir del 2 de febrero hasta el 26 de mayo de 2011. Fue diagramado por la Dirección de Metodología Estadística, la cual seleccionó una muestra de los cuestionarios escaneados, de manera que fuese posible controlar que la base de datos creada fuese fiel a la imagen obtenida. Esta muestra contempla una cantidad porcentual máxima de errores de escaneo, en relación con la cantidad de variables del cuestionario censal. Si la cantidad de errores supera el umbral máximo de error tolerado, se rechaza el lote completo de material escaneado, y se vuelve a escanear todo ese lote. Un “lote” poseía entre 40 y 60 cajas con cuestionarios. Cada caja admitía aproximadamente hasta 400 hojas con información censal. 143 Metodología de trabajo del equipo de Control de Calidad: Desde INDEC se conformó un equipo de 50 operarios y 2 supervisores que efectuaron las tareas de control durante los 4 meses que demoró este operativo. Se trabajó conformando 25 parejas. Mientras un operario observaba la imagen escaneada en un visualizador de imágenes, otro operario observaba la marca o los caracteres en la base de datos. Ambas marcas o caracteres debían coincidir en las variables seleccionadas por la muestra. Un esquema de trabajo similar al desarrollado en el Censo 2001. La producción diaria de control de imágenes escaneada necesitaba de un trabajo informático constante y sincronizado entre la empresa BOLDT y la Dirección de Informática de INDEC. Cada lote escaneado y aprobado por BOLDT debió exportarse desde un servidor informático de la empresa, a otro ubicado en la misma planta de producción, pero que pertenecía a INDEC. Desde ese servidor de INDEC se proveyó al equipo de Control de Calidad, los lotes diarios para su control, y su posterior aprobación o desaprobación de los mismos. Una vez aprobado un lote pasaba inmediatamente a la etapa siguiente, es decir al equipo de Control de Completitud. El Censo 2010 generó aproximadamente 280.000 cajas con material censal. A modo comparativo el Censo 2001 tuvo 215.000 cajas; esta diferencia (además de la cantidad de personas) puede deberse a una nueva disposición en el Censo 2010 con relación a la cantidad de cuestionarios por caja. La misma se redujo buscando preservar las condiciones del papel, y agilizar el escaneo del material. Cada lote contenía aproximadamente 60 cajas con cuestionarios censales. 280.000 / 60 = 4667 lotes (o unidades de control). Una pareja de operarios era capaz de controlar un mínimo de 4 lotes diarios, trabajando con una carga horaria de 8 horas. Los rechazos del material escaneado tuvieron un promedio del 15% diario. De todas maneras, fue muy variable durante el proceso y difícil de predecir. Al principio fueron porcentajes de rechazo muy altos, vinculados con diversos ajustes de los escáneres y demás; y con el correr de los días ese porcentaje tendió a bajar y mantenerse estable en los dos meses centrales del 144 proceso de captura. Cerca del final del proceso volvió a elevarse el nivel de rechazos, producto del enorme desgaste de los escáneres. Sobre esto se hablará más adelante. La producción de este equipo de trabajo fue variable y dependiente de la velocidad de captura. Las variaciones productivas se debieron a qué no siempre la empresa BOLDT proveyó diariamente la cantidad de lotes escaneados pautados con antelación. Asimismo, en un principio INDEC tuvo inconvenientes con su propio servidor. Y por último el visualizador de imágenes utilizado para realizar el control, mostró innumerables inconvenientes técnicos, que debieron ser solucionados a lo largo de todo el proceso. Asimismo, más adelante se detallan los errores más comunes que detectó este equipo a lo largo del proceso, y algunas modificaciones necesarias, para agilizar el trabajo; por ejemplo, a los escáneres le fue sumamente complejo interpretar todos los nombres de calle, dado que las mismas poseían un código que las identificaba como tal, por ende, se decidió quitar el nombre de calle de la muestra para agilizar el proceso de captura de datos. Esto se adelanta a modo de ejemplo, ya que se desarrollarán estos inconvenientes en el capítulo siguiente. 145 Tabla 19. Argentina. Estado de avance por provincia del control de calidad. 26 mayo de 2011 Fuente: Elaboración propia sobre el estado de situación en el proceso de captura de datos 2011 El cierre del control de calidad de todos los departamentos de las diferentes provincias argentinas se realizó 26 mayo de 2011 (Tabla 19). Si bien los inconvenientes se detallan en el capítulo siguiente, es preciso aclarar en este punto que, durante el proceso de captura, la empresa BOLDT extravió 4 (cuatro) cajas (en color rosado en la Tabla 19). Según la empresa el personal de Logística no las había entregado, y según Logística sí lo habían hecho, además de reconfirmarlo mediante los registros del SAYCO. De esta forma, para esa fecha Control de 146 Calidad aprobó 268.694 cajas (de un total de 268.698 cajas armadas por Logística) quedando 4 cajas faltantes en las siguientes provincias a las que se le detectaron la Fracción, el Radio y los segmentos: ● Río Negro: (una caja) Departamento 042. - Fracción 42 - Radio 02 - Segmentos 10 y 11. ● Mendoza: (una caja) Departamento 126 - Fracción 03 - Radio 16 - Segmento 92. ● Buenos Aires: (una caja) Departamento 805 (Tigre) - Fracción 06 - Radio 09 Segmentos 04-05-06 y 07. ● Resto Buenos Aires: (una caja) Departamento 056 (Bahía Blanca) - Fracción 12 - Radio 11 - Segmentos 01 y 02. Estas 4 cajas pasaron a formar parte del material faltante y se resolvió apoyándose en la información de planillas operativas. En la Tabla 20 se observa la evaluación de la actividad del control de calidad de las cédulas censales está desde el 1 de marzo al 26 mayo de 2011, fecha en que esta actividad finalizó en su totalidad. Para el 1 de marzo esta actividad estaba en un 19,4% a nivel nacional, mientras que para el 15 de marzo este porcentaje aumentó a un 36%. Para esta última fecha finalizó el control de calidad la provincia de la pampa siendo la primera provincia en culminar esta actividad. Posteriormente, para el 31 de marzo y 15 de abril pasó el control de calidad en el país de 56,8% a 82,3%, habiendo finalizado esta actividad en estas fechas las provincias de Corrientes, La Rioja, Catamarca y San Juan. Por otra parte, el 16 de mayo el porcentaje nacional de control de calidad estaba en un 97,9%, fecha en que las provincias de San Luis, Santiago y Tierra del Fuego habían terminado esta actividad. Finalmente, para el 26 de mayo todas las provincias habían finalizado el control de calidad. 147 Tabla 20. Argentina. Porcentajes del control de calidad de las cajas con cédulas censales. Del 1 de marzo al 16 mayo de 2011 Fuente: Estados de situación en el proceso de captura de datos 2011 c. Reescaneo Esta actividad se llevó a cabo del 2 de febrero al 26 de mayo de 2011. Está íntimamente relacionada con el Control de Calidad llevado a cabo por el personal de INDEC. En todos aquellos casos que la imagen escaneada no coincidía con lo registrado en la base de datos, 148 Control de Calidad rechazaba ese lote de cuestionarios escaneados, y la empresa BOLDT procedía a reescanear todo el lote completo. Si bien la empresa BOLDT no informó porcentajes de lotes a reescaneo, es posible reconstruir esta información, calculando los rechazos informados por el subproceso de Control de Calidad, qué estuvo a cargo del INDEC, y que presenta un registro fiable, diario y preciso de la cantidad de rechazos. Pudo haber otros motivos por los cuáles la empresa BOLDT decidió reescanear cédulas censales, pero en este caso, no es posible reconstruirlo, ni se considera que tenga un impacto relevante en los subprocesos que se vienen describiendo. d. Control de Completitud de los Resultados Esta actividad se comenzó a realizar en el mes de marzo de 2011 y terminó a finales del mes de junio. Al igual que el Control de Calidad, esta instancia estuvo a cargo del INDEC. Fue diagramado por la Dirección Nacional de Estadísticas Sociales y de Población, y el departamento de Cartografía. El número de integrantes de este equipo de trabajo fue variando de acuerdo a la demanda de trabajo, que está directamente vinculada con el control de calidad. Pero en promedio estuvo conformado por 30 personas. A diferencia del control de calidad, el trabajo de completitud (palabra que no existe y cuya conjugación queda a cargo de quién la utiliza) se realizó de manera individual. Se trabajó a nivel segmento, o sea que se evaluó el trabajo de cada censista. El análisis a nivel de segmento censal permitió garantizar la completitud de la captura. Este Control posee 2 instancias que se retroalimentan. 1. Control cartográfico 2. Comparación de los resultados obtenidos en las planillas resumen del Jefe de Radio, denominada R2 (la misma planilla con la cual se realizaron los resultados provisionales). De esta manera el Control de Completitud inspecciona que no haya material faltante, y que todo esté debidamente escaneado. Y para ello utiliza insumos censales, como se ha dicho la planilla R2, a lo que también se suma la carátula del censista. 149 El control de completitud incluía una aplicación que permitía controlar las diferencias entre cuestionarios y carátulas de segmento. Este aplicativo fue de gran utilidad para poder anticipar a las etapas siguientes (CANCEIS y Diseño Conceptual) si existían diferencias significativas en el número de personas. (INDEC, 2011) Tabla 21. Argentina. Porcentajes del control de completitud de cajas con cédulas censales. Del 1 de marzo al 16 mayo de 2011 Fuente: Elaboración propia sobre el estado de situación en el proceso de captura de datos 2011 En la Tabla 21 se observa la evaluación de la actividad de control de completitud de las cédulas censales desde el 1 de marzo al 26 mayo de 2011. Para el 11 de abril esta actividad a nivel nacional estaba en un 15,7% habiéndose culminado las provincias de La Pampa y La Rioja. Posteriormente, el control de completitud pasó de 18,8% a 51,2% del 15 de abril al 16 mayo respectivamente, finalizando en estas fechas las provincias de Catamarca, San Juan y Tierra del Fuego. El 31 mayo el control de completitud del total país estaba en un 66,8%, mientras 150 que para el 15 de junio este porcentaje estaba en un 87,3%, habiendo terminado en estas fechas esta actividad las provincias de Corrientes, Santiago, Jujuy, Misiones, Salta y Santa Cruz. Finalmente, para el 21 de junio el proceso de completitud del país estaba en un 94,9% y casi todas habían pasado por esta actividad a excepción de CABA, Buenos Aires, Chaco, Córdoba, Formosa y Santa Fe, las cuales la finalizaron en días posteriores. De esta forma, las provincias de las regiones de NOA, Patagonia y Cuyo finalizaron el control de completitud, el resto de las regiones lo culminaron posteriormente. Para esta misma fecha, el control de completitud había aprobado a 500 de los 527 departamentos de las diferentes provincias argentinas. Esta actividad se cerró días posteriores a esta fecha. 5.3.3.5 Salida Después del control de completitud se procedió a armar la base de datos sucia, la cual fue enviada al equipo de diseño conceptual del INDEC para realizar la edición de la información censal mediante el software canadiense CANCEIS. Asimismo, se hizo el retorno de pallets con las cajas conteniendo material censal escaneado y se las envió a un depósito final (Almacén Definitivo). El proceso de captura hasta la generación de la base sucia para ser consistida duró aproximadamente ocho meses. Sin embargo, a medida que se concluían provincias se enviaban al área de Diseño Conceptual para la edición de datos y así continuar el circuito hasta llegar a la publicación de la información. El equipo de Diseño Conceptual comenzó el proceso de análisis de calidad y consistencia de los datos, trabajando cada provincia por separado. Esta metodología estuvo orientada a lograr acortar los tiempos de publicación de los resultados definitivos. De todas maneras, la publicación de los datos definitivos no se realizó hasta completar el proceso de edición de los datos en cada una de las 24 provincias del país, y poder obtener finalmente la base de datos consistida para el total del país. 151 Monitoreo de los subprocesos de Escaneo, Verificación y Salida: El tablero de control de las imágenes escaneadas El tablero de control es una herramienta creada y completada por BOLDT para hacer seguimiento de las imágenes escaneadas, así como de diversas actividades y tareas del subproceso de escaneo (Figuras 19 y 21). Este instrumento era una planilla de excel que el personal de BOLDT iba actualizando mientras transcurrían las actividades del subproceso de preparación y de escaneo. La primera hoja tenía el control de las imágenes captadas desde el mes de diciembre hasta el mes de mayo, cuando finalizó el subproceso de escaneo. En ella se anotó el total de imágenes esperadas por captar y hacía una comparación entre lo esperado y lo real (Figura 19). Figura 19. Tablero de control – Imágenes – Censo 2010 Fuente: Tablero de control BOLDT 152 A continuación, se observa en la Figura 20 la evolución por semana de las imágenes capturadas desde la semana del 16 de diciembre de 2010 a la del 23 de mayo de 2011. En esta gráfica se ve una pendiente que va incrementándose hasta lograr el total de imágenes captadas. Figura 20. Argentina. Evolución de las imágenes capturadas. Diciembre de 2010-Mayo 2011 Imágenes Acumuladas 250,000,000 200,000,000 150,000,000 100,000,000 50,000,000 Del 16/12/10 al 07/01/11 del 10 al 14/01 del 17 al 21/01 del 24 al 28/01 del 31/01 al 04/02 del 07 al 11/02 del 14 al 18/02 del 21 al 25/02 del 28/02 al 04/03 del 07 al 11/03 del 14 al 18/03 del 21 al 25/03 del 28/03 al 01/04 del 04 al 08/04 del 11 al 15/04 del 18 al 22/04 del 25 al 29/04 del 2 al 6/05 del 9 al 13/05 del 16 al 20/05 del 23 al 27/05 0 Fuente: Tablero de control BOLDT Por otro lado, también hacían seguimiento del avance por provincia de las cajas entregadas por logística (Figura 21). En ella presentan la evolución del control de calidad que BOLDT hacia las cajas. Asimismo, en otra página se encuentra el detalle de las tareas realizadas por esta empresa por día y por provincia. A continuación, se presenta una hoja resumen de estas páginas: 153 Figura 21. Tablero de control - Provincias Fuente: Tablero de control BOLDT En la Figura 22 se muestra la evolución de dos tareas realizadas por BOLDT con respecto a las cajas entregadas y aprobadas. En ellas se observa el incremento de producción a través del tiempo, siendo superior en una primera instancia las cajas totales entregadas que las aprobadas y para el final del periodo, empezar a equipararse (Figura 22). 154 Figura 22. Acumulado de cajas totales entregadas y cajas aprobadas 300000 250000 200000 150000 100000 50000 Cajas Totales entregadas 19 de mayo 5 de mayo 12 de mayo 28 de abril 20 de abril 6 de abril 13 de abril 30 de marzo 21 de marzo 14 de marzo 03 de marzo 24 de febrero 17 de febrero 3 de febrero 10 de febrero 27 de enero 20 de enero 4 de enero 13 de enero 0 Cajas aprobadas por QA Fuente: Tablero de control BOLDT 5.3.4 Cronograma del proceso de captura En la planificación del cronograma tomó como eje central, acortar la distancia entre el relevamiento censal y la presentación de los resultados censales. En general el subproceso de repliegue y las primeras actividades del subproceso de preparación de material (control y clasificación de material censal ingresado y almacenamiento 1 del material censal) se llevaron a cabo entre el 3 y el 30 de noviembre de 2010. Por otro lado, las actividades de armado y acondicionamiento, reelaboración de cédulas censales, guillotinado y almacenamiento 2, se llevaron a cabo entre el 29 de noviembre de 2010 y el 23 de mayo de 2011. De manera paralela, el escaneo se realizó a partir del 29 de noviembre de 2010 y finalizó el 26 de mayo de 2011 (Figura 23). La graboverificación, el control de calidad y el re-escaneo iniciaron a inicios del mes de febrero de 2011 y finalizaron el 26 de mayo del mismo año. Finalmente, el control de completitud se inició también marzo y finalizó en el mes de junio de 2011. El final del proceso de captura se llevó a cabo con el subproceso de salida el cual finalizó completamente el 30 de junio de 2011(Figura 23). 155 Figura 23. Cronograma del proceso de captura Fuente: Elaboración propia 156 6. DISCUSIÓN DE RESULTADOS 6.1 Introducción En este capítulo se procederá a analizar cuáles han sido los inconvenientes más relevantes y recurrentes que se presentaron durante los subprocesos de captura de datos, y de qué manera se resolvieron. Antes es preciso señalar que, en un contexto más general, un inconveniente recurrente a operativos de esta envergadura es la ausencia de un equipo técnico que posea un conocimiento global y completo de todo el proceso de captura de datos. El conocimiento está fragmentado por subprocesos. Este aspecto no puede limitarse solamente a los problemas políticos que atravesó el INDEC de 2007 a 2015, y que lo tuvieron en la tapa de los titulares periodísticos por años, sino que obedece a una lógica más general y duradera del empleo público, que no es capaz de retener a sus equipos técnicos. Formar profesionales idóneos en tareas censales lleva muchos años, y una vez logrado la mayoría de ellos migran por motivos de diferente índole, o directamente no son tenidos en cuenta por las nuevas autoridades de turno. En ese sentido y siguiendo a Álvarez y Goldberg (2007) las actividades que se ponen en funcionamiento para llevar a cabo una operación tradicional, así como los equipos humanos involucrados en ellas, suelen discontinuarse entre un censo y otro, dado que el intervalo censal es cercano a los 10 años. Y ello probablemente obstaculice la fluida transferencia de la memoria institucional ya que no todos los procedimientos, decisiones, discusiones, y vivencias quedan debidamente documentados. En ese sentido, en cada censo nacional pareciese que el proceso de captura comienza desde cero. No existe en la biblioteca de INDEC, un documento sobre captura de datos censales, por ende, no existen lecciones aprendidas, ni es posible aprender de experiencias anteriores realizadas por el Instituto. De allí que todo el proceso de captura se organiza a partir de diferentes grupos humanos que trabajaron sobre temas específicos, fragmentados en un proceso más general. Nunca se llegó a conformar un único equipo de trabajo, sino que actuaron diversos compartimentos estancos que pertenecían a diferentes áreas de trabajo del Instituto, con objetivos específicos por área. Mientras la empresa subcontratada para realizar la captura tiene como objetivo generar imágenes, los objetivos del INDEC son más diversos y 157 federales, para ello precisaba de un escaneo organizado por provincia y departamento que permitiera agilizar los pasos procedimentales posteriores a la captura y poder cumplir con los plazos de publicación de los resultados definitivos. 6.2 Análisis de los inconvenientes más recurrentes al momento de la captura de datos en el Censo 2010. Como hemos mencionado anteriormente el proceso de captura está compuesto por diferentes subprocesos y actividades; en los cuales también se presentaron situaciones especiales e inconvenientes que son importantes documentar. A continuación, se presentan las diferentes dificultades en cada uno de los subprocesos: 6.2.1 Subprocesos de repliegue del material censal y preparación del material censal En el primer subproceso se realizó la recepción del material censal físico, en el área destinada por BOLDT para este propósito. De esta forma, en el galpón 4 de la planta industrial que la empresa BOLDT poseía en Don Torcuato, la Dirección de Logística de INDEC, llevó a cabo una tarea compleja y de dimensiones notables. Se trató de la preparación del material censal para el escaneo. Cómo ya se especificó en el capítulo anterior, las cajas eran identificadas, verificadas en relación con la entrega, con un previo y exhaustivo control cartográfico, llevado a cabo por el programa SAYCO. Luego se procedió al armado de 280.000 cajas con cuestionarios censales, etiquetadas y agrupadas en unidades de control de escaneo (pallets). Enseguida cada documento se guillotinaba y se alistaba para pasar al subproceso de escaneo. Estos subprocesos no tuvieron demasiados inconvenientes. El armado total de las cajas demoró 6 meses. Es interesante señalar que la experiencia previa en el desarrollo de un software propio por parte de la Dirección de Informática de INDEC (y qué ya había sido probado con satisfacción en el Censo 2001), posibilitó un exitoso control cartográfico a nivel de segmento censal, qué permitió detectar con eficacia el material censal faltante. En este punto es oportuno aclarar que el repliegue de material realizado por el Correo no fue 100% satisfactorio. Por motivos de índole diversa, el material censal no había llegado en su totalidad a la planta, cuando se inició el proceso de escaneo. Todo el material reclamado de 158 manera posterior al repliegue llegó a la planta sin mayores inconvenientes, pero fuera de los tiempos establecidos. Lo más relevante registrado durante los seis meses del procesamiento fue el material censal completo de los departamentos de Punta Indio y Chascomús, qué no se retiró en su momento y llegó a la planta durante el mes de marzo de 2011. Asimismo, algunas Fracciones de los 24 partidos del GBA, que llegaron en la misma fecha, luego de realizar diversos reclamos. Dado que el equipo de Logística desarrolló tareas operativas, no se detectaron otros inconvenientes que los señalados, a lo que se puede sumar algún retraso en el armado de cajas, que fue producto de una normativa pedida por BOLDT para mejorar el escaneo, y fue que las cajas no contengan más de 400 hojas de papel, por cuestiones vinculadas a la optimización del escaneo. Esto motivó armar un número levemente mayor de cajas, para lo que en algún momento hubo faltantes de etiquetas y demás elementos de trabajo, que se solucionaron brevemente. Cómo detalle relevante, se puede decir que de las 268.698 cajas armadas por el equipo de Logística de INDEC para ser escaneadas, la empresa BOLDT devolvió 268.694 posteriormente a la captura. Es decir que se extraviaron 4 cajas que contenían cuestionarios censales. Es posible señalar la ubicación geográfica que poseían las mismas: 1- Provincia 62 (Río Negro) Departamento 042. - Fracción 42 - Radio 02 - Segmentos 10 y 11. 2- Provincia 50 (Mendoza) Departamento 126 - Fracción 03 - Radio 16 - Segmento 92. 3- Provincia 06 (Buenos Aires) Departamento 805 (Tigre) - Fracción 06 - Radio 09 Segmentos 04-05-06 y 07. 4- Provincia 06 (Buenos Aires) Departamento 056 (Bahía Blanca) - Fracción 12 Radio 11 - Segmentos 01 y 02. La información extraviada correspondía a un total de 9 segmentos. La información correspondiente a los mismos pudo reconstruirse a partir de las planillas operativas del Censista y del Jefe de Radio. Otro evento a que se registró fue que al momento de archivar el material censal sobrante del operativo (cuestionarios y planillas en blanco, etc.), se detectaron 2 cajas con cuestionarios 159 con información de la provincia de La Pampa, las que fueron oportunamente rearmadas y escaneadas. Si bien todos estos aspectos mencionados son inconvenientes para tener en cuenta, no llegaron a tener un peso relevante respecto a la magnitud total del material replegado y armado para el escaneo. Con respecto a la actividad de reelaboración de cuestionarios del subproceso de preparación de material, es importante indicar que tuvo variaciones diarias en cuanto a su cantidad y volumen. El porcentaje de cajas en reelaboración se calculó de manera diaria, según las imágenes escaneadas. En ese sentido nunca superó el 15% del material escaneado en un día. Esta información surge del tablero de control utilizado por BOLDT. Si bien la reelaboración de cuestionarios estuvo a cargo de la empresa BOLDT, el INDEC insistió en formar parte de dicho equipo. Finalmente, INDEC sumó un técnico especializado en análisis de datos (Magister José María Serbia) para evitar problemas detectados a pocas semanas de iniciada la captura de datos (28 de marzo de 2011), que se detallan a continuación: Según los informes de avance presentados diariamente a las máximas autoridades de INDEC, personal del Instituto visitó por primera vez el área de reelaboración el 28 de marzo de 2011, es decir unos meses después de iniciado este proceso. La presencia del personal de INDEC en la reelaboración de los cuestionarios pudo controlar a tiempo algunos errores que suelen cometerse en esta instancia. En primer lugar, frenar la tendencia a consistir o corregir la información que se vuelca en el nuevo cuestionario. Se observó que el personal de reelaboración de cuestionarios creyó conveniente corregir al momento de reelaborar. Por ejemplo, si se trataba de una persona con nombre de varón y tenía marca en la opción mujer, le corregían la variable Sexo. Algo similar ocurría con la variable Condición de Habitación, en casos en que había registradas personas, y estaba marcada la opción deshabitada, tendían a borrar la cruz y marcar con personas presentes. Al respecto fue necesaria una reunión entre BOLDT e INDEC para dejar en claro que la tarea de reelaboración era para reproducir de manera fiel, aquello que había sido registrado en el campo, y que otro tratamiento constituye una práctica que no corresponde y que iba a ser sancionada. 160 También la presencia de personal de INDEC llevó a la toma de otra decisión a tiempo. La misma corresponde a casos en los cuáles hay más personas en la Lista de Personas del Hogar, que la cantidad de censados en las hojas destinadas a censar la población. En esos casos se acordó que se colocarían dos marcas en las hojas de población: una en sexo y otra en relación de parentesco respetando lo que dice la Lista de Personas. Es una metodología similar a la que utilizó INDEC en el Censo 2001. En aquel entonces cuando una persona era listada pero no se la censaba, se le escribía el sexo y la relación de parentesco y se la volvía a escanear. En el Censo de 2010, aprovechando la instancia de reelaboración y re-escaneo de algunos cuestionarios, fue posible adoptar esa metodología. El impacto debió ser mínimo, ya que se trató de un bajo porcentaje de reelaboración de cuestionarios. Esta descripción del subproceso de reelaboración permite una reflexión acerca del proceso de captura de datos como una primera consistencia de la información censal que debería documentarse y analizarse detallando todas las decisiones que se toman, para poder evaluar los costos-beneficios de los procedimientos llevados a cabo. Sin embargo, dados los intereses técnico-políticos que indudablemente están en pugna a la hora de realizar un censo, estos procedimientos aislados y silenciados no suelen documentarse, lo cual limita su análisis y sólo quedan en la memoria, como anécdota, de aquellos que participaron en dicho proceso. 6.2.2 Subproceso de Escaneo En la actividad de digitalización que hace parte del subproceso de escaneo se obtienen las imágenes de cada uno de los materiales censales almacenando (cuestionarios, planillas, carátulas) de todo el país. Ni Correo Argentino, ni la empresa subcontratada BOLDT dieron demasiados detalles a INDEC sobre inconvenientes en el escaneo de imágenes. Por ello, solo a partir del control de calidad de las imágenes producidas, y de la información comentada en las reuniones semanales entre las tres partes se pudieron reconstruir los inconvenientes generados en este paso procedimental. Un aspecto que se considera importante señalar que está relacionado con cuestiones políticas, y que produjo un impacto en la dinámica de trabajo, estuvo relacionado con problemas gremiales internos de la empresa BOLDT. Debido a los atrasos registrados al comienzo del 161 período de captura la empresa decidió trabajar los fines de semana hasta que lograron llegar a la producción prometida pagando a sus operarios horas extras al mayor valor. Cuando la producción prometida a INDEC logró alcanzarse, decidieron volver a la jornada laboral de lunes a viernes y por ende el no pago de horas extras por los fines de semana. Pero sus operarios presionaron por seguir trabajando los fines de semana ya que les convenía económicamente, y lentificaron la producción semanal. Esto repercutió en la producción semanal diaria de lotes (o unidades de control) generadas por el escaneo, y atrasó el control de la calidad de las imágenes escaneadas. Este hecho está oportunamente señalado por BOLDT y registrado por el Correo Argentino, en las minutas de las reuniones llevadas a cabo durante el proceso. Por lo que se puede observar en las declaraciones del personal de BOLDT durante las reuniones semanales con la coordinación de INDEC, los errores más comunes en el escaneo estuvieron relacionados con lo que se expone en la literatura censal sobre procesos de captura de datos con escáneres. En líneas generales hubo inconvenientes con todos los campos alfanuméricos, y salvo los “errores de desplazamiento”, en muy pocas ocasiones sobre las marcas (o burbujas). Esto fue un avance respecto a la captura del Censo 2001, donde el “no rellenado completo de una burbuja” traía problemas en la captura, los escáneres no la leían y el INDEC tuvo que generar un pequeño equipo de trabajo durante un tiempo, que se dedicaba a rellenar manualmente las burbujas incompletas, para luego volver a escanear esos cuestionarios. Pero un aspecto a resaltar (y quizás el principal en este operativo) tuvo que ver con la dinámica misma del proceso de escaneado, y que en algún momento pudo comprometer la oportunidad del dato. La empresa BOLDT escaneó según su conveniencia, no tuvieron en cuenta los diferentes procesos que conducirían a la publicación de la información censal en los tiempos establecidos, y comenzaron a trabajar sin optimización ni sincronización de los tiempos y los posteriores procesos de trabajo. Para el INDEC era de fundamental importancia concluir departamentos censales, para ir concluyendo y consistiendo posteriormente, la información de cada una de las 24 jurisdicciones nacionales, es decir que el trabajo debía ser una especie de cascada de las jurisdicciones más chicas (departamentos) a las más generales (provincias y luego total del país). Esto permitía que a medida que avanzaba el proceso de captura, fuese posible ir concluyendo provincias completas para el análisis de consistencia y calidad, realizado posteriormente por el equipo de Diseño Conceptual de INDEC. Este equipo era el encargado (entre otras tareas) de aplicar pautas de consistencia y edición de datos por 162 provincias, y precisaba que las provincias estuvieran completas y cerradas para un correcto trabajo de calidad de la información. En este punto es preciso resaltar la importancia sobre “optimizar la vinculación” entre los diferentes equipos. Si el proceso de captura queda divorciado de las necesidades del equipo de Diseño Conceptual, no será posible cumplir con la fecha de publicación estipulada. Finalmente, luego de un tiempo de discusiones diarias entre la empresa BOLDT y el INDEC, se logró que se priorice el escaneo de información por total departamental. Estos acontecimientos están previstos que puedan suceder dentro de la organización de un operativo censal, según CEPAL “el objetivo de la planificación es garantizar no sólo que cada fase esté organizada y tenga los recursos (humanos, físicos y presupuestarios) adecuados, sino también asegurar que los productos de cada fase sean de calidad suficiente para todas las etapas posteriores y dependientes. Hay que mencionar además que la planificación debe ser lo suficientemente flexible y que permita contemplar las holguras necesarias para incorporar los cambios que se requieran producto de las diferentes pruebas, así como por los hallazgos y aprendizajes que siempre ocurren en las innovaciones”. (CEPAL 2021b, p. 74) En los Informes de Avance del Proceso de Captura (2011) es posible advertir que no fue un capricho de BOLDT querer escanear cajas con cuestionarios de distintos departamentos o provincias, sino que al inicio del proceso la falta de una adecuada planificación y coordinación entre la empresa y el INDEC, sumada a la vertiginosa dinámica de trabajo a la que escala un censo nacional, permitieron este inicial desajuste. Al analizar todos los Informes de Avance del Proceso de Captura (2011) queda establecido que las demoras suscitadas en el proceso de graboverificación, los cuestionarios que debieron rehacerse, los lotes rechazados en el control de calidad que debieron ser re capturados, y por último el control de completud que detectaba cajas que no habían sido totalmente escaneadas, podrían haber generado un “círculo vicioso”, del cual la estrategia utilizada por BOLDT para solucionarlo, fue seguir adelante con el escaneo de otros departamentos o provincias, a la espera de que los procesos señalados (graboverificación, reelaboración de cuestionarios, control de calidad y control de completud) devuelvan el material para su re captura, de no haber existido la presencia de profesionales de INDEC para evitar estos errores recurrentes . Según el tablero de control (2011) BOLDT se propuso escanear 14.000.000 de imágenes diarias. En términos teóricos ese número diario permitiría cumplir con los plazos prefijados según el convenio firmado con el Correo Argentino. Pero en este punto, la importancia no 163 radicó sólo en una cuestión cuantitativa de cantidad de imágenes, sino en una cuestión de organización de los diferentes equipos de trabajo, que diera como resultado ir completando la captura de datos de cada uno de los departamentos provinciales, como ya se mencionó. Se insiste en este punto porque en la bibliografía existente sobre pruebas de escaneo previas al operativo censal 2010 (incluso en las pruebas previas al Censo 2022) se replican los errores ya conocidos y documentados que refieren en general a las limitaciones de los escáneres respecto a los campos alfanuméricos, pero poco o nada se dice respecto a la optimización y sincronización de los diferentes equipos que participan en el proceso, y que son un aspecto primordial para garantizar un dato oportuno y de calidad. Al respecto se pudo elaborar la siguiente tabla, en la cuál es posible observar los errores en campos alfanuméricos y marcas. Los errores promedio cercanos a 0 en marcas y mayores en campos alfanuméricos (Tabla 22). Se trata de porcentajes proyectados. La comparación con otros países es para que sirvan de marco de referencia para interpretar la información. Tabla 22. Lectura por escáner: Tasas de error en el archivo censal proyectadas y reales. Argentina (Censos 2010 y 2022) Colombia (Censo 2005) y Uruguay (Censo 1996) Fuente: Elaboración propia en base de documentos del INDEC 2021, INDEC 2010a, DANE sf, CEPAL 2021b. 6.2.3 Subproceso de verificación El subproceso de verificación consta de actividades en las que se presentaron diferentes inconvenientes que se detallan a continuación. a) Graboverificación: Los inconvenientes detectados en esta etapa pueden clasificarse en 2 tipos: 164 ● Inconvenientes ajenos al proceso de captura de datos: se trata de problemas en el llenado de cuestionarios en campo, y relacionados principalmente con el grafito de lápiz demasiado tenue (y no captados por los escáneres), o la letra de los censistas ilegible o poco clara. Al respecto los cursos de capacitación para censistas y jefes de radio, y los manuales correspondientes son claros y concluyentes al respecto. ● Inconvenientes propios del proceso de captura de datos: se trata principalmente de problemas surgidos en el escaneo, y que están relacionados con cuestiones de hardware, el desgaste propio de los escáneres y la falta de calibración de estos, por ejemplo. También refiere a inconvenientes con el uso de diccionarios preparados para ayudar en la captura de campos alfanuméricos. En líneas generales es posible afirmar, de acuerdo con el análisis de las minutas de las reuniones llevadas a cabo por Correo Argentino, BOLDT e INDEC (2011), que durante todo el proceso de captura hubo inconvenientes con los campos alfanuméricos, de manera que debía corregirse de forma manual (grabo verificando). Esto generaba demoras de manera que fue necesario una evaluación de la situación, y tomar una serie de decisiones que constan en los Informes de Avance de la Captura de Datos (2011) y se detallan más abajo. De acuerdo con Naciones Unidas (2011) la calidad del dato está relacionada con las necesidades de los usuarios y su satisfacción. En décadas pasadas se asociaba la calidad con la exactitud. Hoy en día se tienen en cuenta otras dimensiones para asegurar la calidad, y la oportunidad del dato es una de ellas. En este sentido, y dados los inconvenientes que generó el escaneo en las etapas iniciales fue necesario tomar algunas decisiones respecto a las restricciones que desarrolló el área de Metodología Estadística, al generar la muestra que analizó el equipo de control de calidad en la cual se detallan los errores tolerados para cada campo o variable. Al analizar las minutas de las reuniones llevadas a cabo por el Correo, BOLDT e INDEC (2011) es detallan las siguientes cuestiones importantes: - Se resolvió que no pasarían más a graboverificación aquellos cuestionarios que tuvieran el número de hogar o vivienda 00 (cero-cero). - Se resolvió que aquellos cuestionarios que tuvieran marca válida en P2 (SEXO), no pasarían más a graboverificación para controlar los nombres de las personas. Esta nueva determinación por parte del área de Metodología Estadística de INDEC se debió a la búsqueda de obtener menor número de restricciones para evitar demoras en este 165 proceso. Dado que los nombres de las personas traían algunos problemas de interpretación de caracteres por parte de los escáneres, una buena parte de lo procesado pasaba a graboverificación para que un operario resolviera que donde decía: R#ben ... debía anotarse Ruben, o donde decía Nor#erto debía anotarse Norberto. Sobre este punto se consideró pertinente que, si el nombre de la persona solo interesaba para determinar el sexo en casos de blancos o multimarca en P2 (sexo), y que a su vez estos errores eran muy bajos o poco frecuentes, era posible levantar estas restricciones en el control de calidad del material escaneado. (https://www.indec.gob.ar/micro_sitios/webCenso/aquisecuenta/aqui2.pdf). Revista Aquí se cuenta. Diciembre de 1998. Tecnología óptica para procesar los datos del Censo. Por Daniel Martínez). - Se resolvió que, si se establecían estándares de confiabilidad muy altos para el proceso de reconocimiento seguramente se presentarían más dudas y aumentarían los rechazos en el reconocimiento automatizado; y en consecuencia, se incrementarían los casos de reconocimiento asistido y esto a su vez incrementaría los tiempos de procesamiento. b) Control de Calidad La evaluación del Control de Calidad de la información escaneada se realizó a partir de informes de avances diarios, que fueron realizados día tras día por personal del INDEC y del Correo Argentino. Se trata de información que nunca ha sido publicada ni divulgada por el INDEC. La mayor parte de los errores que se citan a continuación fueron elaborados a partir de ese insumo fundamental. La no documentación y por ende la no publicación por parte de INDEC de esa información, obedece a cuestiones relacionadas con el cuerpo central de esta tesis. Lamentablemente no se considera al proceso de captura de datos cómo una etapa formal y planificada, que debe ser documentada al mayor nivel de detalle posible, con el objeto de generar lecciones aprendidas en vistas a los censos posteriores, y asimismo considerarla también como una primera consistencia de los datos censales. En su etapa inicial principalmente, el control de calidad observó un alto nivel de rechazos que alcanzó entre el 30 y 40% de los cuestionarios escaneados. Los campos en los cuáles se detectaron estos errores están vinculados con el nombre de la calle, la fecha de nacimiento y la edad, todos en general son campos alfanuméricos. En lo que respecta a las marcas válidas 166 en los cuestionarios, se detectaron errores que estuvieron relacionados con un incorrecto anclaje del cuestionario en el escaneo, lo que da por resultado una imagen en la cual las marcas no coinciden con las preguntas por las que se está respondiendo. Esto puede traer como consecuencia la existencia de errores en determinadas variables, que no fueron reales en el momento de la entrevista, sino debido al mal anclaje en su lectura. Estas cuestiones se documentaron en reuniones semanales entre las partes, y su posterior solución demandó unos días de ajuste, hasta que esos porcentajes se redujeron considerablemente al reescanear la información. En virtud de lograr celeridad, el campo alfanumérico de nombre de calle se dejó de controlar, dado que cada calle contenía un código, de manera que esa información podía reconstruirse posteriormente al proceso de captura. Lograr que el campo alfanumérico de nombre de calle fuese legible y aceptable, demandaba un tiempo de procesamiento, que hubiese atentado contra la oportunidad del dato. Algo similar ocurrió con la variable sexo y con el nombre de la persona, ya que se tratan de campos alfanuméricos. Se resignó la captura del nombre de la persona considerando que no es un campo relevante a la hora de construir la base de datos. El nombre de la persona orienta más que nada la entrevista censal, pero no es relevante a la hora de publicar la información. Distinto tratamiento fue necesario respecto a la fecha de nacimiento y la edad, dado que son variables demográficas básicas, por lo cual no era posible resignar calidad. El hecho de tratarse de solamente números, fue posible solucionar ajustando los escáneres o directamente pasando a graboverificación los cuestionarios con problemas. Estos errores fueron los más importantes durante el proceso de control de calidad, y generaron retrasos. Los problemas con el incorrecto anclaje de los cuestionarios elevaron el nivel de rechazos entre un 30% y un 40%. Sin embargo, el inconveniente que mayor retraso generó tuvo que ver con una cuestión de hardware. El visualizador de imágenes escaneadas tuvo varios inconvenientes técnicos que no permitían visualizar las imágenes y corroborarlas, por lo que la labor de este equipo estuvo interrumpida en lapsos breves de tiempo, pero en reiteradas oportunidades durante todo el proceso. 167 c) Control de Completud: Este subproceso detectó inconvenientes referidos a cajas que no fueron escaneadas de manera completa. Este problema fue detectado en casi todas las provincias del país, y aparentemente estuvo relacionado con problemas operarios debido al déficit de atención del operario de turno, o con la rotación de los mismos en los turnos de trabajo. Otro inconveniente para señalar se observó cuando la población de un departamento provincial X difería considerablemente respecto de los resultados provisionales. En esos casos se controlaron las imágenes y las cajas con cuestionarios en papel de esos departamentos, para determinar si habían escaneados en su totalidad. Sobre este error, es interesante comentar que la empresa BOLDT no se caracterizó por ser demasiado ordenada con las cajas que ya habían sido escaneadas, por lo que cada vez que había que individualizar y verificar alguna caja para controlar si efectivamente había sido escaneada en su totalidad, se demoraban 2 y 3 días la búsqueda de las cajas en un depósito que contenía más de 200.000 cajas con cuestionarios. Otro inconveniente que se suscitó en esta etapa estuvo relacionado con la información escaneada más de una vez en algunos lotes de cuestionarios. Este error se logró detectar a tiempo y fue posible repararlo mediante un software que anulaba el registro duplicado. Por otra parte, se llevada un control de completitud tomando como referencia los resultados provisionales para detectar si existían posibles diferencias en los totales de población. Otro inconveniente estuvo relacionado con la detección de Carátulas del Segmento con la Ubicación Geográfica en blanco. Si bien fue posible encontrar una solución, la misma se realizó de manera manual y dilató los tiempos de control de este instrumento de captación. El procedimiento fue el siguiente: Se ingresaba al visualizador de imágenes que utilizaba Control de Calidad para sus tareas, y se buscaban los cuestionarios que correspondían a la UG de esa carátula del segmento. Una vez detectados se tomaba nota del nombre de la calle y la altura que registran los cuestionarios en su UG. Luego esa información se la pasaba al área de Cartografía que a partir del nombre de calle y altura podía dictaminar de manera exacta a qué Departamento pertenecía esa carátula. 168 El procedimiento fue un tanto artesanal pero efectivo, y de esa manera se aseguró la correcta información de los segmentos de los departamentos a los que correspondían esas carátulas sin UG. Lo último para señalar, es que al igual que ocurrió durante el control de calidad, hubieron inconvenientes con el visualizador de imágenes escaneadas que retrasó muchas veces los trabajos de control de completitud. El visualizador permitía controlar la información censal escaneada a partir de la observación de las carátulas de segmento. Este inconveniente ocurría con intermitencia y estuvo vinculado con cuestiones informáticas, ajenas incluso al INDEC, ya que la empresa BOLDT fue la encargada de velar por el correcto funcionamiento de esa herramienta de trabajo. 6.3 Listado de los principales errores en el proceso de captura de datos censales A continuación, se especifican las diferentes inconsistencias que se presentaron en dicha etapa: 1. Identificación de cuestionarios Se identificaron cuestionarios con código de identificación preimpreso (código de barra) repetido y esto se debió a dos razones. Por una parte, se detectó que algunos cuestionarios habían sido escaneados más de una vez, y por otra parte, que se habían escaneado cuestionarios fotocopiados de los originales, ya que por razones de demoras o desorganización en el arribo de materiales a las sedes, hayan necesitado más cuestionarios y los hayan fotocopiado para poder salir a campo. La información de estos cuestionarios se reelaboró en los cuestionarios correspondientes para poder ser escaneados y así corresponderse con un único código de barras, y por otra parte se implementó un software que detectaba los cuestionarios doblemente escaneados. 2. Cuestionarios incompletos Se revisaron los cuestionarios incompletos para dimensionar los faltantes. Estos faltantes podían ser de algunas preguntas, o de algunos módulos completos. Cuando el formulario estaba incompleto, se buscaba la caja correspondiente para verificar si la información 169 escaneada era coherente con la información registrada por el censista. Si la información faltante correspondía con el cuestionario en papel, se dejaba tal cual la información puesto que en el proceso posterior llevado a cabo por el equipo de Diseño Conceptual se aplicaban pautas de edición de datos, para que la base sucia o con errores fuera corregida y pudieran ser publicados los datos del censo. 3. Validación del registro persona válida Si existía en el cuestionario censal, al menos 3 marcas en cualquier pregunta del módulo de población, se consideraba el registro como de una persona válida, mientras que, si se presentaba una única marca en el mismo módulo o estuviera mal borrada por el censista, era considerado como persona no válida. 4. Validación del registro de vivienda-hogar ocupado o desocupado. En este caso se consideraba que un registro de vivienda-hogar era válido cuando al menos existía la presencia de alguna marca en cualquier pregunta del módulo vivienda y de hogar. Por otro lado, los cuestionarios censales que presentaban marcas únicas mal borradas eran considerados como no válidos. Para la validación de este registro se revisaba que existiera como mínimo una persona en el hogar. En ese caso se consideraba que era una viviendahogar ocupada, si no había ninguna persona entonces era considerado desocupada. 5. Verificación de cuestionarios con los números de personas por hogar y número de hogares en las viviendas Se verificaba la existencia de todos los formularios de acuerdo con el número de personas del hogar o según el número de hogares en la vivienda, recordando que debía existir mínimo un cuestionario por cada hogar censado. De esta manera, se identificaba y ubicaba a las personas en los hogares y los hogares en las viviendas en donde fueron censados. En el caso de los hogares de más de 6 personas esta revisión fue más específica al ser más de dos cuestionarios, ya que cada cuestionario tenía espacio para anotar información de 6 personas. Si había más personas en un hogar se debía utilizar otro cuestionario. Si la vivienda tenía más de un hogar, entonces debía haber tanta cantidad de cuestionarios como hogares en esa vivienda. Se revisaban en la pregunta 3 relacionada con la cantidad de hogares en la vivienda, el número de hogares anotado por el censista. Si era “5” por ejemplo, entonces se verificaba la existencia de 5 cuestionarios. Si había menos formularios, se 170 realizaba la misma acción de búsqueda hasta encontrar la totalidad de cuestionarios como hogares había anotado en esa vivienda, y si no era posible ubicarlos entonces se corregía el número de hogares, según la cantidad de cuestionarios existentes para esa vivienda. Si aparecían más formularios completados de los anotados en la pregunta 3, entonces también se corregía el dato allí consignado. Si venía un formulario complementario y no aparecía el principal, se debían seguir los mismos pasos hasta encontrarlo; si al final no era posible ubicarlo, entonces se resolvía de la siguiente manera: si entre las personas listadas en el formulario complementario existía una cuya edad fuera de 14 años o más, entonces, se convertía el formulario complementario en principal como si fuera un hogar independiente y se verificaba que los parentescos de los integrantes de este hogar no fueran incoherentes entre sí. 6. Verificación de la clave del código único identificador Con el fin de crear un código único identificador se definió que cada vivienda tendría una única identificación la cual estaría conformado por la concatenación de las variables de ubicación geográfica, número de vivienda y el número de hogar dentro de la misma vivienda. En este caso se presentaron dos tipos de errores. El primero estaba relacionado con problemas de completamiento de los cuestionarios censales, y el segundo con problemas de los escáneres en la interpretación de los caracteres (letras y números) 7. Unión de cuestionarios de hogares que residían habitualmente más de 6 personas Los hogares con siete personas o más debían venir completados en dos o más cuestionarios, debido a que en cada uno se registraba hasta 6 personas. Si el número total de personas era de 10, entonces debían existir dos formularios; en el primero o principal venían registradas 6 personas y en el segundo las 4 personas restantes. Pero por problemas de desorden y desorganización de los cuestionarios podía ocurrir que las personas 7, 8, 9 y 10 que pertenecían al mismo hogar que las primeras 6, fueran identificadas como pertenecientes a un hogar distinto. Así mismo también se presentaron algunos problemas en la lectura por escáner del número de persona dificultando la identificación de las personas que pertenecían al mismo hogar. 171 8. Personas listadas no concuerdan con las censadas Si el número de personas listadas no concordaba con las censadas en el cuestionario de población, se dejaba la lista así y se verificaba la correspondencia de los nombres y del número de orden. Si el cuestionario debía ser reelaborado, se colocaban dos marcas en el módulo de población: una en sexo y otra en relación de parentesco de acuerdo a lo que aparecía en la lista de personas, luego se re-escaneaban esos cuestionarios. 9. Problemas con las variables de municipio, lugar de residencia (urbano- rural) y Área geográfica En general estos errores fueron detectados por el Control de Completitud de los cuestionarios. La metodología utilizada fue artesanal pero efectiva. Se buscaba la carátula de segmento correspondiente al área y se tomaba la información que hubiese anotada allí, para de esa manera reconstruir la información faltante mediante la colaboración del área de Cartografía. 6.3.1 Clasificación de errores según el momento en que se producen Durante el proceso de captura se presentaron inconvenientes que debieron ser solucionados durante la marcha. Estas dificultades se originaron durante las fases precensal, censal y postcensal. A continuación, se procederá a describir cuáles fueron las principales dificultades y las etapas en que ocurrieron: 1. Etapa precensal: Este tipo de errores pueden presentarse por problemas cartográficos, por problemas en el manejo de conceptos al momento del diseño de los instrumentos de capacitación y de la impresión del material censal. A continuación, se presentan algunos errores que pueden originarse en esta fase: ● Cuestionarios con códigos de barras repetidos o que no tenían presencia de código de identificación ● Falta de claridad en la identificación de hogares. ● Problemas de capacitación sobre cómo censar los hogares de 7 o más personas en una vivienda. 172 2. Etapa censal: Estos errores pueden producirse por problemas en la logística de los materiales censales, mal completamiento del cuestionario censal por parte del censista, por mala interpretación del informante idóneo (censado) en el momento de la entrevista. Como ejemplos de estos errores se encontraron los siguientes: ● Problemas con cuestionarios incompletos ● Omisión de algunos campos del cuestionario o errores de flujo ● Errores en las preguntas sobre ubicación geográfica, número de vivienda o de hogar, condición de ocupación o desocupación de la vivienda, detección de hogares en la vivienda y registro de personas. 3. Etapa postcensal: Este tipo de errores puede estar relacionado con el repliegue del material censal o de los demás subprocesos del proceso de captura, y pueden ser: ● Problemas en el ordenamiento de los cuestionarios censales durante el relevamiento o en los subprocesos de repliegue, preparación del material y escaneo del proceso de captura. ● Problemas en la lectura e interpretación de marcas y caracteres (letras y números) por parte del software de reconocimiento óptico. 173 7. CONCLUSIONES A lo largo de la tesis se realizó un análisis descriptivo del proceso de captura de datos en el Censo Nacional de Población, Hogares y Viviendas realizado en Argentina en el año 2010, cómo de cada uno de los subprocesos que lo integran. Asimismo, se han descrito los inconvenientes más recurrentes que se presentaron de manera general, como así también de cada uno de los subprocesos, y las respectivas soluciones que se implementaron en cada momento de este proceso censal. No existe actualmente en la memoria institucional del INDEC un documento que detalle este proceso, como de ninguno de los censos realizados, al menos, en los últimos 50 años. En ese sentido, la pérdida o ausencia de memoria institucional adquiere un carácter relevante. Se considera por ello, que esta tesis realiza un aporte de información inédita sobre este proceso censal para la planificación de los censos venideros, sobre la base de las lecciones aprendidas y los inconvenientes solucionados que se detallan en este trabajo de investigación. La descripción y el análisis propuesto en este trabajo busca e intenta ayudar a comprender cómo el proceso de captura de datos censales es un proceso tecnológico de una ciencia aplicada, que debe integrarse a las distintas etapas censales, siendo concebido como un sistema y no como un proceso estanco que ofrece soluciones tecnológicas al operativo censal. Sobre todo, si se considera que se trata de la primera consistencia a la que se someten los datos censales. Es una aclaración pertinente en un contexto en el que la oferta de los servicios tecnológicos es mucho más amplia en el mercado y permite seleccionar aquellas propuestas más competitivas y que mejor respondan a los requerimientos del INDEC. El proceso de captura de datos del Censo 2010 cumplió con los plazos de tiempo establecidos, lo cual es un primer aspecto importante para señalar, porque este hecho contribuyó a la oportunidad del dato censal al posibilitar la publicación de los resultados definitivos en un corto plazo de tiempo. Asimismo, es destacable mencionar que desde el aspecto político y de compromiso social que conlleva la realización de un Censo; la máxima autoridad del INDEC se comprometió ante las autoridades del Poder Ejecutivo Nacional a publicar casi la totalidad de los resultados definitivos desagregados por provincias a un año de la realización del Censo; por ende, la urgencia se hizo sentir y esto llevó a priorizar la celeridad, para cumplir con lo prometido. 174 En lo que confiere al recurso humano, es preciso señalar que no se contó con profesionales que conozcan de manera íntegra el proceso de captura de datos que involucra a varias Direcciones Nacionales del INDEC aportando una visión global de dicho proceso y sus correspondientes subprocesos. Los técnicos/profesionales tenían amplia experiencia en las tareas pertinentes a sus áreas, pero conocimiento y experiencia fragmentada. Pese a ello, en lo que respecta a la realización del proceso sobre el que trata esta investigación (Proceso de Captura de Datos), fue acorde a las recomendaciones internacionales y a las experiencias de otros países latinoamericanos que utilizan este tipo de captura, y que figuran en los anexos de este trabajo (ver anexo 1 y 4). Tanto el proceso de captura en líneas generales, como cada uno de los subprocesos que se desarrollan en el mismo, tienen su correlato en experiencias similares en otros países, como así también lo realizado por el INDEC en otros censos, sobre todo en el Censo 2001, en donde incluso la misma empresa (BOLDT) realizó un trabajo similar. Pero al no haber una memoria institucional, la experiencia quedó anclada en aquellos agentes que participaron de trabajos similares previos. En ese sentido fue posible aprovechar la experiencia previa de BOLDT, y de los técnicos/profesionales del INDEC de áreas cómo Logística, Cartografía, Informática, Capacitación, Estadísticas Poblacionales y Difusión. Algunos de esos recursos humanos anclaban sus experiencias censales en los Censos de 2001, 1991 en inclusive el Censo de 1980. Este aspecto debe señalarse, para no caer en el facilismo o el oportunismo que se pretendió imponer mediáticamente, de que los mejores profesionales habían sido desplazados durante la realización del Censo 2010. El conflicto del INDEC fue un hecho real y lamentable que hizo perder credibilidad al organismo, pero es preciso trazar una línea divisoria entre lo mediático y el trabajo concreto y cotidiano que realizaron sus trabajadores en esos años. No se pretende desconocer que algunos profesionales hayan sido desplazados, pero esta situación parece estar relacionada con cuestiones vinculadas al tratamiento de los recursos humanos en el Empleo Público, tema que trasciende y no trata esta tesis. Las tareas de logística llevadas a cabo tanto por la Dirección de Logística de INDEC junto al Correo Argentino han sido un excelente hallazgo para destacar en términos operativos. El aporte del Correo Argentino posibilitó una clara y ordenada recepción del material censal en cada provincia, como asimismo un repliegue de material censal exitoso. Se deberían considerar ciertas cuestiones respecto a las condiciones climáticas a las que muchas veces se somete el material censal, sobre todo teniendo en cuenta las limitaciones que posee un proceso de captura llevado a cabo mediante escáneres, en los cuáles las condiciones del papel 175 deben ser óptimas para no verse en la necesidad de reelaborar la información en un cuestionario nuevo. Y luego de la captura la necesidad de encontrar un lugar afín donde albergar y archivar las 1.500 toneladas de papel distribuidas en más de 200 mil cajas. Esos cuidados y esos costos deberían documentarse y tenerse en cuenta en cada Censo realizado, de manera que en futuros relevamientos sea posible optar por modalidades de captura que economicen y simplifiquen los cuidados y los costos que ocasiona el cuidado y archivado del material censal, siempre que un censo se continúe utilizando formularios en papel. Otro aspecto para destacar del trabajo logístico fue el armado y el acondicionamiento del material censal. En ese sentido el haber contado con el software SAYCO que brindó las herramientas necesarias para el control de la gestión y el monitoreo de las actividades en cada una de las etapas del Censo, fue fundamental para el control y acondicionamiento del material censal, y la entrega al Centro de Captura liderado por BOLDT. A su vez proporcionó facilidades para registrar el rearmado del material remitido por cada jurisdicción del país, y ayudó a ordenar todo el material apto para la captura. Permitió realizar los reclamos pertinentes ante eventuales faltantes de material. Y registró el movimiento de los lotes de captura entre el INDEC y el Centro de Captura de BOLDT, posibilitando la supervisión de la logística del flujo y ubicación del material censal. El SAYCO además ayudó en el subproceso de verificación, más precisamente en las actividades de Control de Calidad y Completitud, y en la posterior generación de una base de datos a nivel provincia/departamento. Las limitaciones y los inconvenientes enunciados en esta tesis respecto del subproceso de escaneo y la actividad de graboverificación de la información que quedaron en manos de la empresa BOLDT manifestaron innumerables inconvenientes, a los cuáles no es preciso acceder de la manera que se hubiera deseado, porque la empresa no informó al INDEC sobre estas limitaciones. Toda la información contenida al respecto en este trabajo se desprende de cada una de las minutas de las reuniones diarias entre las partes competentes. Se concluye que los escáneres tuvieron inconvenientes con todos los campos alfanuméricos de los cuestionarios censales, y que el personal que manejaba los mismos, no siempre puso atención en escanear la totalidad de los cuestionarios contenidos en las cajas. Sería pertinente que, en futuras cláusulas de contratos y licitaciones para la captura de datos, se obligara a la empresa contratada a generar y entregar informes periódicos sobre estas cuestiones técnicas, de manera de poder documentar este subproceso y tenerlo en consideración para operativos futuros. 176 Otro aspecto importante a resaltar en estas conclusiones responde a los acuerdos de avance diario o semanal del material escaneado. Durante el Censo 2010, la empresa encargada de la captura se comprometió a escanear un total de 10 mil imágenes diarias. Este valor es la unidad de medición de los escáneres, pero en términos operativos reales solo permite una ecuación matemática para saber en cuántos días se escaneará el total de 183 millones de imágenes. No encierra una mirada abarcativa del proceso más allá de esa cuenta numérica. Por ende, no hay una labor sincrónica entre el trabajo generado por el subproceso de escaneo de imágenes, y las etapas de verificación y control de calidad y completitud posteriores que lleva a cabo el INDEC. Para trabajar avanzando en virtud de la oportunidad del dato, es preciso ir concluyendo departamentos provinciales hasta completar una provincia; así la Dirección de Informática consolida bases de datos provinciales, y posteriormente el equipo de Diseño Conceptual de la Dirección de Estadísticas Poblacionales puede analizar la calidad del dato y consistir la información para ser publicada. Nada de eso ocurrió en un primer momento, y trajo numerosos retrasos, hasta que se logró acordar estos procedimientos con la empresa. Se concluye que la evaluación de la calidad de la información escaneada no puede tener como resultado solo la cantidad de imágenes entregadas diarias (con su esperable y correspondiente margen de error), sino que se debe tener en cuenta la necesidad de ir entregando imágenes correspondientes a una misma provincia hasta completarla. De no ser así, los trabajos de control de calidad y consistencia deberán esperar hasta finalizar el proceso total de escaneo, lo que demorará mucho los tiempos de publicación de los datos censales definitivos. Al respecto es posible afirmar que los censos no se pueden concebir como procesos estancos. Muchas veces las oficinas de estadística planifican cada etapa como si fuese una isla apartada de todo lo demás, sin tener en cuenta que los procesos están concatenados entre sí. Es de suma importancia integrar y reflexionar cómo cada subproceso incide en el posterior, para lograr que la información procesada sea de la mejor calidad posible. Como consecuencia de lo desarrollado hasta aquí y en virtud de cumplir los plazos temporales acordados, se produjo una disminución de la calidad en la captura de campos alfanuméricos, tanto en el nombre de las calles, la fecha de nacimiento, y todas las preguntas abiertas del cuestionario censal. Si bien, los umbrales de error fueron aceptables, los plazos temporales impuestos condicionaron que se pudieran realizar mejores capturas. Aún en el siglo XXI no se han creado escáneres con la calidad suficiente como para interpretar de manera rápida e idónea la caligrafía de 650.000 personas distintas, como lo fueron la cantidad de censistas que participaron en el Censo de 2010. En ese sentido fue necesario renunciar a información que, 177 si bien no es fundamental en un operativo estadístico, podría servir para estudios posteriores al relevamiento censal, por ejemplo, el nombre de las personas del hogar o el nombre de la calle registrado en el cuestionario. Respecto a las actividades de control de calidad y control de completitud que refieren al subproceso de verificación, y que estuvieron totalmente a cargo de personal del INDEC, han mostrado un desarrollo aceptable y fueron capaces de ajustarse a los tiempos de trabajo propuestos. En relación a este proceso de trabajo fue posible que distintas Direcciones del INDEC (Logística, Cartografía, Metodología Estadística, Informática, Capacitación, y Estadísticas Sociales y de Población) fueran capaces de llevar adelante un trabajo integrado y articulado, aportando soluciones desde la experiencia de cada área temática. En ese sentido se aprovechó el conocimiento profesional de aquellos que tenían experiencias censales previas, y se intentó formar profesionales más jóvenes. Sin embargo, la ausencia de documentos de trabajo precedentes, que dejen plasmado los procedimientos con sus correspondientes dificultades, limitaciones y errores, y las posibles soluciones que se implementaron para subsanarlos y avanzar con la publicación de los datos de un Censo, es un aspecto a considerar en vistas de futuros operativos censales. Se insiste en este punto, ya que se trata de un vacío de información que se detecta en este trabajo de investigación, puesto que todo el proceso de captura de datos, al menos en Argentina, es la etapa menos documentada del operativo censal; con la consiguiente fantasía de que las innovaciones tecnológicas serán capaces de realizar una copia fiel de todo lo relevado en campo por parte de los censistas. Otro aspecto importante respecto al subproceso de verificación es que fue llevado a cabo por personal del INDEC o bien de las Direcciones Provinciales de Estadística y no por personal contratado de manera privada y tercerizada que carece de conocimientos previos y expertos sobre los procesos censales. En este sentido esta tesis demuestra cómo algunas decisiones técnicas u operativas tomadas por personal de INDEC durante todo este subproceso, tuvieron incidencia directa y positiva sobre la calidad de la información relevada. El hecho de optar por dejar de controlar cuestiones relativas a campos alfanuméricos en virtud de aprovechar la oportunidad del dato, fue una decisión que debió ser discutida entre equipos técnicos que pudieron sopesar fortalezas y debilidades sobre la base de experiencias previas; y no dejar en manos de un operario informático, sin ninguna preparación estadística ni experiencia previa en operativos de esta índole. 178 Respecto a los errores más comunes que se suscitaron en esta etapa, estuvieron relacionados con el hallazgo de caracteres alfanuméricos mal leídos. Con respecto a los números, parece haber una constante que se repite desde censos anteriores en relación con la confusión de los mismos. En general el 8 con el 0, el 7 con el 1, el 4 con el 9 y el 5 con el 6. Se trataría de un error que se genera en campo, y que estaría motivado porque el censista no respeta el formato de números y letras que se propone en la capacitación intentando igualar la caligrafía de los censistas al momento de la entrevista. Este hecho se hace potencialmente grave en la variable edad, aunque la inclusión de la fecha de nacimiento ayuda posteriormente a corregir la mala lectura de los escáneres. Al respecto se concluye que la solución definitiva para mejorar la captación de esta variable sería directamente optar por otro método de captura de datos. En ese sentido tanto las PDA como los censos vía internet (e-Censo) resolverán ese inconveniente. En caso de que se optara por la realización de un Censo mixto, es decir utilizando métodos tradicionales y novedosos a la hora de censar, se sugiere continuar usando las dos formas de captación de la edad, tanto los años cumplidos como la fecha de nacimiento. En líneas generales, el proceso de captura del Censo 2010 fue exitoso. Quizás convenga señalar que el prometer con antelación una fecha de publicación para los resultados definitivos, sin haber diagramado y proyectado con certeza la totalidad de los subprocesos que conllevan a la producción del dato censal y los posibles inconvenientes por los que se puede atravesar, posibilita la aparición de algunas decisiones técnico-metodológicas no previstas que, si bien acortan los tiempos, pueden afectar la calidad final de los datos censales. Es posible concluir que el proceso de captura no se puede encasillar a un área específica. No se trata solo de un proceso pertinente a lo informático, ya que todo el subproceso logístico previo como el subproceso posterior al escaneo, incide de manera estructural y categórica en la producción final del dato censal. Un descuido en cualquiera de las etapas limita la calidad y la consistencia de la información; y mucho más en censos como los que se desarrollan en la República Argentina, donde se acostumbra a cuestionarios con gran cantidad de preguntas, y por ende, un número considerable de variables a capturar y posteriormente a analizar. En este trabajo, y en virtud de todo lo analizado, no se ha podido comprobar que las soluciones tecnológicas resuelvan por si solas el proceso de captura de datos del Censo 2010. La metodología de captura utilizada en dicho censo podría haber resultado más efectiva si el cuestionario censal hubiera tenido menos variables y menor cantidad de hojas. En ese sentido se toma como ejemplo la experiencia como observador no participante de los preparativos del 179 Censo Japonés de 2010 donde se evidenció la eficacia de los métodos de captura mediante escáneres, trabajando sobre un cuestionario con una sola hoja que contiene sólo 16 variables y en su mayoría con preguntas cerradas. Es preciso señalar que es posible optar por otros métodos de captura en vistas al futuro. Por otro lado, la elección de un método u otro estará limitado por cuestiones de metodología censal con relación al tipo de censo que se llevará a cabo, y obviamente a cuestiones presupuestarias. Este señalamiento resulta a todas luces importante, para ubicar las soluciones tecnológicas en el lugar de importancia correspondiente. Al respecto cabe señalar que desde mediados del siglo XX se ha venido incorporando diferentes experiencias, lecciones aprendidas y conocimientos en la preparación y ejecución de los censos de población y vivienda. A partir de la década de los 90s y durante la ronda de 2010 se presentaron progresos significativos como la inclusión de tecnología para la captura de datos. Por ello los institutos de estadísticas de la región suelen investigar formas alternativas para implementar el Censo, dando lugar a nuevos desarrollos tecnológicos que ofrecen oportunidades para modernizar sus operaciones censales, en especial en la búsqueda de georreferenciar la información de forma satelital, mejorar la captura y validación de datos censales y acelerar la difusión de resultados. Se concluye en resaltar la importancia de la interrelación entre procesos censales, centrándose en que ninguno de estos procesos es autónomo en su desarrollo, sino que todos son interdependientes y forman parte de un sistema integrado, al que cada uno aporta con sus productos específicos. Los productos de unos procesos son insumos para otros y todos, de manera directa o indirecta, pueden lograr un producto de calidad. El uso de la tecnología cobra su verdadero sentido cuando se convierte en una parte integral de los procesos censales críticos y logra mejorar los costos, contribuye a la calidad y la eficiencia del Censo. Permite obtener mejores resultados en lo que respecta a la cobertura censal, la precisión de la medición de los temas que investiga y principalmente en la oportunidad del dato. Es por ello que la elección del método de captura de datos censales se debe tener en cuenta en la etapa precensal, a inicios de la planificación y organización del proyecto censal, ya que implica una transformación en la manera como se lleva a cabo el operativo censal y toda la gestión general del proyecto. Por todo ello la inclusión de nuevas tecnologías para recolectar datos en los censos de población y vivienda, tiene sentido si representa una oportunidad para mejorar, 180 significativamente, la eficiencia de las operaciones y la calidad de los datos y productos. Y cómo ya se ha señalado su incorporación conlleva una serie de pruebas o censos experimentales, para calcular riesgos y desafíos, que también deben incluirse en la planificación y gestión del Censo ya que tendrán implicaciones para las áreas operativas, metodológicas y tecnológicas involucradas en todo el proceso. Los responsables de estos cambios tecnológicos son los INE’s, instituciones en las cuáles la elaboración de estadísticas siempre está sujeta a condicionamientos políticos y presupuestarios, por ello muchas veces buscan optar por la tecnología que, con bajo costo, garantice la recopilación de datos de calidad y oportunos. 7.1 Sugerencias A continuación, se aportan algunas sugerencias con respecto al proceso de captura de datos censales. Respecto a los resultados provisionales, sería pertinente tomar en cuenta las ventajas de informatizar planillas operativas, si se pretende celeridad en la publicación. Y este aspecto es importante, dado que el Censo es el único operativo donde participa toda la población de un país, y es necesario brindar alguna información (fundamentalmente cantidad de población por sexo), desagregada por las provincias argentinas, en un tiempo prudencial y cercano al día del operativo. En ese sentido la planilla R2 (insumo fundamental para la creación del dato provisional) debe tener un tratamiento acorde a su vital importancia. Lo mismo la planilla operativa del censista (C2) que es el insumo con el cuál se completa la R2. Al respecto sobre la planilla C2, se sugiere que no sea lo último que se explica en el curso de capacitación del censista, como tampoco lo último que el censista completa al final del agitado día de trabajo censal. Además, es conveniente que, haciendo uso del avance de la tecnología en todo el país, se pueda garantizar de manera efectiva, la informatización de esta planilla para obtener información fiable y oportuna. Respecto a los resultados definitivos, si se opta por continuar utilizando un método de captura mediante el escaneo de imágenes, se sugiere que el cuestionario censal tenga la menor cantidad posible de variables a recolectar en campo, e incluso pocas preguntas abiertas. Este es un aspecto complicado en nuestros censos, dado que, a la hora de planificarlo, diversos organismos estatales reclaman la inclusión de mayor número de preguntas que consideran de 181 fundamental importancia, motivados por la ausencia o la falta de sistematización o informatización de sus registros administrativos. En ese sentido una mayor cantidad de variables no solo aumentará los tiempos y los costos del procesamiento, sino que atentará contra la calidad de la información relevada. Y dado que este inconveniente es de difícil solución en el corto plazo, se sugiere optar por metodologías alternativas y mixtas; en ese sentido el Censo 2022 ha buscado una solución tecnológica interesante e innovadora, con la inclusión del e-Censo que seguramente se enfrentará a nuevos inconvenientes, soluciones y desafíos, y que sería pertinente se documentaran, no sólo los procesos realizados sino todos los aspectos mencionados, para quedar en la memoria institucional del INDEC. 182 8. BIBLIOGRAFÍA Alonso, Carlos. (4 marzo 2020) Gobierno define plan para Censo 2022: será de derecho y se extenderá por tres meses. La tercera. https://www.latercera.com/pulso/noticia/gobierno-defineplan-para-Censo-2022-sera-de-derecho-y-se-extendera-por-tresmeses/XZ45IGC2PBEMZP5BERLCKHYSQE/ Alonso, Carlos. (2 de octubre de 2020). Pandemia obliga al INE a postergar Censo 2022 en un año. La Tercera. https://www.latercera.com/pulso/noticia/pandemia-obliga-al-ine-apostergar-Censo-2022-en-un-ano/JXHBLPDWEJGO7IQM66HX5NJN2Y/ Alonso, Carlos. (24 mayo 2022) Gobierno posterga por segunda vez el Censo y ahora quedará para marzo-junio de 2024. La tercera. https://www.latercera.com/pulso/noticia/gobiernoanuncia-postergacion-del-Censo-de-poblacion-y-vivienda-para-marzo-junio-de2024/YQEEFCM6YRHPTECR5KFITZ4JU4/ Alvado, María Alicia. (2022) Los Censos en 153 años de historia: mediciones objetivas e imagen de cómo se autopercibe la sociedad. TELAM Digital. https://www.telam.com.ar/notas/202203/585436-los-Censos-en-153-anos-de-historiamediciones-objetivas-e-imagen-de-como-se-autopercibe-la-sociedad.html Álvarez, G. y Goldberg, M. (31 de octubre y 1 y 2 de noviembre 2007). Métodos censales alternativos: requisitos para su implementación en Argentina [Sesión de conferencia]. IX Jornadas Argentinas de Estudios de la Población. Sesión 5 Nuevas metodologías censales y su viabilidad en la Argentina. AEPA. Huerta Grande, Córdoba, Argentina. https://www.aacademica.org/000-028/15.pdf Aguilera, M. (1999). Algunas reflexiones sobre la producción de estadísticas y uso de la información censal. En CELADE, América Latina: aspectos conceptuales de Los censos del 2000. Santiago de Chile: CEPAL. https://hdl.handle.net/11362/5573 ATE-INDEC (septiembre 2010). Censo 2010: Lo que no se va a poder contar Informe de la comisión técnica ATE-INDEC. Argentina. http://www.ateindec.org.ar/documentos/55%20CENSO_2010%20lo%20que%20no%20se%2 0va%20poder%20contar.pdf Barrios Cesar. (9 de junio de 2022) En el Censo 2023 esperamos cubrir un porcentaje importante vía web. La Mañana.uy. https://www.xn--lamaana-7za.uy/politica/en-el-Censo2023-esperamos-cubrir-un-porcentaje-importante-via-web/ Bazán, Boyanovsky. (19 de mayo de 2022). Qué otros países de la región harán Censos este año. Tiempo argentino. https://www.tiempoar.com.ar/mundo/que-otros-paises-de-la-regionharan-Censos-este-ano/ Biblioteca virtual Miguel de Cervantes (2014). Constitución de 1853. 1 de mayo de 1853. https://www.cervantesvirtual.com/obra-visor/constitucion-para-la-confederacion-argentina-del1-de-mayo-de-1853/html/0ffc4f42-4620-490e-80ff-ae47aeeff6e5_2.html#I_6_ 183 Buttarello, Letizia. (19 de julio de 2021) Gobierno valora el "sentido propio" con bono de obsequio. La voce d´Italia. https://voce.com.ve/2021/07/19/597063/gobierno-estimula-elautoCenso-con-un-bono-de-obsequio/ Cámara Argentina de Comercio y Servicios. (2019). Informe sobre la historia de Los censos nacionales en Argentina. Unidad de Estudios y Proyectos Especiales. https://www.cac.com.ar/data/documentos/49_La%20historia%20de%20los%20Censos%20N acionales%20en%20Argentina.pdf Cámara Argentina de Comercio y Servicios. (2019). Informe sobre la historia de Los censos nacionales en Argentina. Unidad de Estudios y Proyectos Especiales. https://www.cac.com.ar/data/documentos/49_La%20historia%20de%20los%20Censos%20N acionales%20en%20Argentina.pdf Cardoso, Ciro F. S. / Brignoli, Héctor Pérez (1976) Los métodos de la historia. Introducción a los problemas, métodos y técnicas de la historia demográfica, económica y social. Ed. Crítica. Grupo Editorial Grijalbo, Barcelona. España Carrasco, Rodolfo. (24 mayo 2022) Gobierno suspende el Censo programado para 2023 por razones técnicas derivadas de la pandemia. Diario financiero. https://www.df.cl/gobiernosuspende-Censo-de-2023-por-razones-tecnicas-derivadas-de Cecchini, S. (23 de noviembre 2021) [Discurso inicial]. Evento paralelo a la XI Reunión de la Conferencia Estadística de las Américas de la CEPAL “Los censos de población y vivienda en contextos de pandemia: panorama regional y desafíos”. Santiago de Chile. https://www.cepal.org/sites/default/files/presentations/panorama-Censos-_poblacion_vivienda-al-cepal-23nov2021_.pdf Celi, Estefanía. (19 May 2022). Censo nacional llega con cambio de metodología y cerca de 80 preguntas. Primicias https://www.primicias.ec/noticias/sociedad/Censo-nacional-cambiometodologia-confusiones/ CELADE (1983) Demografía histórica en América latina. Fuentes y métodos. Serie E, No. 100 2. San José, Costa Rica. https://repositorio.cepal.org/bitstream/handle/11362/8735/S8300370_es.pdf?sequence=1&is Allowed=y CENTROESTAD, ONE, SICA. (2018) Taller Regional Censos de la Ronda 2020: Una oportunidad para generar información de cara al diseño de políticas públicas y el seguimiento a los compromisos nacionales e internacionales. República Dominicana. https://www.sica.int/documentos/relatoria-y-principales-recomendaciones-taller-regionalCensos-de-la-ronda-2020_1_113605.html CEPAL (2004) Manual de formulación, evaluación y monitoreo de proyectos sociales. Santiago de Chile. https://dds.cepal.org/redesoc/publicacion?id=242 CEPAL (2007) Potencialidades y aplicaciones de los datos censales: una contribución a la explotación del Censo de Población y Vivienda de Nicaragua 2005. Serie Manuales (nº 56). Santiago. https://repositorio.cepal.org/bitstream/handle/11362/5495/1/S0700698_es.pdf 184 CEPAL (2011a) Recomendaciones para Los censos de la década de 2010 en América Latina. https://www.cepal.org/es/publicaciones/5511Serie Manuales (nº 72). Santiago. recomendaciones-Censos-la-decada-2010-america-latina CEPAL (2011b) Guía para asegurar la calidad de los datos censales. Serie Manuales (N.°74). Santiago. https://www.cepal.org/es/publicaciones/5515-guia-asegurar-la-calidad-datoscensales CEPAL (2011c). Guía para la elaboración de un proyecto censal. Serie Manuales N.°70. Santiago de Chile. https://repositorio.cepal.org/bitstream/handle/11362/5508/1/S1100203_es.pdf CEPAL (2014) Los datos demográficos Alcances, limitaciones y métodos de evaluación. Serie Manuales No 82. https://www.cepal.org/es/publicaciones/37145-datos-demograficosalcances-limitaciones-metodos-evaluacion CEPAL (2017a), “Los censos de la ronda 2020: desafíos ante la Agenda 2030 para el Desarrollo Sostenible, los Objetivos de Desarrollo Sostenible y el Consenso de Montevideo sobre Población y Desarrollo”, serie Población y Desarrollo N° 120. Santiago de Chile, https://repositorio.cepal.org/bitstream/handle/11362/42394/4/S1700849_es.pdf CEPAL (2017b) Informe de resultados de la “Encuesta sobre el estado de avance de Los censos de 2020 e identificación de las necesidades nacionales”. https://celade.cepal.org/Censosinfo/documentos/INFORME_CENSOS_RONDA_2020_LAyC ARIBE.pdf CEPAL (2018). Encuesta sobre estado de avance de Los censos de 2020 e identificación de las necesidades nacionales. Informe final de resultados. https://celade.cepal.org/Censosinfo/documentos/INFORME_CENSOS_RONDA_2020_LAyC ARIBE.pdf CEPAL (2019) Aspectos conceptuales de los censos de población y vivienda: desafíos para la definición de contenidos incluyentes en la ronda 2020. serie Seminarios y Conferencias. (N.º 94) Santiago de Chile. https://www.cepal.org/es/publicaciones/44944-aspectos-conceptualesCensos-poblacion-vivienda-desafios-la-definicion CEPAL (2021a) Recomendaciones para los censos de población y vivienda en América Latina Revisión 2020. Documentos de Proyectos. Santiago de Chile. https://www.cepal.org/es/notas/nueva-edicion-recomendaciones-Censos-poblacion-viviendaamerica-latina-revision-2020 CEPAL (2021b) Lineamientos generales para la captura de datos censales Revisión de métodos con miras a la ronda de censos 2020. Documento de referencia de la Undécima Reunión de la Conferencia Estadística de las Américas de la Comisión Económica para América Latina y el Caribe. https://repositorio.cepal.org/handle/11362/47483 CEPAL (2021c) Los censos de población y vivienda de la ronda de 2020 en América Latina y el Caribe en el contexto de la pandemia Panorama regional y desafíos urgentes. Observatorio demográfico América Latina y el Caribe. https://mexico.un.org/sites/default/files/202206/S2100995_es.pdf 185 CEPAL (sfa) Cuestionarios censales, enlaces, resultados y procesamiento en línea con https://www.cepal.org/es/temas/Censos-de-poblacion-y-vivienda/enlacesREDATAM institutos-nacionales-estadistica-america-latina-caribe CEPAL (sfb)Documentos metodológicos de los países. https://www.cepal.org/es/temas/Censos-de-poblacion-y-vivienda/documentos-metodologicospaises CEPAL (2022a) Censos de población y vivienda: décadas 2000 y 2010. https://www.cepal.org/es/temas/Censos-de-poblacion-y-vivienda/Censos-poblacion-viviendadecadas-2000-2010 CEPAL (2022b) Censos de población y vivienda: calendario desde la ronda de 1950. https://www.cepal.org/es/temas/Censos-poblacion-vivienda/Censos-poblacion-viviendacalendario-la-ronda-1950 CEPAL (2022c) Documento metodológico para el aprovechamiento estadístico de registros administrativos económicos. https://repositorio.cepal.org/bitstream/handle/11362/48066/1/S2100970_es.pdf Chackiel, Juan. (2002). Los Censos en américa latina: nuevos enfoques. En Notas de población. Año XXIX. No 75. CELADE. Santiago de Chile. https://repositorio.cepal.org/bitstream/handle/11362/12731/np75045072_es.pdf?sequence=1 &isAllowed=y Constitución de la confederación argentina. Artículo 39. 1853. (Argentina). https://bibliotecadigital.csjn.gov.ar/Constitucion-de-la-Confederacion-Argentina-1853-.pdf DANE (2004) Diseño del Proceso de Captura y sus Aplicativos Censo General 2005 - CGRAL. Colombia DANE. (2005) Diseño del proceso de grabación, digitalización y procesamiento de imágenes del Censo General 2005. DANE (2007) Ficha metodológica Censo general 2005 – (CGRAL). CM-CGRAL-FME-01. versión: 06. Colombia DANE. (2019) Ficha Metodológica Censo Nacional de Población y Vivienda 2018. Colombia https://www.dane.gov.co/files/Censo2018/informacion-tecnica/DSO-CNPV-FME-01-v2.pdf DANE (2021) Lecciones aprendidas del Censo Nacional de Población y Vivienda (CNPV 2018). Colombia. https://www.dane.gov.co/files/Censo2018/informacion-tecnica/CNPV-2018lecciones-aprendidas-NTCE-PE-1000.pdf Decisión Administrativa 89 de 2022. [Ministerio de Economía] Adjudícanse los renglones Nros. 1 y 2 de la Licitación Pública N° 27-0001-LPU21 del Instituto Nacional de Estadística y Censos (INDEC). 31 de enero de 2022 https://www.boletinoficial.gob.ar/detalleAviso/primera/256889/20220201 Del Popolo, F. (2016) Avance en la identificación de pueblos indígenas y afrodescendientes y de personas con discapacidad en los Censos de población y vivienda. [Diapositiva de PowerPoint]. Seminario “Los Censos de la ronda 2020: potencialidades y desafíos frente a los 186 Objetivos de Desarrollo Sostenible y al Consenso de Montevideo en el marco de la Agenda 2030” https://www.cepal.org/sites/default/files/events/files/dia3_fdelpopolo.pdf Del Popolo, F. (2018) Aspectos generales sobre los Censos de población y vivienda en América Latina con miras a la ronda 2020. [Diapositiva de PowerPoint]. “Aspectos conceptuales de los Censos de población y vivienda: desafíos para la definición de contenidos incluyentes en la ronda 2020. https://www.cepal.org/sites/default/files/presentations/01_fabiana_del_popolo_celade.pdf Demirci, Meryem (2017). Experiences, good practices and challenges for the National Statistical Systems of Latin American countries in the light of the 2020 Population and Housing Census round. [Diapositiva de PowerPoint]. Overview of UNSD World Census Programme Use of Technology in Censuses. https://www.cepal.org/sites/default/files/presentations/meryem_demirci.pdf DIGESTYC (sf) Salvador. VI Censo de Población y V de http://digestyc.microdatahub.com/index.php/catalog/4/related_materials Vivienda 2007. Dirección General de Estadística Encuesta y Censos (2002) Medidas adoptadas en los Censos de población y vivienda para enfrentar los efectos de la pandemia COVID-19 Experiencia de Paraguay. CNPV 2022. https://rtccea.cepal.org/sites/default/files/rtc_connected/files/DGEEC_Paraguay_Censo2022_covid19%202020.07.30%20rev.pdf Dirección General de Estadística y Censos (2010). Los Censos modernos y el Censo del Bicentenario. Población de Buenos Aires, 7 (12),69-84. ISSN: 1668-5458. Disponible en: https://www.redalyc.org/articulo.oa?id=74015656007 Dirección Nacional de Estadísticas y Censos (1965). Censo Nacional de Población 1960. Tomo I. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1960_1.pdf Dirección Nacional del Servicio Estadístico (sf). IV Censo general de la nación 1947. Tomo 1. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1947t1master.pdf Diputados Argentina. (4 de mayo https://www.hcdn.gob.ar/prensa/noticias/2022/noticias_1762.html de 2022) El pitazo. (9 de abril de 2021). Esto es lo que se sabe hasta ahora del Censo nacional 2021. https://elpitazo.net/gran-caracas/claves-esto-es-lo-que-se-sabe-hasta-ahora-del-Censonacional-2021/ Estrada Orrego, Victoria. (2016) ¿Cuántos somos? Una historia de los Censos civiles y de la organización estadística en Colombia en la primera mitad del siglo XX. Historia Crítica, núm. 64. Departamento de Historia, Facultad de Ciencias Sociales, Universidad de los Andes. DOI: https://doi.org/10.7440/histcrit64.2017.08. https://www.redalyc.org/journal/811/81153004009/html/ FLACSO-CELADE-CEPAL & INE-Chile. (2018). Experiencias, buenas prácticas y desafíos para los sistemas estadísticos nacionales de los países de América Latina frente a la ronda de Censos de población y vivienda de 2020. Santiago de Chile: FLACSO. 187 Giambartolomei, Mauricio. (18 de mayo de 2022) Censo 2022: dan a conocer los primeros resultados pero el operativo seguirá una semana. En: LA NACION. https://www.lanacion.com.ar/sociedad/Censo-2022-en-vivo-ultimas-noticias-del-relevamientonacional-y-el-minuto-a-minuto-nid18052022/ Gobierno Brasil. (24/01/2022). Censo Demográfico 2022 mostrará el retrato actualizado de Brasil https://www.gov.br/pt-br/noticias/educacao-e-pesquisa/2022/01/Censo-demografico2022-vai-mostrar-o-retrato-atualizado-do-brasil González D y Ortiz, L. (2011) La medición de las tecnologías de información y comunicación a través de los Censos de población y vivienda. Una propuesta con miras a la ronda de Censos de la década de 2010 [Sesión de conferencia]. Los Censos de 2010 y las condiciones de vida Informe del Seminario-Taller. Santiago de Chile. https://repositorio.cepal.org/bitstream/handle/11362/6962/1/S1001019_es.pdf González, Rebeca. (19 de julio de 2021) XV Censo de Población y Vivienda: Empadronamiento de cuarta generación. Conatel. http://www.conatel.gob.ve/xv-Censo-de-poblacion-y-viviendaempadronamiento-de-cuarta-generacion/ Giusti, Alejandro. (2007) “Censos modernos: 1960, 1970, 1980, 1991, 2001”, en Torrado, S. (comp.), Población y bienestar en la Argentina del Primero al Segundo Centenario. Una historia social del siglo XX, Edhasa Buenos Aires. Horvat, Alejandro. (17 de mayo de 2022) Anécdotas: un pueblo “rebelde”, ataques de perros, y hasta un exhibicionista, los hechos inusuales que marcaron los últimos tres Censos. En LA NACION. https://www.lanacion.com.ar/sociedad/anecdotas-un-pueblo-rebelde-ataques-deperros-y-hasta-un-exhibicionista-los-hechos-inusuales-que-nid17052022/ IBGE. 2000. Brasil. Metodología del Censo Demográfico 2000. https://biblioteca.ibge.gov.br/index.php/biblioteca-catalogo?id=284173&view=detalhes IBGE. 2010. Brasil. Metodología del Censo Demográfico https://biblioteca.ibge.gov.br/pt/biblioteca-catalogo?view=detalhes&id=295987 2010. IBGE.2016. Metodología do Censo https://biblioteca.ibge.gov.br/visualizacao/livros/liv95987.pdf 2010 Demográfico IBGE. 2022. Censo 2022. https://Censo2022.ibge.gov.br/etapas.html IHSN. (2010) VII Censo de Población https://catalog.ihsn.org/index.php/catalog/4403 y VI de Vivienda 2010. Ecuador IHSN. (2007) VI Censo de Población 2007 - Subconjunto IPUMS El Salvador. https://catalog.ihsn.org/catalog/2634 INDEC. (1973) Censo Nacional de Población, familias y viviendas 1970. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1970_1master.pdf INDEC. (1983) Censo Nacional de Población y vivienda 1980. Serie D Población. Resumen Nacional. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1980d1.pdf 188 INDEC. (1993) Censo Nacional de Población y vivienda 1991. Resultados Definitivos. Características seleccionadas. Serie B N. 25. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1991b25.pdf INDEC. (1997) Evaluación DE La calidad de datos y avances metodológicos. Censo nacional de Población y vivienda 1991. Primera parte. Serie J. No 2. Argentina. https://biblioteca.indec.gob.ar/bases/minde/1c1991j2.pdf INDEC. (2006) Censo Nacional de Población, hogares y vivienda 2001. Serie 2 Resultados generales. N. 25. Total país. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c2001_2_25.pdf INDEC. (2010a). Especificaciones técnicas de la impresión de cuestionarios, captura de datos y provisión de materiales y servicios conexos para el Censo Nacional de Población, Hogares y Viviendas del año 2010. INDEC. (2010b) Manual de operaciones de repliegue y captura del Censo 2010 (Documento Interno) INDEC. (2010c) Manual del censista de viviendas particulares. Censo Nacional de Población, Hogares y Viviendas 2010. https://celade.cepal.org/Censosinfo/manuales/AR_ManCensistaVP_2010.pdf INDEC. (2010d) Manual del Jefe de Radio. Censo nacional de población, hogares y vivienda 2010. https://biblioteca.indec.gob.ar/bases/minde/1c2010x2_1.pdf INDEC. (2010e) Manual del Jefe de Fracción. Censo nacional de población, hogares y vivienda 2010. https://biblioteca.indec.gob.ar/bases/minde/1c2010x2_4.pdf INDEC. (2011) Estados de situación en el proceso de captura de datos 2011. Documento interno. INDEC. (2012) Censo Nacional de Población, Hogares y Viviendas 2010. Censo del Bicentenario. Resultados definitivos. Serie B Nº 2. Tomo 1. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c2010b2t1.pdf INDEC. (2013) Censo Nacional de Población, Hogares y Viviendas 2010. Censo del Bicentenario. Base de datos REDATAM. Aspectos metodológicos. Serie Base de datos Censo 2010. Buenos Aires. https://redatam.indec.gob.ar/redarg/CENSOS/CPV2010A/Docs/aspectos.pdf INDEC. (2020) Informe de evaluación de calidad cuantitativa de la segunda prueba piloto Hacia la Ronda 2020. Documento de trabajo N° 33. https://www.indec.gob.ar/ftp/cuadros/poblacion/informe_IIPP_calidad_cuantitativa_Censo_ro nda2020.pdf INDEC. (2021) Pliego de especificaciones técnicas Censo nacional de población, hogares y viviendas ronda 2020. http://servicios.infoleg.gob.ar/infolegInternet/anexos/350000354999/353719/res550-2.pdf 189 INDEC. (2022a). Censo Nacional de Población, Hogares y Viviendas de la Argentina Síntesis de la planificación del Censo 2022 Instituto Nacional de Estadística y Censos Buenos Aires, marzo de 2022. https://www.indec.gob.ar/ftp/cuadros/poblacion/sintesis_planificacion_Censo_2022.pdf INDEC. (2022b) Censos de https://www.Censo.gob.ar/index.php/historia/ población en la argentina. INDEC. (2022c). Historia. https://www.indec.gob.ar/indec/web/Institucional-Indec-Historia INDEC. (2022d). Informe de evaluación de los aspectos operativos del Censo Nacional de Población, Hogares y Viviendas 2022 – Provincia de Buenos Aires. INDEC. (18/08/2022) Procesamiento de los resultados preliminares del Censo Nacional de Población, Hogares y Viviendas 2022. En Gacetilla de prensa. https://www.indec.gob.ar/indec/web/Institucional-GacetillaCompleta-447 INDEC. (2023) Resultados provisionales del Censo Nacional de Población, Hogares y Viviendas 2022. https://www.indec.gob.ar/ftp/cuadros/poblacion/cnphv2022_resultados_provisionales.pdf INE (2018) Chile. Memoria Censo. 2017. Chile. http://www.Censo2017.cl/memoria/descargas/memoria/libro_memoria_censal_2017_final.pdf INE (sf) Costa Rica. Documento Metodológico. V Censo Nacional de Vivienda del año 2000. https://1library.co/document/y4m9d2ky-documento-metodologico-v-Censo-nacional-devivienda-del-ano-area-de-Censos-y-encuestas.html INE (Sf) Guatemala. Documentación https://www.Censopoblacion.gt/documentacion y manuales. INE (sfa) Uruguay. Censos 2011. Documentos. https://www.ine.gub.uy/web/guest/Censos2011 INE (2021). Uruguay. Proyecto Censal Censo de Población, Hogares y Viviendas 2023. https://Censo2023.ine.gub.uy/wp-content/uploads/2021/08/Proyecto-Censal-Censo-dePoblacion-Hogares-y-Viviendas-2023.pdf INE (Sfb) Uruguay. Resumen operativo. Censos https://celade.cepal.org/Censosinfo/manuales/UY_ResumenOperativo_2011.pdf 2011. INE (sf) Venezuela. Venezuela - XIV Censo Nacional de Población y Vivienda 2011. file:///C:/Users/nigitaruben/Downloads/ddi-documentation-spanish-18.pdf INEC (sf) Ecuador. https://www.ecuadorencifras.gob.ec/institucional/home/ INEC (2010) Ecuador. ¿Qué es el Censo de Población y https://www.ecuadorencifras.gob.ec/que-es-el-Censo-de-poblacion-y-vivienda-2/ Vivienda?. INEGI 2011. Síntesis metodológica y conceptual del Censo de Población y Vivienda 2010 https://celade.cepal.org/Censosinfo/manuales/MX_MetodologiaConceptual_2010.pdf 190 INEGI 2021. Síntesis metodológica y conceptual Censo de Población y Vivienda 2020. https://www.inegi.org.mx/contenido/productos/prod_serv/contenidos/espanol/bvinegi/producto s/nueva_estruc/702825197537.pdf INEGI (sf) México. Subsistema de Información Demográfica y Social. Censos y Conteos. Censos de Población y Vivienda. 2010. 2020. https://www.inegi.org.mx/datos/metodologias.html INEI (sf) Perú. Documentos Metodológicos. http://Censo2017.inei.gob.pe/metodologias/ Informe técnico licitación pública 27-0001-LPU21. Dictamen del INDEC 2021. [INDEC]. 4 de noviembre de 2021. (Argentina) https://es.scribd.com/document/537844670/Dictamen-delIndec. Juran, Sabrina (2021). Innovación censal al servicio del aseguramiento de la calidad y la cobertura. En: Agenda 2030: ¿Hacia un cambio de paradigma de los Censos de población? XX Encuentro de la Reunión Especializada de Estadística del Mercosur. Mayo de 2021. https://docs.google.com/document/d/1q7szwHQ1_GLzS4zm6YN15k6Kq2uLc39mA59NtxymS UE/edit Juran, Sabrina/ Pistiner, Arona L. (2017) The 2010 round of population and housingcensuses (2005–2014). En: Statistical Journal of the IAOS vol. 33, núm. 2. https://www.researchgate.net/publication/311167099_The_2010_round_of_population_and_h ousing_censuses_2005-20141 La Nación (17 de abril de 2002). Habría más habitantes argentinos que lo estimado. https://www.lanacion.com.ar/sociedad/habria-mas-habitantes-argentinos-que-lo-estimadonid389311/ La Nación. (24 de octubre de 2022) Se perdieron millones de datos provisorios del Censo. https://www.lanacion.com.ar/economia/se-perdieron-millones-de-datos-provisorios-delCenso-de-este-ano-nid24102022/ Maeder, Ernesto J. (1968). Historia y resultados del Censo confederal de 1857. Trabajos y Comunicaciones; no. 18. Argentina. http://sedici.unlp.edu.ar/bitstream/handle/10915/11616/Documento_completo__.pdf?sequenc e=1&isAllowed=y Maeder, Ernesto J. A. (2018) Manual de historia argentina colonial. cuadernos docentes. Instituto de Investigaciones Geohistóricas (IIGHI)-CONICET. Argentina https://iighi.conicet.gov.ar/wp-content/uploads/sites/29/2020/04/Libro-Cuadernos-DocentesN%C2%BA-10-Definitivo-compressed.pdf Masse G. (1997) Fuentes útiles para estudios de población argentina [Sesión de conferencia] Simposio del 49 congreso internacional de americanistas. Quito, Ecuador https://periferiaactiva.files.wordpress.com/2019/03/fuentes-c3batiles-para-los-estudios.pdf Masse G. (2012) El tamaño y el crecimiento de la población desde la Conquista hasta 1870. En Historia de la provincia de Buenos Aires: tomo 1. Población, ambiente y territorio. Edhasa. 191 UNIPE. http://biblioteca.clacso.edu.ar/Argentina/unipe/20200408112545/HPBA1.pdf Argentina. Massé, G. (Enero de 2011). Documento metodológico guía para la elaboración de un proyecto censal [Sesión de conferencia]. Los Censos de 2010 y las condiciones de vida Informe del Seminario-Taller. Santiago de Chile. https://repositorio.cepal.org/bitstream/handle/11362/6962/1/S1001019_es.pdf MDZ, (18 de mayo de 2022). Cuánto dinero gastó el gobierno en la app del Censo que no funcionó. https://www.mdzol.com/sociedad/2022/5/18/cuanto-dinero-gasto-el-gobierno-en-laapp-del-Censo-que-no-funciono-244192.html Memo, política, economía y poder. (11 de octubre de 2021). Las 4 empresas que se disputan la millonaria licitación del Censo nacional 2022. https://www.memo.com.ar/poder/las-4empresas-que-se-disputan-13-000-millones-del-Censo-nacional-2022/ Ministerio de Economía y Producción. (2007). Estudio para la producción de indicadores de resultado que cuantifiquen la eficiencia de la inversión pública mediante el recurso FONAVI en la política de vivienda. https://www.argentina.gob.ar/sites/default/files/fonavi.pdf Mejía Guerra, José Antonio. (2021) Los retos de la transición en los Censos de América Latina. En: Agenda 2030: ¿Hacia un cambio de paradigma de los censos de población? XX Encuentro de la Reunión Especializada de Estadística del MERCOSUR-Mayo de 2021. https://docs.google.com/document/d/1q7szwHQ1_GLzS4zm6YN15k6Kq2uLc39mA59NtxymS UE/edit Moncayo, José Rosero (2015) Una Mirada Histórica a la Estadística del Ecuador. Primera Edición. Quito. https://www.ecuadorencifras.gob.ec/documentos/webinec/Bibliotecas/Libros/INEC_Historia_Censos.pdf Mrkić, Srdjan. (2019). United Nations Statistics Division Programme in Support of the 2020 Round of Population and Housing Censuses. United Nations Statistics Division. En Regional Workshop on the 2020 World Programme on Population and Housing Censuses: International standards and contemporary technologies.. Ankara, Turkey, 12-15 March 2019. https://www.sesric.org/imgs/news/2137_PRESENTATION_UNSD_SESSION_2.pdf Mrkić, Srdjan, (27 de marzo de 2020) La ronda de Censos de población y vivienda de 2020: una visión general Estadísticas Demográficas, División de Estadística de las Naciones Unidas, Nueva York. En: Revista Estadística de la IAOS, vol. 36, núm. 1. DOI: 10.3233/SJI-190574 Mrkić, Srdjan. (1 de enero de 2021). Conducting population and housing censuses during the pandemic: An overview. En: Statistical Journal of the IAOS. vol. 37. No. 2. https://content.iospress.com/articles/statistical-journal-of-the-iaos/sji210820 Muñoz Ayala, J.E. (2013). Determinantes del Uso de la Tecnología en los Censos de Población de América Latina y el Caribe. [Diapositiva de PowerPoint]. http://www.ine.gov.ve/documentos/INE/NotasDePrensa/docs/Seminario_Internacional/BID/Pr esentacionBID.pdf Naciones Unidas (2001) Handbook on Population and Housing Census Editing. Studies in https://unstats.un.org/unsd/demographicMethods (SER.F/82/Rev1) New York. 192 social/Standards-and-Methods/files/Handbooks/population-and-housingcensuses/SeriesF_82-E.pdf Naciones Unidas (2008), Principios y recomendaciones para los Censos de población y habitación Revisión 2. (M/67/Rev.2), Informes estadísticos. New York. https://unstats.un.org/unsd/publication/seriesm/seriesm_67rev2s.pdf Naciones Unidas (2009), Census Data Capture Methodology. Technical Report. Nueva York. https://unstats.un.org/unsd/demographicsocial/census/documents/CensusDataCaptureMethodology.pdf Naciones Unidas (2010) Handbook on Population and Housing Census Editing. Revision 1. Studies in Methods (SER.F/82/Rev.1). New York. https://unstats.un.org/unsd/publication/SeriesF/seriesf_82rev1e.pdf Naciones Unidas (2011) Manual de revisión de datos de los Censos de población y vivienda Revisión 1. Nueva York. https://unstats.un.org/unsd/publication/SeriesF/seriesf_82rev1s.pdf Naciones Unidas. (2012) Informe de Estados Unidos sobre el Programa mundial de 2010 sobre los Censos de población y vivienda. E/CN.3/2012/2. Disponible en: http://unstats.un. org/unsd/statcom/sc2012.htm Naciones Unidas (2017). Principles and Recommendations for Population and Housing Censuses, Revision 3, (M/67/Rev.3), New York. https://unstats.un.org/unsd/demographicsocial/Standards-and-Methods/files/Principles_and_Recommendations/Population-andHousing-Censuses/Series_M67rev3-E.pdf Naciones Unidas (2019). Guidelines on the use of electronic data collection technologies in population and housing censuses. New York. https://unstats.un.org/unsd/demographic/standmeth/handbooks/guideline-edct-census-v1.pdf Naciones Unidas (2020a). Handbook on Population and Housing Census Editing Revision 2. New York. https://unstats.un.org/unsd/publication/SeriesF/seriesf_82rev2e.pdf Naciones Unidas (2020b), “Responses to the 1st UNSD survey on the impact of COVID-19” [en línea] https://unstats.un.org/unsd/demographic-social/census/COVID-19-SurveyT1/. Naciones Unidas (2021a) Handbook on the Management of Population and Housing Censuses Revision 2. Series 2020 (SER.F/83/Rev.2) New York. https://unstats.un.org/unsd/publication/seriesF/Series_F83Rev2en.pdf Naciones Unidas (2021b), “Impact of COVID-19 on 2020 round population and housing censuses” [en línea] https://unstats.un.org/unsd/demographic-social/census/COVID-19/ Nigita Ruben. (27-30 de octubre de 2014) Experiencias de los Censos de Población y Vivienda Ronda 2010 Taller experiencias de los Censos de población y vivienda de la ronda de 2010. Bogotá. Colombia. Novick, Susana. (22 al 26 de julio 2002). Legislación referida a Censos y estadísticas en la Argentina: 1854-1991. [Ponencia]. XIII World Congress of the International Economic History Association (IEHA), Session N* 80: “Estatistical and cartographic information in State and 193 market building processes. Buenos Aires, Argentina. http://biblioteca.clacso.edu.ar/Argentina/iigg-uba/20161125024358/PONNovicklegislacion.pdf ONE. Cuba. Informe Nacional. Censo de Población y Viviendas. http://www.onei.gob.cu/sites/default/files/informe_nacional_Censo_0.pdf Cuba 2012. Otero, Hernán. (1998) Estadística censal y construcción de nación. Boletin del instituto de Historia argentina y americana. No 16 y 17. Segundo semestre de 1997 y primero de 1998. https://ravignanidigital.com.ar/_bol_ravig/n16_17/n1617a05.pdf Otero, Hernán. (2006) Estadística y Nación. Una historia conceptual del pensamiento censal de la argentina moderna 1869-1914. Prometeo libros. Buenos Aires, Argentina. Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A. (2012). Estimación de algunos efectos y determinantes del uso de distinta tecnología en los Censos de población de América Latina y el Caribe- Revista notas de población. No 95 (Año XXXIX). 65-106. https://www.cepal.org/es/publicaciones/37687-notas-poblacion-vol39-ndeg-95 PreCenso de viviendas. (sf). Metodología preCenso de viviendas del Censo 2022. https://preCensodeviviendas.indec.gob.ar/metodologia Presidencia de la República- Uruguay. (6 de agosto de 2021). Censo 2023- Lanzamiento del https://www.gub.uy/sistema-nacionalCenso 2023. gub.uy. emergencias/comunicacion/noticias/lanzamiento-del-Censo-2023 Programa Mundial de Censos de Población y Vivienda. (2016). Estadísticas Demográficas y Sociales. https://worldbank.github.io/sdg-metadata/phase-2/documents/es/17-19-2a.pdf Red Eco. (30 de septiembre de 2010) Lo que no se va a poder contar. Informe preliminar de la comisión interna ATE-INDEC sobre el Censo 2010. http://www.redeco.com.ar/nacional/masdelpais/4238-lo-que-no-se-va-a-poder-contar República Argentina. (1872) Primer Censo de la República Argentina, verificado en los días 15, 16 y 17 de septiembre de 1869. Imprenta del Porvenir. Buenos Aires. http://www.estadistica.ec.gba.gov.ar/dpe/Estadistica/Censos/C1869-TU.pdf República Argentina. (1898) Segundo Censo de la República Argentina, mayo 10 de 1895. Tomo II Población. Taller topográfico de la penitenciaria Nacional. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1895t2.pdf República Argentina. (1916) Tercer Censo de la República Argentina, Levantado el 21 de juniode1914. Tomo I. Talleres gráfico de L. J. Rosso y Cía. Buenos Aires. https://biblioteca.indec.gob.ar/bases/minde/1c1914t1.pdf Revoluciona. (22 de septiembre de 2019) Continúa primera fase del XV Censo de Población y Vivienda en Caracas. https://www.vtv.gob.ve/continua-primera-fase-xvCenso-poblacionvivienda-caracas/ Ríos, Eduardo L.G. (23 de noviembre de 2021) Los Censos de población y vivienda en contextos de pandemia: panorama regional y desafíos urgentes. https://www.cepal.org/sites/default/files/presentations/Censos-poblacion-vivienda-contextospandemia-ibge-23nov2021.pdf 194 Ruiz, M y Del Popolo, F. (2009) Fuentes de datos demográficos: viejos problemas, potencialidades vigentes y nuevos desafíos en América Latina. Revista Notas de Población N°89. 7-12. CEPAL. Santiago de Chile. https://repositorio.cepal.org/bitstream/handle/11362/37693/1/S0900339_es2.pdf Ruiz, M. (2016) Estado de avance de los Censos de la ronda 2020 e identificación de las necesidades nacionales. [Diapositiva de PowerPoint]. Seminario “Los Censos de la ronda 2020: potencialidades y desafíos frente a los Objetivos de Desarrollo Sostenible y al Consenso de Montevideo en el marco de la Agenda 2030”. file:///C:/Users/nigitaruben/Documents/TESIS%20RUBEN/magda%20ruiz.pdf Sacco. Nicolás. (2017) ¿Cierran los números con la gente adentro?. Estudios demográficos urbanos. https://estudiosdemograficosyurbanos.colmex.mx/index.php/edu/article/view/1648 Sacco, Nicolás (6 diciembre de 2019) La estadística militante y el Censo 2020. OLAC. https://observatoriocensal.org/2019/12/06/la-estadistica-militante-y-el-Censo-2020/#more3403%20Nicol%C3%A1s%20Sacco Sabag, A., & Villalón, G. (1999). Criterios de consistencia e imputación de la no respuesta. En América latina: aspectos conceptuales de los Censos del 2000. CEPAL. Santiago de Chile. https://repositorio.cepal.org/bitstream/handle/11362/5552/S9950308_es.pdf?sequence=1&is Allowed=y SG (sf) SQLite: La Base de Datos Embebida. https://sg.com.mx/revista/17/sqlite-la-basedatos-embebida Sánchez, C. (11 de febrero de 2020). Ejemplos de Referencias Bibliográficas APA. Normas APA (7ma edición). https://normas-apa.org/referencias/ejemplos/ Tomino, Pablo. (13 de octubre de 2010) Crítico informe sobre el Censo nacional. En La Nación. https://www.lanacion.com.ar/sociedad/critico-informe-sobre-el-Censo-nacional-nid1314347/ UNAM (sf). Lenguaje de programación VISUAL BASIC .NET. https://cursosenlinea.tic.unam.mx/sl/Temarios/Lenguaje_de_programacion_VISUAL_BASIC_ .NET.html UNFPA y DANE (2014).Taller: Experiencias de los Censos de Población y Vivienda de la Ronda 2020. https://lac.unfpa.org/sites/default/files/pubpdf/Memorias%20Taller%20Censos%20Poblacion%20Bogot%C3%A1%202014.pdf UNFPA (2017) Porque todo el mundo cuenta. marzo de 2017 Revisado en julio de 2019. https://www.unfpa.org/sites/default/files/pub-pdf/Census_Strategy_Spanish.pdf UNFPA, MERCOSUR, INDEC (mayo de 2021) Agenda 2030: ¿Hacia un cambio de paradigma de los Censos de población? (Conclusiones) XX Encuentro de la Reunión Especializada de Estadística del MERCOSUR. https://docs.google.com/document/d/1q7szwHQ1_GLzS4zm6YN15k6Kq2uLc39mA59NtxymS UE/edit Valente, Paolo. (13 de septiembre de 2019) Modernización del Censo en Europa: métodos tradicionales y nuevos para la ronda de 2020. N-IUSSP. https://www.niussp.org/environmentand-development/modernizing-the-census-in-europe-traditional-and-new-methods-for-the2020/ 195 Velázquez, Guillermo Ángel / Celemín, Juan Pablo. (2020) Calidad de vida en Argentina 1960. Una perspectiva geográfica. Vol.11, Núm.1 Enero-Abril. https://rde.inegi.org.mx/index.php/2020/03/24/calidad-de-vida-en-argentina-1960-unaperspectiva-geografica/ Velázquez, Guillermo/ Tisnés, Adela. (2016) Evolución y características de la población. En geografía y calidad de vida en Argentina. Tandil 2016. https://igehcs.conicet.gov.ar/wpcontent/uploads/sites/104/2019/06/GCVA-web.pdf Vidal, R. (2018) Principales Resultados de la encuesta sobre uso de la tecnología en los Censos de población y vivienda de la ronda 2020. [Diapositiva de PowerPoint]. Seminario “Aspectos conceptuales de los Censos de población y vivienda: desafíos para la definición de contenidos incluyentes en la ronda 2020. https://www.cepal.org/sites/default/files/presentations/02_rodrigo_vidal_lizbeth_exposito.pdf Wainer, Luis E. (2010) La Ciudad de Buenos Aires en los Censos de 1778 y 1810. EN Población de Buenos Aires, vol. 7, núm. 11, abril. Dirección General de Estadística y Censos. Buenos Aires, Argentina. https://www.redalyc.org/pdf/740/74012783008.pdf Wainfeld, Mario. (31 de mayo de 2022) El Censo, los datos, los avances, los deberes, el contexto. En https://www.pagina12.com.ar/423328-el-Censo-los-datos-los-avances-losPÁGINA 12. deberes-el-contexto XV Censo nacional de población y vivienda. (2019). XV Censo nacional de población y vivienda. https://xvCenso.gob.ve/ 196 9. ANEXOS Anexo 1. Generalidades de los Censos “Un Censo de Población y/o vivienda es el conjunto de las operaciones consistentes en recoger, recopilar, evaluar, analizar y divulgar datos demográficos y/o de vivienda, económicos y sociales relativos a todos los habitantes y sus locales de habitación” (Naciones Unidas, 2008). “Aparecen como una herramienta primordial que debe ser tenida en cuenta para enfrentar los desafíos de información esencial para el desarrollo de los países” (CEPAL, 2017a). Esta operación estadística es la más grande y es para gran parte de los países la fuente principal de información, para identificar las características sociodemográficas y habitacionales en un momento específico en el tiempo. En la sociedad surgen nuevas demandas de información sociodemográfica, resultado de la variedad de temas poblacionales que se establecen en las agendas de cada país, así como de los enfoques a abordar, ocasionados por los cambios sociales y políticos que enfrentan diferentes sectores de la población. La información no sólo constituye una herramienta técnica, sino también un recurso político a favor del ejercicio de los derechos, la democracia y el buen gobierno. En este sentido “las instituciones del Estado, los organismos internacionales y las organizaciones de la sociedad civil plantean demandas crecientes de información tendiente a visualizar” (Ruiz, M y Del Popolo, F. 2009). “Además de contribuir a la definición de políticas más efectivas y pertinentes, la disponibilidad de más y mejor información también pone a disposición de los diferentes usuarios un instrumento de utilidad para que puedan ejercer grados crecientes de participación y control respecto de las acciones que llevan a cabo los Estados y sus organismos” (Ruiz, M y Del Popolo, F., 2009). Desde el punto de vista estadístico, el Censo por su carácter de universalidad, provee la información básica para la construcción de un sistema de muestras de diverso alcance; a partir de los marcos muestrales, se estructuran los diseños de la mayor parte de las encuestas a hogares y de propósitos múltiples que se realizan en el país, siendo la columna vertebral del Sistema Estadístico Nacional. Asimismo, la información que se obtiene es el soporte de la planeación, administración y elaboración de planes de desarrollo, planes económicos y sociales focalizados; así como la construcción de políticas públicas eficaces en su alcance, y eficientes en torno a la focalización de sujetos y recursos. De igual forma, es la herramienta 197 que permite llevar a cabo el seguimiento, evaluación y formulación de nuevas metas a los compromisos del país ante la comunidad internacional. Contar con datos precisos y detallados acerca de la magnitud, la distribución y la composición de la población, permite a los dirigentes y tomadores de decisiones planificar y ejecutar actividades de desarrollo económico y social, administrativas o de investigación científica. “El Censo de Población es una fuente fundamental de esas estadísticas básicas de referencia, que abarcan no sólo la población sedentaria, sino también las personas sin alojamiento y los grupos nómadas. Los datos de los Censos de población pueden presentarse y analizarse en forma de estadísticas sobre las personas y los hogares y para una gran variedad de unidades geográficas”. (Naciones Unidas, 2008). Dentro de la literatura relacionada con los Censos se identifican varios fines sobre este tipo de operación estadística. Según Aguilera (1999), entre los principales objetivos de los Censos de población, está el de obtener “información estadística para los planes de desarrollo económico y social, para fines administrativos y para evaluar las condiciones de los asentamientos humanos; asimismo, para la realización de investigaciones y usos comerciales, etc. (Aguilera, 1999). De acuerdo con este autor los principales usos de los datos censales se pueden clasificar de la siguiente manera: 1. Usos con fines políticos, de programación y administrativos. La información censal sirve para conocer y evaluar la situación económica, social y demográfica y para establecer programas de fomento del bienestar del país. También para la evaluación de programas de educación, empleo, recursos humanos, vivienda, salud, desarrollo rural, urbanización, ente otros. (Aguilera, 1999). 2. Uso con fines de investigación. Para el análisis y evaluación sobre la composición, distribución y crecimiento de la población por sexo y edades, distribución geográfica de la población socio económicas, etc. (Aguilera, 1999). 3. Uso en el comercio, la industria y el trabajo. Para estimar la demanda de bienes y servicios por parte de los consumidores; calcular la disposición de mano de obra; etc. (Aguilera, 1999). 4. Uso de los Censos de vivienda. Para la formulación de políticas y programas habitacionales; evaluar disponibilidad, déficit y costo de la vivienda; etc. (Aguilera, 1999). Los procesos y resultados censales, a la vez que son la base para el desarrollo de futuros Censos de población por la acumulación de experiencias que genera, son fundamentales para cualquier otra operación estadística de amplia cobertura nacional que se pretenda realizar; 198 así, la tecnología, la cartografía, la geo-referenciación de viviendas, el recuento de viviendas, el diseño de los operativos, la forma de acceder a la población y la recolección y procesamiento de la información, son elementos de utilización inmediata en el diseño y ejecución de futuras operaciones estadísticas. En este capítulo se abordará las características principales de los Censos teniendo en cuentas sus criterios básicos entre otros aspectos. Asimismo, se revisará las diferentes alternativas para la realización de Censos y las diferentes recomendaciones que ha hecho naciones unidas para su realización. Por otra parte, se hará un recorrido por las diferentes etapas censales teniendo en cuenta los procesos que las componen, haciendo énfasis en la etapa postcensal. Finalmente, se hará un breve análisis de las tecnologías de captura de información y como esta se ha implementado en América latina en las últimas décadas. 1 Tipos de Censos 1.1 Criterios básicos Las características esenciales de los Censos de población y habitación son el empadronamiento individual, la universalidad dentro de un territorio definido (Naciones Unidas 2008), la simultaneidad y la periodicidad definida, las cuales se detallan a continuación: 1. Empadronamiento individual: La enumeración de cada persona, cada hogar y cada vivienda por separado con el fin de poder clasificar a esas unidades según cada uno de sus atributos. “El Censo supone que se empadrona a cada persona y se enumera cada local de habitación por separado, y que sus características se registran también por separado” (Naciones Unidas 2008). 2. Universalidad dentro de un territorio definido: Este criterio se basa en que es imprescindible que toda la población hogares y viviendas dentro de los límites del territorio deben ser empadronadas sin excepción. “El Censo debe abarcar un territorio definido con precisión (por ejemplo, todo el país o una parte bien delimitada del mismo). El Censo de Población debe incluir a todas las personas que estén presentes y/o residan dentro de la zona abarcada, según la clase de recuento de la población necesario. El Censo de habitación debe incluir todos los locales de habitación, con independencia de su tipo” (Naciones Unidas 2008). 3. Simultaneidad: Se refiere a que es necesario que la información este referida a un momento preciso en el tiempo. “Todas las personas deben ser empadronadas y todos los 199 locales de habitación enumerados en una fecha lo más próxima posible a un mismo momento bien determinado, y los datos recogidos deben corresponder a un período de referencia bien definido. Sin embargo, no es indispensable que el período de referencia sea idéntico para todos los tipos de datos obtenidos. Para la mayoría de los datos será el día del Censo; en algunos casos puede ser un período anterior a la fecha de éste.” (Naciones Unidas 2008). 4. Periodicidad definida: Esta característica hace referencia a que esta operación estadística debe realizarse en intervalos regulares, con el fin de poder disponer de información que sea comparable en una secuencia fija y de esta forma poder hacer una evaluación del pasado de la información censal, describir con exactitud el presente y predecir el futuro. De esta forma Naciones Unidas recomienda que se levante un Censo nacional con una periodicidad constante por lo menos cada diez años, haciendo énfasis en los años terminados en cero o en fechas cercanas a estos años. “Algunos países quizás encuentren necesario levantar Censos con más frecuencia, por la rapidez con que se producen cambios importantes en su población o en las condiciones en materia de habitación (Naciones Unidas 2008). Esto permite que se pueda realizar una comparación de la información censal entre los países que hayan realizado el Censo de Población por la misma época. Esta recomendación algunas veces los países no pueden seguirla por razones jurídicas, administrativas, presupuestarias o de otra índole. La implementación de estos criterios permite la generación de información censal con un amplio detalle a nivel geográfico, así como la posibilidad de obtener clasificaciones que abarquen múltiples variables y categorías, y de esa forma identificar grupos poblacionales con características sociales o demográficas específicas, teniendo en cuenta la confidencialidad de los datos. 1.2 Censo tradicional La aproximación tradicional comprende “una compleja operación de recopilación activa de información suministrada por las personas y hogares sobre una gran variedad de temas en un momento previamente especificado, junto con la compilación, evaluación, análisis y divulgación de datos demográficos, económicos y sociales relativos a un país o a una parte del mismo bien delimitada” (Naciones Unidas 2008). La metodología tradicional tiene la gran ventaja que provee una radiografía de la población total en un periodo específico y la 200 disponibilidad de información para áreas pequeñas, cumpliendo con los criterios básicos mencionados anteriormente de enumeración individual, universalidad y simultaneidad. En este sentido el Censo tradicional es único en su naturaleza. Los Censos tradicionales son la operación estadística en donde se realiza una recopilación de datos de manera muy elaborada y compleja. Para plantear esta metodología es necesario tener en cuenta “la existencia y/o el desarrollo de determinados recursos, tecnologías y métodos sin los cuales no podría replantearse la metodología censal tradicional” (Álvarez 2007). Así como tener a disposición información actualizada como registros administrativos, cartografía y un archivo de domicilios completo. Naciones Unidas identifica en los Censos tradicionales dos metodologías o modalidades de enumeración; los Censos de hecho o facto y los Censos de derecho o de Jure. En los Censos de hecho o facto, el relevamiento se realiza en el sitio donde se encuentran presentes o “dónde se encuentran las personas en la noche del Censo” (Naciones Unidas, 2008). Por otra parte, la modalidad de derecho o jure, la población es censada en su lugar de su residencia habitual, aunque no se encuentren presentes en él en el momento del relevamiento. “Por “residencia habitual” se entiende el lugar en que la persona vive en el momento del Censo y en el que ha estado o tiene intención de permanecer por algún tiempo” (Naciones Unidas, 2008). Los Censos de hecho pueden llegar a tener como ventaja la sencillez que adopta el operativo, ya que disminuye las imprecisiones en las poblaciones que se mueven de manera frecuente o que tienen más de un lugar de residencia. “El diseño conceptual del Censo no asume entonces los problemas que alude la definición del concepto de residencia habitual al momento de tener que definir a quién censar y dónde. En consecuencia, se asume que con la implementación de esta modalidad de enumeración se reduciría la probabilidad del error censal por doble cuenta u omisión de personas” (Massé, 2011). Sin embargo, los Censos de derecho son los que mejor representan las formas de asociarse de la población y su distribución espacial (Álvarez 2007), suministrando información básica de la población habitual en áreas locales y evidenciando las demandas y servicios (educación, salud, servicios públicos, vivienda, etc) que requieren para satisfacer sus necesidades. En los Censos de derecho se recomienda al momento de considerar el lugar de residencia que se contemple un umbral de 12 meses teniendo en cuenta los siguientes criterios: “a) el lugar donde la persona ha vivido de forma ininterrumpida durante la mayor parte de los 12 últimos meses (es decir, al menos seis meses y un día), sin contar las ausencias temporales por 201 vacaciones o motivos laborales, o donde tiene intención de vivir durante al menos seis meses; y b) el lugar donde la persona ha vivido de forma ininterrumpida durante al menos los 12 últimos meses, sin contar las ausencias temporales por vacaciones o motivos laborales, o tiene intención de vivir durante al menos 12 meses” (Naciones Unidas, 2008). Figura 24. Censos de población y vivienda en América Latina por Modalidad de enumeración según ronda censal Fuente: Elaboración propia con base de la encuesta sobre el uso de tecnología en los Censos de población y vivienda de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponible en las páginas web de las oficinas de estadística y de la Cepal, del documento "Lineamientos generales para la captura de datos censales" (Cepal, 2021) y del artículo "Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en los Censos de población de América Latina y del Caribe" (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Con respecto al tiempo de relevamiento de datos, los Censos de hecho se suelen realizarse con inmovilización de la población y en un periodo de tiempo muy corto, que tiende a ser de un día en las áreas de mayor concentración de población y extendiéndose un poco más en áreas dispersas, utilizando una mayor cantidad de recursos humanos, los cuales deben pasar por un sistema de selección, capacitación y supervisión durante la etapa censal. Todo esto acarrea un mayor costo y complejidad del operativo censal. Por su parte los Censos de derecho tienen la posibilidad de extender su periodo de recolección ya que “el lugar de residencia tiene por lo general, una mayor “estabilidad” que el pernocte en una fecha determinada. Un período de relevamiento más largo permite reducir la cantidad de enumeradores y eventualmente contar con un recurso de mejor calidad. También hace posible incorporar más procedimientos de supervisión y control del trabajo de campo y tener más 202 capacidad de respuesta ante las contingencias que pueden ocurrir durante el operativo” (Álvarez 2007). En la Figura 24 se observa una tendencia de aumento en Latinoamérica en la implementación de los Censos de jure o derecho, al pasar de 7 países en la ronda de 1990 que implantaron esta modalidad, a 14 en la del 2020, mientras que en la metodología de enumeración de hecho o facto, este comportamiento tiende a disminuir en la región (pasaron de 9 a 4 los países entre las rondas de 1990 a la del 2000). En la Tabla 23 se puede observar los casos particulares de países como Argentina y Panamá, los cuales cambiaron la modalidad de enumeración entre la ronda de 2010 a la ronda de 2020, pasando de un Censo de hecho a un Censo de derecho; caso contrario que lo implementado en Paraguay, país que en la ronda de 2010 realizó un Censo de derecho y para la ronda de 2020 decidió volver a hacer un Censo de hecho, tal y como lo venía haciendo históricamente. Dentro del proceso de enumeración se plantean dos métodos principales; el canvasser o métodos de enumeración en los cuales la recolección se realiza mediante la técnica de entrevista directa o el auto empadronamiento. “En el primer caso, la información para cada persona (en un Censo de Población) y para cada vivienda y sus ocupantes (en un Censo de vivienda) se recopila y se ingresa en el cuestionario mediante un censista designado para realizar esta operación en una zona específica” (Cepal, 2021). Esta opción es utilizada en gran parte de los países, en especial los que tienen menor desarrollo y los enumeradores recorren todas y a cada una de las viviendas que están comprendidas en su área de enumeración y formulan las preguntas del cuestionario censal a sus habitantes. Por otro lado, en el autoempadronamiento “la población llena por sí misma el cuestionario censal, el cual pudo haber recibido vía correo, o bien retirado “en mano” por un enumerador. En este método la responsabilidad de ingresar la información recae en una persona de la misma unidad que se enumera (generalmente, la persona de referencia del hogar), aunque el cuestionario puede ser distribuido, recopilado y verificado por un funcionario del Censo (Cepal, 2021). . 203 Tabla 23. Censos de población y vivienda en América Latina por tipo de modalidad de enumeración 204 Fuente: Elaboración propia con base de la encuesta sobre el uso de tecnología en los Censos de población y vivienda de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponible en las páginas web de las oficinas de estadíst ica y de la Cepal, del documento "Lineamientos generales para la captura de datos censales" (Cepal, 2021) y del artículo "Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en los Censos de población de América Latina y del Caribe" (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Pagina we CEPAL (CEPAL 2022a y CEPAL 2022b) 205 La autoenumeración o autoempadronameinto permite reducir los costos de la operación censal, dado que demanda menor cantidad de enumeradores, sin embargo, sólo puede aplicarse en países cuya población posea un nivel educativo elevado” (Álvarez 2007). Los países que realizan el Censo con un diseño tradicional pueden utilizar diferentes métodos o combinarlos, como los cuestionarios enviados por correo o depositados, el teléfono, la Internet, el seguimiento de las visitas personales o una combinación de dichos métodos” (Naciones Unidas, 2008) La alta demanda de información sociodemográfica y económica ha hecho que el número de temáticas y preguntas que se incluyen dentro de los cuestionarios censales haya ido en aumento, incrementando los costos. Durante las últimas décadas varios países siguen utilizando un cuestionario censal, el cual es un cuestionario único que se aplica a toda la población, pero a raíz de las nuevas demandas de información algunos de ellos han decido incorporar técnicas de muestreo con el fin de investigar y profundizar algunos temas que hacen parte del cuestionario censal. De esta forma utilizan dos cuestionarios durante el mismo marco cronológico del Censo, uno corto que contiene preguntas de cobertura universal, y otro largo o extendido. Los temas del formulario extendido se realizan para profundizar en algunos temas específicos o abarcar temáticas que no se incluyeron en el cuestionario breve. Este se aplica a las viviendas y/u hogares establecidos a través de una muestra; de esta forma, las estimaciones del formulario extendido no están basadas en la cobertura completa, pero están representadas en los resultados y se incluyen entre los productos del Censo. Dichas muestras censales usualmente están entre el 5% y el 20 % del Censo completo. “Sin embargo no es posible obtener estimaciones con amplio detalle geográfico y conceptual con el mismo nivel de precisión con el que se obtienen los datos que se encuentran en ambos cuestionarios” (Álvarez 2007). En la Figura 25 se observa que la región tiende a utilizar en mayor medida el cuestionario censal único; no siendo tan utilizado en la misma ronda censal la implementación de los dos cuestionarios simultáneamente, uno básico y uno ampliado (dirigido a una muestra de la población). En esta gráfica se puede observar que los países que en las últimas décadas han aplicado tanto un Cuestionario Básico como uno ampliado son Brasil y México y que también los utilizaran en la ronda de 2020 con el método de enumeración de derecho o jure. 206 Adicionalmente, así se utilizará un cuestionario único o la dupla de cuestionarios básico y ampliado, algunos países de la región también están contemplando incorporar cuestionarios específicos, como el de viviendas colectivas, poblaciones indígenas o afrodescendientes y entorno, etc. Figura 25. Censos de población y vivienda en América Latina por tipo de cuestionario según ronda censal Fuente: Elaboración propia con base de la encuesta sobre el uso de tecnología en los Censos de población y vivienda de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponi ble en las páginas web de las oficinas de estadística y de la Cepal, del documento "Lineamientos generales para la captura de datos censales" (Cepal, 2021) y del artículo "Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en l os Censos de población de América Latina y del Caribe" (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). La “Encuesta sobre estado de avance de los Censos de 2020 e identificación de las necesidades nacionales” que realizó la Cepal en 2018, (contempló 20 países de la región, de los cuales respondieron 18), tenía como objetivo “identificar los cambios metodológicos y tecnológicos que se están proponiendo con respecto a los Censos anteriores, las dificultades que están afrontando para su diseño y planeación y las necesidades de asistencia técnica, cooperación o capacitación, así como tipo de cuestionario. Con respeto a los formularios específicos apunta a que seis países indicaron que contarían con un cuestionario para viviendas colectivas, tres que no y seis que no está decidido aún. Un país afirmó que dispondría de una boleta para pueblos indígenas o poblaciones afrodescendientes, seis que no y ocho que aún no se ha decidido al respecto. (CEPAL, 2018) En cuanto al formulario para 207 entorno mencionar que cuatro países dijeron que tendrían una boleta de este tipo en el operativo censal de la ronda 2020, cuatro que no y ocho que todavía su uso no se ha definido. Otros formularios específicos señalados por los países fueron el dirigido a personas sin domicilio (en zona urbana) y el destinado a personal diplomático en misión en el exterior. (CEPAL, 2018) En las últimas décadas algunos países han optado por la incorporación de innovaciones tecnológicas en la recolección de datos censales, sustituyendo de manera parcial o total el uso de cuestionario en papel por un cuestionario electrónico cargado en celulares o en computadoras de mano, dispositivos conocidos como Personal Digital Assistant - PDA o Dispositivos móviles de captura DMC. Estos cuestionarios electrónicos permiten tanto incorporar verificaciones, así como saltos automáticos de preguntas. “Ello facilita el desarrollo de la entrevista y minimiza algunos errores (respuestas inconsistentes los errores de secuencia y los errores de no respuesta). Esta tecnología ofrece la posibilidad de reducir enormemente los tiempos en los procesos de toma del dato, captura, transmisión, consistencia y publicación, favoreciendo la oportunidad de los resultados y su calidad”. (Álvarez 2007). En algunas ocasiones los PDA pueden incluir un GPS (Global Position System), permitiendo que los censistas puedan ubicarse en sus áreas asignadas, captando sus coordenadas geográficas y asociándolas al cuestionario censal. “El Censo tradicional tiene la ventaja incomparable de presentar una panorámica de toda la población en un período determinado y la disponibilidad de datos para pequeños ámbitos geográficos” (Naciones Unidas, 2008), siendo adecuado este planteamiento especialmente para países descentralizados o con una estructura federal y que necesitan presentar información de acuerdo con diversas características demográficas, sociales y económicas de su población en forma simultánea y para todos los niveles geográficos en que este organizado el territorio. De esta forma se podrá identificar las necesidades de cada uno de estos entes territoriales, así como generar políticas públicas y planes acción acordes a estas necesidades. Por otro lado, es importante tener en cuenta que “los Censos tradicionales son la actividad de recopilación de datos más compleja y costosa entre las que puede realizar una oficina del Censo” (Naciones Unidas, 2008), siendo esta una de las razonas por la que su implementación se suele realizar al menos una vez cada 10 años. Esta metodología tiene costos muy elevados, con fuerte concentración en los años cercanos a la realización de los Censos. No siempre los 208 países están en condiciones de afrontar estos picos fiscales sumamente distorsivos en sus presupuestos. En algunos casos esta circunstancia ha provocado posponer su implementación, erosionándose el principio de periodicidad de los datos” (Álvarez 2007). Por otro lado, este tipo de Censo puede generar presión en la población, afectando la calidad de los datos y de la cobertura del Censo. Esto se ve “en los países en los que se recurre a la inmovilización de la población, las empresas, los comercios y muchas familias tienen que asumir el costo material que trae aparejado el cese de la actividad económica” (Álvarez 2007). Por otra parte, si no es necesario que sean inmovilizados las personas deben sacar tiempo extra para completar el cuestionario censal y/o tener visitas de los censistas. En los últimos años el Censo tradicional está siendo cuestionado por la presión que ejerce sobre la población censada, debilitando su colaboración frente a esta investigación estadística. “Como ya se ha expresado, su éxito depende de conseguir un compromiso activo por parte de toda la población. En los países en los que se recurre a la inmovilización de la población, las empresas, los comercios y muchas familias tienen que asumir el costo material que trae aparejado el cese de la actividad económica (Álvarez 2007). Con el fin de reducir el impacto que realiza la inmovilización en la actividad económica, se han implementado estrategias como realizar el Censo en fines de semana o días festivos, o incluso realizar el Censo de manera extendida en donde no se inmoviliza la totalidad de los municipios en un solo día si no se particiona a lo largo de los días. Así mismo, en los países en donde el Censo se realiza sin paralizar las actividades, las personas deben estar dispuestas a dedicar parte de su tiempo a completar el cuestionario o a tener una entrevista con el enumerador. En suma, los obstáculos que enfrentan los países para contar con los presupuestos de los Censos en tiempo y forma, así como el debilitamiento de la colaboración de la población han llevado a que los Censos tradicionales encuentren cada vez mayores dificultades para mejorar o sostener estándares de calidad adecuados (Álvarez 2007). Los países en la actualidad tienen una alta demanda de información sociodemográficas, la cual se necesita que sea actualizada y variada para la generación de políticas en los diferentes sectores de la sociedad. El realizar un Censo cada 5 ó 10 años, conlleva a que sus datos tengan un desfase de varios años, “para cuantificar la situación actual del empleo e indicadores similares es necesario, por lo tanto, realizar una encuesta por muestreo durante el período intercensal” (Naciones Unidas 2008). A su vez, la simultaneidad y universalidad en la recogida 209 de los datos impide realizar investigaciones más completas y detalladas sobre una realidad social cada vez más compleja, sosteniendo estándares de calidad adecuados. La periodicidad de la información censal y lo acotado de su abordaje, se empieza a estimar insuficiente para responder a la demanda emergente (Álvarez 2007). Adicional a los costos, a la participación ciudadana y al tema de la demanda actual de información, se encuentra la complejidad que se exige para llevar a cabo este tipo de Censo. De esta forma, se requiere para su preparación y ejecución el más alto grado de organización y coordinación del personal que realiza este operativo censal. En varios países se presenta la falta de continuidad de los equipos de trabajo de los Censos anteriores, así como la falta de documentación en cada uno de sus procesos, procedimientos, y tareas, perdiéndose la memoria institucional, la experiencia e información importante, necesaria para la debida implementación de los futuros Censos. Por otra parte, “la mayoría de los modelos alternativos conciben al Censo como una la actividad permanente. Ello ofrece la posibilidad de perfeccionar progresivamente la generación de información y controlar los riesgos operativos que rodean a los operativos de gran escala realizados en períodos espaciados en el tiempo” (Álvarez 2007). Es importante destacar que la gran mayoría de los países de América Latina han aplicado la metodología del Censo tradicional, debido a que es “la que mejor responde a la situación actual y a las características de sus sistemas estadísticos” (Massé, 2011). 1.3 Técnicas alternativas A nivel internacional se han planteado diferentes metodologías alternativas para la realización de Censos de población, debido a que el Censo tradicional tiene dificultades crecientes para resolver la demanda de información de alta calidad y con la suficiente frecuencia para dar cuenta de los fenómenos sociales cada vez más complejos a niveles de áreas menores requeridas por los diferentes usuarios. Adicional a esto, varios países en las últimas décadas, han atravesado dificultades económicas y financieras para poder realizar los Censos de población, lo cual ha generado un riesgo en el cumplimiento de su periodicidad, teniendo en muchos casos que posponer su realización. Hasta inicios de los 90, la mayor parte de los países llevaban a cabo Censos tradicionales. Esta alternativa comprende una operación compleja para recolectar información de viviendas 210 y hogares en una amplia variedad de tópicos en un momento específico y en la mayor parte de las veces obtenida a través de entrevista directa. A partir de la ronda de 2000, a nivel mundial, se ha venido experimentando la utilización de nuevas alternativas orientadas a reducir costos, lograr la cobertura total y mejorar la calidad de la información. A continuación, se presenta un resumen de estas metodologías: a. Censo rotativo continuo de población (The rolling census approach) El Censo continuo representa una alternativa al modelo clásico a partir de una encuesta continua, siguiendo el modelo de las muestras rotativas (rolling samples) concebido por Leslie Kish. Esta opción fue particularmente impulsada por los países que no contaban con registros administrativos suficientes para el estudio continuo de la población. (Álvarez 2007). En él se remplaza el período corto de enumeración por una encuesta continua de muestras acumulativas que cubre todo el país en un período de varios años. Los dos principales parámetros de un Censo continuo son la extensión del período de enumeración (asociado a la frecuencia de las actualizaciones requeridas) y la tasa de muestreo (que depende de la disponibilidad de presupuesto y los niveles geográficos requeridos). Por ejemplo, es posible construir un marco muestral para producir resultados nacionales con una encuesta anual, resultados regionales mediante la acumulación de tres encuestas anuales, y pequeñas áreas mediante la acumulación de cinco años. Las encuestas anuales pueden realizarse a lo largo de todo el año, en un mes concreto o en un período más breve. Francia es uno de los países que ha implementado esta alternativa (Censos rodantes o rolling census) a través de una acumulación de encuestas anuales. D esta forma, este país implementa y acumula encuestas anuales hasta completar el relevamiento en un período quinquenal. Cada nueva encuesta anual que se realice, reemplazará a la del dominio equivalente llevada a cabo cinco años antes, de modo que cada año se actualizará el perfil de la población francesa, detallado a todos los niveles geográficos y se tendrá una cifra renovada del volumen poblacional (Álvarez 2007). La aplicación de este planteamiento requiere técnicas muy complejas de muestreo y elaboración de modelos; un marco muestral de alta calidad para poder efectuar muestreos en niveles geográficos muy bajos (es indispensable contar con un archivo maestro de direcciones actualizado anualmente) y consultas eficaces acerca del planteamiento con las principales 211 partes interesadas, incluidos los gobiernos nacionales y locales y la comunidad de usuarios. (Naciones unidas 2008) Entre las ventajas en la incorporación de esta alternativa se encuentra una mayor frecuencia de actualización de los datos al poder realizar actualizaciones anuales; la distribución de la carga del Censo, a diferencia del alto costo que tiene un Censo tradicional; un menor requerimiento de recursos humanos y físicos; el mejoramiento del proceso al poder evaluarlo anualmente, y la incorporación de tecnologías que puedan ayudar a mejorar el proceso. Como desventajas se encuentra que “no cumpliría con los criterios de simultaneidad y universalidad requeridos como fundamentales por la misma naturaleza de la fuente censal. Tanto el no brindar una fotografía simultánea de toda la población, complicando la comparación de información entre áreas enumeradas en diferentes momentos, como estar afectada por fenómenos demográficos tales como la movilidad de la población o los efectos de la mortalidad, requieren de la aplicación de imprescindibles ajustes metodológicos y estadísticos” (Masse, 2011). Respecto de la implementación de esta metodología en América Latina, países como Perú y Colombia intentaron realizar una variante intermedia entre esta metodología y el Censo tradicional durante los Censos de población y vivienda que realizaron en el año 2005. En el caso de Perú se implementó un cuestionario breve que sería complementado en los años siguientes por encuestas de muestras acumulativas que actualizarían anualmente el perfil de la población peruana. Sin embargo, cambios de autoridades en la oficina nacional de estadística derivaron en la interrupción de esta metodología (Álvarez 2007). Por otra parte, Colombia con el Censo General 2005 realizó un Censo tradicional que presentaba varias innovaciones tecnológicas. Este país aplicó un cuestionario breve para toda la población y por muestreo un Cuestionario Ampliado. Sin embargo, aunque se apegó a la implantación de criterios clásicos como individualización, universalidad y periodicidad, innovó en cuanto al de simultaneidad, ya que, por cuestiones organizativas, el trabajo de campo se llevó a cabo en varios meses, no utilizando una misma fecha de referencia, sino que esta se adaptó al momento de cada relevamiento (Álvarez 2007) b. Combinación de Censo clásico con registros La filosofía que subyace en esta metodología es la de sacar provecho de la existencia de fuentes administrativas o registros, entre los cuales se encuentran los registros de hogares, 212 viviendas e individuos. En la próxima iteración estos están unidos, a nivel individual con información de negocios, impuestos, educación, empleo y otros registros relevantes. Mientras, en teoría, es posible ligar los registros con base en el nombre del individuo y la existencia de un único número de identificación para cada uno de ellos, los registros de hogares y las viviendas son de crucial importancia, ya que permiten una más efectiva y real unión de la información de diferentes registros. Naciones Unidas afirma que es “imprescindible armonizar los conceptos y definiciones al relacionar los registros, y será difícil establecer relaciones cuando no exista un identificador personal universal. Deberían realizarse evaluaciones de calidad. Si no se cumplen estas condiciones, el país debería utilizar el Censo de Población como fuente primaria de estadísticas de referencia sobre la población” (Naciones Unidas, 2008). Una condición indispensable de esta alternativa es que el país debe contar con un registro de población institucionalizado de alta calidad y con excelente cobertura, unido a un permanente sistema de actualización. Este es el caso de varios países europeos los cuales tienen registros administrativos y de población con una larga tradición y con un nivel de cobertura y actualización aceptable. Las principales ventajas de la aplicación de un planteamiento basado en los registros, se encuentra la reducción de los costos que compone el proyecto censal, así como también la mayor frecuencia con que se obtienen datos actualizados. Por otra parte, como limitaciones, puede mencionarse las dificultades propias a estas fuentes de datos, en cuanto a alcanzar la meta de ser constantemente actualizadas, así como también lograr un alto nivel de cobertura y calidad. (Masse, 2011). El uso de los registros administrativos y de población combinan distintas opciones según el grado de integración que se ha logrado en dichos registros. Mientras algunos países han utilizado exclusivamente registros administrativos, otros complementaron dichos registros con encuestas por muestreo y finalmente en alguno se utilizan los registros para apoyar la aplicación de un Censo clásico (Álvarez, 2007). En los casos de países como Suecia, Finlandia y Noruega, que utilizaron exclusivamente registros administrativos, “constituyeron Censos sin administrar cuestionario alguno, basándose en registros exhaustivos y con un extenso alcance temático, sumados a sistemas de actualización permanente. Para ello, se vinculó la información –mediante un número 213 identificatorio individual- proveniente de registros de población, de empleo, de actividades económicas, combinada con los archivos de domicilios y los registros de edificación” (Álvarez, 2007). Por otra parte, en algunos países los registros útiles para el Censo son complementados con encuestas por muestreo. Es el caso cuando los registros no contienen toda la información requerida para el Censo. Esta aproximación combina los microdatos de los registros con los datos obtenidos a través de encuestas por muestreo y las asocia al nivel micro. En la siguiente iteración, dependiendo de los resultados, los datos son extrapolados. Un ejemplo de esto son países como Holanda e Israel, que buscaron atender las necesidades de información complementado la fuente continua con encuestas por muestreo. En el caso de Holanda utilizó la información de los diversos registros administrativos existentes y aplicó una encuesta por muestreo para captar los contenidos que no se hallan en tales registros. El resultado de la combinación de encuesta y registro se ha dado mediante la micro-integración de las diversas fuentes. (Álvarez, 2008). Por otra parte, Israel, combinó también registro de población con encuestas por muestreo, que además de proveer contenidos adicionales (semejantes a los de formularios censales extensos) se implementó para evaluar la precisión de los domicilios declarados en el registro de población. (Álvarez, 2008). Por otra parte, tenemos la experiencia de España que a pesar de contar con un registro de población universal y de larga tradición, realizo un Censo tradicional que se apoyó en los registros administrativos disponibles (Padrón de Habitantes y el Catastro Urbano) (Álvarez, 2007). De esta forma hace uso de registros administrativos relevantes al Censo, a fin de reducir costos y disminuir la carga a los ciudadanos, pero complementado con una exhaustiva operación estadística, con dos objetivos: mejorar la consistencia de los conteos de población y obtener las variables del Censo no disponibles mediante la combinación de registros. Finalmente, es importante resaltar que la pandemia de COVID 19 aceleró el uso de registros administrativos tanto para la localización de las viviendas como para identificar a los hogares y las personas, con el fin de atender las distintas emergencias. Así, se constatan avances en la geolocalización de viviendas y uso de identificadores estándares. Esto ha generado una mayor fuerza a los debates en torno a avanzar hacia un registro de personas, con miras a que en las próximas décadas se implementen los Censos de población de manera más eficiente. De esta forma, se ve la necesidad de generar alianzas con las instituciones del Sistema 214 Estadístico Nacional y otros actores relevantes para lograr las convergencias, cobertura y exhaustividad que requieren estos registros administrativos, para que se avance en su uso como estadísticas oficiales de población, garantizando la anonimización de los registros y la seguridad en el acceso (Cecchini, S, 2021). c. Censo de Población con actualización anual de las características Este diseño es una variación de los Censos tradicionales, en que se focaliza en el conteo de población y recolección únicamente de las características demográficas básicas en la fecha censal. Mediante una gran encuesta anual de hogares se obtiene información demográfica, social, económica y del hogar detallada, durante los diez años anteriores a la fecha prevista para el conteo. No es imprescindible obtener información sobre todos los tópicos cada año. Esta alternativa permite proveer datos demográficos básicos con mayor frecuencia. Aunque entre sus limitaciones se encuentra que es costosa y técnicamente difícil de montar; demanda un programa multi-anual de planeación y desarrollo y pruebas de encuestas por muestreo. Asimismo, se presenta “la falta de cumplimiento del criterio de simultaneidad como el hecho de que la difusión de los resultados censales para las áreas geográficas menores se logra recién después de dos o tres años de haber acumulado encuestas anuales” (Masse 2011). Un ejemplo de esta alternativa es los Estados Unidos. En la siguiente tabla se presenta una lista de las características esenciales de un Censo. Dentro de cada una de ellas se describe la forma en que el Censo tradicional las incorpora en su diseño y producción. 215 Tabla 24. Cuadro comparativo tipo de Censos y criterios básicos 216 Fuente: Naciones Unidas, 2008 217 2 Recomendaciones internacionales 2.1 Recomendaciones de Naciones Unidas Desde mediados del siglo pasado, Naciones Unidas ha venido publicando y actualizando periódicamente una serie de manuales e informes técnicos en respuesta a la necesidad de desarrollar estándares internacionales y de colaborar con los países en la planificación y elaboración de sus Censos de población y vivienda. Con estos documentos se busca dar a conocer cuáles son las novedades e innovaciones que se están aplicando en los operativos censales, así como mostrar cuales son las principales problemáticas que se presentan en las diferentes etapas del Censo. En general la Oficina de Estadística de las Naciones Unidas, recomiendan a los países miembros realizar un Censo de Población y vivienda al menos cada 10 años, exigencia que se hace apremiante en el caso de países como Argentina en donde el Censo de Población es la principal fuente de información poblacional con que cuenta el país, las provincias y cada uno de sus municipios. Dentro de los manuales de la serie de manuales que se han elaborado para ayudar a los países a prepararse para las rondas de Censos tenemos los siguientes: -Principios y recomendaciones para los Censos de población y habitación ▪ Naciones Unidas publicó por primera vez un conjunto de principios y recomendaciones para los Censos de población y habitación en 1958 a petición de la Comisión de Estadística de las Naciones Unidas en respuesta a la necesidad de formular normas internacionales como piedra angular del primer Programa Mundial de Censos de Población y Vivienda (naciones unidas 2008) ▪ La primera revisión sobre este tema se publicó en 1998 con el título Principios y recomendaciones para los Censos de población y habitación, Revisión 1 (naciones unidas 2008) ▪ En 2008 se publicó la revisión 2 sobre esta serie en donde realiza y define varias recomendaciones de los Censos (Naciones Unidas, 2008). o Se recomienda que los Censos nacionales de población se lleven a cabo al menos cada 10 años. Algunos países pueden encontrar necesario llevarlos a cabo en forma 218 más frecuente debido a la rapidez de los cambios en su población o en las circunstancias de los hogares. o Cumplimiento de los principios Fundamentales: Universalidad en un territorio definido, Simultaneidad y periodicidad definida, Enumeración Individual. o Realización de Censo tradicional en países que no cuentan con registros adecuados de población o Planeación y preparación previa de todos los procesos o Otros temas como las ventajas de aplicar un sistema de control, el mejoramiento de la calidad en las etapas iniciales del Censo y la importancia y necesidad de recopilar y presentar metadatos, que se consideran un elemento imprescindible para la interpretación precisa de los resultados censales. o En el contexto de la importancia de la información estadística para la política de desarrollo formulación y seguimiento, toca el tema de los indicadores de desarrollo y el uso de datos censales para el seguimiento de los indicadores de los Objetivos de Desarrollo del Milenio. o Finalmente, las recomendaciones para la ronda de Censos de 2010 están también más orientadas a los productos y presentan un conjunto de tabulaciones recomendadas sobre las características de la población y la vivienda que todos los organismos estadísticos o censales nacionales deberían generar al nivel geográfico más bajo al menos una vez durante la ronda de Censos de 2010. ▪ En Principles and Recommendations for Population and Housing Censuses, Revision 3 o Las recomendaciones revisadas del Censo brindan más detalles sobre alternativas metodológicas al Censo tradicional para la producción de estadísticas censales basadas en experiencias de la ronda de Censos de 2010 o Introduce cambios importantes en los conceptos y terminología relacionada con las características económicas de acuerdo con la nueva norma internacional, marco conceptual de la Organización del Trabajo para las estadísticas del trabajo. o Trata sobre el uso de la tecnología en las operaciones del Censo, debido principalmente al uso creciente y significativo de tecnologías avanzadas, en todas las fases del Censo, ya que los países aspiran a aumentar la respuesta general, la calidad y la puntualidad del Censo o Otros cambios notables incluyen secciones sobre el archivo de registros individuales y sobre la evaluación general del Censo. (Naciones unidas, 2017) 219 -Recomendaciones para los Censos en América Latina: ▪ Recomendaciones para los Censos de la década de 2010 en América Latina: (CEPAL, 2011a). o Este manual contiene las recomendaciones conceptuales y metodológicas para los Censos de la década de 2010, dando lineamientos sobre la cartografía censal y algunos aspectos temáticos que hacen parte del cuestionario como equipamiento y medio ambiente, vivienda, tecnologías de la información y la comunicación y hogar y familia, enfoque étnico y de género, variables socioeconómicas (educación y actividad económica); de migración, fecundidad y mortalidad, salud (salud sexual y reproductiva: fecundidad adolescente y mortalidad materna), y protección y la seguridad social. Igualmente presenta algunas orientaciones para la evaluación de la cobertura censal. (Cepal, 2011a) ▪ En Recomendaciones para los Censos de población y vivienda en América Latina Revisión 2020. o Es una actualización metodológica y conceptual del documento Recomendaciones para los Censos de la década de 2010 en América Latina, está concebidas según la temática censal que se debe abordar en un cuestionario censal en América Latina, según los desafíos de medición que impone la presente década (el Consenso de Montevideo, la Agenda 2030 y los Objetivos de Desarrollo Sostenible -ODS. o Presenta recomendaciones generales al momento de comenzar a desarrollar un nuevo cuestionario censal; da una mirada a los aspectos cartográficos y geográficos y, por último, trata sobre la trasversalidad durante todo el proceso censal del enfoque étnico y de género. o Se abordan recomendaciones para los módulos sobre viviendas y hogares, incluyendo sus características, el acceso a bienes, servicios y equipamiento, junto a las mediciones de hogar y familia. o Finalmente, se proponen recomendaciones para las características y análisis de las personas, en sus diferentes dimensiones: fecundidad, mortalidad, etnicidad, migración, educación, discapacidad, actividad económica, movilidad cotidiana, protección y seguridad social, acceso a TIC e idiomas. (CEPAL, 2021a). 220 -Manuales de revisión de datos de los Censos de población y vivienda ● En Handbook on Population and Housing Census Editing o La primera versión del Manual de edición de las Naciones Unidas para la ronda de 2000 se centró en el registro y la manipulación en papel de datos. El escaneo recién comenzaba a usarse para la recopilación y captura de datos del Censo. (Naciones unidas 2001) ● En Manual de revisión de datos de los Censos de población y vivienda Revisión 1 - 2011 o La finalidad de la presente publicación es ofrecer a los países un amplio panorama de la metodología de revisión de los datos de Censos y encuestas y suministrar a los funcionarios interesados información sobre la aplicación de diversos enfoques de la revisión de los datos censales. o Este manual se centró en escanear para capturar. Cada vez menos países en esta ronda de Censos ingresaron sus datos, y usaron captura automática de alto nivel: OCR u OMR. El procedimiento requería que el cuestionario se preparara de tal manera que la máquina pudiera leer las marcas o entradas escritas y convertirlas en un conjunto de microdatos que podría editarse y tabularse. Sin embargo, el tipo de edición basada en las especificaciones vistas en la versión anterior del manual no cambió mucho porque la enumeración fue básicamente la misma. o Así mismo, propone a los países conservar un historial de sus experiencias de revisión, promover la comunicación entre los especialistas temáticos y los especialistas en procesamiento de datos y documentar las actividades llevadas a cabo en el Censo o en la encuesta en curso, a fin de evitar duplicar esas actividades en el próximo Censo o encuesta. (Naciones unidas, 2011) ● Handbook on Population and Housing Census Editing. Revision 2 o Este manual amplía el tema de revisión de los datos, considerando tanto la edición tradicional y la nueva forma a partir de recopilación electrónica de datos que permite editar los datos a medida que se recopilan. Si bien los cuestionarios electrónicos recogen información de la misma manera que los cuestionarios en papel, también pueden detectar y reconciliar inconsistencias durante la entrevista. (Naciones Unidas, 2019) (Naciones Unidas, 2021a) 221 -Handbook on Census Management for Population and Housing Censuses, revisión 2 Esta publicación busca dar una orientación a institutos de estadística de los diferentes países sobre el desarrollo de una estructura que pueda gestionar de manera eficaz la planificación del Censo y sus diferentes procesos. De esta forma, da lineamientos en los distintos aspectos de gestión relacionados con la planificación y la preparación de todos los procesos que deben ser considerados en la realización de un Censo. La estructura del Manual refleja lo más fielmente posible el ciclo del Censo. Los capítulos iniciales discuten etapas, seguidas de discusiones sobre la fase precensal, así como de los procesos y actividades del operativo de campo, el procesamiento, la difusión de los resultados, la evaluación y, la documentación y archivo. así como de procesos de control y seguimiento. La publicación también es útil para aquellos que necesitan planificar encuestas, dada la descripción detallada del proceso general de recopilación, procesamiento. (Naciones Unidas, 2021a) -Guidelines on the use of electronic data collection technologies in population and housing censuses Este documento busca servir como referencia para los países que planean utilizar tecnologías de recopilación electrónica de datos, con métodos como computer-assisted personal interviewing (CAPI) y computer-assisted selfinterview (CASI), buscando mejorar la cobertura, la calidad de los datos y la oportunidad de los resultados del Censo. Igualmente, da directrices sobre nuevos aspectos y consideraciones que se deben tener en cuenta con estas nuevas tecnologías de recopilación electrónica en los procesos de planificación, diseño y gestión del Censo, principalmente a través de dispositivos electrónicos portátiles e Internet. También analiza los nuevos desafíos, los beneficios y los riesgos que se pueden presentar con el del uso de dichas tecnologías, enfatizando en la importancia de contar con un sólido proceso de toma de decisiones para comprender el valor de introducir una solución tecnológica particular, evaluar su rentabilidad y viabilidad sobre la base de factores institucionales, operativos y sociales, con el fin de poder tomar la mejor decisión sobre una base de la información reunida durante este proceso. (Naciones Unidas, 2019) 2.2 Recomendaciones de CEPAL -Guía para asegurar la calidad de los datos censales 222 ● Este manual presenta una guía metodológica que debe tener en cuenta los países latinoamericanos al momento de definir los aspectos que deben monitorear y los indicadores básicos necesario para controlar la calidad de un Censo en sus diferentes etapas. (Cepal,2011b) -Lineamientos generales para la captura de datos censales Revisión de métodos con miras a la ronda de Censos 2020 El presente documento se enfoca en la mejora de los procesos asociados a la recolección de datos censales mediante la incorporación de la tecnología en Censo. De esta forma, se aborda los diferentes métodos de captura empleados para el proceso de recolección de datos y su interacción con etapas censales previas y posteriores (planificación o procesamiento), con el fin de levantar alertas o llamados de atención sobre aspectos que deben ser considerados al momento de tomar la decisión de la tecnología de captura que utilizarán en sus próximos Censos. Adicionalmente, se bosquejan los desafíos en la captura de datos durante la etapa de empadronamiento, en un escenario donde, cada vez más, los países complementan los mecanismos de recolección y buscan el aprovechamiento óptimo de la tecnología. (Cepal 2021b) - Aspectos conceptuales de los Censos de población y vivienda: desafíos para la definición de contenidos incluyentes en la ronda 2020 Este documento contiene los principales resultados del seminario “Aspectos conceptuales de los Censos de población y vivienda: desafíos para la definición de contenidos incluyentes en la ronda 2020”, realizado en Santiago de Chile del 6 al 8 de noviembre de 2018, el cual buscaba contribuir en la definición de contenidos censales acordes a las nuevas realidades y demandas sociales de la región, para ser considerados en la ronda de Censos 2020. El documento incluye algunos lineamientos sobre la definición de las temáticas que deberían incluir los países de América Latina y el Caribe en la ronda de Censos de población y vivienda 2020, así como las necesidades y demandas que existen en la actualidad, las cuales van adaptando y modificando paulatinamente los contenidos del cuestionario censal. Además, del tema de las nuevas variables sociodemográficas, se toca el tema del uso de tecnologías de la información y la comunicación (TICs), la movilidad cotidiana, entre otros, analizando la experiencia regional con el fin de identificar los alcances y desafíos para la nueva década de Censos que se avecina. (CEPAL, 2019). 223 Anexo 2. Descripción de los procesos posteriores a la captura de datos 1. Codificación: Es el conjunto de actividades encaminadas a diseñar e implantar un sistema estandarizado de normas y procedimientos para convertir información textual o alfanumérica en información codificada (numérica) de acuerdo con estándares establecidos. Los sistemas de codificación asignan códigos de clasificación a las diversas respuestas escritas en el formulario del Censo. Los sistemas de codificación pueden ser: ● Codificación administrativa: La codificación administrativa implica que el procesador haga coincidir la respuesta en el formulario censal con respuestas contenidas en uno o más índices que son comúnmente referidos como libros de códigos. Luego, los procesadores transfieren el código asociado al formulario para la posterior captura de datos. Ese proceso administrativo es tedioso y puede estar sujeto a errores más altos que otros tipos de codificación. Usando ese método, los procesadores también tienden a confiar en sus recuerdos para la codificación, lo que puede introducir más errores en el proceso (Naciones Unidas 2021) ● Codificación asistida por computadora: La codificación asistida por computadora involucra procesadores que usan sistemas computarizados para ayudar en el proceso de codificación. Se utilizan índices similares a los utilizados en la codificación administrativa, pero están basados en una computadora. El procesador generalmente ingresa solo los primeros caracteres de cada palabra en la respuesta, y el sistema devuelve una lista coincidente del índice apropiado. Luego, el codificador selecciona la entrada de índice coincidente y el código puede escribirse automáticamente en el archivo de datos. La codificación asistida por computadora se utiliza durante las operaciones de captura de dispositivos portátiles y datos basados en Internet. Los países que han desarrollado sistemas asistidos por computadora han encontrado que estos son más eficientes que los sistemas administrativos y dan como resultado, datos de mayor calidad, sin embargo, el sistema y los índices asociados son relativamente complejos y requieren un largo tiempo de preparación. (Naciones Unidas 2021) ● Codificación automática: La codificación automática utiliza algoritmos computarizados para hacer coincidir el texto capturado (por ejemplo, de ICR) con los índices, sin ninguna intervención humana. Los algoritmos utilizados en la codificación automática son 224 complejos. Las fallas en el algoritmo o en los índices asociados pueden generar códigos incorrectos. Este sistema tiene altas tasas de coincidencia para respuestas textuales más simples como el lugar de nacimiento (aprox. 80 %), pero las respuestas para los temas más difíciles como la ocupación y la industria presenta tasas de coincidencia mucho más bajas (aprox. 50 %). Independientemente del sistema utilizado, no será posible codificar todas las respuestas automáticamente. Por lo tanto, aquellas respuestas que no se puedan codificar automáticamente necesitarán ser procesado en una etapa posterior a través ya sea de codificación asistida por computadora o de codificación administrativa. (Naciones Unidas 2021) ● Una combinación de los tres anteriores. (Naciones Unidas 2021) 2. Revisión de datos: La revisión de los datos desempeña un papel importante en la localización y corrección de errores. Con esta actividad es posible efectuar comprobaciones de coherencia detalladas en consulta con los especialistas temáticos. Los errores observados pueden corregirse consultando los impresos originales o automáticamente. (Naciones unidas 2011) El objetivo final del procesamiento de datos censales es producir un base de datos libre de errores e inconsistencias. Sin embargo, los errores y las inconsistencias indudablemente surgen durante las fases de recolección, codificación o captura de datos. Con la revisión de datos se detectan tantos de esos errores en base como sea posible y se busca hacer cambios en ésta para que las respuestas sean válidas y consistentes. (Naciones Unidas 2021) Según Naciones Unidas los errores que se encuentran pueden ser críticos o no críticos. Los errores críticos tienen el potencial de bloquear el procesamiento posterior y deben ser corregidos para que siga el flujo. Por otra parte, los errores no críticos producen resultados no válidos o inconsistentes sin interrumpir el flujo lógico de las fases de procesamiento posteriores. Esos errores a menudo se clasifican como cobertura o errores de contenido (Naciones Unidas 2021): ● -Errores de cobertura: son errores que surgen de no enumerar un persona o unidad de vivienda, o contar una persona o unidad de vivienda múltiplo veces. ● -Errores de contenido: son errores que surgen de informar o registrar incorrectamente las características de personas, hogares o unidades de vivienda 225 La revisión de datos puede llegar a reducir algunas de las contradicciones entre los datos. No obstante, los datos que proceden del sistema de procesamiento no serán de mejor calidad que la información contenida en los cuestionarios del Censo. A veces se realizan notables esfuerzos por corregir aparentes contradicciones o imprecisiones del Censo, sin que ello signifique que éstos sean más válidos para conseguir los objetivos previstos. (Naciones unidas 2008) Por otro lado, es importante tener en cuenta al evaluar la calidad tanto con los métodos tradicionales captura como con los nuevos, las restricciones “técnicas” de los diferentes instrumentos, los cuales pueden dar origen a algunas inconsistencias. De esta manera, se pueden identificar las siguientes imperfecciones, relacionadas con el origen de algunas inconsistencias: ● Imperfecciones en el método de medición. El método de medición utilizado para la recolección de información censal corresponde a una secuencia de operaciones, mediante una interacción circunstancial (entrevista) entre dos personas (encuestador y entrevistado), regida por las normas sociales y de la buena educación, influyendo una gran variedad de factores, como el temperamento o forma de reaccionar, el estado de ánimo, predisposición y otros relacionados. También inciden elementos propios de la comunicación, como son el poder transmitir claramente las preguntas e interpretar adecuadamente las respuestas. (Sabag & Villalón, 1999). ● Imperfecciones en la resolución o nivel de desglose. Debido a deficiencias en la capacitación de encuestadores, y/o capacidad de respuesta del informante al nivel de resolución esperado. (Sabag & Villalón, 1999) ● Inconsistencias de orden sistemático. En esta categoría se pueden incluir inconsistencias originadas en el diseño del instrumento de medición (cuestionario), tales como preguntas incorrectamente formuladas, saltos condicionales no planteados adecuadamente y rangos no bien explicitados. (Sabag & Villalón, 1999) Este tipo de imperfecciones se pueden acrecentar en los métodos de autoenumeración, ya que la calidad de las respuestas depende de la interpretación del entrevistado. 3. Generación de tabulados: Los datos tabulados son uno de los principales productos de un Censo y deben responder a las necesidades de los usuarios de datos. Dentro de los productos estándar se encuentran 226 tabulaciones básicas y tabulaciones cruzadas sobre temas como edad y sexo, características de la fuerza laboral y composición familiar. Otros productos para los usuarios especializados pueden requerir tabulaciones personalizadas, quienes proporcionan las especificaciones para las tabulaciones que requieren (Naciones Unidas 2021): 4. Difusión de resultados: En la difusión se prepara la información para ponerla a disposición del público de manera confiable, oportuna y fácil, este proceso deberá considerarse también de manera continua, al atender las necesidades de los usuarios durante un largo período de tiempo. Toda difusión estará sujeta a problemas de garantía de calidad, riesgo de divulgación de datos sobre declarantes identificables, y derechos de autor y de propiedad. (Naciones unidas 2008). “Los datos censales oportunos y de calidad son indispensables para la toma de decisiones y la planificación e implementación de políticas; estos deben transformarse en información útil que permita responder a las necesidades de los usuarios y al mismo tiempo, proteger la confidencialidad” (Naciones Unidas 2021) y la “previsibilidad de la distribución de datos sin superar los costos convenidos (Naciones unidas 2008). La recomendación de Naciones Unidas señala que: “un Censo no está completo mientras la información reunida no se ponga a disposición de los posibles usuarios en una forma adecuada a sus necesidades” (Naciones Unidas, 2010). Debido a esto, es preciso contar con un plan de difusión, el cual debe ser amplio, completo y eficiente, y en él “deben atenderse aspectos tales como las categorías de usuarios, las formas y medios de difusión, las características de las publicaciones, el plan de tabulados y las políticas de recuperación de costos” (CEPAL, 2007). Cada medio de difusión presenta sus respectivas ventajas y limitaciones, y la decisión de utilizar uno o varios de ellos depende del contexto y de las categorías de usuarios previstas. En la mayoría de los casos estos métodos son complementarios entre sí y ofrecen formas eficaces de llegar a los sectores público y privado. (Naciones unidas 2008). Tradicionalmente, los datos censales se entregan en cuadros de información (para la distribución general), en cuadros originales (para la distribución restringida), o se almacenan en una base de datos con el fin de entregarlos en medios informáticos a solicitud de los interesados (González, D, Ortiz, L, 2011). 227 El cambio de paradigma fundamental en las últimas rondas de Censos de población y vivienda es la utilización de estadísticas para aumentar el conocimiento público relacionado con el progreso de la sociedad. Al diseñar y desarrollar productos censales, se tiene en cuenta la Agenda 2030 para el Desarrollo Sostenible, en particular la lista de indicadores para el seguimiento de la implementación de esta agenda, dirigiéndose todos los esfuerzos para producir estadísticas censales acordes con estos indicadores. (Naciones Unidas 2021). De esta forma, “los Censos se constituyen en una fuente esencial para definir líneas de base para las fechas de inicio del monitoreo de indicadores, y además serán parte de los responsables de registrar los avances hacia 2030, año para el que se propone alcanzar las nuevas metas y momento de una nueva ronda censal” (CEPAL, 2017a). Daniela González y Laura Ortiz en la conferencia “Los Censos de 2010 y las condiciones de vida”, proponen que al realizar una estrategia de difusión se debe tener en cuenta tres momentos distintos. En una primera fase proponen presentar la difusión de metodologías y primeros resultados, con un informe de difusión que describa los diversos productos que se han planeado realizar para su distribución; y con la publicación de tabulados básicos en donde se presentan los cuadros estadísticos con los resultados básicos del Censo. En un segundo momento, se propone la difusión de resultados finales con publicaciones impresas en donde la información que se entrega es agregada (Síntesis de resultados); a través de cuadros estadísticos, gráficos, mapas etc y con publicaciones en medios informáticos donde se publique los resultados definitivos por grandes temáticas y sean difundidas a través de medios informáticos. Así como el distribuir la base de datos del Censo en medios magnéticos y el uso de Sistemas de consulta en línea vía Internet, Extranet y/o Intranet en donde los usuarios pueden acceder directamente a través de Internet a las bases de datos, sin necesidad de tenerlas en forma local, permitiendo procesar de manera fácil y rápida la información. Finalmente, un tercer o último momento en donde se presentan los productos finales de difusión en donde se presentan los productos específicos que apunten a determinados usuarios y necesidades, y se requiere un mayor tiempo para su elaboración, puesto que se trata de investigaciones sustantivas con términos de referencia específicos. Así mismo un sistema de indicadores a nivel nacional, especialmente si se cuenta con información regular, actualizada y comparable que permite generar datos e indicadores confiables. (González, D, Ortiz, L, 2011). 228 5. Evaluación Es importante tener en cuenta que un Censo de Población no es perfecto y que en todas las etapas de la operación pueden producirse errores. Por ello, deben evaluar no solo la calidad de los datos sino también cada uno de los procesos que hacen parte del Censo, identificando todas las ventajas e inconvenientes de cada actividad y/o tarea, así como documentar las lecciones aprendidas y proponer medidas de acción para los futuros administradores del Censo. Este proceso “es muy importante por numerosas razones, que fomentan la confianza pública en el sistema nacional de estadística y su comprensión” (Naciones Unidas 2008), ofreciendo a los usuarios cierto nivel de confianza cuando vayan a utilizar los datos, así como el poder explicarles los errores existentes en los resultados censales. La evaluación permite tomar decisiones a través de la comparación de distintas alternativas. El significado de la evaluación difiere según la etapa del ciclo de vida del proyecto en la que se la utilice. Si es durante la formulación, la evaluación proporciona los criterios de decisión para aceptar u ordenar las alternativas consideradas en función de las relaciones existentes entre sus costos y la calidad/oportunidad de los resultados censales. Si se la aplica durante el período de relevamiento propiamente dicho o con posterioridad al mismo, ello permite determinar el grado de alcance de los objetivos censales establecidos inicialmente (CEPAL, 2004) La evaluación censal tiene dos grandes objetivos amplios que son: garantizar que la calidad de los resultados cumpla con los requisitos de los usuarios y que cada proceso censal contribuya de manera rentable a lograr el nivel de calidad deseada (Naciones unidas 2021). Entendiéndose de esta forma “la calidad como un concepto multidimensional” (Naciones unidas 2008). Para formular un proyecto censal se requiere saber cómo se va a evaluar cada una de sus etapas. La evaluación sirve de marco de referencia para la formulación de un proyecto censal, permitiendo medir costos e impacto (o beneficios) del mismo, así como las interrelaciones existentes entre ambos (Massé, 2011) “El Censo necesita ser evaluado para asegurar que el esfuerzo y la inversión de los recursos han valido la pena y proporcionar a los usuarios información sobre la calidad de las estadísticas censales resultantes” (Naciones unidas, 2021a). De esta forma, “una evaluación exhaustiva también debería incluir la evaluación del éxito de las operaciones del Censo, en cada una de 229 sus fases, incluso de actividades como la campaña de publicidad del Censo. Por consiguiente, los países deberían asegurarse de que el proceso general de evaluación del Censo aborde debidamente toda la actividad conexa, además de los resultados”. (Naciones unidas 2008) La evaluación de los resultados del Censo busca en primer lugar, “proporcionar a los usuarios algún criterio sobre la calidad de los datos del Censo que les ayude a interpretar los resultados; en segundo lugar, determinar en la medida de lo posible los tipos y fuentes de error, para facilitar la planificación de Censos futuros; y, en tercer lugar, servir de base para construir las mejores estimaciones posibles de agregados tales como la población total o ajustar los resultados del Censo para tener en cuenta los errores detectados”. (Naciones unidas 2008) La información relevada en un Censo presenta “procedimientos que son susceptibles de cometer distintos tipos de errores e irregularidades de diferente índole que afectan su calidad final.” “La tarea de evaluación procura detectar los errores que afectan a la información, establecer su naturaleza y magnitud. La evaluación de la exactitud o precisión de los datos comienza por la identificación de los componentes del error potencial que pueden causar imprecisión, para luego determinar los caminos y metodologías adecuadas dirigidas a evaluar su magnitud” (Cepal, 2014). Los errores de los resultados del Censo se clasifican en dos categorías generales: errores de cobertura y errores de contenido de la información. “Los errores de cobertura son los que se producen en el empadronamiento por la omisión o duplicación de personas o unidades de habitación” (Naciones unidas 2008), surgiendo cuando las personas o eventos no se registran, o bien se lo hace cuando no correspondía incluirlos, o se los registra más de una vez. “Estas situaciones producen errores cuantitativos, generando subenumeración o sobreenumeración de las personas o eventos que se estén contabilizando” (Cepal 2014). Dentro de los errores de cobertura se encuentran el error bruto y el error neto de cobertura “El error bruto de cobertura de un Censo se define como el total de personas omitidas, duplicadas o empadronadas erróneamente. El error neto de cobertura tiene en cuenta la subestimación debida a omisiones y la sobreestimación debida a duplicaciones e inclusiones erróneas. Cuando las omisiones superan la suma de las duplicaciones y las inclusiones erróneas, que es la situación más corriente en la mayoría de los países, se dice que existe una subestimación neta; de lo contrario, se producirá una sobreestimación neta.” (Naciones unidas 2008) 230 Por otra parte “los errores de contenido son los provocados por errores de comunicación y registro de las características detalladas de las personas, los hogares y las unidades de vivienda” (Naciones unidas 2008). Estos errores “aluden a todos aquellos casos en que las personas o eventos se han contabilizado pero sus características se han registrado incorrectamente. Se trata de errores que se refieren a la calidad de la información, es decir, a errores cualitativos” (Cepal 2014). Los últimos errores de contenido “se producen por equivocaciones del empadronador al formular las preguntas del Censo, la incapacidad de responder o los malentendidos por parte de los declarantes, el suministro deliberado de información incorrecta, los errores debidos a la cumplimentación del cuestionario por terceros, y los errores de codificación o asiento de datos, entre otras razones” (Naciones unidas 2008). Existen numerosos métodos para estimar el error de cobertura y el error de contenido de los Censos. Es así que “muchos países han reconocido la necesidad de evaluar la calidad general de los resultados de sus Censos y han recurrido a distintos métodos para evaluar el grado de cobertura del Censo, así como determinados tipos de errores de contenido” (Naciones unidas 2008), llegando incluso a realizar una combinación de métodos para atender plenamente a esos objetivos. A continuación, se presentan algunos métodos para evaluar los datos censales8: o Evaluación de cobertura: -Análisis por conciliación censal -Encuesta postcensal -Otro tipo de análisis ad hoc o Evaluación de contenido: -Evaluación de la declaración de la edad -Evaluación de la no respuesta -Evaluación de la consistencia interna de la información -Evaluación de resultados censales respecto de aquellos obtenidos por otras fuentes de información (consistencia externa) -Monitoreo y evaluación de calidad de la captura y codificación de los datos -Aplicación de paquetes específicos de consistencia y evaluación censal 6. Documentación y archivo 8 Métodos listados por Gladys Masse en su exposición del documento metodológico guía para la elaboración de un proyecto censal. (Massé 2011) 231 Un Censo nacional de población y viviendas genera una gran cantidad de información, tanto en formato impreso y digital, siendo esencial del proyecto censal documente cada etapa y sus procesos de manera completa y objetiva. En consecuencia, la planificación para el desarrollo de un proceso de documentación integral debe llevarse a cabo desde el principio de los preparativos del Censo. De esta forma, la documentación debe incorporarse en la gestión general y la organización estructura, con una clara e inequívoca asignación de responsabilidades en cada nivel gerencial y organizacional. En general, hay dos clases de documentación que deben mantenerse y conservarse durante los Censos de población y vivienda. La primera se refiere a la documentación de las actividades operativas y la segunda a la documentación que acompaña a las estadísticas censales, incluidos los metadatos (Naciones Unidas, 2021a) Se recomienda que cada país prepare y, de ser posible, publique un informe que sea lo más completo posible y abarque todos los estadios y aspectos de la planificación y las operaciones del Censo, como la labor sobre el terreno, la elaboración, el análisis, la difusión y la evaluación. Este informe ayudará a los usuarios de los resultados del Censo a evaluar e interpretar los datos y facilitará la planificación adecuada de programas futuros de reunión de datos, incluidos los Censos de población y habitación. (Naciones Unidas 2008) “La experiencia acumulada en los Censos anteriores de un país es de gran utilidad para preparar un nuevo Censo. Debido al tiempo que transcurre entre un Censo y otro, y a la probabilidad de que incluso en una oficina permanente del Censo haya cambios en el personal directivo, resulta muy útil conservar expedientes completos de la metodología de cada Censo, una evaluación de las técnicas empleadas y un detalle de los gastos y de la ejecución del presupuesto censal” (Naciones Unidas 2008) Toda la documentación generada en el Censo deberá, clasificarse, organizarse y archivarse de manera que sea posible encontrar con facilidad información sobre cada aspecto de la operación del Censo y así garantizar la preservación de los materiales censales pertinentes. El enfoque principal para preservar la información de archivo es el de garantizar que se almacene utilizando medios a largo plazo y que el acceso a esos medios esté cuidadosamente controlado. El archivo engloba las actividades que prolongan la vida útil de la documentación al minimizar el deterioro físico y químico de los registros y prevenir la pérdida de contenido informativo. (Naciones unidas, 2021a). “Los instrumentos y técnicas de gestión de 232 conocimientos ayudan a conservar la memoria institucional en forma codificada para que las enseñanzas aprendidas del pasado puedan utilizarse para gestionar mejor la planificación y ejecución del Censo en el futuro”. (Naciones Unidas, 2008). De esta forma, el propósito del archivar la documentación, en el contexto de los Censos, es para garantizar que los registros de la operación del Censo (considerados importantes para mantener una información histórica precisa de la operación del Censo, así como para permitir la reconstrucción de los procesos del Censo) se conservan adecuadamente a largo plazo para que estar disponible para uso futuro (Naciones unidas, 2021a). 233 Anexo 3. Las rondas censales posteriores a la del 2010 1 Ronda censal 2020 La ronda de Censos 2020 (de 2015 a 2024) se ha venido desarrollando “en el contexto de nuevos compromisos para identificar y abordar las desigualdades entre y dentro de los países, respecto a una amplia variedad de indicadores de desarrollo”. (UNFPA 2017). Los Censos son críticos para “la planificación del desarrollo nacional y subnacional, el seguimiento del progreso de los Objetivos de Desarrollo Sostenible (ODS), la distribución de los programas de bienestar social e infraestructuras, la planificación de las elecciones y el análisis de los mercados, entre otros” (UNFPA 2017). Uno de los indicadores planteado dentro de los ODS “realiza un seguimiento de la proporción de países que han realizado al menos un Censo de Población y vivienda en los últimos 10 años. Esto también incluye a los países que compilan sus estadísticas detalladas de población y vivienda a partir de registros de población, registros administrativos, encuestas de muestras u otras fuentes o una combinación de esas fuentes” (Programa Mundial de Censos de Población y Vivienda, 2016). De esta forma el Programa Mundial de Censos de Población y Vivienda de 2020 insta a “los Estados Miembros a realizar al menos un Censo de Población y vivienda durante el período de 2015 a 2024, teniendo en cuenta las recomendaciones internacionales y regionales relacionadas con los Censos de población y vivienda, y prestar especial atención a la planificación anticipada, la eficiencia de costos, la cobertura, y la difusión oportuna y el fácil acceso a los resultados del Censo para los interesados nacionales, las Naciones Unidas y otras organizaciones intergubernamentales apropiadas a fin de informar decisiones y facilitar la implementación efectiva de planes y programas de desarrollo”. (Programa Mundial de Censos de Población y Vivienda, 2016) Esta nueva ronda censal presenta desde el 2015 algunas innovaciones entre los distintos países, “como la actualización cartográfica con dispositivos electrónicos e imágenes satelitales; la recolección mixta, por medio de auto-empadronamiento, cuestionarios en línea, etapa presencial y telefónica; herramientas visuales interactivas de monitoreo del avance del Censo; modelo híbrido de capacitación de la estructura operativa, a distancia y presencial”. (UNFPA, MERCOSUR, INDEC, mayo de 2021). Muchos de estos enfoques que se están aplicando actualmente “implican el uso de múltiples fuentes de datos y/o múltiples modos de recopilación. En un Censo tradicional, por ejemplo, los países pueden combinar la respuesta por Internet, la recolección de campo con tabletas en grandes ciudades y entrevistas en papel en regiones remotas. En un Censo combinado, los datos pueden derivarse de fuentes 234 administrativas y de una recopilación de campo ad hoc”. (Valente. Paolo, 13 de septiembre de 2019) Por tanto, los enfoques multimodales utilizan fuentes de datos y tecnologías existentes que pueden “aumentar potencialmente la eficiencia del Censo en términos de tasa de respuesta, cobertura, calidad de los datos y costos. Sin embargo, un enfoque multimodal también implica desafíos y riesgos. Se debe configurar un sistema de seguimiento de respuestas para registrar en tiempo real las respuestas recibidas a través de los diferentes modos y compartir esta información con los trabajadores de campo”. (Valente. Paolo, 13 de septiembre de 2019) Por otra parte, el contexto a nivel mundial fue cambiando a partir de la pandemia de covid 2019, la cual “forzó a las oficinas de estadística a hacer en el término de meses lo que en otras circunstancias hubiera llevado años. (Esto) implicó el levantamiento de datos por medios remotos, tales como teléfonos e internet; revisitar la importancia de los registros administrativos, ya no como fuente de información para generar datos sino como una de las fuentes de información más relevantes sobre todo en el contexto de la preparación de la siguiente ronda censal”. (Mejía Guerra, José Antonio, 2021), dando paso a varias innovaciones en los Censos de población y vivienda. En América Latina, a raíz de la pandemia se produjo un cierre de oficinas al comienzo de esta y una reapertura más lenta hacia fines de 2020. De esta forma, “el confinamiento y el teletrabajo se prolongaron más que en otros lugares. Por otra parte, cabe destacar el papel que tuvieron que desempeñar los organismos de estadística en la medición y el control del avance de la pandemia, como apoyo fundamental para las autoridades sanitarias y como contribución al bienestar social, en una región en que los sistemas de registros administrativos contaban con un menor nivel de desarrollo” (CEPAL 2021d). En 2020, con el fin de identificar los desafíos e impacto que han tenido los diferentes países a raíz de la pandemia en relación con los Censos de población y el funcionamiento de los INEs, así como por la necesidad de conocer “las necesidades de apoyo técnico y financiero que se requieren, el Banco Mundial y la División de Estadística de las Naciones Unidas, en coordinación con las comisiones regionales de las Naciones Unidas, diseñaron e implementaron una encuesta mundial en línea dirigida a los INE. La encuesta 9., a la que 9 Los resultados de dicha encuesta se pueden encontrar en el siguiente https://unstats.un.org/unsd/demographicsocial/census/COVID-19-SurveyT1/. 235 respondieron 120 países de todo el mundo, entre ellos 18 de América Latina y el Caribe, constaba de tres rondas(fases): mayo, julio y octubre de 2020” (CEPAL 2021d). Posteriormente, la División de Estadística de las Naciones Unidas, la cual cumple con las responsabilidades de la Secretaría del Programa Mundial de Censos de Población y Vivienda de 2020, realizó dos encuestas entre los países que originalmente habían programado un Censo para 2020 o 2021 con el objetivo de monitorear y tener información sobre cómo se estaban siendo afectados por el COVID-19 y cual había sido el impacto en la realización de Censos. “La primera encuesta, realizada en marzo/abril de 2020 al comienzo de la pandemia, se centró en países que originalmente programaron un Censo en el año 2020. La encuesta buscaba obtener información preliminar directamente de las oficinas nacionales de estadística sobre cómo estaban siendo afectados por COVID- 19. Las respuestas recibidas proporcionaron una comprensión provisional del impacto de la pandemia en ese momento. (Esta encuesta dispone de información para 7 países de la región, 4 de América Latina y 3 del Caribe). (Naciones unidas, 2020b) La segunda encuesta de la UNSD se realizó en diciembre de 2020/enero de 2021. La encuesta se centró en países que originalmente programaron un Censo en el año 2020 o 2021. La encuesta solicitó a los países que proporcionaran información sobre el impacto de COVID19 en las actividades preparatorias del Censo, enumeración basada en el campo, métodos censales y desafíos”. (Naciones Unidas, 2021b). En relación con la segunda encuesta, (diciembre de 2020 y enero de 2021), “se dispone de información de 28 países de América Latina y el Caribe (18 del Caribe y 10 de América Latina), de los cuales, 17 tenían un Censo programado para 2020, 8 tenían un Censo programado para 2021 y 3 no indicaron el año censal previsto” (CEPAL 2021d). Uno de los temas que se pudo analizar a partir de estas encuestas es el calendario censal de la ronda de 2020, el cual fue impactado de manera importante debido a la pandemia. Los Censos de población y vivienda de la estaban previstos para realizarse en los años 2020, 2021 y 2022, pero muchos tuvieron que postergarse o suspenderse, y reprogramarse para los años posteriores. “Incluso se han visto afectados algunos Censos programados para 2022, como resultado de la falta de financiamiento y las limitaciones para realizar el trabajo de campo requerido en las etapas precensales” (CEPAL 2021c). Según el informe ronda de la encuesta mundial, realizada en octubre de 2020, “casi tres cuartas partes de los INE que respondieron a la encuesta (90 países) tenían previsto hacer un Censo de Población y vivienda en 2020 o 2021 antes del brote de la pandemia, y, ante la 236 persistencia de los desafíos para la recolección de datos cara a cara, el 40% de ellos indicó que debía posponer las operaciones de recopilación de datos. (Cepal 2021d) Con respecto a las etapas preparatorias de los Censos de población y vivienda “los países del mundo que durante 2020 se encontraban en etapa precensal (39) y que debieron aplazar los Censos como consecuencia del COVID-19, poco más de la mitad se vieron afectados en lo pertinente al Censo piloto y la capacitación de personal (51%), y casi 4 de cada 10 (39%) aplazaron labores de cartografía y contratación de suministros a través de licitaciones (CEPAL 2021d). Al analizar los países de América Latina y el Caribe, se observó que “solo Aruba y México alcanzaron a realizar sus Censos en el (año) 2020 y, si bien algunos países en un principio pospusieron el Censo para 2021, después debieron postergarlo para 2022. Esto se debió tanto a la continuidad de las restricciones sanitarias como a recortes en los presupuestos o dificultades para cumplir con la totalidad de los procesos relativos a la etapa precensal, como la actualización cartográfica, las pruebas piloto y la capacitación. También tuvo que ver con la incertidumbre respecto de las posibilidades reales de llevar a cabo la recolección de la información censal mediante entrevistas cara a cara y de aplicar metodologías de monitoreo y control de calidad” (CEPAL 2021d). Con respecto a las actividades preparatorias que fueron más afectadas en la región sobresale en América Latina, la necesidad de cancelar o posponer fue la cartografía y la publicidad en el Caribe. Asimismo, las actividades de “capacitación y adiestramiento se suspendieron o cancelaron en más del 60% de los países de la región y a ellas les siguieron los Censos piloto, cancelados o aplazados en un 50% de los países” (CEPAL, 2021d). De esta forma en general en la región “7 entidades de cada 10 (67%) debieron postergar las actividades correspondientes a cartografía, Censo piloto, capacitación de personal y contratación de suministros. La tercera parte de los países postergaron lo correspondiente a publicidad y contratación de consultores y asesores. (CEPAL 2021d) Por otra parte, la mayoría de los países de la región suspendió las entrevistas cara a cara, tanto por la seguridad sanitaria de los censistas como de los hogares entrevistados. Asimismo, no se reportaron como método de recolección el autoempadronamiento en papel por correo postal (a excepción de México que la implementó durante la cuarentena a causa del COVID19), pero “cerca de la mitad de los países que respondieron la pregunta utiliza los métodos de entrevista para recolección de datos por Internet (CAWI) y de entrevista telefónica asistida por computadora (CATI), y, en menor medida, piensan recurrir a los registros administrativos”. (CEPAL 2021d). Toda esta situación se vio reflejado en las reprogramaciones de los Censos que tuvieron que realizar los países debido a la pandemia (Tabla 25). 237 Tabla 25. América latina: Características de la etapa precensal y programación de los Censos ronda 2020 según la segunda encuesta de la división estadística de las Naciones Unidas sobre el impacto del COVID-19 Fuente: Elaboración Propia con base en Los Censos de población y vivienda de la ronda de 2020 en América Latina y el Caribe en el contexto de la pandemia (Cepal 2021d), Encuesta sobre el uso de tecnología en los Censos de población y vivienda de la ronda 2020, declaraciones de los países de la región en asistencias técnicas o en reuniones internacionales, de información disponible en las páginas web de las oficinas de estadística, del documento "Lineamientos generales para la captura de datos censales" (Cepal, 2021b) y del artículo "Estimaciones de algunos efectos y determinantes del uso de distintas tecnologías en los Censos de población de América Latina y del Caribe" (Perfit, J. T., Russell, M, Moncada G, A. y Muñoz Ayala J. A., 2012). Nota: NC "No corresponde"; SI "Sin información"; DMC " dispositivo móvil de captura" y CATI "entrevista telefónica asistida por computador" TablaEn el 2021 “la División de Estadística de las Naciones Unidas organizó dos reuniones de expertos en formato virtual: la primera en febrero y la segunda en noviembre. En ambas reuniones, que versaron sobre el impacto de la pandemia de COVID-19 en la realización de los Censos de población y vivienda y calidad de los datos. La primera reunión se centró en el impacto de la pandemia de COVID-19, en el diseño y la realización de las operaciones del Censo, y en los desafíos para producir estadísticas de áreas pequeñas, oportunas, precisas y 238 confiables durante la pandemia. Entre las principales conclusiones de esta reunión se destacan, más allá de los aplazamientos de los calendarios censales, la ampliación del período de enumeración, la modificación de los cuestionarios y la adaptación de los procedimientos. Las principales modificaciones están relacionadas con la introducción de métodos de recopilación de datos de autoenumeración vía web (eCenso), entrevista telefónica asistida por computadora y autoenumeración en papel (dejar la encuesta y pasar a recogerla), en sustitución de las entrevistas cara a cara, y en una combinación de dichos métodos. En la segunda reunión, celebrada en noviembre, cuando los países confirmaron que habían podido avanzar en la implementación de estas modificaciones a las operaciones censales pese a las circunstancias epidemiológicas y que incluso habían llegado a hacer Censos de población y vivienda en medio de la pandemia. Al mismo tiempo, no obstante, se concluye que no todos los países están en las mismas condiciones para implementar estos cambios y que ello tiene como consecuencia sucesivos aplazamientos de los Censos” (CEPAL 2021d). Por otra parte, en estas reuniones se remarcó la preocupación sobre el tema de la calidad de los datos censales de las enumeraciones que se han realizado bajo la presión de la pandemia de COVID-19. “Los cambios en el diseño de la operación de campo para reducir las entrevistas cara a cara y extender la duración del empadronamiento podrían tener efectos negativos en la calidad de los datos. Los encuestados pueden tener dificultades para recordar dónde vivían y cuántas personas residían en una dirección determinada en la fecha de referencia del Censo”. (CEPAL 2021d). De manera similar, también se señaló que “el concepto de residencia habitual puede tener menos relevancia o resultar más ambiguo, dada la incertidumbre vivida durante la pandemia de COVID-19, para las personas que han cambiado varias veces de lugar de residencia, los estudiantes, que generalmente viven lejos del hogar familiar, pero que se quedan con su familia durante la pandemia, o los trabajadores que tuvieron que mudarse a su casa familiar desde su lugar de residencia habitual debido a los cierres a causa del COVID19”. (CEPAL 2021d). Asimismo, se hizo referencia a “diversas circunstancias que pudieron haber afectado la calidad del cuestionario electrónico, como las escasas habilidades tecnológicas de las personas para el completamiento de cuestionarios en ese formato, el temor frente al uso de estas y otras herramientas tecnológicas y los problemas de conectividad” (CEPAL 2021d). Igualmente puede presentarse problemas en como sucedió en pruebas realizadas en Brasil con “la omisión de personas en las viviendas y la existencia de formularios inconclusos” (CEPAL 2021d). 239 2 Futuras rondas censales y los registros administrativos En las próximas rondas censales es probable que más países adopten métodos alternativos basados en múltiples fuentes y métodos de recolección. “Un posible desarrollo para futuros Censos es el uso, en combinación con otras fuentes, de "grandes datos". Varios países ya han probado este enfoque para la ronda de Censos de 2020, pero aún quedan muchos desafíos metodológicos, legales, de calidad y de TI por abordar”. (Valente. Paolo, 13 de septiembre de 2019). Una de las fuentes que pueden tener una mayor importancia son los registros administrativos. “La incorporación de los registros administrativos en los sistemas estadísticos en general y en los Censos de población, en particular, se configura como un escenario compartido de oportunidades y desafíos. En ese camino, el intercambio de experiencias a nivel internacional será crucial. Avanzar hacia sistemas de información sociodemográfica apoyados en registros constituye un proyecto de largo plazo. Por eso los Censos combinados constituyen una transición hacia la siguiente ronda censal con uso intensivo de registros administrativos”. (UNFPA, MERCOSUR, INDEC, mayo de 2021). Para ello es necesario “evaluar su calidad dada la visión extendida de avanzar hacia el siguiente Censo como una transición a un sistema de uso intensivo de registros administrativos, lo que exigirá la búsqueda de integración de fuentes, por ejemplo, mediante la inclusión del número de identidad en el cuestionario censal, tanto para integración como para validación de la calidad de los registros existentes” (Mejía Guerra, José Antonio, 2021). En rondas anteriores los países en el mundo han venido utilizado los registros administrativos combinados con las operaciones censales. Para la ronda de Censos de 2010 y 2020, varios países realizaron un Censo basado en registros o un Censo combinado, sin embargo, el método tradicional sigue siendo el enfoque más popular. Por otro lado, se prevé que para futuros Censos la proporción de países que adopten un método alternativo como los Censos basados en registros o combinados, vaya aumentando significativamente. 240 Anexo 4. Los Censos de población en América Latina y el proceso de captura En los países de América Latina, la tendencia ha sido transitar hacia procesos de modernización e innovación tecnológica al buscar afrontar los retos de una sociedad más exigente, que requiere datos, cada vez más oportunos, de mejor calidad y más detallados. Esta modernización también la ha tenido que sobrellevar los distintos INEs en las últimas décadas al momento de planear y ejecutar operaciones estadísticas como los Censos de población y vivienda; introduciendo diferentes innovaciones tecnológicas en la recolección y/o captura de la información y en algunos casos implementando métodos mixtos de manera secuencial o simultaneo, con el fin de mejorar la calidad y oportunidad de los datos censales. La adopción de nuevas tecnologías, ya sea para la captura de los datos censales, afecta de manera importante la planeación del Censo, “entendiendo por método de captura el proceso de entrada, ingreso o digitalización de los datos censales, proceso que puede realizarse durante o después de la enumeración, dependiendo del método utilizado durante el operativo: electrónico con DMC, eCenso o papel con digitación y escaneo (lectura óptica)” (CEPAL, 2021b). De esta forma, la incorporación un nuevo método de captura “conlleva una serie de actividades, pruebas, riesgos y desafíos que, también, deben incluirse en la planificación y gestión del Censo” (CEPAL, 2021b). El presente capítulo hace una breve descripción de las diferentes experiencias de algunos países latinoamericanos con respecto a los Censos de las últimas rondas censales, conociendo los métodos y la tecnología de captura que utilizaron para la recolección de la información censal. Los países seleccionados son Brasil (Censo 2010 y 2022), Chile (Censo 2017 y 2024), Colombia (Censo 2005 y 2018), Ecuador (Censo 2010 y 2022), México (Censo 2010 y 2020), Uruguay (Censo 2011 y 2023) y Venezuela (Censo 2011 y 2021). De esta forma, la información recabada se basa en las “fichas de Sistematización de Experiencias para Países de América Latina y el Caribe”, las cuales fueron realizadas por el personal técnico cada uno de los INE y se encuentran en el documento “Lineamientos generales para la captura de datos censales”, publicado por la CEPAL en 2021. Asimismo, también la recopilación se basó en diferentes páginas web oficiales y documentos metodológicos elaborados por los distintos INEs, al igual que en algunos artículos prensa de los diferentes países analizados. 241 1. Brasil 1.1 Censo 2010 a. Generalidades El Censo demográfico 2010 es un Censo tradicional de derecho que cubrió la totalidad del territorio nacional en Brasil. La recolección del Censo comenzó el 1 de agosto de 2010 y duró hasta el 31 de octubre del mismo año, teniendo como fecha de referencia la noche del 31 de julio al 1 de agosto de 2010. (IBGE, 2016). La duración del Censo fue de 12 semanas y se extendió 4 semanas después del periodo oficial (CEPAL, 2021b). El Censo Demográfico 2010, utilizó dos modelos de cuestionario, siendo implementado solo uno de ellos en cada hogar (IBGE, 2016). Estos formularios son los siguientes: ● Cuestionario Básico: es un formulario simplificado que contiene 37 preguntas (IBGE, 2016). ● Cuestionario Ampliado: es un formulario más extenso y detallado que se aplicó a los hogares seleccionándolos mediante muestreo probabilístico. Este último contiene todas preguntas del Cuestionario Básico, además de un conjunto de preguntas sobre temas tales como educación, religión, discapacidad, migración, fertilidad, trabajo e ingresos, entre otros (IBGE, 2016). En total este formulario tiene 108 preguntas. Se llevó a cabo la recolección de información en el Censo Demográfico 2010 según dos modalidades diferentes: • Entrevista presencial con uso del DMC: Esta modalidad fue la principal alternativa para la recolección de datos (IBGE, 2016). El 99,9 % de la población fueron censados con esta tecnología. (CEPAL, 2021b) •Autoempadronamiento por vía web: La internet fue usada paralelamente como una alternativa auxiliar que se utilizaba solamente en los casos en que los informantes hacían la solicitud de utilizar este medio (CEPAL, 2021b). Era una alternativa que ofrecía el Censista, cuando existían restricciones de acceso a áreas específicas o se encuentra alguna otra dificultad para realizar entrevista cara a cara (IBGE, 2016). Solo el 0,1% de la población se censó por vía web. 242 No se censó toda la población en situación de calle, solamente la parte que vivía en habitaciones improvisadas o viviendas colectivas. En las viviendas colectivas, la entrevista fue presencial siempre que fuera posible, pero en algunos casos especiales (como prisiones) se hizo por medio de los registros administrativos (CEPAL, 2021b). Para el Censo de 2010 se realizaron tres pruebas piloto y un Censo experimental. Después del Censo experimental, se realizó otro operativo de campo para testar nuevos equipos, debido a que los “Netbooks” que se utilizaron como DMC para los empadronadores no fueron una buena opción en el Censo experimental. Se realizaron también muchos testeos internos de homologación de los sistemas (tanto DMC como web). La evaluación del cuestionario web se dio siguiendo la misma lógica del DMC. Además de las tres pruebas piloto y del Censo experimental, se hizo también dos testeos internos con la participación de todos los funcionarios del IBGE (alrededor de 5000). (CEPAL, 2021b). b. Información del método de captura El software utilizado para la recolección electrónica de datos en dispositivos móviles fue desarrollado internamente por IBGE, utilizando el lenguaje Java y una plataforma llamada TotalCross, compuesta por bibliotecas y una máquina virtual para el sistema operativo Windows Mobile, que era el sistema utilizado en los DMC. Los datos se almacenaron internamente en el dispositivo de forma encriptada y en archivos independientes para cada cuestionario. Cada dispositivo tenía una tarjeta SD de backup. La información se transmitió desde el dispositivo a la computadora portátil local en el “puesto de recolección”, a través de un cable USB. Desde este portátil, los datos se transmitían a través de un canal seguro al servidor central de IBGE. Más de 200.000 dispositivos móviles de recolección fueron adquiridos para uso de empadronadores y supervisores en 2010. Además del equipo interno del IBGE que desarrolló la aplicación de recolección, IBGE contrató un suporte de la empresa responsable de TotalCross durante el período de desarrollo y recolección para ayudar al desarrollo y mantenimiento de la aplicación. (CEPAL, 2021b). El sistema web para el cuestionario del Censo de 2010 también fue desarrollado internamente por el IBGE. Se utilizó una plataforma basada en el servidor Apache / HTTPS y PHP. Para la base de datos, se utilizó Oracle en una arquitectura de clúster (Oracle RAC). Se empleó una arquitectura de red con firewall F5 y equilibrio de carga. Los servidores web de la aplicación tenían su propia rutina de copia de seguridad interna y la base de datos de Oracle también se configuró para realizar copias de seguridad periódicas utilizando las propias herramientas de 243 Oracle. Se firmó un contrato con una empresa especializada en soluciones Oracle para soporte y mantenimiento durante el período de desarrollo y recolección de datos. (CEPAL, 2021b). c. Monitoreo y control Los sistemas de monitoreo y control del Censo 2010 eran descentralizados. Toda la vinculación del equipo de campo con los DMC y la recepción de los datos ocurrían en los “Puestos de Recolección”, con uso de Notebooks que contenían un sistema llamado Sistema de Gerenciamiento del Puesto de Recolección (SIGPC). Los DMC no se comunicaban con el ambiente central, solamente lo hacía el SIGPC. Cuando se hacía la comunicación del SIGPC con el ambiente central, toda la estructura del Instituto Brasileño de Geografía y Estadística (IBGE) tenía acceso a los datos para hacer el acompañamiento (generalmente, se hacía esa comunicación una vez al día). Todo el control del trabajo dependía de la conexión de los DMC con el SIGPC. Los DMC contaban también con una tarjeta de memoria para respaldo, que podía descargarse directamente en el SIGPC en caso de problemas con el equipo. Toda la validación de los datos se realizaba en el ambiente central, donde había criterios preestablecidos para cada caso. Las pérdidas de datos o datos erróneos fueron muy insignificantes (CEPAL, 2021b). El control de la recolección con autoempadronamiento web siguió la misma lógica del DMC. Cuando un informante llenaba el cuestionario, sus informaciones iban a un banco de datos intermediario, hasta que la clave entre el código del cuestionario y la dirección fueran transmitidos del DMC al SIGPC, y después del SIGPC para el sistema central. Así, cuando se hacia la comunicación del SIGPC con el ambiente central, toda la estructura del IBGE tenía acceso a los datos de colecta vía DMC y web para hacer el acompañamiento. Toda la evaluación y control de integridad en el caso de los cuestionarios web se daba en el ambiente central. (CEPAL, 2021b). 1.2 Censo 2022 a. Generalidades El Censo en Brasil tuvo dos postergaciones. Primero se pasó de 2020 a 2021, por la pandemia, y luego el gobierno de Jair Bolsonaro recortó los fondos destinados a su realización. El espacio conformado por un grupo de académicos del área estadística es igualmente crítico con la situación de Brasil. Dice que “desde la llegada de Susana Cordeiro Guerra (a la presidencia 244 del Instituto Brasileiro de Geografía e Estadística, IBGE) en 2019, el Censo tuvo reducciones en el tamaño de cuestionario y reducciones en su presupuesto”. (Bazán, 19/05/2022). Con la renovación de autoridades (hoy preside Eduardo Ríos Neto), el Censo en Brasil comenzará el próximo 1 de agosto de 2022 (Bazán, 19/05/2022) y se extendería hasta finales de octubre. El IBGE plantea una estrategia de modernización del Censo en la cual viene trabajando desde antes del inicio de la pandemia. “En esa estrategia se combinan registros administrativos y encuestas por muestreo en que se optimiza el papel del Censo y se aprovechan tecnologías que facilitan la recolección y el procesamiento de datos, permiten una operación más eficiente y mejoran los índices de cobertura. La pandemia impuso el desafío de repensar los métodos tradicionales de recolección de datos, y de modificar y adaptar los ambientes de trabajo, por ejemplo, hacer posible el trabajo en casa. A los efectos del Censo, el catastro de direcciones se obtendrá mediante el emparejamiento con registros administrativos, lo que va a mejorar la cobertura territorial”. (CEPAL 2021c). Se aplicarán dos tipos de cuestionarios censales: ● Cuestionario Básico: Este formulario consta de 26 preguntas y busca medir las características sociodemográficas básicas. (Gobierno Brasil. 24/01/2022.) ● Cuestionario Ampliado: Para una muestra, que es alrededor del 11% de los 78 millones, que da aproximadamente 8,5 millones de hogares, se aplicará un cuestionario extendido que tiene 77 preguntas. Este formulario tiene preguntas sobre los ingresos, el trabajo, todas las características que suelen encontrarse en las encuestas de hogares como la Encuesta Nacional Continua por Muestreo de Hogares. (Gobierno Brasil. 24/01/2022.) La estrategia de recolección utilizara las siguientes modalidades de enumeración: ● Entrevistas presenciales con uso del DMC de forma descentralizada. (CEPAL, 2021b). ● Internet utilizado de forma auxiliar y paralela con la operación presencial. (CEPAL, 2021b). ● Llamada telefónica: como alternativa para el llenado de los cuestionarios, los censistas podrán utilizar sus DMCs para hacer las entrevistas por teléfono. Esta modalidad será utilizada cuando el censista no encuentre ningún morador presente en la vivienda. En estos casos podrá dejar su número para que el morador haga una llamada al censista y se realice defina una cita para hacer la entrevista telefónica. (CEPAL, 2021b). 245 Se realizaron diferentes pruebas para evaluar los diferentes procesos censales y herramientas que se implementaran en el Censo demográfico: ● Primera prueba piloto: La primera Prueba Piloto del Censo Demográfico 2022 se realizó del 20 de agosto al 6 de septiembre de 2018 en 38 municipios repartidos en 13 Unidades de la Federación, cubriendo áreas urbanas, rurales y áreas de pueblos y comunidades tradicionales de las Regiones Norte, Nordeste, Sudeste y Sur. Esta operación tuvo como objetivo probar la primera versión de los cuestionarios, evaluando el desempeño del instrumento de recolección, la comprensión de las preguntas, la duración de las entrevistas, además de producir insumos para evaluar cuestiones operativas esenciales para la planificación (IBGE. 2022). ● Segunda Prueba Piloto: La segunda Prueba Piloto del Censo Demográfico 2022 se realizó del 11 de marzo al 5 de abril de 2019 en municipios repartidos en 14 Unidades de la Federación, cubriendo áreas urbanas, rurales y de pueblos y comunidades tradicionales del Norte, Nordeste, Sudeste y Sur. Esta prueba evalúo los posibles cambios derivados de los resultados de la 1ra Prueba Piloto, el auto completamiento vía internet, la funcionalidad del call center, la adecuación y desempeño de las preguntas en los diferentes métodos de recolección, el tiempo de las entrevistas, el control de la cobranza, además de probar la cadena de capacitación y los materiales didácticos, entre otros (IBGE. 2022). ● Censo Experimental en Poços de Caldas – Minas Gerais: Este Censo experimental se realizó en noviembre 2019, cuando se tenía pensado realizar el Censo demográfico en 2020.Poços de Caldas, en Minas Gerais, fue el municipio elegido para probar la recolección integral de datos en este Censo Experimental, probando también la posibilidad de contestar vía Internet (IBGE. 2022). ● Prueba de aproximación telefónica del Censo de 2022: La prueba consta de dos fases: o Prueba remota (realizada en noviembre y diciembre de 2020): Buscaba mejorar la operación del Censo mientras el escenario de la pandemia impedía la realización de la prueba de campo. Toda la estrategia fue diseñada para evitar entrevistas cara a cara o aglomeraciones de personas en las actividades de capacitación. Se previeron dos grupos en la fase 1: el grupo 1 que fue entrevistado por teléfono y su objetivo era investigar la factibilidad de la alternativa de recolectar información por teléfono; y el grupo 2 que participó en las pruebas de equipos y sistemas por simulación y buscaba 246 evaluar el buen funcionamiento de los equipos y sistemas, los totales en reportes, transmisiones y otras funcionalidades, considerando las limitaciones impuestas por el aislamiento social provocado por la pandemia del coronavirus (IBGE. 2022). o ● Prueba Presencial (2021). Prueba de aprobación de equipos y sistemas del Censo del 2022: Se realizó en el municipio de Engenheiro Paulo de Frontin (RJ). Esta prueba tenía como objetivo evaluar, en condiciones reales de campo, los dispositivos que se utilizarán en la recolección de datos, los sistemas de captura, transmisión y seguimiento de la información recolectada y el acercamiento a los informantes. La recolección también está prevista en 19 sectores de Pueblos y Comunidades Tradicionales (indígenas y quilombolas), distribuidos entre los municipios de Angra dos Reis (RJ) y Paraty (RJ), para probar características diseñadas específicamente para esta población. (IBGE. 2022). Las etapas de recolección de datos y supervisión previstas para iniciar el 15 de marzo de 2021 fueron reprogramadas debido a las condiciones sanitarias derivadas de la pandemia de la Covid-19. La prueba se realizó con entrevistas presenciales, por teléfono y también con la opción de autocumplimentación vía internet en nueva fecha por definir (IBGE. 2022). ● Prueba Isla Paquetá Rio de Janeiro: Esta prueba se realizó en septiembre 2021 y el lugar fue elegido por el avanzado estado de inmunización de la población, pues ya se han aplicado dos dosis de la vacuna contra el coronavirus. Los objetivos principales de la prueba feuron evaluar las aplicaciones y sistemas desarrollados específicamente para el Censo, con el fin de corregir las fallas y mejorarlas para la operación censal que se va a trabajar en el campo en 2022 en todo el país, además de probar la aplicación simultánea de las tres modalidades de recolección de datos (presencial, por internet y por teléfono) y realizar la Encuesta Post-Enumeración (EPP). (IBGE. 2022) ● Pruebas en los 27 estados: Estas pruebas se implementaron en noviembre y parte del mes de diciembre de 2021. Hubo recolección tanto en los distritos capitalinos, como Minas Brasil en Belo Horizonte (MG), Laguinho en Macapá (AP) y Amaralina en Salvador (BA) y en lugares más remotos, como la comunidad ribereña de Novo Remanso, a 200 km de Manaus (AM), o el municipio de Tigrinhos, a nueve horas en auto desde Florianópolis (SC). Debido a su alcance nacional, la operación permitió involucrar a todos los equipos de coordinación local para la gestión del Censo, posibilitando el uso de todos los sistemas de monitoreo y la puesta a punto de las distintas herramientas para el seguimiento y control de la recolección (IBGE. 2022). 247 La operación incluyó todas las etapas de preparación e implementación, tales como: capacitación, involucrando una etapa remota y una etapa presencial; recopilación de información urbana sobre el entorno del hogar; recolección de cuestionarios utilizando el modelo de enfoque mixto que incluye recolección de datos presencial, telefónica e internet; realización de procedimientos para verificar la calidad del trabajo de los censistas por parte de los supervisores (supervisión). Además de realizar la Encuesta PostEnumeración (EPP) (IBGE. 2022). b. Monitoreo y control El proceso Minería de Recopilación de Datos es una herramienta para evaluar la recopilación de datos en tiempo real, en donde se puede seguir el número de visitas al hogar, el tiempo dedicado a cada visita, la finalización del cuestionario, las razones para no completar el cuestionario, las actividades de supervisión, etc. (Ríos, 23 de noviembre de 2021). 2 Chile 2.1 Censo 2017 a. Generalidades La metodología utilizada en el Censo de Población y vivienda 2017 fue la de un Censo tradicional de hecho. Para ello, se definió que este se efectuaría el 19 de abril de 2017, día que fue legalmente declarado feriado nacional, al igual que en los Censos de hecho realizados con anterioridad (INE- Chile, 2018) y se extendió por 3 semanas después de la fecha oficial. (CEPAL 2021b). Luego que el Proyecto Censal del año 2012 fuera declarado inválido, la principal recomendación de los expertos nacionales e internacionales fue realizar un Censo de emergencia con carácter abreviado, utilizando la forma tradicional de recolección de los Censos anteriores en el país; esto se tradujo en programar un Censo de hecho con cuestionarios en papel y reconocimiento óptico (CEPAL, 2021b). El operativo se dividió en cuatro estrategias: viviendas particulares; personas en viviendas colectivas; personas en tránsito y; personas en situación de calle y utilizó personal voluntario que fue convocado con funcionarios públicos, estudiantes secundarios y universitarios además de organizaciones de la sociedad civil y voluntarios reclutados vía web. (CEPAL, 2021). 248 Una de las características del Censo 2017 es que se jerarquizaron los objetivos tradicionales de los proyectos censales y, en consecuencia, se redujeron los contenidos del cuestionario. Por ello se le considera abreviado respecto al número de preguntas de su cédula censal, lo que disminuye los tiempos de procesamiento de los datos (INE- Chile, 2018). El cuestionario del Censo de Población y Vivienda 2017, constó de 21 preguntas, divididas en tres ámbitos: 1) Variables demográficas 2) Marco Muestral y 3) Requerimientos de vivienda. Sumado al cuestionario para viviendas particulares se diseñaron dos cuestionarios más, uno específico para viviendas colectivas y otro para personas en tránsito, cada uno de 14 preguntas. La aplicación de estas versiones implicó la planificación y ejecución de operativos especiales en la noche del 18 al 19 de abril de 2017. (INE- Chile, 2018). Los métodos de recolección o captura utilizados durante la recolección fueron Papel/Digitación % de Viviendas: 99,995 y % de Población 99,9955. Web / CAWI de Viviendas: 0,005 y % de Población 0,0045 (CEPAL 2021). Se diseñaron y elaboraron diversos ejercicios piloto para preparar el levantamiento censal 2017, con el fin de fortalecer procesos que resguardaran el cumplimiento de los objetivos y resultados esperados: ● Prueba piloto: Se realizo entre agosto y septiembre de 2015. Las comunas seleccionadas para realizar este ejercicio fueron Providencia, de la Región Metropolitana, y Curicó, de la Región del Maule. El propósito consistió en evaluar los procedimientos generados para la ejecución de las actividades precensales. ● Prueba Piloto de Tiempo: se realizó entre el 30 de septiembre y el 5 de octubre de 2015 en comunas urbanas y rurales de la Región Metropolitana y la Región de Valparaíso. Tuvo por objetivo medir el tiempo en la aplicación de tres versiones del cuestionario censal y dar respuesta a una serie de hipótesis respecto a los factores que podrían intervenir en los tiempos considerados. ● Pretest: se llevó a cabo desde el 30 de noviembre hasta el 11 de diciembre de 2015, en cuatro regiones del país: Arica y Parinacota, O´Higgins, Los Ríos y Metropolitana. Su objetivo fue depurar las preguntas del cuestionario censal, categorías y flujos de respuestas, así como afinar su diseño y diagramación. ● Prueba Piloto Censal: se efectuó el domingo 10 de abril de 2016 y contempló sectores censales correspondientes a las siguientes regiones: Metropolitana, Biobío, La Araucanía, Los Ríos y Aysén. Buscó obtener una visión global acerca del proceso censal, testear 249 tanto las modificaciones realizadas al cuestionario censal como las funciones del supervisor. ● Censo experimental (Ensayo Operativo): a este ejercicio se le denominó Ensayo Operativo del Censo (EOC), y se realizó el 6 de noviembre de 2016, en todas las regiones del país. Fue un ejercicio que abarcó todos los procesos relacionados con el registro censal, y probó el funcionamiento de los diferentes procesos operativos, así como las herramientas desarrolladas para la ejecución, control y monitoreo del levantamiento censal 2017 (INE-Chile, 2018). Se trabajo el proceso de impresión, distribución y digitalización de datos a través de un contrato que en este caso se llevó a cabo con tres empresas especializadas en su área, pero bajo el mismo contrato público. De esta manera quedaban vinculados los procesos que impactan en toda la cadena del reconocimiento, desde el diseño gráfico del cuestionario, el tipo de hoja, los tamaños de los cuadros para letras, números y marcas además de los códigos asociados al tracking y los controles de completitud de cuestionario durante el procesamiento. Los cuestionarios eran revisados en los locales y organizados para ser enviados en las mismas cajas que fueron enviados para su retorno a nivel central y ser digitalizados de forma central en una bodega de la capital (CEPAL 2021b). b. Información del método de captura El Instituto Nacional de Estadísticas, en el marco de la realización del Censo de Población y Vivienda 2017, licita la adquisición de material censal y los servicios de impresión, mecanizado, distribución, procesamiento de datos y bodegaje. Dicha licitación fue adjudicada por un proveedor externo formado por una unión temporal de las empresas Xerox de Chile SA e Imprenta Alfredo Molina Flores S.A. (AMF/XEROX) (CEPAL 2021b). La digitalización y procesamiento de los cuestionarios censales se realizó entre mayo y principios de septiembre de 2017 y contó con la participación de alrededor de 300 funcionarios de la empresa externa, distribuidos entre dos y tres turnos dependiendo de la tarea a realizar y el período de tiempo. (INE- Chile, 2018). El proceso se llevó a cabo en 8 subprocesos (CEPAL 2021b): 1. Recepción y registro de material censal: Recepción y clasificación de las cajas con material censal en las instalaciones de la empresa externa (CEPAL 2021b). 250 2. Preparación del material censal: se realizaron actividades para preparar el material censal en miras del ingreso de los cuestionarios censales al sistema de captura de datos (CEPAL 2021b). 3. Digitalización: Una vez revisado el material, las hojas de los cuestionarios eran separadas y guillotinadas, adaptándolas para su paso por el escáner (CEPAL 2021b). Cada página escaneada generaba dos imágenes: una a color para la verificación visual de los analistas (como respaldo del original en papel) y otra en blanco y para la lectura óptica. La pantalla del escáner permitía visualizar la totalidad y, al mismo tiempo, ayudaba a verificar que la cantidad de cuestionarios y portafolios escaneados coincidiese con las cantidades declaradas en la fase de preparación del material. Junto con la digitalización de las hojas se escaneaba el código de barra de cada página de las cédulas censales, con el objetivo de verificar los formatos, completitud y orden de las imágenes contenidas en cada uno de los cuestionarios. Por último, las imágenes escaneadas eran sometidas a un control de calidad, de modo que se revisaban un 25% del total (INE- Chile, 2018) 4. Lectura óptica: Una vez digitalizado el material, las imágenes eran comparadas con una plantilla del cuestionario a procesar para identificar el número de página al que correspondía cada una, e ingresaban a un sistema de Reconocimiento Óptico de marcas y caracteres. Es en este proceso de Reconocimiento Óptico que se capturan los datos presentes en el cuestionario (CEPAL 2021b). Al final de este proceso se generaba la primera base de datos, llamada Base 0, que corresponde a toda la información de los cuestionarios que fue recogida por los escáneres (INE- Chile, 2018). 5. Verificación interactiva: El personal de la empresa externa hacía un reconocimiento visual de posibles errores de lectura del escáner, especialmente en los campos de texto (CEPAL 2021b). 6. Verificación INE: Los funcionarios del INE revisaban las variables claves de los cuestionarios, comparando las imágenes en pantalla con la información que se recogía en la base de datos, en aquellos casos en que el reconocimiento automático no lograba el nivel de confianza deseado. 7. Controles y seguimiento del flujo de trabajo a través de un sistema de trazabilidad (CEPAL 2021b). Todos los subprocesos anteriores se realizan bajo una plataforma tecnológica completamente modular, que permite hacer el seguimiento de cada lote de trabajo, haciendo de este un proceso completamente trazable. Dentro de los controles aplicados, estaban chequeos de completitud geográfica, revisión de cuestionarios que no pudieran ser escaneados, completitud de los cuestionarios, peso de las imágenes, 251 verificación de códigos únicos de cuestionarios, verificación tasas de reconocimiento, etc. Esta etapa tiene como finalidad la obtención de una base de datos e imágenes resultantes de la digitalización y reconocimiento óptico de imágenes, marcas y caracteres (CEPAL 2021b). 8. Salida: Una vez concluidos los procesos anteriormente mencionados, se generaban las bases de datos e imágenes finales que son entregadas al INE (CEPAL 2021b). Se estructuran la base de datos en las tres unidades de análisis (viviendas, hogares y personas), para la generación de un enlace o vinculación a través del comportamiento de ciertas variables, el tratamiento de rezagados, que corresponden a la incorporación de cuestionarios provenientes de la recuperación post día del Censo en locales operativos y la incorporación de la información capturada vía web (Sistema de Atención de Citaciones), mediante la vinculación a través de variables claves, como número de portafolio, vivienda y dirección, entre otros, y finalmente se realiza la unificación de los diferentes operativos (viviendas particulares, colectivas, personas en tránsito y situación de calle) para así poder realizar el procesamiento secundario. Posteriormente se realiza un Procesamiento secundario que corresponde al análisis, validación y corrección de inconsistencias, la codificación de las variables de texto (automática y asistida), tanto de comunas, países, pueblos originarios y rama de actividad económica, y el ajuste geográfico para readecuar los sectores de empadronamiento en el territorio, revisando de esta manera los tipos de asentamientos humanos para las definiciones urbano/rural, como también la completitud de su estructura geográfica, y así obtener una base de datos final consistente para publicar y diseminar. Para el procesamiento de datos fue necesario contar con un sistema que fuese capaz de capturar datos de los cuestionarios de Censo utilizando la digitalización y el reconocimiento inteligente de caracteres escritos a mano (ICR), marcas (OMR) y caracteres impresos (OCR), así como otras técnicas de procesamiento de formularios, codificación y transferencia de los datos a la Base de Datos del Censo, llevó a utilizar TIS (Top Imaging Systems) como la plataforma de procesamiento del proyecto y Eflow como el software de captura de datos contratado por Xerox. Respecto al proceso de seguridad y protección de los datos, se siguieron estrictos protocolos de seguridad física y lógica, exigiendo al proveedor, por ejemplo, el envío encriptado de los datos, los que solo personal autorizado del INE podía descifrar (CEPAL 2021b). 252 Para el almacenamiento digital se definió un protocolo de traspaso de información desde la empresa hasta el INE. En este caso, el proveedor dispuso un servidor en el centro de datos principal de la institución. Lo anterior facilitó el proceso de traspaso de información, que se hacía con un disco duro externo proveniente del servidor interno de la empresa que se instalaba en el servidor del centro de datos, llamado también “servidor de paso”. Esta actividad fue monitoreada por personal técnico de la Departamento de Tecnologías de la Información (TI) INE (CEPAL 2021b). Una vez copiados los archivos en el “servidor de paso”, funcionarios de los equipos Censo revisaban la entrega de acuerdo con la documentación previamente definida, y así se verificaba que estuviera completa y que lo informado correspondiera con lo efectivamente copiado en el servidor. Una vez verificada la completitud de las cantidades de datos e imágenes, personal del INE aprobaba la entrega y se generaba la copia desde el “servidor de paso” hacia servidores internos del INE. Como medida de precaución, tanto el INE como la empresa realizaron copias de respaldo de cada entrega bajo estrictas medidas de seguridad y confidencialidad (CEPAL 2021b). Uno de los aspectos a destacar, es que durante la planificación se estableció que el proveedor del procesamiento primario debía participar en el Ensayo Operativo del Censo (EOP), realizado con condiciones reales de procesamiento, factor clave para así identificar los posibles errores que se podían producir a lo largo de las diferentes etapas, con la finalidad de mitigar riesgos, mediante la implementación de medidas correctivas de cara al procesamiento del Censo (CEPAL 2021b). c. Monitoreo del funcionamiento del reconocimiento óptico. El INE hizo un control y seguimiento a la calidad del trabajo desarrollado en la empresa. En primer lugar, revisó las imágenes de los cuestionarios censales y las bases de datos, usando criterios como la coincidencia de portafolios y cuestionarios con la base de datos. También revisó la posición y correspondencia de cada hoja al interior del cuestionario, mediante la verificación del código de barras, el que hacía único a cada registro. Se cotejaron imágenes de color de los cuestionarios censales contra la base de datos de cada una de las entregas recibidas por el INE, al igual que con las imágenes en blanco y negro. Junto con ello, se comprobó que las bases de datos entregadas por la empresa tuviesen la identificación geográfica correcta de cada portafolio, la que fue entregada al inicio del proceso (CEPAL 2021b). 253 En segundo lugar, se efectuó un seguimiento de cada uno de los portafolios en las distintas etapas del proceso realizado dentro de la empresa. A través del sistema de trazabilidad, fue posible observar los estados de avance del proceso y verificar que ningún portafolio quedase estancado en alguna de las fases. Con este sistema de seguimiento se pudo conocer los avances de las etapas de preparación física de los cuestionarios y las posteriores a la digitalización. En tercer lugar, se llevó a cabo un control sobre la consistencia estructural de la base de datos. Esto significó verificar que cada una de las variables definidas para el proceso de captura de datos de los cuestionarios censales se encontrara dentro de sus dominios. En este paso también se verificó la consistencia con las categorías de las respuestas (CEPAL 2021b). 2.2 Censo 2024 a. Generalidades El instituto Nacional de Estadística de Chile está en estos momentos planeando el próximo Censo de Población, el cual correspondía hacerlo en 2022 pero debido a la pandemia ha tenido que ser aplazado durante dos oportunidades. Las razones del aplazamiento obedecen a razones técnicas, ya que “el proceso de preparación de un Censo requiere un tiempo adecuado de diseño y planificación, lo que se ha visto dificultado producto de la pandemia”. Asimismo, el Comité Asesor para el Censo recomendó posponer la fecha dado que se necesita al menos un año de anticipación para ajustes entre la Prueba Censal y el Censo, ya que este proceso “requiere de un trabajo de diseño, preparación y testeo para reducir al mínimo eventuales inconvenientes de la labor de implementación del trabajo de campo, con el objeto de asegurar la máxima calidad y confiabilidad a los datos que perdurarán hasta el próximo Censo, datos que son fundamentales para la adecuada toma de decisiones, tanto en el ámbito de las políticas públicas como para decisiones del ámbito privado” (Alonso, 24 mayo 2022). El Censo de 2024 será un Censo de derecho o Jure a diferencia del Censo de 2017 (Alonso, 2 de octubre de 2020), y se plana que el operativo se ha efectuado en el primer semestre del 2024 entre los meses de marzo y junio (Carrasco, 24 mayo 2022), con una duración de 12 semana (Alonso, 4 marzo 2020), “utilizando DMC como método principal de recolección, acompañado de la plataforma eCenso, la modalidad CATI y el papel como formas complementarias” (CEPAL 2021c). 254 Este Censo considera para su ejecución una serie de innovaciones operativas, entre las que se destaca la incorporación de distintas herramientas tecnológicas y estrategias operativas para recoger los datos de las personas y la extensión del período de recolección, al tratarse de un Censo con metodología de derecho. “Estas innovaciones impactan de distinta forma en el diseño operativo, ya que muchas de las decisiones que se deben tomar no cuentan con antecedentes de los resultados de su implementación y, por ende, se vuelve vital la necesidad de realizar pruebas censales, que permitan obtener información sobre la pertinencia del diseño, los ajustes necesarios y, al mismo tiempo, que nos aporten datos cruciales para la planificación de las actividades de la recolección” (CEPAL, 2021b). Dentro de las estrategias que se planean probar esta la implementación de manera integrada de las estrategias presencial y no presencial, permitiendo así su funcionamiento alternado al mismo tiempo, con el fin de ampliar las posibilidades de respuesta de los informantes, y poder facilitar y potenciar la participación de la población (CEPAL, 2021b). La estrategia presencial de recolección de la información “considera un recorrido inicial del territorio, en donde se deben ubicar geográficamente las unidades, sean edificaciones o sitios, lo que permite asociarlas a un código único y, con este, identificarlas y distinguirlas entre ellas. Una vez realizada su identificación en terreno, se procede con el levantamiento de la información a través de la realización de una entrevista presencial con un informante en la unidad en el caso que corresponda, usando para ello un dispositivo móvil de captura de información (DMC)” (CEPAL, 2021b). La estrategia no presencial considera la recolección de la información censal de las personas residentes habituales de la unidad previamente identificada, por medio de una entrevista no presencial con un operador telefónico o del auto empadronamiento en una plataforma web (CEPAL, 2021b). “Debido a la relevancia de la georreferenciación, la ubicación de las viviendas debe realizarse a través de una visita inicial que le permita al censista identificar en terreno el tipo de unidad y si en ella existen residentes habituales. Esto último es lo que posibilitaría iniciar el contacto con algún informante. Esta información es importante, debido a que la presencia o disposición de los informantes determinará el tipo de estrategia (presencial o no presencial) con la que se recogerá la información. Uno de los principales desafíos que se observan son los problemas de duplicación de información y optimizar el uso de los recursos disponibles, junto con el 255 implementar de forma masiva por primera vez estas estrategias combinadas en el marco de un Censo” (CEPAL, 2021b). 3 Colombia 3.1 Censo 2005 a. Generalidades El Censo general 2005 fue un Censo de vivienda, hogares y personas, unidades económicas y unidades agropecuarias (solamente predios rurales con vivienda) que se llevó a cabo durante gran parte del 2005 e inicios de 2006. “El Censo General 2005 utilizó el criterio de derecho o de jure, mediante el cual se contaron a todos los residentes habituales del país” (DANE, 2009). Este Censo tuvo como unidades de observación y análisis a las personas, los hogares, las viviendas para el Censo poblacional; para el agropecuario las unidades fueron los predios con actividad agrícola o pecuaria asociada a una vivienda ocupada en dicho predio ubicada en el rural disperso; para el Censo económico fueron los establecimientos económicos, empresa, unidad auxiliar y finalmente para el entorno urbanístico el lado de manzana (DANE, 2007). Para el proceso de recolección de datos se utilizaron tres (3) cuestionarios: ● Cuestionario de entorno urbanístico: consta de 7 preguntas que recogen información sobre el entorno urbanístico predominante a nivel de lado de manzana (DANE, 2009). ● Cuestionario de unidades censales: integra los temas demográfico, social, económico y agropecuario en un mismo cuestionario. Se distinguió entre dos tipos de cuestionario (DANE, 2009): o Un Cuestionario Básico: con las preguntas comunes del Censo (DANE, 2009). o Un Cuestionario Ampliado: que contenía, adicionalmente, las preguntas de profundización (DANE, 2009). ● Cuestionario de lugares especiales de alojamiento: es aplicado en guarniciones militares, centros penitenciarios, y en otros sitios de vivienda en comunidad, como conventos (DANE, 2009). “La recolección de información censal se llevó a cabo en un periodo de tiempo extendido con inmovilización parcial, utilizando como estrategias la agrupación de municipios por conglomerados y una sensibilización a través de la cual se desplegó un proceso de comunicación y difusión sociocomunitaria” (DANE, 2009). El año censal corresponde al 256 periodo de mayo 22 de 2005 al 6 de marzo de 2006. La recolección se realizó en seis fases de acuerdo con la dinámica demográfica municipal, considerando los periodos vacacionales y climáticos (DANE 2007). El operativo censal en cada una de las unidades de observación, se llevó a cabo mediante entrevista directa a un encuestado idóneo, realizada por un encuestador capacitado y en lo posible, residente en el municipio (DANE 2009). La recolección en el área rural se realizó por barrido o por rutas. ● Recolección por barrido: “El Censo por barrido se realizó en 1.019 municipios del país, y permitió la recolección de la información censal de toda el área rural, mediante el barrido de la totalidad de las veredas existentes en cada municipio” (DANE, 2009). ● Recolección por rutas: “se aplicó en 79 municipios y 20 corregimientos departamentales, caracterizados todos ellos por las dificultades de acceso, la baja densidad de población y grandes extensiones territoriales. En su mayoría las rutas fueron fluviales, algunas terrestres y otras fluviales-terrestres” (DANE, 2009). Debido a la situación de orden público del país y a su complejidad geográfica, se tuvieron dos esquemas de recolección y tres de captura. El uso de DMC (94,6%), permitió la implementación de un cuestionario inteligente, lo que mejoró los indicadores de calidad, al ser esta una herramienta que posee toda la capacidad lógica, de memoria y de velocidad de procesamiento, que presenta un equipo de cómputo en la actualidad. (DANE, 2009). “El Censo de Colombia de 2005 marca el punto de inflexión en el tránsito a la tercera generación, ya que es el primero en utilizar dispositivos móviles (DMCs) para la captura de datos, y a partir de entonces otros países han ido optando por el uso de DMCs, aunque en 2013 solo un 20% de los países utilizaba tecnologías de estas características” (CEPAL, 2019). El uso de formularios en papel en zonas donde no es posible introducir esta tecnología, ya sea por dificultades geográficas o por problemas de seguridad, hace necesario convivir con procesos paralelos a los esquemas tradicionales, al utilizar métodos de captura como la digitación en DMC (3%) o por tecnología de imágenes - escáner (2,4%) (DANE, 2009). El proceso de recolección utilizó por primera vez la captura de datos a través de computadores de mano denominados Dispositivos Móviles de Captura (DMC), los cuales permitieron “integrar la cartografía digital y las preguntas censales a través del generador de formularios, en donde se programaban el flujo de estas y las reglas básicas de validación y consistencia. Así mismo, se utilizó la Georreferenciación por GPS (Global Positioning System) la cual permitió disponer de información con precisión en la zona rural” (DANE, 2009). Como consecuencia de la 257 inclusión de la DMC en el proceso de recolección de los datos censales y la recolección realizada en un tiempo extendido (un año), se incluyeron los siguientes cambios: ● Agrupación de municipios por conglomerados, inmovilización asincrónica de la población, sensibilización a través de la cual se desplegó un gran proceso de comunicación y difusión sociocomunitaria del Censo (DANE, 2009). ● DMC equipada con GPS y cartografía digital para la recolección de los datos censales (DANE, 2009). ● La estructuración de una red de datos para concentración y transmisión de datos al DANE Central (DANE, 2009). ● Selección de la muestra cocensal in situ, en el momento de la aplicación de la encuesta, apoyada en el software del DMC (Método de Bernoulli) (DANE, 2009). Se diseño un sistema con enfoque integral, basado en una concepción sistémica y en una secuencia de verificaciones sobre productos de los principales procesos precensales y censales denominado Sistema General de Pruebas (SGP) (DANE, 2009). El sistema diseñado constaba de cuatro niveles de prueba: 1) Pruebas de escritorio: buscaban verificar el diseño, construcción, integridad, cumplimiento de requerimientos establecidos para el producto y el uso autónomo del mismo. Se constituyeron en pruebas lógicas o conceptuales de manera metódica para presentar sus resultados como parte de la entrega formal de su producto (DANE, 2009). 2) Pruebas de simulación: verificaban el uso autónomo, el funcionamiento y la integridad del producto, buscaban hacer representaciones o simulaciones lo más parecidas posibles a situaciones reales de campo. Contemplaban verificar, tanto los contenidos y funcionamiento de los instrumentos, elementos y procedimientos, como sus rendimientos (DANE, 2009). 3) Pruebas de campo: se constituyeron en ensayos, en trabajos de campo con población real, pero sin llegar a constituir aún un operativo censal propiamente dicho (DANE, 2009). 4) Pruebas de operativo real: fueron similares a las tradicionales de los Censos pilotos o experimentales, pero en este caso se practicaron con el operativo censal inicial, especialmente programadas y realizadas con poblaciones en número y complejidad bajos (DANE, 2009). 258 Para el proceso de difusión se diseñó un repositorio de datos denominado Infraestructura Colombiana de Datos (ICD) y un sistema de consulta llamado REDATAM, que permiten facilitar el acceso y difusión de los datos censales (DANE, 2009). “En el Censo 2005 no se aplicó encuesta de cobertura. Para determinar la no cobertura se realizó un proceso de conciliación y evaluación censal, el cual utilizó un análisis estadístico de la consistencia de la información en su fase final de consolidación, a partir de la coherencia con los indicadores demográficos con los Censos anteriores, las estadísticas vitales, las encuestas de demografía y salud y los registros de entradas y salidas del país, entre los principales. De acuerdo con la conciliación del Censo 2005, se determinó que este Censo tuvo una omisión o no cobertura del 3.7%” (DANE, 2009). b. Información del método de captura La transmisión y consolidación diaria de la base de datos censales se llevó a cabo mediante un canal de acceso a Internet por fibra óptica entre la Sede Central y las Gerencias Territoriales disponiendo de canales que permitían realizar la transmisión diaria de los datos a los Centros locales de acopio. Al aplicar la encuesta con los DMC, la información validada, era guardada y encriptada, tanto en la memoria del DMC como en la tarjeta SD que tiene cada una; al final de cada día, la información de cada DMC fue sincronizada con la DMC del supervisor, trasladando toda la información de cada una de las DMC de cada encuestador a la DMC de su respectivo supervisor (DANE, 2009). De otra parte, “la información recolectada en formularios en papel, en la fase de rutas, es capturada mediante tecnología de imágenes, que genera archivos planos en formato ASCII. Se carga sobre un esquema independiente de tablas relacionales en plataforma Oracle, para su revisión y posterior alimentación al esquema principal; se agrega a la información ya existente y se somete las mismas verificaciones de duplicidad a nivel de llave principal, y campos adicionales de identificación. Al final de estos procesos, se realizó un reprocesamiento total de la información. Para el efecto se cargó nuevamente toda la información recolectada en campo, y contenida tanto en las copias de respaldo realizadas en CD ROM, como en las tarjetas SD. Este proceso posibilitó recuperar en su totalidad la información que no se hubiese cargado a la base principal” (DANE, 2009). 259 c. Monitoreo y control Se diseñó un sistema de monitoreo y control con alcance integral denominado Sistema de Monitoreo y Control Censal (SMCC), el cual estaba basado en un repertorio de indicadores de alerta para acompañar los avances en las tres fases: Precensal, censal y poscensal (DANE, 2009). La unidad básica es el municipio y los resultados se produjeron para este nivel, con agrupaciones que permitieron visualizarlos a niveles de mayor agregación (territorial, conglomerado, departamento y país). La metodología y estrategia definidas para el SMCC presenta un enfoque de sistema compuesto por tres subsistemas (DANE, 2009): ● Subsistema Precensal: contó con 44 indicadores, los cuales determinaban si los preparativos del Censo de cada municipio se encontraban listos para iniciar el proceso de recolección (DANE, 2009): ● Subsistema Censal: tenía como objetivo conocer con precisión el estado de avance del operativo en términos de calidad y cobertura a partir de 37 indicadores, de manera que se pudieran tomar las decisiones respectivas paran mejorar y ajustar este proceso. (DANE, 2009) ● Subsistema postrecolección: una vez iniciado el proceso de recolección y efectuados los ajustes respectivos, se inició el proceso de consolidación de los datos censales en el ámbito local, que consistía en la agregación progresiva de los resultados para el respectivo municipio. En esta fase de agregación el sistema disponía de 25 indicadores (DANE, 2009). 3.2 Censo 2018 a. Generalidades El Censo de Nacional de Población y vivienda 2018, fue un Censo tradicional con la modalidad de enumeración de Jure o facto (DANE, 2019). Las “Unidades de análisis del Censo son las viviendas, los hogares y las personas y las Unidad de observación las viviendas, los hogares y los Lugares Especiales de Alojamiento. Siendo la operación estadística que proporciona información de tipo estructural sobre viviendas, hogares y personas, ésta es recolectada a través de tres tipos de cuestionarios: 1. Cuestionario dirigido a hogares particulares 260 2. Cuestionario para ser aplicado en Lugares Especiales de Alojamiento – LEA, 3. Cuestionario de entorno y equipamiento urbano” (DANE, 2019). No se dispuso “de ningún preCenso ni de ningún conteo de viviendas debidamente actualizado, lo que trajo como consecuencia dificultades en todo el operativo de campo” (CEPAL, 2021d). Este Censo utilizo varias estrategias de recolección, por autoempadronamiento por vía web con el e-Censo y por entrevista directa a través de varias estrategias operativas: ● Barrido: Esta estrategia es un recorrido sistemático de los equipos de recolección que permitía regresar diariamente a entregar reportes, visita vivienda a vivienda. ● Ruta: es un recorrido de territorios cuyo acceso geográfico no permitía el regreso diario del equipo de trabajo al centro operativo a entregar reportes, esto solo se realizaba al finalizar cada ruta, por una estrategia ● Mixta: se basaba en que el recorrido contemplara los dos métodos de recolección (barrido y ruta) con sus respectivas estrategias (CEPAL 2021b). ● Convocatoria: Es una estrategia de contingencia de uso excepcional, implementada exclusivamente en áreas que por limitaciones ajenas al DANE (por razones de seguridad, orden público, etc), el personal operativo no puede acceder a las zonas para ser censadas. Para su implementación se define una ubicación específica reconocida, del área urbana o rural del municipio, donde se dispone el personal operativo necesario y los medios para la colecta censal; en este lugar se concentra la población de la comunidad no censada para brindar la información (DANE, 2019). El levantamiento de la información se realizó por fases. La primera fase del Censo 2018, en la que se implementó el método electrónico, denominado eCenso, se realizó entre el 9 de enero y el 12 de abril de 2018, mientras que el operativo de campo (puerta a puerta) que se realizó en las fases 2, 3 y 4, se aplicaron los métodos de recolección de información de forma presencial y se desarrolló entre el 26 de abril y el 30 de octubre de 2018. La duración de la recolección fue de 43 semanas en total, teniendo 13 semanas adicionales a lo planeado inicialmente (después del período oficial). La fase de recolección presencial se extendió por varios motivos entre los que se encuentran factores climáticos, problemas de orden público, resistencia por parte de actores sociales, problemas administrativos relacionados con el personal y el transporte, mayor cantidad de 261 unidades a visitar con respecto a las programadas, rediseño de rutas que se facilitaban desde municipios diferentes a los inicialmente programados, conflictos o rechazos al Censo en las áreas limítrofes de algunos municipios y bajos rendimientos diarios, especialmente del personal étnico contratado (indígena y afrodescendientes) que exigían la prolongación del Censo. (CEPAL 2021b). Como métodos de recolección o captura utilizados se utilizaron los siguientes: ● Método principal: o Dispositivo Móvil de Captura (DMC) con un 86,49% de viviendas y 85,17% de personas cubiertas mediante ese método (CEPAL 2021b). ● Métodos secundarios: o Web (e-Censo) con un 12,05% de viviendas y 12,38% de personas cubiertas (CEPAL 2021b). Este método tuvo una mayor frecuencia de respuestas en hogares de estratos 3 y 4 (clase media). o Papel/Digitación con un 1,45% de viviendas y 2,44% de personas cubiertas. (CEPAL 2021b). Para el CNPV 2018 se diseñaron una serie de pruebas, cuyos resultados permitieron efectuar los ajustes requeridos al cuestionario, así como a los instrumentos, los procesos y los procedimientos involucrados. Se efectuaron diferentes tipos de pruebas de acuerdo con su finalidad, complejidad y cobertura operativa (DANE, 2021). En este orden de ideas, se realizaron (DANE 2019): ● Pruebas a los cuestionarios análogos ● Pruebas temáticas de las preguntas incluidas y excluidas ● Pruebas de escritorio para identificar la compresión de las preguntas ● Pruebas de campo con el fin de captar compresión y tiempos de completamiento ● Censo experimental en Jamundí. El inicio de las pruebas se dio en 2012 con la realización de pruebas focales y en 2013 se realizaron las pruebas cognitivas con el fin de analizar el bloque de preguntas de funcionamiento humano. Posteriormente, se realizaron las de contenido y las de rendimientos en diferentes ciudades y estratos con el fin de evaluar la comprensión de las preguntas y las alternativas de respuesta por parte de los encuestados, así como la facilidad de uso del 262 cuestionario en papel y DMC, entre otras. Este proceso se complementa con la realización del Censo Experimental en Jamundí realizado en 2016, en el que fueron probados, además del componente temático (cuestionarios en papel, DMC y eCenso), el diseño operativo, las estrategias de comunicación y movilización y el diseño de aprendizaje, así como aspectos logísticos y de contratación de recurso humano y de transporte, entre otros (DANE 2021). Para la logística operativa asociados a los dispositivos móviles de captura DMC, se emplearon formatos para la entrega y recepción de los dispositivos al personal de campo. También se diseñaron formatos en caso de daños o robos. No se emplearon formatos que identifiquen errores cometidos en completamiento o sobre la forma de corrección en campo (CEPAL 2021b). “Uno de los métodos implementados para estimar la omisión censal para el total nacional, fue a través de la Encuesta de Calidad de Vida (ECV 2018), utilizada como encuesta post-censal y adecuada durante su diseño para tal fin. Para el cálculo de la omisión censal se estableció realizar un emparejamiento de dicha encuesta con el CNPV 2018, y se aplicó la metodología directa llamada captura recaptura. Como resultado de las metodologías descritas, se estimó una omisión censal para el total nacional del 8,5%, 6,4% para cabeceras municipales y 15,0% para centros poblados y área rural dispersa” (DANE 2021). “En el momento de consolidar la información procedente de las tres diferentes bases de datos obtenidas a partir de los medios de recolección antes mencionados, se hallaron incoherencias debidas a omisiones y a imputaciones que no eran compatibles entre las bases de datos. A esto se agregó el hecho de que no se pudo definir con claridad el momento de referencia censal, lo que impidió aplicar la recomendación de unificar el tiempo en un intervalo mínimo” (CEPAL, 2021d). b. Información del método de captura La captura de la información se hizo principalmente en DMC; cuando se recolectaba en cuestionarios a papel, se digitaba luego en los DMC en los centros operativos, esto se realizaba en forma paralela (CEPAL 2021b). “Al finalizar las encuestas, la información correspondiente al número de personas y hogares censados era almacenada en el DMC automáticamente y al finalizar la jornada de recolección, el supervisor generaba los archivos de transmisión de cada censista y la entregaba al apoyo informático en cada centro operativo. Esta información fue descargada en los computadores, y mediante una conexión VPN, enviada 263 a DANE Central. Los archivos generados se transmitieron encriptados y empaquetados” (DANE 2021). La captura de la información fue descentralizada in situ, pero una vez cerradas las encuestas completas, se realizaba un reporte automático desde los DMC mediante mensajes de texto al DANE central para evidenciar el avance de los recorridos; la información de los cuestionarios era transmitida a diario desde los centros operativos vía internet al DANE central, con los respectivos protocolos de seguridad (CEPAL 2021b). La calidad de los datos del Censo estuvo condicionado a ciertas situaciones de campo como: el desconocimiento de la información solicitada, el rechazo de las personas a informar acerca de las variables de interés, a la no participación de los hogares en la investigación, entre otras razones, lo que generó datos faltantes o inconsistentes. Para la solución de estos problemas se aplicaron algunas técnicas para el tratamiento de estos datos, tomando como insumo algunos registros administrativos o la información de la misma operación. Además, la calidad de la información en el CNPV se basa en la cantidad de datos faltantes y la inconsistencia de estos (DANE, 2021). c. Monitoreo Para el monitoreo de la recolección se utilizó los dispositivos móviles de captura. El Control de cobertura se realizó a partir de los formatos operativos completados diariamente por los censistas para cada unidad de cobertura asignada. Allí registraban los resultados sobre las unidades visitadas (Viviendas, unidades mixtas y no residenciales): tipo de ocupación de la vivienda y resultado de entrevista. Esta información fue consolidada por los supervisores diariamente y enviada a los coordinadores, quienes a su vez revisaban y consolidaban la información, para enviarla al siguiente nivel para su consolidación hasta llegar al coordinador departamental, permitiendo ejercer el seguimiento y monitoreo permanente directamente desde los municipios (CEPAL 2021b). El control de la cobertura en campo del CNPV 2018 mediante el método de barrido fue complementario a través del visor geográfico, en el cual los coordinadores departamentales podían observar que Unidad de Cobertura Urbana o Unidad de Cobertura Rural habían trabajado y cuáles les faltaban. Posteriormente, desde el DANE Central, en cabeza de la Dirección de Geoestadística, se le enviaba un reporte a los coordinadores departamentales que permitía tener un control de la cobertura efectivo. Se dispuso este visor geográfico con 264 fines de seguimiento geográfico a los reportes de la herramienta SPOT (dispositivo que incluye tecnología GPS, con la funcionalidad de enviar reportes sobre la posición geográfica del personal asignado a los grupos de trabajo del método de rutas y que dentro de sus funciones estuvo el manejo de dicho dispositivo) en los grupos de trabajo de rutas. Esta herramienta permitió observar en tiempo real el avance de los grupos de trabajo asignados en las áreas operativas de rutas, como una alternativa para que desde el nivel central se evidenciara que el personal estuviera recorriendo las áreas de trabajo (CEPAL 2021b). A nivel central se estableció el Centro Operativo Nacional (CONAL) el cual “ejerció una regulación de atención y solución de novedades que surgieron en el desarrollo operativo, soportado por personal idóneo de diferentes áreas como temática. Desde el nivel central, se entabla comunicación directa con la estructura organizacional del orden departamental encabezado por el coordinador departamental y su línea de colaboradores, con el fin de conocer los pormenores de la ejecución en el departamento, los posibles inconvenientes que se presenten, la gestión y solución de estos siempre teniendo como marco la metodología técnica censal (CEPAL 2021b). 4 Ecuador 4.1 Censo 2010 a. Generalidades El Censo de Población y vivienda de 2010 tuvo la metodología de enumeración de hecho y su empadronamiento “se realizó el 28 de noviembre en las áreas amanzanadas (urbanas) y en las zonas rurales se extendió hasta el 5 de diciembre” (INEC, 2010). Como estrategia de levantamiento, se planificaron y ejecutaron los siguientes operativos censales: ● Operativo de viviendas particulares en áreas amanzanadas: el levantamiento se realizó en un solo día a escala nacional en todas las áreas con características de amanzanamiento en el país, fueron censistas los estudiantes de bachillerato o de universidad, como jefes de sector (con una carga de 12 censistas aproximadamente) se designaron a los profesores de colegio o universidad, también se designaron Jefes de Zona (directores o personal de los colegios o universidad) que tuvieron a cargo alrededor de 10 Jefes de Sector (CEPAL, 2021b). 265 ● Operativo de viviendas particulares en áreas dispersas: el operativo se planificó para una semana, en la que participaron como censistas los profesores de las escuelas ubicadas en el área rural, cada uno a cargo de un sector disperso (80 viviendas aproximadamente) (CEPAL, 2021b). ● Operativo de viviendas colectivas y móviles: este operativo especial tuvo una duración de una semana, fueron censistas, delegados de dichas viviendas, debidamente capacitados, con el apoyo de personal INEC (CEPAL, 2021b). ● Operativo de personas sin vivienda: se censaron a las personas en situación de calle en un operativo especial realizado desde la noche anterior al día del Censo y que duró generalmente algunas horas alrededor del momento censal (00H00 del día del Censo). Lo realizó personal INEC (CEPAL, 2021b). ● Operativo en la frontera norte: por las dificultades de acceso y seguridad en esta área del país, se realizó el levantamiento con personal de las Fuerzas Armadas, la duración fue similar al área dispersa (CEPAL, 2021b). El cuestionario del Censo contuvo 71 preguntas centradas en la vivienda, el hogar, la migración, remesas y la población (Rosero, 2015). En todos los operativos se utilizaron cuestionarios físicos tipo cuadernillo. La responsabilidad de la captación de datos fue descentralizada, su ejecución recayó sobre las cuatro coordinaciones zonales a través de las cuales desconcentra la estructura institucional, cada una de ellas a cargo de un número determinado de provincias, cantones y parroquias rurales, que conforman la División Político Administrativa del país (CEPAL, 2021b). Al concluir el operativo, se recopilan los cuestionarios, agregados por área de empadronamiento (carga de trabajo del censista amanzanado), luego agregados por sector censal (a cargo del Jefe de Sector) y zona censal (a cargo del Jefe de Zona), el material se concentró en las ciudades o parroquias rurales, luego se lo trasladó a las capitales cantonales y finalmente a las capitales provinciales, desde allí se envió el material consolidado a las sedes zonales INEC, donde se conformó el archivo físico, para su entrega a la siguiente fase que es el procesamiento de datos (CEPAL, 2021b). El INEC tenía la experiencia previa de escaneado en la investigación del Registro Único de Beneficiarios (cuestionario de una sola hoja - 2 páginas). Se realizaron algunas pruebas tecnológicas y de cuestionario, aunque no se realizaron pruebas de escaneado en pruebas piloto. En el Censo experimental, se escaneo con un cuestionario totalmente diferente al 266 definitivo tanto en el diseño (horizontal) y contenido (preguntas) y diferente tipo de papel; por lo tanto, esta prueba no permitió obtener ninguna observación y/o recomendación (CEPAL, 2021b). El cuestionario para el Censo 2010 fue aprobado en el mes de julio del año indicado, luego de pruebas de campo para comprobar el diseño (entre cuestionario horizontal vs vertical), definiendo al cuestionario vertical como definitivo, luego de esta prueba de campo se diseñó el cuestionario definitivo y pasó al proceso de impresión. En el proceso de impresión se realizó un control de calidad específicamente sobre la lectura al código de barras, marcas de escáner y calidad de impresión (CEPAL, 2021b). b. Información del método de captura El proceso se realizó en la modalidad in-house, por tanto, el escaneo y actividades relacionadas (interpretación, verificación y transferencia) fue realizado a través de un software contratado para el efecto, el INEC instaló la infraestructura tecnológica (red de datos, servidores de datos e imágenes, computadoras de escritorio y escáneres), contrato el personal para todas las actividades indicadas y ejecuto el proceso con su propio personal (experiencia 2010) (CEPAL, 2021b). Los servicios más relevantes contratados fueron: comunicaciones, alquiler de software y mantenimiento de infraestructura (guillotinas y escáneres), la adquisición de infraestructura tecnológica (servidores y computadores de escritorio) estaban bajo garantía del fabricante, este proceso de adquisición fue realizado sin novedad alguna. (CEPAL, 2021b). Se utilizaron escáneres de alta velocidad que al absorber directamente la información de la hoja censal eliminaron errores de digitalización manual (Rosero, 2015). Al ser el proceso de forma descentralizada, el INEC instaló en cada una de las coordinaciones zonales servidores con espacio en disco para la grabación de las imágenes a través de unidades de cinta, el proceso de respaldo fue periódico, no se realizó la transferencia de datos a administración central en ningún momento (CEPAL, 2021b). Para la gestión del proceso de digitalización (administración de la documentación censal) se realizó un sistema que permitía la distribución y registro a nivel de sector censal en las fases de critica-codificación, corte de cuestionarios y escaneo; con este sistema se controlaba la producción además de permitir obtener indicadores de avance de la misma (CEPAL, 2021b). 267 El software fue alquilado a una empresa ecuatoriana con licencia de distribución, el nombre: Readsoft Forms Version 5.3, el alquiler fue de tipo modular (licencia por cada módulo): Manager, Scan, Interpret, Verify y Transfer) distribuidos en cada zonal de acuerdo al número de cuestionarios por cada coordinación zonal. De la empresa proveedora se recibieron los siguientes servicios adicionales como parte del contrato: instalación y configuración de los módulos, capacitación al personal técnico, afinamiento previo al proceso y acompañamiento al indicio de la producción (CEPAL, 2021b). Toda la información se encontraba dentro del servidor, no se realizó ningún proceso de encriptación dado que la información se encontraba en una BDD, además de que no se investigó datos identificativos de la población, las claves de acceso eran de responsabilidad exclusiva de los administradores del sistema y del responsable zonal de procesamiento. Se configuro una red con bloqueo a internet, bloqueo a puertos de los computadores conectados en red y políticas de seguridad del sistema operativo (Active Diectory) (CEPAL, 2021b). Como breve descripción de las fases que contempla el procesamiento tenemos: ● Archivo inicial: Recepción de la información enviada luego del empadronamiento y ordenamiento y ubicación en las estanterías (CEPAL, 2021b). ● Pre-Critica: Separación de cuestionarios en blanco y otros materiales, revisión y corrección de la identificación geográfica de cada cuestionario, revisión y ordenamiento de los cuestionarios por área de empadronamiento y vivienda en orden ascendente, revisión de la estructura vivienda-hogar-población (CEPAL, 2021b). ● Guillotina: Corte del lote censal en la línea de corte (impreso en cada cuestionario censal) (CEPAL, 2021b). ● Escaneo: Escaneo de cada lote censal (sector censal), no se deben escanear sectores unidos o parciales, verificación en el monitor del sistema que el escaneo sea completo, verificación que las imágenes de cada sector censal vayan a su correspondiente carpeta (CEPAL, 2021b). ● Interpretación: El software especializado interpreta el contenido de las imágenes y transforma en valores numéricos o alfanuméricos y almacena en una base de datos (CEPAL, 2021b). ● Verificación: Verificación de las variables interpretadas (números y caracteres alfanuméricos), corrección manual (teclado) entre la imagen de la variable y lo contenido en la base de datos (CEPAL, 2021b). 268 ● Control de cobertura: Corrección de identificaciones de cuestionarios (ubicación geográfica errada o diferente a la base precensal, matching entre la base precensal y la base censal a niveles geográficos (zona, sector y áreas de empadronamiento), re escaneo de sectores con errores (CEPAL, 2021b). ● Codificación: Codificación automática de las variables con respuesta alfanumérica (geográficas y económicas), codificación asistida de las variables que no pudo realizar la codificación automática. Previamente se valida y se añaden variables de Registros Administrativos (CEPAL, 2021b). ● Validación y asignación: Consiste en obtener reportes de validación y asignar valores válidos a variables con información inconsistente, nula o en blanco; hasta obtener una base de datos consistente e integra para obtener reportes de salida para uso de instituciones del país y usuarios en general. Imputación Estática (Hard Coded o Cold Deck) / Imputación dinámica (Hot Deck). Previamente se valida y se añaden variables de Registros Administrativos (CEPAL, 2021b). Uno de los mayores logros del proceso de captura óptica tiene que ver con el tiempo de entrega de resultados, tal es así que, para enero de 2011, ya hubo datos provisionales y los resultados definitivos, en detalle hasta el menor nivel territorial, se entregaron al país en 8 meses, es decir, en agosto de 2011, tal como el INEC lo anuncio al país al inicio del operativo censal (Rosero, 2015). c. Monitoreo del funcionamiento del reconocimiento óptico. El monitoreo de la fase de escaneo se realizó a través del propio software, unido a las características propias de un escáner de alta producción. Cada sector escaneado el software (módulo SCAN) entregaba un reporte de hojas escaneadas en función del número de hoja. En caso de que algún cuestionario esté incompleto, el proceso se detenía hasta solucionar el error (CEPAL, 2021b). En caso de duplicación en el escaneado de cuestionarios, se realizó una aplicación por el equipo de procesamiento que eliminaba el cuestionario en función del código de barras (código único por cuestionario) (CEPAL, 2021b). En el CPV se tuvo un grave problema por no incluir una fase de control de calidad después de la fase de interpretación, este problema obligó a reescanear al menos un 20% de sectores censales. La elaboración de la plantilla (en el software) de la página 2 del cuestionario censal, 269 no escaneaba las marcas de una columna de variables, la solución fue actualizar la plantilla, reescanear las imágenes almacenadas en los servidores, reinterpretar las marcas e insertar las respuestas en las variables erróneas en función del código de barras del cuestionario censal. Con la modificación y revisión de las plantillas, el 80% de sectores censales fueron escaneados e interpretados sin ninguna novedad posterior (CEPAL, 2021b). 4.2 Censo 2022 a. Generalidades El Octavo Censo de Población, el Séptimo de Vivienda y el Primero de Comunidades que se llevara a cabo en el segundo semestre de 2022 utilizara la modalidad de enumeración de Hecho. (El comercio, 20 de mayo de 2022). La pandemia retrasó dos años la ejecución de este Censo el cual se planea realizarlo entre el 7 de noviembre y el 18 de diciembre de 2022. (Celi, 19 May 2022). “El proyecto debió rediseñarse a raíz del COVID-19, y eso implicó que el monto asignado al presupuesto inicial se redujera un 63% y que hubiera que conformar mesas de trabajo para replantear estrategias de recolección que suponían recurrir a la posibilidad de utilizar registros administrativos (cédulas de ciudadanía, bases de datos de servicios públicos e información de predios)” (CEPAL, 2021d). El cuestionario incluirá 80 preguntas y constará de “cinco secciones: ubicación geográfica, dirección domiciliaria, vivienda, hogar y población. Las tres primeras deben responderse una sola vez por vivienda, y las últimas dos, hogar y población, por cada grupo que viva dentro de la vivienda y luego por cada persona. El Censo incluirá cuatro temas adicionales: mascotas, identificación sexual, reciclaje de basura y fertilidad de las mujeres. Estos se sumarán a la temática que ya se ha aplicado en procesos anteriores” (El telégrafo, 30 de mayo de 2022). El Censo nacional estará dividido en dos etapas: una primera fase en línea (virtual) y otra de forma presencial. Todo el Censo se llevará a cabo de octubre a diciembre de 2022, de acuerdo con el Decreto Ejecutivo No. 425. En ambas fases, la idea es tener un “informante indirecto”: una sola persona será la encargada de entregar la información de todo el hogar o la vivienda (El comercio, 20 de mayo de 2022). La primera fase corresponde al Censo virtual, que se desarrollará en el mes de octubre y es voluntario. “Según el Gobierno, se espera que un 25% de los hogares opte por esta alternativa. Las personas podrán ingresar la información del cuestionario del Censo nacional en línea, 270 correspondiente a ellos mismos y a las personas de su hogar. Una vez enviada la información, un encuestador acudirá personalmente para verificar el número de personas que viven en ese hogar. Y entregará físicamente el certificado de haberse censado en línea. Si bien el Censo en línea es voluntario, el INEC planea aplicarlo de forma obligatoria para las personas que trabajan como funcionarios públicos. Y prevé también hacer acercamientos con empresas privadas para lograr que el mayor número de gente sea censada por Internet” (El comercio, 20 de mayo de 2022). En los lugares en los que no sea posible o donde gente escoja no hacer el Censo en línea, se hará un Censo presencial, del 7 de noviembre al 18 de diciembre de 2022 (El comercio, 20 de mayo de 2022). En los lugares en los que no sea posible o donde gente escoja no hacer el Censo en línea, se hará un Censo presencial, del 7 de noviembre al 18 de diciembre de 2022. (El comercio, 20 de mayo de 2022). Para la estrategia presencial ya no se requerirá la ayuda de estudiantes, sino que serán técnicos contratados y capacitados por el INEC. Serán cerca de 18.000 y cada uno de ellos tendrá una tablet para ingresar la información. La selección de estos técnicos será a través de una convocatoria. Los postulantes deberán cumplir una capacitación y, si cumplen los requisitos mínimos, serán parte del equipo de censistas (Celi, 19 May 2022). En este caso un encuestador se acercará a la vivienda quien levantará la información a través de la persona designada o informante indirecto, el resto de los miembros del hogar o la vivienda deberá anticipar sus respuestas para que este informante las entregue” (El telégrafo, 30 de mayo de 2022). “El diseño del formulario definitivo se llevó a cabo previa realización de ocho pruebas piloto, pero la actualización cartográfica y el preCenso de las viviendas no se pudo realizar y su cronograma debió extenderse hasta junio de 2021. Esta situación, dio méritos para que el Instituto Nacional de Estadística y Censos del Ecuador (INEC) planteara la necesidad de recurrir a la asistencia técnica del exterior a los efectos de la planificación, el diseño, la recolección, el procesamiento, el análisis y la evaluación” (CEPAL, 2021d). 271 5 México 5.1 Censo 2010 a. Generalidades El Censo nacional de población y vivienda 2010 fue de derecho o de jure, que se llevó a cabo del 31 de mayo al 25 de junio de 2010, siendo considerado el momento de referencia de la información las cero horas del 12 de junio de 2010. Las unidades de observación fueron los residentes habituales del territorio nacional y las viviendas particulares y colectivas (INEGI. 2011). Utilizó varios métodos de enumeración: La entrevista fue directa, la entrevista telefónica y el autoempadronamiento por Internet; todos siempre bajo el control territorial de la cobertura por parte del INEGI. El informante adecuado fue la jefa o jefe de los residentes de la vivienda, su cónyuge o una persona de 15 y más años de edad que habitara en la misma y fuera apta para proporcionar la información solicitada (INEGI. 2011). Para censar a la población se utilizaron dos tipos de cuestionarios: uno básico y otro ampliado, este último incluyó las preguntas del primero e incorporó otras para profundizar más en los diversos temas. Se aplicó solo un tipo de cuestionario por vivienda. En un esfuerzo adicional, el personal del Censo recabó información sobre algunas características de la infraestructura urbana que prevalecen en torno a las manzanas de las localidades con 5 mil y más habitantes, y de la infraestructura y servicios existentes en las menores a dicho número de habitantes (INEGI. 2011). Se instrumentaron Operativos especiales para identificar y recabar la información de la población que vive en alojamientos colectivos por razones de trabajo, educación, salud, seguridad u otros motivos; la que se desempeña en el Servicio Exterior Mexicano, además de aquella que no tiene donde vivir y pernocta en lugares públicos (INEGI. 2011). Bajo las premisas de cobertura total y alta calidad en la información, en 2010 se planearon, organizaron, ejecutaron y controlaron tres operativos de campo: ● Operativo de Enumeración: realizado del 31 de mayo al 25 de junio, con dos semanas adicionales para la recuperación de rezagos. (INEGI. 2011). Este operativo tuvo como insumo central al Mapa de Riesgos Operativos (MRO) que asignó a cada manzana o 272 localidad un nivel de contingencia debido a situaciones como acceso difícil o restringido a las manzanas o localidades, localidades remotas, vulnerabilidad a fenómenos naturales y situación de hablantes de lengua indígena, de modo que el área de operación conocía el tipo de problema que se podía presentar y en consecuencia cómo prevenirlo. Con base en este mapa de riesgos se establecieron anticipadamente estrategias de levantamiento de información complementarias a la tradicional visita del entrevistador (INEGI. 2011): o Habilitación de promotores censales en aquellas áreas habitacionales donde se restringía la entrada de los entrevistadores: Tales promotores fueron vecinos de la misma unidad habitacional y avalados por la misma; ellos realizaron las funciones de un entrevistador, y así se dio confianza a los residentes para que fueran censados por un vecino (INEGI. 2011). o Proceso de autoenumeración en las viviendas en que no aceptaban la entrevista directa ni aun con promotor censal: En estos casos se usó un cuestionario de autoenumeración que se dejaba en la vivienda para ser contestado por el jefe(a) de familia y luego era recogido (INEGI. 2011). o Enumeración a través del Centro de Atención Telefónica (CAT) o Internet: Esta estrategia era para la población que prefería proporcionar su información censal a través de una operadora del centro de atención telefónica, o llenando el cuestionario en el sitio de Internet específicamente creado para tal fin, el cual se controlaba por medio de claves que proporcionaban los entrevistadores. El área de Enumeración se encargó de planear, operar, supervisar y dar seguimiento al proceso de levantamiento de información (INEGI. 2011). Con el fin de contar con mayores elementos de supervisión y control de campo, el operativo utilizó tres tipos de etiquetas para clasificar viviendas: verde para identificar a las censadas, durazno para las pendientes y blanca con logotipos pequeños del Censo para identificar viviendas deshabitadas o de uso temporal. Además, la estructura de Enumeración organizó y ejecutó Operativos especiales para censar a la población sin vivienda, a los residentes habituales de viviendas colectivas y al personal del Servicio Exterior Mexicano (INEGI. 2011). ● Operativo de Verificación de viviendas deshabitadas o de uso temporal: que tuvo lugar del 14 de junio al 16 de julio. (INEGI. 2011). Este operativo se realizó 16 días después del de Enumeración y se instrumentó con personal distinto para eliminar los 273 sesgos que provoca la autorrevisión de los resultados de campo. Se destinaron cuatro semanas y la actividad consistió en verificar que las viviendas deshabitadas o de uso temporal estuviesen correctamente clasificadas en las zonas urbanas que el operativo anterior había declarado como cerradas, en caso de que no fuese así procedían a realizar la entrevista utilizando el Cuestionario Básico. Además, realizó un esfuerzo adicional para rescatar viviendas pendientes, es decir, aquellas en las que la Enumeración no logró contactar a un informante adecuado o dicho informante se negó a proporcionar la información por cualquier motivo (INEGI. 2011) ● Encuesta de Post enumeración: realizada del 22 de julio al 6 de agosto. (INEGI. 2011). Esta encuesta la aplicó el mismo personal del proceso de Verificación dos semanas después de concluir esa etapa. Este operativo permitió determinar el nivel de cobertura del Censo al visitar una muestra de viviendas. Para ello, el verificador elaboró el Listado de inmuebles de las manzanas y localidades seleccionadas, y realizó una entrevista en las viviendas habitadas, captando su información en la Cédula de Post enumeración. Al término de este proceso se llevó a cabo una confronta entre la cobertura obtenida por el operativo de Enumeración y el de la encuesta de Post enumeración. En caso de existir diferencias entre ambos operativos, personal de las dos estructuras regresaba al lugar a corroborar la situación real (INEGI. 2011). La estrategia de la logística de los materiales se implementó a través de tres vías: la distribución en cascada de la mayor parte de los recursos adquiridos o producidos centralmente, es decir, que estos pasaban de puesto en puesto desde oficinas centrales hasta la persona que los requería; la adquisición o concertación con dependencias gubernamentales locales e incluso con particulares (inmuebles y mobiliario de oficina); y la producción local de algunos materiales (la cartografía por ejemplo). Estas labores de generación, consecución o distribución duraron de diciembre de 2009 a junio de 2010. Todo fue controlado por medio del Sistema de Seguimiento Logístico (SISEL 2010) que permitió contar con reportes sobre la distribución de los recursos materiales, y la adquisición de espacios físicos y mobiliario a todos los niveles (INEGI. 2011).. b. Información del método de captura Una vez que el operativo de campo recolectó, verificó y validó la información de los instrumentos de captación, se realizó la etapa de tratamiento de la información que comprende los siguientes procesos (INEGI. 2011): 274 ● Recepción y almacenamiento de los instrumentos de captación. ● Captura. ● Codificación de preguntas abiertas. ● Validación automática. ● Actualización de claves cartográficas en los instrumentos de captación. ● Generación de resultados. En los 909 centros de captura se transcribieron los datos de los instrumentos de captación y se integraron en una base de datos, para lo cual se utilizaron sistemas que incluyeron esquemas de seguridad de la información. Esta etapa comprendió los siguientes subprocesos (INEGI. 2011) ● Digitación: Consistió en transcribir la información en medios magnéticos utilizando sistemas de captura locales (INEGI. 2011). ● Control de calidad por muestreo: En él se implementaron procesos que garantizaron, a través de un muestreo de aceptación, la calidad de la digitación de la información (INEGI. 2011). ● Procesos primarios: Se buscó establecer el control cuantitativo de los universos de estudio, garantizando la unicidad de los instrumentos por unidad de observación y la integridad de la información (INEGI. 2011). ● Integración y envío: Se integró la información para transferirla a los servidores de oficinas centrales, mediante un protocolo de comunicación seguro donde la información viajó encriptada (INEGI. 2011). La codificación consiste en asignar claves numéricas a las descripciones registradas en las preguntas abiertas. A partir de estas claves se realiza su posterior procesamiento y presentación de resultados; dicha actividad se realizó de manera centralizada y operó en dos fases (INEGI. 2011). ● Codificación automática: Consiste en un sistema que bajo algoritmos definidos asigna claves directamente cuando la información registrada en el cuestionario coincide con la contenida en la clasificación establecida para cada variable (INEGI. 2011). ● Codificación asistida: Se aplica a todas aquellas descripciones a las que no se les asignó clave automáticamente, por lo que personal capacitado es el responsable de asignarla con base en la clasificación establecida y los criterios específicos (INEGI. 2011). 275 La Validación automática se realizó para garantizar la congruencia lógica e integridad de la información de las preguntas y secciones de los instrumentos de captación, mediante la aplicación de criterios diseñados con apego al marco conceptual y de acuerdo al contenido y estructura de los instrumentos de captación. Cada criterio ofreció una solución derivada de la lógica de las preguntas. En los casos en los que no se contó con información suficiente para dar consistencia, se asignaron códigos especiales correspondientes a la categoría “No especificado” (INEGI. 2011). c. Seguimiento y control Se consideró una estrategia para detectar oportunamente problemas de avance, cobertura y calidad de la información recabada en campo, así como para controlar el flujo de documentos hacia el área de captura y de verificación de la información. Las unidades de análisis del seguimiento fueron las manzanas o localidades sin amanzanamiento, las viviendas y la población contabilizada (INEGI. 2011). Para realizar el seguimiento, el personal de campo integró un reporte que daba cuenta de las manzanas o localidades visitadas y las viviendas enumeradas clasificadas según el resultado de la entrevista y su condición de habitación. El reporte se envió diariamente a las oficinas de la coordinación municipal para su captura y posterior procesamiento de los datos (INEGI. 2011). Para la captura y procesamiento de la información, se habilitó una herramienta informática denominada Sistema de Verificación, Avance y Cobertura (SIVAC) que generaba reportes de las áreas visitadas, las pendientes de cubrir de acuerdo con la planeación de las viviendas censadas, las deshabitadas o de uso temporal, a nivel de área de responsabilidad de la estructura operativa y de área geoestadística. Adicionalmente, proporcionó información sobre la población censada y problemas en la georreferencia de los documentos. Todo ello permitió intervenir oportunamente cuando se identificó baja productividad o subcobertura (INEGI. 2011). Para los Operativos especiales, de Verificación y de pos enumeración se siguió una estrategia similar, mediante la utilización de los mismos formatos y reportes, ya que estos tenían la posibilidad de distinguir el operativo del cual procedían. Además de lo anterior, el sistema tuvo una vertiente de reportes que le permitió a los directivos del Censo de oficinas centrales analizar la información agregada en el ámbito municipal y estatal, con lo cual podían analizar 276 el avance incluso hasta el nivel de coordinación municipal. En conclusión, esto permitió observar el correcto avance en la cobertura de más de 2.4 millones de manzanas y localidades del país, a través de información simple, confiable y sobre todo oportuna que como consecuencia ayudó a conocer inmediatamente cualquier inconveniente que se presentara en el avance del operativo en campo (INEGI. 2011). 5.2 Censo 2020 a. Generalidades El Censo de Población y Vivienda 2020 es un Censo de derecho o de jure, por lo que se enumeró a la población en su lugar de residencia habitual. Para este Censo las unidades de observación fueron las y los residentes habituales del territorio nacional. El periodo de levantamiento del Censo fue del 2 al 27 de marzo de 2020 (Duración de 4 semanas), en el cual, para efectos estadísticos, la información está referida a las cero horas del 15 de marzo del mismo año. Se consideró como informante adecuado(a) a la jefa o al jefe del hogar, a su cónyuge o a una persona residente de 18 años y más de edad que conociera la información de la vivienda y de sus ocupantes (INEGI. 2021). Para recabar los datos de las viviendas habitadas y sus ocupantes se emplearon los siguientes instrumentos de captación: ● Cuestionario Básico: para la enumeración exhaustiva, con 38 preguntas. (INEGI. 2021) ● Cuestionario Ampliado: para una muestra probabilística de 4 millones de viviendas, con 103 preguntas, entre las cuales se incluyen las 38 preguntas del Cuestionario Básico. Dado que el Cuestionario Ampliado contiene la totalidad de preguntas del Cuestionario Básico, se aplicó un solo tipo de instrumento por vivienda habitada (INEGI. 2021). Además, con la finalidad de censar a todos los habitantes del país, se llevaron a cabo Operativos Especiales para censar a la población residente en viviendas colectivas, al personal del Servicio Exterior Mexicano y sus familiares que radican fuera del país, así como a la población sin vivienda. Adicionalmente, se llevaron a cabo operativos para captar información sobre las características de las localidades, del entorno urbano y de los alojamientos de asistencia social (INEGI. 2021), a través de los siguientes instrumentos de captación: 277 ● Cuestionario de Localidad: con 45 preguntas, aplicado en aquellas localidades que contaron con menos de 2 500 habitantes. El o la informante fue la autoridad local (INEGI. 2021). ● Cuestionario de Entorno Urbano: con 23 preguntas, aplicado en localidades de 2 500 o más habitantes. La captación fue por observación (INEGI. 2021). ● Cuestionario de Alojamientos de Asistencia Social: con 91 preguntas. El o la informante fue la autoridad del alojamiento (INEGI. 2021). La recolección de la información del Censo cubrió el conjunto de actividades para obtener los datos de cada unidad de observación. La estrategia operativa contempló tres operativos diferentes: ● El Censo: cuyo periodo de levantamiento fue del 2 al 27 de marzo de 2020, integró la enumeración exhaustiva de viviendas y los operativos especiales para captar la información de la población residente en alojamientos colectivos, en el Servicio Exterior Mexicano y de la población sin vivienda (en situación de calle) (CEPAL 2021b). ● La Verificación de cobertura: con un periodo del 23 de marzo al 10 de abril de 2020, mismo que fue postergado debido la pandemia del Covid-19, y retomado hasta después del 17 de julio, fecha en que la Secretaría de Salud emitió el acuerdo mediante el que se permitió la reanudación de Censos y Encuestas (CEPAL 2021b). ● La encuesta de pos enumeración: que se realizaría del 27 de abril al 8 de mayo de 2020, y que fue cancelada debido a la pandemia por Covid-19. Esta fue sustituida por la Encuesta de Muestreo para la Estimación Focalizada de Cobertura (ENCOBER) (CEPAL 2021b). Las medidas sanitarias adoptadas por el gobierno debido a la pandemia incidieron en la enumeración, la cual se encontraba a mitad de camino. “La situación se tornó crítica debido al incremento considerable de los casos de COVID-19, y eso obligó a reforzar el personal para poder concluir dicha etapa, que se llevó a cabo con la autorización de la Secretaría de Salud de México, pero acatando de manera estricta las medidas sanitarias. Eso de todas formas obligó a postergar la etapa de verificación y a considerar la posibilidad de hacerla por Internet. La encuesta de cobertura que se había programado para el 27 de abril de 2020 se canceló de forma definitiva” (CEPAL 2021c). El Censo 2020 contó con tres métodos de recolección de la información: 278 ● La entrevista directa: (DCM y papel): fue el principal método utilizado, se realizaba utilizando dispositivos de cómputo móvil en la mayoría de los casos (97% de la población), los cuestionarios en papel se utilizaron en las áreas de alto riego o debido a alguna incidencia con el dispositivo (2% de la población) (CEPAL 2021b). Se contó con instrumentos de captación impresos, para ser utilizados en caso de que la aplicación llegara a tener problemas durante la entrevista o por falta de energía eléctrica, así como en aquellas áreas de trabajo inseguras debido a la delincuencia, donde los entrevistadores corrieran el riesgo de ser asaltados o agredidos. Cada instrumento tuvo un código de respuesta rápida (QR) único, el cual los hizo irrepetibles, esto sirvió para controlar su distribución entre las figuras responsables del levantamiento de información (CEPAL 2021b). ● Autoempadronamiento: se realizó mediante la implementación de una página web para que el ciudadano, a partir de una carta invitación entregada en su domicilio por el entrevistador, proporcionara los datos de las características de su vivienda y sus residentes (0.30% de la población) (CEPAL 2021b). ● Entrevista asistida por teléfono: el ciudadano marcaba al teléfono señalado en la carta invitación para proporcionar los datos de su vivienda y los habitantes (CEPAL 2021b). Para la Autoenumeración y la Entrevista asistida por teléfono se generaron cartas invitación que contenían las credenciales únicas para responder el Cuestionario Básico vía Internet, y fue entregada por el entrevistador, bajo demanda de los informantes, o si en la tercera visita a la vivienda no se logró realizar la entrevista cara a cara; durante el recorrido de levantamiento el entrevistador iba llenando el Listado de inmuebles, procedimiento que incluyó la lectura en campo del código QR de las etiquetas que pegaba en los inmuebles, así como el de las invitaciones, de esta manera la vivienda quedaba asociada a estos datos, lo que permitió el control de la captación de información en el sitio Web (CEPAL 2021b). Se realizaron diversas pruebas para evaluar la recolección con dispositivos móviles de captura: ● Prueba de Estrategia operativa y dispositivos de cómputo móvil: se realizó en 2017 y buscaba determinar las características del dispositivo móvil a utilizar, licitar para la recolección de información del Censo, definir y probar la estrategia operativa considerando el uso de DCM; probar el desarrollo, en diferente marco tecnológico, de las herramientas informáticas, y definir su operatividad en el Censo. En dicho ejercicio se propuso la compra o préstamo de al menos 10 dispositivos móviles de características y 279 marcas diferentes, y contar con al menos 5 unidades de cada uno, siendo este el número de sedes en donde se realizó dicha prueba (CEPAL 2021b). ● Prueba Piloto del Censo de Población y Vivienda 2018: Para realizarla se eligieron dos ciudades, teniendo en cuenta los flujos migratorios, la presencia de alojamientos de asistencia social y que presentaran condiciones representativas de la zona rural y urbana del país. Esta prueba se proyectó para tener características similares al Censo, con una muestra de más de 44 mil viviendas y una duración de 20 días hábiles; las oficinas instaladas correspondieron a una coordinación municipal, y se realizaron todos los operativos planeados, incluyendo la pos enumeración y el operativo especial para la enumeración de viviendas colectivas, mismos que no se probaron en la prueba del 2017. También se probó el proceso de licitación para la compra de los DCM. (CEPAL 2021b) ● Ensayo Censal 2019: Con este ejercicio se buscó probar los procedimientos para la ejecución de cada una de las etapas y procesos, los cuestionarios y las soluciones tecnológicas y de comunicaciones que permitieran realizar los últimos ajustes a la infraestructura de TIC y herramientas informáticas, previo a la realización del Censo de Población y Vivienda 2020. Se probó la captación de datos de todos los operativos mediante los diferentes instrumentos implementados, (electrónicos e impresos; la estrategia de Autoenumeración vía Internet y su interrelación con las herramientas de captación de los dispositivos móviles; los procedimientos para el registro de actualizaciones cartográficas en formato digital; el intercambio de información entre figuras operativas y la integración de datos censales a la base de datos central; verificación del directorio de viviendas colectivas; el proceso de seguimiento logístico para el control de la distribución de materiales; y el seguimiento y control al levantamiento de información). (CEPAL 2021b) ● Prueba Estadística: se planteó realizar un levantamiento de información con los cuestionarios del Censo de Población y Vivienda 2010, con la finalidad de obtener información que permitiera estimar las diferencias en los indicadores que se deriven de los cambios de redacción o estructuración de las preguntas en los cuestionarios básico y ampliado del Censo de Población y Vivienda 2020, principalmente por la captación en papel del primero, y en DCM en el segundo. (CEPAL 2021b) ● Pruebas de volumen y concurrencia: Se realizaron durante el año 2019 y principios del 2020 y su fin era de garantizar la disponibilidad de las aplicaciones WEB, así como el desempeño de las bases de datos, tanto la del levantamiento mediante el uso de dispositivos móviles, como la correspondiente a la Autoenumeración. (CEPAL 2021b) 280 “Frente a la experiencia acumulada en el Censo de 2020 y los desafíos que se esperan para la ronda de 2030, se vislumbra la necesidad de incorporar los registros administrativos, como se espera hacer en otros países de la región, utilizando el documento de identificación individual como vínculo entre las bases de datos”. (CEPAL,2021d) b. Información del método de captura Todos los cuestionarios levantados en papel fueron capturados de manera descentralizada, para ello, se implementaron centros de captura, los cuales fueron coordinados por un responsable de captura estatal. (CEPAL 2021b) Para estas estrategias, la captura de información se realizó en paralelo, ya que gran cantidad de informantes pudieron acceder simultáneamente. Es importante mencionar que las respuestas a los cuestionarios se almacenaban de forma dinámica, evitando la pérdida de información, y permitiendo al informante proporcionar sus datos en varias sesiones. (CEPAL 2021b) La transferencia de datos tuvo dos vías: ● Envío de entrevistas completas directamente desde el DCM mediante el uso de datos móviles. (CEPAL 2021b) ● Envío de todos los inmuebles mediante el uso de memorias USB, donde el entrevistador enviaba la información diariamente a su supervisor, el cual mediante el módulo de integración del OPERA transfería, al menos una vez al día, la información de todos sus entrevistadores vía internet. (CEPAL 2021b) Para el cierre del operativo censal se implementaron en el Administrador Censal y en el Kiosco INEGI, herramientas para la generación de un respaldo de información (backup) y de un paquete de datos finales o de cierre. Ambos archivos se enviaron a oficinas centrales, y se le dio seguimiento mediante reportes implementados en el OPERA, siguiendo una estrategia similar a la etapa de levantamiento. (CEPAL 2021b) Esta versión de cierre también integró una herramienta de confronta de cifras entre supervisor y entrevistador, así como de verificación de las cifras del dispositivo del supervisor con las del OPERA. Al término de estas tareas, se debía deshabilitar el DCM para evitar que se siguiera haciendo uso de él, mediante un botón de bloqueo. (CEPAL 2021b) 281 Por otro lado, tanto para la Autoenumeración como para la entrevista asistida por teléfono, se implementó un sitio web, y se desarrollaron aplicaciones responsivas con la plataforma de desarrollo de software .NET web pages, en la cual se programaron ciertas validaciones primarias, tanto del lado del cliente como en el servidor, para contribuir a la calidad e integridad de los datos proporcionados por el informante. Para el almacenamiento de la información, al igual que para el sistema OPERA, se diseñó e implementó un esquema de base de datos en Oracle 12c. (CEPAL 2021b) c. Monitoreo de la recolección El sistema OPERA es una plataforma institucional que permite atender cualquier proyecto de generación de estadística. Este sistema apoya tareas de seguimiento y control de las diferentes etapas del proyecto. Para su acceso se requiere que el usuario sea parte del dominio institucional, es decir que se haya creado una cuenta y una contraseña, y con base a sus credenciales, el sistema determina el perfil de usuario y presenta los módulos a los que tiene acceso. (CEPAL 2021b). Los principales módulos definidos en el OPERA para el Censo 2020 fueron: ● Integración de datos y distribución de materiales ● Reclutamiento y selección de personal ● Contingencias e incidencias operativas ● Seguimiento logístico ● Soporte Informático y Gestión de DCM (MDM) ● Seguimiento operativo El módulo de Seguimiento operativo, es la herramienta que permite la detección oportuna de problemas de cobertura de los operativos censales, tomando como base las principales unidades de observación: Viviendas, Personas, Manzanas y localidades que integran el Marco Geoestadístico Nacional. Particularmente, las viviendas y su condición operativa: Visitada, censada, pendiente, deshabitada y uso temporal, tienen la mayor relevancia, ya que nos indican el avance del operativo de campo y proporcionan un panorama nacional que facilita la toma de decisiones que conlleve a una mayor cobertura. También se presentan informes detallados sobre el avance en el proceso de actualización cartográfica detectada por el personal en campo, así como de la validación que de dichas actualizaciones realiza el personal de cartografía, quienes determinan aquellas que proceden y las que no. (CEPAL 2021b) 282 Durante la entrevista cara a cara, conforme se iban cubriendo secciones del cuestionario, los datos captados se iban guardando en una tabla temporal y, una vez concluida la entrevista, se copiaban a la base de datos productiva, evitando su pérdida. (CEPAL 2021b) Para los casos de robo o daño total de dispositivo móvil, se elaboró una herramienta de restauración de información del último respaldo o paquetes de información generada, de esta manera, la pérdida de información se redujo considerablemente, ya que se complementó con una serie de comunicados a la estructura operativa, solicitando el respaldo constante de información, creando así una cultura de protección de datos censales. (CEPAL 2021b) Para la Autoenumeración y la Entrevista asistida por teléfono, se generaron cartas invitación. Se implementó un reporte en el módulo de Seguimiento Operativo del OPERA (CEPAL 2021b), que informaba lo siguiente: ● Número de invitaciones entregadas a nivel nacional, estatal, y por estructura operativa hasta supervisor de entrevistadores ● Número de invitaciones con respuesta en el sistema de Autoenumeración, y ● Número de invitaciones sin respuesta Para la eliminación de duplicados, se definió una estrategia de consolidación de la base de datos para tener datos homogéneos y únicos, respecto a la información censal que se captó en los diferentes operativos de campo del Censo 2020. En la definición de campos, se determinó generar un identificador único para cada unidad de observación, así se tiene uno para cada inmueble, vivienda particular habitada y vivienda colectiva, residente de la vivienda y persona migrantes, así como para cada localidad y manzana. Esto permitió que en la etapa de integración de la base de datos operativa se pudieran identificar duplicados fácilmente, y en la Autoenumeración, tanto el identificador único del inmueble, como los códigos QR de la invitación y de la etiqueta, fueron los elementos que permitieron la identificación de entrevistas duplicadas, incluso si, a pesar de haber dejado una invitación en la vivienda, posteriormente el entrevistador pudo realizar la entrevista. (CEPAL 2021b) 283 6 Uruguay 6.1 Censo 2011 a. Generalidades El Censo de Población y vivienda de 2011 fue un Censo de derecho cuyo período de relevamiento del Censo fue de 16 semanas (setiembre-diciembre 2011), y estuvo a cargo de personal de campo contratado. (INE- Uruguay, 2021). La captura de la información fue realizada con Dispositivos Electrónicos Portátiles (DEPs) equipados con Sistema de Posicionamiento Global (GPS). Los dispositivos realizaban controles de consistencia y crítica, y habilitaban a los censistas a ejecutar las descargas en las bases territoriales que trasmitían la información diariamente a la sede central del INE. (INEUruguay, 2021). En las dos últimas semanas de diciembre de 2011 se desarrollaron estrategias especiales de relevamiento, tanto para la población en viviendas colectivas, la población en situación de calle, y un operativo de contingencia para completar la cobertura (INE- Uruguay, 2021). El Censo concluyó otorgando resultados preliminares que fueron conocidos en forma inmediata luego de cerrado el trabajo de campo (el 30 de diciembre de 2011). Los resultados definitivos fueron divulgados 8 meses después (10 de agosto de 2012), conjuntamente con los resultados de la Encuesta Nacional de Evaluación Censal (ENEC), operativo que fue llevado a cabo por un equipo independiente que evaluó los resultados tanto en lo que hace a la cobertura como a la calidad de la información relevada (INE- Uruguay, 2021). 6.2 Censo 2023 a. Generalidades El noveno Censo de Población; el quinto de hogares y el séptimo de viviendas que se llevará a cabo en 2023 se vio afectado por la pandemia de COVID 19 al tener la necesidad de modificar el plan de acción presentado por INE en 2020 (Presidencia de la República- Uruguay, 2022). El Censo será de derecho y el relevamiento tendrá cobertura universal dentro del territorio uruguayo y estará basado en el enfoque tradicional, es decir que toda la información obtenida por el Censo provendrá de las respuestas de la población censada. Las unidades de 284 observación serán los residentes habituales del territorio nacional, los hogares, las viviendas particulares y colectivas. (INE- Uruguay, 2021). El INE espera que el Censo de Población y vivienda 2023, sea el último Censo en que se aplique metodología tradicional y aspira que “el próximo Censo de la ronda de 2030 pueda basarse en registros administrativos” (CEPAL, 2021d) El período de relevamiento del Censo está previsto que sea en abril-mayo del 2023 (Barrios, 9 de junio de 2022). Dado que el proceso se desarrollará durante algunas semanas, la fecha de referencia del Censo se tomará (ex post) y será la fecha en que se constate que fue alcanzado el 50% de las personas empadronadas. (INE- Uruguay, 2021). En el Censo no se realizarán relevamientos por muestreo, sino que se recorrerá todo el territorio nacional con un cuestionario censal único. Para revisar y actualizar el contenido temático del cuestionario censal se realizará consultas a los diferentes usuarios. En dicha instancia se busca involucrar a especialistas del mundo académico y centros de investigación, así como a otros usuarios importantes de la información censal, como los organismos gubernamentales; no obstante, la consulta estará abierta en la web del INE a todos los usuarios de la información censal, a los efectos que todos puedan hacer llegar sus sugerencias. También, se llevarán a cabo instancias de intercambio con otros institutos de estadística de la región y con organismos internacionales especializados en la materia (CELADE/CEPAL, UNFPA y otros), considerando -igual que en instancias anteriores- las recomendaciones internacionales. (INE- Uruguay, 2021). Por otro lado, se promoverá la incorporación del documento de identidad, para comparar eficientemente los resultados básicos censales con los que se pudieren obtener de bases registrales (y determinar el nivel de cobertura y precisión de la información sobre la localización territorial de la población, por edad, sexo, etc.), para validar la confiabilidad del padrón demográfico nacional basado en registros administrativos. (INE- Uruguay, 2021). Para garantizar la universalidad, se visitarán todas las viviendas y se contabilizará la totalidad de las personas que residen en ellas; también, se implementarán operativos especiales para contabilizar a la población en viviendas colectivas (incluye residentes de alojamientos de asistencia social) y las personas en situación de calle. Se abarcará en forma simultánea el relevamiento de las viviendas urbanas y rurales ubicadas en los 19 departamentos del país (INE- Uruguay, 2021). 285 El personal de campo será contratado, de esta forma los censistas recogerán la información de un informante adecuado (informante calificado) la cual es la persona residente de la vivienda, de 18 años o más de edad, que conoce las características de la misma y de sus ocupantes. (INE- Uruguay, 2021). Para la recopilación de la información del Censo 2023 se utilizarán los siguientes instrumentos de captura (INE- Uruguay, 2021).: ● Dispositivos Móvil de Captura (DMC), que contendrán: o Los cuestionarios censales generales aplicables a personas, hogares y viviendas particulares; o Los cuestionarios para vivienda colectivas (hogares de ancianos, prisiones, alojamientos de asistencia social, etc. que serán relevadas mediante un operativo especial) ● Internet a través de cuestionarios web para la auto-enumeración ● Entrevista telefónica para recuperar datos faltantes y su alcance será definido a partir del resultado de pruebas previas ● Formulario en papel o DMC para el operativo de relevamiento de información a personas en situación de calle. Los DMC serán cargados con los formularios censales utilizando el sistema SMR, desarrollado por el INE, que permite generar cuestionarios desde una aplicación web y descargarlos directamente a cada dispositivo móvil de captura. Este software ha ido evolucionando durante los últimos 8 años, ha sido probado en la Encuesta Continua de Hogares y múltiples encuestas especiales. Se harán los agregados necesarios para dotarlo de mayor funcionalidad, de acuerdo a lo que requiera el proyecto. Los 12.000 dispositivos para el relevamiento serán obtenidos en préstamo mediante un convenio con otra institución pública, que adquirirá una partida especial de dispositivos móviles adecuados a las especificaciones técnicas requeridas para el Censo. Estos móviles serán reutilizados en el marco de otro proyecto de gran envergadura fuera del INE. A diferencia del Censo 2011, se pretende contar con chips LTE en cada dispositivo para permitir la comunicación entre el personal de campo y sus supervisores, así como la transmisión de la información en tiempo real, permitiendo tener información actualizada del avance del operativo y de la calidad de la información. (INE- Uruguay, 2021). Para dotar de seguridad en la transmisión, se establecerá un enlace VPN (red privada virtual) entre los servidores receptores y el DMC, que podrá operar tanto sobre redes LTE (móviles) 286 como redes WiFi. Para asegurar la información dentro del DMC se utilizará un modo cautivo (Modo kiosko) que permite el acceso (a los usuarios habilitados) exclusivamente a las aplicaciones necesarias para el relevamiento. Los formularios permanecerán encriptados tanto dentro del DMC como durante la trasmisión y posterior almacenamiento centralizado. (INEUruguay, 2021). Con respecto a la modalidad de auto enumeración se estudiará las posibilidades para su consideración, las cuales van desde su utilización como medio primario (opcional) de relevamiento, hasta su uso como herramienta de recuperación en las viviendas donde no se pudo hacer contacto luego de varias visitas. (INE- Uruguay, 2021). Para implementar la modalidad de auto-llenado en la web, el INE desarrollará un generador de formularios web anexado a la base de conocimiento del SMR. Con esto se dispondrá de un único editor de formulario y reglas de crítica que generará automáticamente los formularios para DMC y para la web (siguiendo la premisa “un cuestionario sólo está en un lugar”). Esto significa que un cuestionario puede estar asignado a un censista (en su DMC) o puede estar asignado para ser llenado vía web, pero no puede estar en más de un lugar a la vez. No podrá ser llenado por otro censista o por otro medio hasta no ser reasignado. Esto evitará la posibilidad de tener más de un cuestionario / formulario relevado para el mismo domicilio. Para esta modalidad de captura también se desarrollarán estrategias que garanticen la seguridad de la información. (INE- Uruguay, 2021). Las aplicaciones podrán ser desarrolladas por el propio INE, por un equipo de 4 desarrolladores que estarán destinados a estas actividades o, adquiridas externamente, según sea más conveniente. Para la fase de instalación y configuración de los DMC se contará con el apoyo de 10 técnicos que luego oficiarán de soporte técnico para asistir a los precensistas y censistas durante los trabajos en terreno. (INE- Uruguay, 2021). Para el Censo se pretende utilizar toda la experiencia y las tecnologías probadas en Censos y encuestas anteriores, potenciándolas para aportar herramientas que lleven a un mejor relevamiento censal y a su vez, puedan ser aprovechadas en un futuro para el resto de las operaciones estadísticas del INE. El objetivo del proyecto para el Área de Tecnología es generar un paquete de herramientas que permitan realizar las siguientes tareas (INE- Uruguay, 2021): ● Relevamiento del preCenso 287 ● Relevamiento de la información censal por diversos mecanismos. ● Gestión de recursos humanos y materiales ● Gestión de cargas de trabajo ● Creación de mecanismos para interactuar con la base de datos geográfica. ● Monitoreo de reclutamiento, capacitación y relevamiento. ● Capacitación. ● Procesamiento post censal Los dispositivos de captura que llevarán los pre-censistas contendrán mapas digitales de apoyo a la tarea. La información de bordes y domicilios va a estar sincronizada con la base geográfica a ser validada. (INE- Uruguay, 2021). Se llevará adelante un piloto de Censo basado en registros administrativos o combinado en paralelo al Censo tradicional, para evaluar la cobertura de los registros. Esto permitirá establecer la brecha actual entre los datos recogidos en el Censo tradicional y los datos provenientes de registros, con el fin de preparar un plan de mejora de los registros administrativos en vista de la ronda censal 2030. Este piloto de Censo se realizará en paralelo a la planificación y ejecución del Censo tradicional 2023, es así que a partir de junio de 2021 se conformará un equipo técnico dedicado específicamente a potenciar y mejorar el Data Warehouse Estadístico del INE y a partir de éste generar la información necesaria para el piloto de Censo basado en registros. (INE- Uruguay, 2021). Por otra parte, las pruebas que se lleven adelante durante el período de preparación del Censo determinarán el rol y el peso que pueda tener esta modalidad en el relevamiento definitivo. (INE- Uruguay, 2021). El proceso hacia el Censo 2023 incluirá un Censo piloto experimental que será desarrollado en un área que presente la mayor cantidad posible de variantes respecto a las complejidades habituales de las diferentes configuraciones territoriales que surgen de la experiencia de la Encuesta Continua de Hogares. Este Censo experimental, el cual buscará poner a prueba todas y cada una de las actividades que se llevarán adelante en el operativo censal de 2023, a pequeña escala, en una localidad que reúna la mayor cantidad posible de situaciones que deberán ser enfrentadas durante el relevamiento definitivo. (INE- Uruguay, 2021). Se realizará en Minas de Corrales (Rivera), Guichón y algunas zonas aledañas (Paysandú). En Canelones será en Lagomar y en Montevideo en algunas zonas de seis barrios: Carrasco, Cerrito, La 288 Comercial, La Teja, las Acacias y Pocitos. Esto alcanzará a más de 7.000 viviendas y 17.000 personas, efectuándose en octubre y noviembre de 2022 (Barrios, 9 de junio de 2022). Para la evaluación de la cobertura se considerarán los resultados de la Encuesta Nacional de Evaluación Censal (ENEC), donde se estimará la omisión a partir del método Dual System. Dicha encuesta será desarrollada por otra unidad del INE y comenzará a ejecutarse una vez se vaya completando el relevamiento en las zonas censales que pertenezcan a la muestra. La cobertura también será testeada a través del ejercicio de conciliación Censal, que será fundamental para la determinación de la población base de las próximas proyecciones de población. (INE- Uruguay, 2021). “De cara al Censo basado en registros, se evaluará la cobertura tanto del universo como de las variables y la calidad, y se determinará cuál es la brecha actual entre el Censo tradicional y el basado en registros. Es necesario captar la cedula de identidad para vincular los casos con los registros administrativos. Esta línea de base se actualizará de forma anual durante de varios años hasta llegar al Censo basado en registros de 2030” (CEPAL, 2021d). b. Información del método de captura Las principales actividades de la etapa postcensal a desarrollarse en esta fase son (INEUruguay, 2021): ● Análisis de consistencia, correcciones y generación de bases de datos operativas ● Procesamiento ● Análisis sustantivo ● Evaluación de cobertura y calidad ● Difusión de resultados ● Ajuste cartográfico final Las actividades de análisis de consistencia se realizarán de acuerdo a los controles predefinidos en la etapa de preparación censal y enriquecidos luego del Censo experimental. La evaluación de la calidad de la información se realizará en función de dos estrategias (INEUruguay, 2021): ● Consistencia interna de la información ● Consistencia con información proveniente de otras fuentes (Censos anteriores, encuestas o registros administrativos) 289 Las actividades de procesamiento y análisis sustantivo se desarrollarán de acuerdo a planes de tabulados prestablecidos en la etapa preparatoria y de las solicitudes institucionales de otros organismos. (INE- Uruguay, 2021). c. Monitoreo y control La incorporación de tecnología en el proceso de relevamiento permitirá un reporte continuo del estado de avance del relevamiento de cada censista, y su performance diaria. Se definirán mecanismos automáticos que alerten a los supervisores ante una serie de situaciones que puedan esconder irregularidades (baja performance diaria, horarios extensos sin trasmisión, trasmisión de varios registros desde el mismo punto, registros repetidos, formularios incompletos, etc. (INE- Uruguay, 2021). En forma paralela al relevamiento de los Censos, se cumplirá con un operativo de control de calidad mediante la modalidad de re-entrevistas. Cada supervisor deberá revisitar una muestra de las viviendas relevadas por cada censista, para chequeo de información básica, así como responder a las solicitudes de revisita que sean indicadas a partir de los sistemas superiores de monitoreo. (INE- Uruguay, 2021). 7 Venezuela 7.1 Censo 2011 a. Generalidades En Venezuela el XIV Censo Nacional de Población y Vivienda de 2011 utilizó el criterio de derecho y el método de la entrevista directa, mediante el cual la información referente a cada vivienda, hogar y persona es observada y/o solicitada, según sea el caso, y registrada en el cuestionario por un empadronador adiestrado para tal fin. En cada vivienda, las personas mayores de 15 años presentes al momento de la entrevista deben suministrar sus datos al empadronador. Las unidades de observación son las Viviendas, hogares y personas (INEVenezuela, 2011) El Operativo de empadronamiento del Censo se realizó en todo el territorio nacional venezolano comenzando el 1º de octubre y concluyendo el 30 de noviembre de 2011 (INEVenezuela, 2011), con una duración de 12 semanas. Se extendió dos semanas más para los operativos de casos específicos principalmente de la población en áreas de difícil acceso, 290 rurales y/o indígenas. (CEPAL, 2021b). El IV Censo de Comunidades Indígenas se llevó a cabo simultáneamente, empadronando a la población indígena asentada en zonas selváticas de muy difícil acceso, localizadas previamente. En las Comunidades Indígenas se utilizará un cuestionario que contenía ciertas modificaciones con respecto al utilizado en el empadronamiento general, así como un cuestionario especial para determinar las características de cada Comunidad. (INE- Venezuela, 2011) Las colectividades o refugios eran levantadas en operativos especiales con un cuestionario ajustado a las condiciones de estas estructuras –información de la unidad inmobiliaria y de las personas que residen en ella, fuertes militares, cárceles, hospitales y otros (CEPAL, 2021b). Este Censo aplicó solamente el método tradicional de levantamiento de datos en campo tocando puerta por puesta en cada una de las unidades inmobiliarias con fines residenciales (entrevista directa). La etapa pre-censal fue hecha según el método Paper And Pencil Interviewing -PAPI; mientras que para el levantamiento de los datos censales se utilizó principalmente según el método Computer Assisted Personal Interview -CAPI (95% de las personas y 93 de las viviendas). Como método secundario de captura se utilizó el Papel/Digitación (viviendas 0.01% y personas 0.02%). (CEPAL, 2021b). La gestión de los materiales y equipos utilizados en el XIV Censo de Población y vivienda, fueron gestionados a nivel central por un equipo paralelo complementario contratado para el control de la gestión y trasladado de los insumos (equipos, materiales de oficina, papeles de trabajo, etc.) coordinado por la Gerencia de Administración y la Coordinación de Bienes del INE. El retorno de los equipos se realizó de igual forma en dos niveles, primero a nivel estadal y luego a nivel central. De los 15.000 sólo 170 dispositivos fueron perdidos por hurto o robo, de los cuales la mayoría fue por desatención o descuido de los empadronadores. De igual forma menos de 100 dispositivos tuvieron problemas de pila, pantalla y/o su funcionalidad. (CEPAL, 2021b). En general fueron realizadas tres pruebas donde fue usado el dispositivo móvil de captura. ● Primera prueba piloto: En esta prueba sólo se consideró el manejo del dispositivo en paralelo con el llenado del cuestionario en papel, a fin de identificar las diferencias o incidencias respecto a los tiempos de ingreso de los datos en el DMC. Esta prueba fue realizada en paralelo por cinco encuestadores que aplicaron el método PAPI y cinco que aplicaron el método CAPI. 291 ● Segunda prueba piloto: se realizó exclusivamente con el uso de DMC, logrando mejorar los tiempos de respuestas y las aplicaciones correctas de los saltos y las validaciones generales de los datos censales. ● Censo Experimental: Las pruebas de gestión y asignación de cargas de trabajo se realizaron en el Censo Experimental realizado en la Parroquia Macuto y el Municipio Atures un semestre previo al Censo, donde se realizaron pruebas de trasmisión de los datos, desde los DMC a los CRTC a través de un cable USB disponible por CRTC donde se asignaba la carga de trabajo y descargaba los datos censales de los DMC; y desde los CRTC a nivel central vía internet. b. Información del método de captura Para la adquisición de los DMC, se consideró y ejecutó una licitación con el apoyo y gestión del UNFPA para mejorar las condiciones de completamiento, gestión y/o adquisición de los DMC. (CEPAL, 2021b). El desarrollo de la aplicación del software necesario para la captura de la información contenida en el cuestionario censal estuvo bajo la responsabilidad de la Oficina de Tecnologías de Información del INE (INE- Venezuela, 2011), desarrollando sobre la herramienta de procesamiento y captura de datos censales CSPro 4.2. Tanto en los dispositivos móviles como los equipos de desarrollo utilizaron Windows como sistema operativo. Adicionalmente se realizó una App para la transformación y gestión de los archivos de trabajo y los archivos levantados, desarrollado en Visual .NET10 en el FrontEnd11 y, SQLite12 en el BackEnd13. Esta aplicación copiaba los archivos completos y/o válidos a las carpetas de gestión según los estatus de las encuestas, generaba respaldos y creaba los archivos XML para la transmisión de los datos a nivel local al Centros de Recolección y Transmisión Censal (CRTC). La trasmisión de los datos se realizó a través de un cable USB disponible por CRTC donde se descargaba los datos XML de los DMC y los archivos de respaldo (CEPAL, 2021b). 10 El Visual . NET es un lenguaje de programación orientado a objetos que se puede considerar una evolución de Visual Basic y que cuenta con los beneficios que le brinda .NET Framework (el modelo de programación diseñado para simplificar la programación de aplicaciones en un entorno sumamente distribuido: Internet). El lenguaje Visual Basic .NET permite crear aplicaciones de escritorio, Web y móviles. Brinda un completo número de características para hacer que el desarrollo de aplicaciones sea realmente rápido. (UNAM, sf). 11 Frontend de una app es la parte visual de un sitio web, con la que se puede interactuar. En él, se incluyen imágenes, botones, menús, transiciones, etc. (MMA, 6 de enero 2016). 12 El SQLite es una herramienta de software libre, que permite almacenar información en dispositivos empotrados de una forma sencilla, eficaz, potente, rápida y en equipos con pocas capacidades de hardware, como puede ser una PDA o un teléfono celular (SG, sf). 13 El Backend, también conocido como CMS o Backoffice, es la parte de la app que el usuario final no puede ver. Su función es acceder a la información que se solicita, a través de la app, para luego combinarla y devolverla al usuario final. (MMA, 6 de enero 2016). 292 c. Monitoreo de la recolección con dispositivos móviles de captura El monitoreo y control en el Censo 2011 se realizó en dos niveles, en el nivel local, y en el nivel central. A nivel local se realizó un seguimiento por semáforos de un conjunto de indicadores predefinidos que se adjuntan en la siguiente imagen, donde se le hacía el seguimiento cobertura y contenido del levantamiento de datos censales a partir de consultas o informes que procesaban los datos consolidados y mostraban las distribuciones o relaciones propuestas para el seguimiento, donde los valores resultantes eran comparados con valores esperados rangos inferiores o superiores. El semáforo se colocaba en rojo si dos o más criterios estaban por debajo de lo esperado, en amarillo si sólo uno estaba por debajo y en verde si todos estaban en el rango esperado. (CEPAL, 2021b). La información llega desde los Centros de Recolección y Transmisión Censal (CRTC) al Sistema Central en dos formatos (SQL y *.dat). La primera, SQL era presentada en la página web para ver la calidad del contenido de los datos. Luego con CSPro se verificaba y corregían los datos erróneos u omitidos y se generaba en Redatam para actualizar una aplicación XPlan de Redatam para el análisis complementario. Se verificaban los distintos niveles de desagregación geográfica (entidad, municipio y parroquia) con informes por cortes semanales, donde se compara con el estimado en base a las proyecciones de población oficiales de 2001 y con la tendencia histórica censal y se determina si se encuentran dentro de los intervalos de confianza. Las validaciones de saltos y consistencias estuvieron programadas en el DataEntry por registro luego en la etapa post-censal se realizó entre registros y la limpieza final. (CEPAL, 2021b). 7.2 Censo 2021 a. Generalidades La realización del XV Censo Nacional de Población y Vivienda de la República Bolivariana de Venezuela “transcurre en medio de dos escenarios a: la pandemia de COVID-19 y el bloqueo económico que se aplica al país desde hace varios años. Eso conlleva la reducción de los recursos disponibles y graves dificultades a la hora de hacer la recolección de campo debido a problemas de bioseguridad que limitan la posibilidad de hacer entrevistas cara a cara, entre otras restricciones” (CEPAL, 2021d). 293 El XV Censo nacional de población y vivienda se realizó en dos fases: La primera fase, llamada identificación inmobiliaria (fase precensal), efectúo la contabilización de todos los inmuebles del país y sus características, mediante la implementación del código QR de la cedula inmobiliaria como el identificador único del inmueble, vinculado a un sistema de información automatizado y georreferenciado, que permitirá asociarle atributos como sus características y los servicios que usa, a los fines de mejorar la planificación urbana y optimizar los tramites asociados a este inmueble. En esta fase, “la actualización cartográfica se ha realizado con DMC, lo que ha permitido llevar a cabo la georreferenciación al capturar los puntos de las unidades inmobiliarias sobre los mapas digitales y asignarles un único código QR que las identifica inequívocamente en el territorio nacional”. (CEPAL, 2021d) La segunda fase denominada etapa censal, permitió el registro de la población, incorporando la innovación tecnológica mediante el registro de cada hogar y sus habitantes en el cuestionario electrónico, incluido el sistema web de autoempadronamiento censal. (XV Censo nacional de población y vivienda, 2019). En esta etapa “la información censal se recolectará de dos modos. El primero será el autoempadronamiento en un formulario digital (eCenso), que se llevará a cabo en dos fases: en la fase 1 se invitará al personal adscrito a la administración pública, y en la fase 2 se ampliará el acceso a cualquier residente venezolano que desee autoempadronarse”. (CEPAL, 2021d). Esta información se verificará y actualizará en el momento del levantamiento de campo. “El segundo modo de recolectar la información censal será la recolección de campo mediante entrevista cara a cara que llevarán a cabo censistas dotados de DMC (teléfonos inteligentes ensamblados en la República Bolivariana de Venezuela) Para el trabajo de campo se crearán 3.000 nodos o puntos donde se distribuirá y compilará la carga de trabajo, y se efectuarán labores de coordinación y validación territorial de la información captada”. (CEPAL, 2021d). En la segunda fase, los ciudadanos accederán a un sistema en línea donde suministrarán los datos familiares y los empadronadores, por su parte, visitan casa por casa, escaneando el código QR del recinto y automáticamente obtendrán la información. (González, 4 octubre, 2019). La etapa censal inició el 15 de abril de 2020 con el autoempadronamiento, pero solo para empleados públicos y se habilitó el acceso a toda la población residente a partir del 1 de marzo de 2021 (CEPAL, 2021d). Cabe acotar, que este Censo da como resultado una Cédula Inmobiliaria, que recaba los datos geográficos y estadísticos y agiliza la realización de pago de servicios y otros trámites, todo 294 esto gracias a la estructuración de los sistemas de información del país. (González, 4 octubre, 2019). Por cada vivienda se debe llenar solo un formulario para todos los integrantes y grupos familiares que en ella habiten, quienes quedan a la espera de que la información sea validación. (El pitazo, 9 de abril de 2021) Los métodos por utilizar en el XV Censo de Población y Vivienda de Venezuela son el método CAPI y como método principal el de auto-empadronamiento en la etapa censal. Dado a las condiciones actuales de acceso a internet en los hogares o en los lugares de trabajo, estudio o particulares, se consideró usar el método de levantamiento de datos censales por autoempadronamiento a fin de permitir llegar a los hogares en primera instancia de la Administración Pública Nacional y luego para la población general. Esta opción se consideró abrir a toda la población como desafío para poder llegar a zonas que anteriormente no se ha llegado y en consideración de la pandemia del COVID-19. (CEPAL, 2021b). Para lograr la participación de la población se hizo una campaña publicitaria y de comunicación, sobre todo en redes sociales. Así mismo se aplicó otras estrategias para incentivar a la población a realizar el autoempadronamiento a través de medios de comunicación estatales como el portal web xCenso.gob.ve, el cual impulsó esta aplicación entre los venezolanos, obsequiando un bono como incentivo económico para motivar la participación de todos los "Jefes de Familia" que completan el XV Censo de Población y Vivienda (Buttarello, 19 de julio de 2021) b. Información del método de captura Para el caso del levantamiento de datos en campo se utilizó CSPro/CAPI nuevamente por la capacidad de desarrollo en la institución, sin embargo, es utilizado tanto para la actualización cartográfica, el registro de unidades inmobiliarias, como para el levantamiento en campo del cuestionario censal. (CEPAL, 2021b). El desafío del uso de tecnología en la etapa pre-censal obligó a normalizar y estandarizar la cartografía digital disponible, y de igual forma, la construcción de la metodología de elaboración de mosaico de imágenes de las AOE que no están disponibles, para que puedan ser precargados en los dispositivos móviles, y así puedan ofrecer la oportunidad de utilizar la cartografía digital y las imágenes satelitales vinculadas a los mapas o polígonos de las áreas operativas censales para la ubicación y actualización cartográfica. De igual forma se utilizó las bondades de geo-posicionamiento para la identificación de las coordenadas geográficas de 295 las edificaciones y/o unidades inmobiliarias, así como la vinculación con la identificación del código QR impresas en las etiquetas de censado y de identificación del código compuesto de identificación de los registros de las viviendas con fines residenciales con el UBIGEO. (CEPAL, 2021b). Se desarrolló el manejo de la asignación de carga, el registro de la actualización cartográfica, el registro del cuestionario censal, la transferencia y sincronización de los datos y el aseguramiento de calidad con CSWeb, CSPro y CSEntry. Offline en campo y en línea entre los CRTC y el nivel Central. (CEPAL, 2021b). c. Seguimiento y Monitoreo Para el proceso de seguimiento y monitoreo se creó la sala situacional. En ella se creó una herramienta que permitía de forma permanente, dar seguimiento y controlar el empadronamiento en diferentes niveles (nacional, estadual, municipal y comunal), en lo que atañe a la cobertura y la calidad de los datos. También permitió auditar la gestión y proporcionar insumos para tomar medidas correctivas durante la recolección. (CEPAL, 2021d). 296 Anexo 5. Principales diferencias metodológicas y conceptuales de los últimos Censos argentinos A continuación, se realizará un breve recuento de diferencias y similitudes entre los 4 últimos Censos en Argentina, con el fin de poder visualizar los cambios metodológicos y de contenido más significativos, que han experimentado estas operaciones estadísticas durante los últimos 30 años. 1 Fase pre-censal a. Modalidad de enumeración: Los Censos de 1991, 2001 y de 2010 se realizaron como Censos de hecho o facto, caracterizándose “por censar a la población en el lugar donde paso la noche de referencia del Censo” (Giusti, 2007). En 2001 “Se censó a las personas en el hogar en el que pasaron la noche de referencia del Censo (la del 16 al 17 de noviembre), fueran o no residentes habituales de aquél”. (INDEC, 2003). En 2010 el operativo se realizó en un solo día para evitar duplicaciones en el conteo, y la información relevada se refiere al día del operativo. El Censo fue llevado a cabo el miércoles 27 de octubre de 2010, el cual fue declarado feriado nacional. Al efectuarse el relevamiento censal en un solo día, se desarrolló una amplia difusión y campaña informativa y se garantizó la seguridad a fin de optimizar las condiciones del operativo. (INDEC, 2012) El Censo de 2022 es el primer Censo con el criterio de jure o derecho que se ha realizado en el país. Con este criterio “las personas serán contabilizadas según su lugar de residencia habitual, es decir, en el que pasan la mayor parte del tiempo durante la semana. La definición de Censo de derecho es la más utilizada globalmente, debido a la oportunidad de integración que proporciona la variable de residencia habitual en la vivienda para las encuestas a hogares, y a su asimilación con los registros administrativos. Asimismo, censar a la población donde vive la mayor parte del tiempo contribuye a precisar el diseño de las políticas públicas en relación con la demanda de servicios, por ejemplo, los relativos a la atención de la salud y a la educación” (INDEC, 2022a). 297 b. Tecnología para la recolección de la información: Los formularios en papel fueron el medio para la recolección de la información en los Censos de 1991, 2001, 2010 y 2022. Pero el último Censo se incluyó un formulario digital para el auto empadronamiento por vía web como método secundario de captura de información. c. Método de enumeración. La entrevista directa también es otro elemento común entre los Censos de 1991, 2001, 2010 y 2022. Con este método “cada hogar es visitado por un censista a quien se deben proporcionar todas las respuestas del formulario censal. El censista (en esta modalidad) es quien visita los hogares, realiza las preguntas al censado y marcas las respuestas en el cuestionario censal”. (Giusti 2007). En el Censo 2022 además de realizar entrevista directa el día del Censo también utilizó la modalidad de auto empadronamiento vía web o e-Censo; de esta forma implementa “un operativo bimodal de relevamiento –en línea y en terreno mediante entrevistas presenciales– que permite encarar los desafíos identificados y cumplir con el mandato constitucional de realizar cada decenio un Censo Nacional de Población, Hogares y Viviendas”. (INDEC, 2022a) d. Unidades de empadronamiento 1991: Las unidades son hogares, vivienda y personas. 2001: “Las unidades de empadronamiento del Censo 2001 fueron la población, los hogares14 y las instituciones colectivas15. El Censo además relevó datos sobre las características de las viviendas en las que residen los hogares y contó las viviendas no habitadas por hogares durante el momento de relevamiento del Censo” (INDEC, 2006) 2010: Las unidades de empadronamiento del Censo 2010 fueron la Población, los Hogares y las Viviendas (particulares y colectivas). 2022: Las unidades de empadronamiento del Censo 2010 fueron la Población, los Hogares y las Viviendas (particulares y colectivas). En el Censo 2001 “el hogar se define como la persona o grupo de personas que viven bajo el mismo techo y comparten los gastos de alimentación.” (INDEC, 2003) 15 “Una institución colectiva es el lugar destinado a alojar personas que viven bajo un régimen no familiar regulado por normas de convivencia de carácter administrativo, militar, religioso, de salud, de reclusión, de trabajo, etc.” (INDEC, 2006) 14 298 e. Formularios Universal o Ampliado (Muestra) 1991: En este Censo se utilizó dos tipos de cédulas censales uno básico y otro ampliado y se aplicaron técnicas de muestreo estadístico utilizadas desde hace años en otros países y que en la argentina se emplean se emplean en operativos censales, desde 1980. Se aplicó muestreo solo en las veintiséis localidades de población estimada previamente al Censo en cien mil o más habitantes, utilizando los segmentos como unidades de muestreo (subdivisiones de los radios censales). “En las localidades de población estimadas en medio millón de habitantes o más, se obtuvo una muestra del diez por ciento, esto es, se seleccionó en forma aleatoria uno de cada diez segmentos para ser censado con la cedula ampliada. En las localidades con población estimada entre 100.000 y 499.999 habitantes se obtuvo una muestra del 20 por ciento, es decir, se seleccionó uno de cada cinco segmentos para censarlo con la cedula A. Las primeras viviendas colectivas fueron excluidas del procedimiento de muestreo; en ellas se aplicó cedula ampliada”. (INDEC, 1993) 2001: A diferencia de los Censos de 1980 y 1991, el del 2001 no aplicó muestra en el relevamiento, de modo que se formularon las mismas preguntas a toda la población, sin excepción, mediante la aplicación de un cuestionario único. La cédula censal que se utilizó es producto de la actividad conjunta entre el INDEC, las DPE y usuarios externos de la información tanto públicos como privados. El cuestionario fue formulado atendiendo a las recomendaciones internacionales, a la experiencia de Censos argentinos anteriores, y al análisis de las Pruebas Piloto y el Censo Experimental (INDEC, 2006). 2010: Este utilizó dos cuestionarios, uno ampliado (A) y otro básico (B). Se aplicó la metodología de Censo con muestra como en los Censos de población de 1980 y 1991. A una muestra de las viviendas particulares se les administró un cuestionario más extenso (ampliado), mientras que al resto de las viviendas particulares se las censó con el básico. En las viviendas colectivas, se aplicó un cuestionario específico (C). El haber utilizado dos cuestionarios (ampliado (A) y básico (B)) implicó también “la definición del marco de utilización combinada de cuestionarios A y B y, como consecuencia, dónde utilizar exclusivamente el A, un mecanismo de selección de la muestra de viviendas, un procedimiento de estimación o expansión de resultados y una medición de la magnitud del error muestral” (INDEC, 2012) 2022: El instrumento de recolección es un cuestionario censal único que se utilizó tanto en el relevamiento digital, accesible mediante múltiples dispositivos, y en papel para el barrido territorial presencial el día del Censo. (INDEC, 2022a) 299 f. Contenido temático 1991: En este Censo el formulario básico tenía 8 preguntas mientras el ampliado tenía 28. La definición de los contenidos de las cédulas censales tuvo en cuenta “las preguntas formuladas en los Censos anteriores, las recomendaciones internacionales y las necesidades de las diferentes instituciones tanto públicas como privadas. La cédula incluyó características seleccionadas de viviendas, hogares y población con alternativas de respuesta precodificada. La ampliada incluyo las características seleccionadas para la cedula B y muchas otras. La mayoría de las preguntas tenían categorías de respuesta precodificadas., pero otras eran abiertas, por lo que debían ser precodificadas”. (INDEC, 1993): Según la metodología del Censo de 1991 los temas incorporados en los formularios censales presentan novedades con respecto a los Censos anteriores como la incorporación de definiciones de hogar y vivienda particular, cobertura de salud y previsión social, el mejoramiento de la validez de los aspectos vinculados al trabajo a partir de la indagación de temas como aportes de jubilados. Se modificó la manera de formular preguntas para mejorarla calidad y confiabilidad de las respuestas (estado conyugal, volumen de población económicamente activa y la mayoría de las peguntas referidas a trabajo) (INDEC, 1993) 2001: El cuestionario único de este Censo está compuesto por 40 preguntas. En materia de contenidos hay varios cambios respecto del Censo de 1991: Se incorporan las temáticas de discapacidad, reconocimiento de pertenencia a pueblos indígenas, equipamiento con que cuentan los hogares, características del hábitat y migraciones internacionales, así como la utilización de Encuestas Complementarias por muestreo (posteriores al Censo). (INDEC, 2006) 2010: El Cuestionario Básico tenía 35 preguntas mientras que el ampliado 67. Las temáticas de los cuestionarios censales del Censo 2010 relevan información sobre las viviendas y su entorno, características demográficas básicas de la población, migraciones, cobertura de salud, percepción de jubilación o pensión, educación, situación conyugal, trabajo y fecundidad. Además, el Censo 2010 considera la necesidad de obtener datos estadísticos sobre poblaciones específicas manteniendo preguntas sobre pueblos originarios y población con limitaciones permanentes, ya abordadas en el Censo 2001, e introduciendo el tema sobre población afrodescendiente. (INDEC, 2012). “El Cuestionario Básico (B) contuvo preguntas que permiten determinar la estructura sociodemográfica de la población y obtener los principales indicadores en nuestro país (Sexo, Edad, Nivel Educativo, Características Básicas 300 de la Vivienda, Condición de Actividad de las personas, etc). Con el Cuestionario Básico podrá calcularse varios indicadores. El Cuestionario Ampliado (A), aplicado a una muestra probabilística de viviendas, contiene bloques que profundizan las temáticas de Características habitacionales del hogar, Migraciones y Empleo e indaga en aspectos de la población “como Fecundidad, Pertenencia a pueblos originarios, Población Afrodescendiente, Previsión social y Cobertura de salud, entre otras. Estas temáticas podrán ser estimadas a niveles más agregados (Total Nacional, Provincial, etc.), ya sea directamente utilizando las técnicas usuales de estimación a partir de muestras probabilísticas, o aplicando otras herramientas estadísticas, diseñadas para obtener estimaciones a nivel de pequeños dominios”. (INDEC, 2012). 2022: El cuestionario censal tiene 37 peguntas e indaga sobre variables que ya se consultaron en Censos e incluye una optimización en el diseño de algunas preguntas y nuevas variables que son demandadas por la sociedad y por quienes formulan políticas públicas en la actualidad. Por primera vez, el autorreconocimiento étnico -pueblos indígenas y afrodescendientes- se releva para toda la población y se incorpora la posibilidad de responder sobre autopercepción de identidad de género. (INDEC, 2022a). “De forma similar a lo que pasó en el Censo 2010, el Censo de 2022 tuvo poca participación tanto de instituciones académicas, de otros institutos y organismos y de distintos expertos para la elaboración y discusión de las preguntas. Los principales institutos de investigación social de la Argentina debieron enviar comunicados de prensa para manifestar su preocupación, mientras que las recomendaciones internacionales sugieren que el alcance temático del Censo cuente con una justificación de su requerimiento, y a la vez, se socialice a través de seminarios donde usuarios y expertos puedan participar de la discusión e intercambio de ideas”. (Sacco N, 2019). g. Cartografía censal: 1991: Para este Censo se utilizó cartografía tradicional, la cual, “consistió en mapas, planos y croquis que permitieron planificar, organizar y ejecutar el relevamiento” (INDEC, 1993) “El proceso de segmentación se realizó en forma manual. Se determinaban los segmentos sumando la cantidad de viviendas estipuladas. Un grupo de técnicos monitoreó el proceso de segmentación, la selección de los segmentos y la cobertura territorial de las áreas muestrales”. (ATE-INDEC, 2010) 2001: Salvo dos provincias (Misiones y C.A.B.A) el resto utilizó tecnología digital por primera vez (ATE-INDEC, 2010). La cartografía comprendía mapas, los planos y los croquis de todo el 301 territorio nacional, con la representación de las diferentes divisiones político- territoriales administrativas en las que está organizado el país (Provincias, departamentos, partidos, distritos escolares), estableciéndose además divisiones creadas en el operativo censal (fracción, radio y segmento). Por primera vez se utilizó procedimientos asistidos por computadora para determinar los segmentos de la mayoría de las áreas urbanas. (INDEC, 2006) 2010: Se utilizó cartografía digital. La metodología aplicada para la obtención de una cartografía impresa actualizada de todo el territorio nacional fue definida por el INDEC, y su realización estuvo a cargo de las Direcciones Provinciales de Estadística en sus respectivos territorios. (INDEC, 2012). Algunas “áreas como las rurales o las que corresponden a algunas localidades muy pequeñas que se (elaboraron) manualmente”. (ATE-INDEC 2010). “Se empleó imágenes de alta resolución para la actualización de la cartografía existente, con énfasis particular en las áreas periféricas de localidades con importantes crecimientos poblacionales durante el período intercensal; la realización de un operativo de conteo/listado de viviendas que permitió comprobar en terreno cualquier cambio cartográfico y estimar la cantidad de viviendas por lado de manzana; la utilización de un archivo digital de puntos correspondientes a establecimientos educativos y sus rutas de acceso, para la determinación de los puntos sede del operativo; el uso de archivos digitales del Sistema de Información Geográfica 250 (SIG 250), para completar y enriquecer la cartografía existente a nivel provincial; el redimensionamiento de fracciones y radios censales cuya cantidad de viviendas excedía el valor recomendable desde el punto de vista operativo y la segmentación del territorio a los efectos de determinar las zonas de relevamiento bajo responsabilidad de cada censista” (INDEC, 2012). Posterior al relevamiento la información cartográfica actualizada sirvió como herramienta para las tareas de análisis y consistencia, “asimismo, se realizó la verificación de los códigos de las localidades/aglomerados existentes y la codificación de las nuevas localidades/aglomerados para su incorporación a la cartografía censal” (INDEC, 2012). Durante la etapa postcensal el material de campo fue revisado con el fin de “incorporar en la base cartográfica nacional todas las novedades de terreno detectadas por los censistas y consistir la información estadística desde el punto de vista geográfico para su presentación georreferenciada” (INDEC, 2012) 2022: Desde marzo de 2019 las provincias bajo las pautas metodológicas impartidas por el INDEC comenzaron el operativo de actualización del Archivo de Domicilios de la República 302 Argentina (ADRA). La DPE de Buenos Aires contaba desde el año 2010 con una base de datos geográfica asociada al listado de domicilios, la cual fue un insumo clave para la actualización de los listados de domicilios para el Censo 2022. Con esta información, la DPE llevó adelante un trabajo de actualización cartográfica utilizando imágenes satelitales e información de catastro municipal, así como imágenes de drone y vuelos aportados por los municipios. No obstante, en la provincia de Buenos Aires durante el año 2019 en 35 municipios, se realizó una prueba con una metodología distinta a la usada en el preCenso 2010. Esta metodología propuesta por INDEC tenía como desventaja que el listado de domicilios no se vinculaba directamente a la base geográfica, sino que el procedimiento de vinculación era posterior al relevamiento. En febrero del año 2020, luego de diversas pruebas, el INDEC aprobó la metodología propuesta por la DPE que posibilitaba el uso de las bases cartográficas digitales existentes e incorporaba la utilización de una app en dispositivo celular con el listado de domicilios vinculados a dichas bases. El trabajo realizado para la conformación del ADRA se realizó pronunciadamente durante todo el año 2020 y parte del año 2021, durante la pandemia de COVID 19. En tal sentido, el relevamiento se llevó adelante mediante una combinación virtual y presencial de campo. (INDEC 2022d. pp. 1,2) h. Pruebas pre-censales: 1991: Para este Censo se realizaron 5 pruebas piloto sucesivas, así como “un estudio cualitativo y un experimento sobre condiciones de actividad realizados en terreno entre 1988 y 1990, en distintas zonas del país, tanto urbanas como rurales”. (INDEC, 1993) 2001: Se realizaron 4 pruebas piloto generales, 2 pruebas de diseño conceptual en distintas provincias, 3 encuestas de validación, que pusieron a prueba y dieron lugar a los cambios relacionados con la organización funcional del Censo, la metodología a emplear, la preparación del relevamiento y el procesamiento y difusión de los datos, y un Censo experimental en la ciudad de Pergamino en noviembre de 1999. (INDEC, 2006) 2010: Se llevaron a cabo dos pruebas piloto; la primera en Bariloche, Posadas y en la Ciudad Autónoma de Buenos Aires (C.A.B.A). en 2007, cuyo objetivo fue evaluar conceptos referidos a las migraciones internacionales principalmente y la segunda en algunos barrios de la C.A.B.A en 2009, la cual buscaba evaluar conceptos referidos a las migraciones internacionales principalmente. Así mismo también “se brindó asistencia técnica a la provincia de Córdoba, que llevó a cabo un Censo provincial en el año 2008. Esta ha sido la prueba más relevante en términos de la planificación definitiva del Censo Nacional de Población, Hogares y Viviendas 303 2010, hasta el levantamiento del Censo Experimental, que tuvo lugar en noviembre de 2009, en el partido de Chivilcoy -Provincia de Buenos Aires”. (INDEC, 2012) 2022: Este Censo realizo dos pruebas piloto de barrido territorial, la primera en San Javier, Provincia de Misiones; Pilar, Provincia de Buenos Aires en 2017 y la segunda en Ciudad Autónoma de Buenos Aires y localidades de las provincias de Buenos Aires y de Jujuy en 2019. Asimismo, hizo cuatro pruebas piloto del Censo digital (la primera Interna del INDEC, la segunda en DPE; 24 jurisdicciones del territorio nacional, la tercera con expertos en usabilidad y comunicación y la cuarta con DPE – INDEC). Finalmente, un Censo Experimental en 2021 en la Localidad santafesina de Gálvez y zonas seleccionadas de dos comunas en CABA) (INDEC, 2022a), (INDEC, 2020) 2 Fase censal a. Estructura censal La estructura censal ha perdurado y se ha ido actualizando permanentemente en los Censos analizados. “A las divisiones administrativas propias del Estado Nacional (Provincias y departamentos) se agrega las propias de la actividad censal: fracción, radio y segmento. Esta estructura garantiza que los Censos en cuestión hayan captado la casi totalidad de la población en los lugares definidos por el Censo.” (Giusti, 2007). A continuación, en el siguiente esquema se encuentra la estructura de relevamiento a nivel provincial de los Censos de 1991, 2001, 2010 y 2022: Figura 26. Comparación de las estructuras operativas de los Censos de población y vivienda de 1991, 2001, 2010 y 2022 Fuente: Metodologías censales Censo 1991, 2001, 2010 y 2022 304 1991: La estructura censal estaba conformada a nivel nacional por un comité coordinador nacional cuyo secretario ejecutivo era el Director del INDEC. A nivel provincial estaba un comité censal provincial cuyo secretario ejecutivo era el Director de Estadística. A nivel departamental un jefe por departamento. A nivel de fracción un Jefe de Fracción. A nivel de radio un Jefe de Radio y a nivel de segmento censistas. A partir del nivel de departamento cargos eran convocados por carga pública. (INDEC,1993) (Figura 26) 2001: “Cada una de las unidades territoriales del Censo estuvo a cargo de una autoridad censal, responsable de que todos los hogares y las personas fueran censados en el área correspondiente. La estructura de relevamiento quedó conformada por 24 Coordinadores Provinciales; 530 Jefes de Departamento, Partido o Distrito Escolar; 5.000 Jefes de Fracción; 50.000 Jefes de Radio y 420.000 censistas. Para el desempeño de aquella, se recurrió mayoritariamente a la estructura educativa que es la que tradicionalmente ha proporcionado el personal para los recuentos de población. Sin embargo, pocos días antes del operativo, un conflicto planteado por algunos gremios docentes relacionado con aspectos ajenos al Censo, llevó al reemplazo de algunos de ellos como censistas, debiendo recurrirse a personal administrativo o de las fuerzas armadas. El nivel de reemplazo de esa estructura fue en promedio del 5 por ciento del total, lo cual no afectó el operativo en general, aunque sí en algunas áreas puntuales sobre las que se informa por separado. A su vez, en zonas fronterizas o de islas y puertos fue necesario contar con la participación de las fuerzas de seguridad (Gendarmería Nacional y Prefectura Naval). El personal afectado al operativo desempeñó su tarea como carga pública y de todas formas se estableció para el mismo una compensación económica en concepto de gastos”. (INDEC, 2006) (Figura 26) 2010: “Cada una de las áreas geográfico-censales así delimitadas, estuvo bajo la responsabilidad de un integrante de la estructura censal, conformada por más de 700.000 personas, en su mayor parte docentes. El Coordinador Provincial del Censo tuvo a su cargo la planificación, organización, dirección, coordinación y evaluación de cada una de las etapas del Censo en la jurisdicción provincial. El Jefe de departamento tuvo a su cargo asegurar la movilización del personal de relevamiento requerido en el departamento, la disponibilidad de sedes de entrenamiento y operativas, la distribución del material censal y de capacitación en tiempo y forma, así como canalizar las comunicaciones entre las autoridades de conducción del Censo y el resto de la estructura de relevamiento. El Jefe de Fracción aseguró el relevamiento de todas las viviendas, hogares y personas en la fracción. También supervisó y controló las tareas de los Jefes de radio y de los censistas de Viviendas Colectivas a su cargo. 305 El Jefe de Radio tuvo como función asegurar el relevamiento de todas las viviendas, hogares y personas incluidas en el radio. Supervisó y controló las tareas de los censistas a su cargo, responsabilizándose por la calidad de la información relevada. Los censistas de Viviendas Particulares recogieron información de las viviendas, hogares y personas en el segmento asignado por su Jefe de Radio. Los censistas de Viviendas Colectivas levantaron información de las personas en las Viviendas Colectivas asignadas por su Jefe de Fracción”. (INDEC, 2012) (Figura 26) 2022: El INDEC trabaja en conjunto con las direcciones provinciales de estadística para el diseño de las estructuras censales de cada una de las jurisdicciones. Las DPE son los organismos encargados de convocar la estructura censal en sus provincias. La organización jerárquica consta de las 600.000 personas que componen la estructura censal. La estructura está conformada a nivel provincial por un coordinador provincial del Censo, un subcoordinador de gestión y un jefe de equipo de operativo de población en situación de calle. A nivel de departamento un jefe por departamento. A nivel de fracción un Jefe de Fracción y un asistente de Jefe de Fracción. A nivel de radio un Jefe de Radio y a nivel de segmento censistas de población en situación de calle (dirigidos por el jefe del operativo dirigido a esta población), censistas de viviendas colectivas (dirigidos por el Jefe de Fracción) y censistas de viviendas particulares (dirigidos por los jefes de radio). (INDEC,) (Figura 26) b. Conteo de viviendas 1991: Se realizó listado de viviendas en todas las localidades. La tarea se inició el año anterior a la fecha del operative (ATE-INDEC, 2010) 2001: “Esta actividad, se realizó en áreas urbanas, contándose las viviendas en todas las localidades del país”. (INDEC, 2006). “Se realizó conteo en localidades de 5000 y más habitantes y sólo se listaron las manzanas con más de 40 viviendas. El INDEC desarrolló un programa para ingresar la cantidad de viviendas por lado de manzana. Este fue incorporado a la base de datos geográfica (cartografía digital) para el diseño automático de segmentos. Se hizo manualmente en algunos por falta de archivos digitales en localidades de menos de 5000 habitantes y zona rural” (ATE-INDEC, 2010) 2010: En el CEN-10 se realizó de igual manera que el Censo 2001 (se realizó conteo en localidades de 5000 y más habitantes y sólo se listaron las manzanas con más de 40 viviendas. El ingreso de cantidad de viviendas y conexión con la base digital se (realizó) en forma 306 automática en todo el país. Se aggiornaron los programas y secuencias de procesos. (ATEINDEC, 2010; INDEC, 2010d). se decidió que para las localidades que no contaran con el listado de viviendas se utilizarían los datos precensales de 2001. (Sacco, 2017) 2022: A finales de 2019 y principios de 2020 se planificaron las tareas para la confección del ADRA tomando como referencia las experiencias de Censos. Se planificó que la metodología en este operativo fuera de barrido territorial en donde los actualizadores debían recorrer caminando todas las manzanas de las localidades de 2.000 habitantes o más del municipio, contando con el listado de domicilios 2010 y un plano impreso con la cartografía estadística. De esta manera debían verificar los domicilios e indicar las altas, las bajas y las modificaciones y en general cualquier cambio en la cartografía estadística. A principios del mes de marzo de 2020 se capacitó en forma presencial, pero el 20 de marzo se suspendieron las tareas conforme a las restricciones impuestas por el decreto presidencial. A pesar de los inconvenientes generados por la emergencia sanitaria, se decidió afrontar la tarea de actualización y cuantificar todos los domicilios de las áreas urbanas, mediante carga digital programada, vía aplicación informática en dispositivos móviles, en todo el territorio. Se realizó un operativo, el cual contó con la participación de instructores, actualizadores-listadores, supervisores, jefes de Partidos, subcoordinadores y coordinadores regionales y generales. (INDEC 2022d. pp. 3-9). “El relevamiento se organizó de manera escalonada y regionalizada, en convenio con cada Dirección Provincial de Estadística”. (PreCenso de viviendas, sf) c. Logística 1991 “El material fue enviaron anterioridad al relevamiento a la sede del departamento, desde donde se distribuyó a las escuelas, lugar en donde se entregó a los censistas. Al finalizar la jornada los censistas debían devolver a su Jefe de Radio, debidamente cumplimentados, los materiales recibidos. Luego de efectuar los controles correspondientes. Este a su vez devolvió el material a su jefe inmediato, que debía elevarlo a la sede departamental. A partir del 16 de mayo se inició la recolección de las cajas que contenían las cedulas censales, que fueron remitidas desde esas sedes al INDEC. El material cartográfico y las planillas resúmenes con las cantidades de población (discriminada por Censo) y vivienda fueron enviados a las direcciones provinciales de Estadística desde las sedes departamentales.” (INDEC, 1993) 2001: El INDEC se encargaba directamente en la coordinación de la logística (ATE-INDEC, 2010). 307 2010: Se hizo un convenio de tercerización con el Correo Argentino, quien coordina ahora estos aspectos. (ATE-INDEC, 2010). “La actividad logística involucró acciones previas al relevamiento censal del 27 de octubre y acciones posteriores a esa fecha hasta la finalización de las actividades de procesamiento de la información. Con anterioridad al relevamiento de campo fue necesario calcular el material en función no sólo de la cantidad estimada de viviendas a censar, sino también a partir de su distribución, de modo de garantizar existencias suficientes bajo cualquier eventualidad y conformar los packs de cada puesto de la estructura censal según las necesidades de cada una de las sedes provinciales, poniendo especial énfasis en que hubiera adecuada disponibilidad de cada uno de los tipos de cuestionarios y demás materiales requeridos en cada sede operativa. Con vistas al día del operativo, se controló la calidad de 32.500.000 cuestionarios censales, 14.000.000 de planillas operativas, 2.200.000 carátulas de segmento, 400.000 carátulas de cajas, 964.000 sobres, materiales de escritura, tablas de apoyo, bolsos de censista, credenciales, porta credenciales y estampillas. Estos controles de calidad involucraron los procesos de diseño, impresión, compaginación, legibilidad, encuadernación, contenido, integridad de la numeración, posicionamiento de campos, anclajes, códigos de barra, color y engomado de los cuadernillos. El envío de las 380.000 cajas con los materiales se realizó a nivel de Departamento y/o Fracción, según la magnitud de cada provincia, con aproximadamente 2.000 destinos. Se utilizaron cajas uniformes identificadas mediante etiquetas con diferentes letras, que cumplieron la función de identificar el contenido y permitieron el seguimiento de las etapas de envío y repliegue del material. Con posterioridad al 27 de octubre, comenzó la etapa de repliegue, clasificación y acondicionamiento de los materiales censales para su posterior procesamiento informático” (INDEC, 2012) 2022: La distribución del material censal estuvo a cargo del Correo Argentino y también como en el caso de la provincia de Buenos Aires de la unidad orgánica Dirección de Distribución de la Información Clasificada “SODIC”, dependiente del Ministerio de Gobierno de la Provincia. El Correo Argentino distribuyó las cajas desde INDEC a cada una de las sedes de fracción con el material censal. Mediante el “SODIC”, en la provincia de Buenos Aires, se efectuó la distribución de las carpetas correspondientes a los Jefes de Departamento, Jefes de Fracción y Jefes de Radio, a cada uno de los distritos. En una segunda entrega se distribuyó kits que contienen material de librería junto con credenciales para identificar acompañantes de barrios populares. Por último, más cercana a la fecha del Censo se distribuyeron notebooks 308 destinadas a los jefes de fracción que tenían radios con barrios populares. (INDEC 2022d. pp. 20) d. Relevamiento Un elemento común de los Censos de los cuatro Censos es “el hecho que un decreto o Ley establecieron el feriado obligatorio del día del Censo. Esto significa que solo pueden mantenerse las actividades esenciales de funcionamiento habituales de cualquier otro feriado. (Giusti, 2007) 1991: Se realizo el 15 de mayo, “los responsables de cada puesto de la estructura censal concurrieron a las respectivas sedes operativas (departamento, fracción y radio). La carga de trabajo se había establecido de manera que el personal afectado pudiera concluir su tarea en una sola jornada”. (INDEC, 1993) 2001: El Censo de Población se realizó el 17 y 18 de noviembre de 2001. “La actividad de empadronamiento continuó en algunas áreas hasta una semana después de la fecha prevista originalmente, como ocurre en la totalidad de los Censos de hecho. En las áreas inundadas no solamente se retrasó el operativo, sino que en algunos casos (Rivadavia, provincia de Buenos Aires) sólo pudo completarse el mismo en mayo del 2002. El empadronamiento de hogares y de instituciones colectivas se realizó mediante dos operativos simultáneos. El Censo de Población también comprende el empadronamiento de las personas que no residen en viviendas ni en instituciones colectivas, vale decir aquellas que viven en la calle. Las mismas fueron censadas en el operativo de empadronamiento de hogares”. (INDEC, 2006) 2010: El Censo fue llevado a cabo el miércoles 27 de octubre de 2010, “declarado feriado nacional. Al efectuarse el relevamiento censal en un solo día, se desarrolló una amplia difusión y campaña informativa y se garantizó la seguridad a fin de optimizar las condiciones del operative. Se estableció que el relevamiento se realizaría un miércoles, para que la población pudiera esperar al censista en su área de residencia. Se propició la movilización de integrantes de las comunidades originarias, afrodescendientes, habitantes de zonas carenciadas, y otras organizaciones comunitarias y populares en calidad de censistas, en tanto son quienes mejor conocen sus entornos. En las zonas rurales de difícil acceso y en las seis bases permanentes del Territorio Antártico Argentino el operativo censal comenzó con anterioridad al 27 de octubre. Los censistas, con la apoyatura de las Fuerzas Armadas y de Seguridad se desplazaron a lomo de mula, en kayaks, helicópteros y lanchas”. (INDEC, 2012). 309 “Lamentablemente, lo que comenzó como un día festivo se convirtió en un hecho luctuoso para todos los argentinos a partir de la muerte del gran estadista, el ex-Presidente de la Nación y Presidente de la UNASUR, Dr. Néstor Kirchner”. (INDEC, 2012) 2022: Los cuatro Censos (1991, 2001, 2010 y 2022) se realizaron con inmovilización de la población durante uno o algunos días en donde se llevó a cabo la recolección a través de entrevista directa por parte de un censista quien utilizó un cuestionario en papel, pero en el Censo 2022, se realizó de manera extendida durante unos meses antes del día del Censo. Para este Censo se utilizó un operativo bimodal de relevamiento a través del Censo digital (autoempadronamiento) y por barrido territorial (entrevista directa), la cual se llevó a cabo el 18 de mayo de 2022. El Censo digital inicio el 16 de marzo de 2022 y terminó en mayo, varios días después de la fecha censal. Por otra parte, el relevamiento en viviendas particulares rurales y en viviendas colectivas comenzó días antes del Día del Censo, y la noche del 16 de mayo se llevó a cabo el operativo de población en situación de calle en grandes aglomerados urbanos. (INDEC, 2022a). El operativo de viviendas particulares rurales inicio del operativo fue el 9 de mayo y finalizó el 17 de mayo. La mayoría de los inconvenientes giraron en torno a la utilización de la app CensAr; ya que el completamiento de los datos se realizó al finalizar el operativo. El operativo de viviendas colectivas se inició el 9 de mayo. Este operativo fue organizado de acuerdo con dos modalidades de trabajo: 1) mediante entrevista directa con cuestionario en papel, a cargo de los/as censistas de viviendas colectivas de barrido pertenecientes a la estructura educativa mayormente, y 2) a través de registros administrativos a cargo de censistas institucionales que formaban parte de cada una de las dependencias a relevar. (INDEC 2022d. pp. 29-30) La utilización de la APP Cens.AR fue muy dispar, en términos generales, en el inicio de la jornada hubo inconvenientes y fallas en el sistema, lo que imposibilitó la apertura del segmento en los dispositivos móviles. Luego de un tiempo de prueba, y con el propósito de no demorar más tiempo la salida a campo, los jefes de Fracción y/o de Radio decidieron comenzar el relevamiento utilizando las planillas en papel. Los resultados en muchos casos no fueron volcados en la app, y se realizaron en las planillas resumen. En el armado de materiales hubo dificultades, fue mucha información, modificada continuamente que impedía precisión y claridad en los procedimientos que se debían completar en cada caso. (INDEC 2022d. pp.32) e. Control de cobertura 1991- 2001: En general los diseños de estos Censos contemplan: 310 • Con base cartografía y el reconocimiento del área correspondiente por parte de los jefes de departamento, jefes de fracción y de jefes de radio. • Control a los resultados. Cotejo hogares con el conteo 2010: “El Jefe de departamento tuvo a su cargo asegurar la movilización del personal de relevamiento requerido en el departamento, la disponibilidad de sedes de entrenamiento y operativas, la distribución del material censal y de capacitación en tiempo y forma, así como canalizar las comunicaciones entre las autoridades de conducción del Censo y el resto de la estructura de relevamiento. El Jefe de Fracción aseguró el relevamiento de todas las viviendas, hogares y personas en la fracción. También supervisó y controló las tareas de los Jefes de radio y de los censistas de Viviendas Colectivas a su cargo. El Jefe de Radio tuvo como función asegurar el relevamiento de todas las viviendas, hogares y personas incluidas en el radio. Supervisó y controló las tareas de los censistas a su cargo, responsabilizándose por la calidad de la información relevada” (INDEC, 2012) 2022: Se contrató la realización de una app que formaba parte del paquete de servicios de tracking y monitoreo denominada CensARL, la cual debía haber brindado servicios y apoyo técnico al desarrollo del operativo territorial, soportado los cuatro operativos del Censo (Censo de viviendas particulares, Censo de viviendas colectivas, Censo de Población en situación de calle y Censo rural). La aplicación debía haber permitido a los censistas registrar y verificar números de e-Censo, en el caso de hogares que lo hubieran respondido; permitir la respuesta a un número de preguntas a definir por INDEC que se hacían en cada hogar directamente en forma digital; reportar eventos durante la realización del Censo; informar a intervalos regulares la posición de cada censista; permitir a los distintos niveles de supervisión, de acuerdo con su responsabilidad, hacer seguimiento en tiempo real del estado de avance del Censo a distintos niveles de agregación; permitir a los distintos niveles de supervisión administrar censistas durante los diversos operativos (abrir y cerrar la jornada del operativo, certificando al cierre la entrega de documentación por parte del censista, reasignar en tiempo real tareas de un censista a otro, bloquear a un censista, crear censistas adicionales en el sistema en tiempo real) y ofrecer a censistas y supervisores la capacidad de intercambiar mensajes durante la realización de operativo. Esta aplicación en muchos casos no se pudo usar y en otros resultó insuficiente de acuerdo con lo que denunciaron censistas en diferentes regiones del país, no alcanzando los objetivos mínimos que imponía el pliego fechado el 23 de noviembre de 2021 (MDZ, 18 de mayo de 2022). 311 3 Fase post-censal a. Recepción, transmisión y procesamiento de la información 1991: Esta etapa tuvo en cuenta diferentes actividades: ingreso de datos, su control y corrección, obtención de resultados básicos, codificación, ponderación de la muestra y obtención de los resultados. El ingreso de datos se hizo por medio de lectoras ópticas sensibles a las marcas hechas con lápiz. Luego se realizan controles de calidad de las respuestas. Esta información fue procesada, tabulada y publicada. La codificación de las respuestas abiertas de la cédula ampliada se efectúa manualmente, la cual se incorporó a los registros de computadora mediante las lectoras de marcas. Una vez expandidos los resultados de la muestra de la cédula ampliada para las localidades donde se aplicó el muestreo, se genera la base de datos con la información completa de las cédulas Ampliadas. 2001: El INDEC llevó a cabo una licitación para la contratación de la impresión de formularios, lectura óptica y procesamiento de la información (ATE-INDEC, 2010). Se incorporó nuevas metodologías de captura de información (lectoras de marca y caracteres alfanuméricos). Se aplicaron software diseñados especialmente a las imágenes de los cuestionarios capturadas por escáneres de alta resolución. El análisis de la fidelidad de la captura se basó fundamentalmente en el cotejo con imágenes se complementó con otros controles (presencia de duplicaciones, de cantidades inusuales de respuestas en blanco o multimarcas como indicadores de problemas de implementación de la lectura, etc) comprobándose la integridad de las imágenes almacenadas. Una vez realizado el control de la captura se llevó a cabo el control de integridad o completitud de los datos censales, con el fin de verificar que la base de datos incluyera todos los segmentos censados sin excepción, todos los hogares que lo integran y controlar su correcta denominación y ubicación en el radio, fracción, departamento y provincia. Esta revisión se realizó contrastando la información proveniente de las cédulas censales, con los resultados provisionales y con la tabla de segmentación. Posteriormente la información se revisó a partir de la evaluación de calidad y consistencia de los datos. Por último, se efectuó el plan de tabulados para su posterior presentación en el marco del plan de difusión de los datos del Censo 2001 (INDEC, 2006) 2010: El procesamiento de los datos obtenidos mediante el relevamiento censal se inicia con la captura de la información censal, la cual se realizó mediante el escaneo de las hojas de los 312 cuestionarios y el posterior reconocimiento inteligente de los caracteres contenidos en las mismas, lo que permite generar la base de datos primarios del Censo de Población. Se conformó un Centro de acopio y procesamiento donde se instalaron los escáneres de última generación y un Centro de cómputos. Se utilizaron 23 Escáneres y el Centro de cómputos contó con un sistema de almacenamiento con una capacidad superior a los diez terabytes y una red de datos con alrededor de 265 puestos de trabajo. Los equipos técnicos del INDEC, encargados de supervisar el proceso de captura, el control de calidad y asegurar que la captura fuera completa. El análisis se hizo a nivel de segmento censal para garantizar que la captura fuera completa. El sistema de captura comprendió el empleo de tecnologías OMR (Programa de Lectura Óptica de Marcas), así como herramientas ICR (Programa de Reconocimiento Inteligente de Caracteres). El Instituto dispuso de un equipo técnico de Control de Calidad de captura que, mediante inspecciones por muestreo, confrontando la información de las imágenes de los cuestionarios frente a la información de la base de datos primarios, permitió asegurar la confiabilidad de la información capturada dentro de las tasas de error aceptables. En el Censo 2010 se obtuvieron datos procesados y publicados a los dos meses de haberse realizado. (INDEC, 2012). 2022: Como el relevamiento de los datos censales se llevó a cabo en forma bimodal (Censo digital y barrido territorial con cuestionarios en papel), se llevan diferentes estrategias para la recepción de la información censal dependiendo del método de recolección. En el caso del relevamiento presencial, la recepción del material censal la realizó el correo argentino. Por otra parte, el proceso de captura de las planillas operativas y de las cédulas censales lo realiza la empresa KOLLOR PRESS IMPRESORA DE PUBLICACIONES Y EDICIONES S.A. a partir del Escaneo y el posterior reconocimiento inteligente de marcas y caracteres. (Memo, 2021). De esta forma, los cuestionarios en papel, cuyos datos fueron escaneados para proceder a su digitalización y captura a través de un software de reconocimiento OCR/ICR/OMR hasta conformar la correspondiente base de microdatos (INDEC 2020). En el pliego de especificaciones técnicas del Censo se afirma que la captura del material censal se realizará por escáner de manera centralizada y contemplara el guillotinado y escaneo de las cédulas censales; el reconocimiento de los datos de las imágenes, ya sean estos códigos de barras, marcas, caracteres numéricos o alfabéticos; la generación de la base de datos con niveles de tasas de error máximo y la entrega de bases de datos finales (INDEC 2021). Es posible que el proceso de captura de datos que se implemente en el Censo 2022 tenga los mismo subprocesos y actividades que en las pruebas pilotos, las cuales son: 1. Ordenamiento: 313 actividad en la cual se organizan los cuestionarios de manera metódica, según la ubicación geográfica, la numeración consecutiva de las viviendas, la de los hogares dentro de cada vivienda y la de cuestionarios consecutivos al interior de cada hogar. 2. Guillotinado en donde se separa cada una de las hojas del cuestionario para escanearlas. 3. Escaneo: en esta actividad se capturará y digitalizará el cuestionario censal en papel para transferirlo a una computadora en formato de imagen o a una base de microdatos para su procesamiento. 4. Reconocimiento e interpretación: Esta actividad se desarrollaría a través del software de reconocimiento OCR/ICR/OMR, se extraen los datos de las imágenes de los cuestionarios censales y se construye una base de datos que permite ser procesada. (INDEC 2020). Por otra parte, la validación y coherencia utilizará los registros administrativos como complemento. (CEPAL 2021c, p27) b. Encuesta de cobertura 1991: “La planificación del Censo de 1991 contempló la realización después del relevamiento de una encuesta por muestreo con los siguientes objetivos: a. Medir la cantidad total de personas omitidas en el Censo, teniendo encueta el sexo, la edad, la nacionalidad y el nivel de educación. b. Medir el error de respuesta de ciertas características informadas en el Censo (edad, educación, lugar de nacimiento, etc) Los resultados se obtendrán comparando la cédula censal llenada por el censista con el cuestionario de la encuesta postcensal” (INDEC, 1993) 2001: A partir de la semana siguiente de la finalización del relevamiento se efectuó la encuesta postcensal –EPC- que tuvo como objetivo medir la omisión de personas en las áreas seleccionadas y el empadronamiento erróneo en muestras de hogares seleccionados en todas las localidades mayores a 500 mil habitantes y en las ciudades capitales de provincia que no superaran ese tamaño de población. Para ello se aplicó un cuestionario especialmente diseñado al efecto (INDEC, 2006) 2010: No se aplicó encuesta de cobertura. Para determinar la no cobertura se realizó un proceso de conciliación y evaluación censal el cual realizó un análisis estadístico de la consistencia de la información censal en su fase final de consolidación, a partir de la coherencia con los indicadores demográficos con los Censos anteriores, las estadísticas 314 vitales, las encuestas de demografía y salud y los registros de entradas y salidas del país, entre los principales. (INDEC, 2012) 2022: Por el momento no se ha hecho público cómo van a evaluar la cobertura del Censo 2022. c. Depuración y control de calidad de la información 1991: Se realizaron dos tipos de controles: 1) el control de cantidades y totales, el cual verifica las cantidades de personas y viviendas por lugar, confrontándolas con otras de referencia tales como el Censo anterior, convenientemente actualizadas con otras fuentes de información existentes en el INDEC; y 2) el de calidad de las respuestas, que consiste en el análisis de consistencia y coherencia de las características de la población y de las viviendas. Los datos erróneos detectados con esos controles se corrigieron mediante programas especiales de análisis de consistencia y reparación de información. Estos programas, modificaron la información mediante la aplicación de criterios estadísticos. (INDEC, 1993) 2001: La información resultante de la lectura e interpretación de los datos de las cédulas censales fue evaluada a partir de una serie de procedimientos denominados evaluación de calidad y consistencia de los datos, en donde se detectaron cada uno de los errores, su correspondiente magnitud, el origen y su incidencia en los distintos universos de análisis. Entre las actividades de la evaluación de calidad también se lleva a cabo la comparación de los datos con información proveniente de otras fuentes (Censos, encuestas, registros continuos, relevamientos regulares, investigaciones, etc.) y consultas a informantes calificados de las provincias. La mayor parte de los errores de una u otra índole eran subsanados mediante la aplicación de un programa de consistencia y asignación de datos en el que, a través de criterios estadísticos – al azar o determinísticamente - se asignan las respuestas faltantes, erróneas o inconsistentes. Por último, se efectuó el plan de tabulados para su posterior presentación en el marco del plan de difusión de los datos del Censo 2001 (INDEC, 2006) 2010: El Censo 2010 al igual que el de 2001 previeron dos tipos de controles: control de cantidades y totales y el control de la calidad de respuesta. Para realizar estas tareas, se utilizó un software desarrollado específicamente por profesionales del INDEC, en combinación con el programa CANCEIS (CANadian Census Edit and Imputation System), desarrollado por la Oficina de Estadísticas de Canadá (Statistics Canada) y utilizado por la mayoría de los Institutos Nacionales de Estadística para estas actividades (INDEC, 2012) 315 2022: Todo lo que es el proceso de calidad de imágenes y primer control lo está haciendo la empresa de unión temporal KOMO (Kollor’s S.A y Modo). Se contrataron 40 personas que están en la Universidad de la Matanza quienes hacen el trabajo de chequeo y data-entry entre las imágenes y un programa de validación. d. Divulgación de los resultados: 1991: Los resultados definitivos se presentaron en 1993, dos años después de terminado el operativo de recolección. 2001: La publicación de los datos definitivos del Censo se publicó en septiembre de 2009. las publicaciones, los principales cuadros de salida a nivel nacional, departamental y municipal, en papel y en medio magnético, CD e internet. (INDEC, 2006). 2010: La publicación de los resultados definitivos fue en octubre de 2012. La difusión de los datos del Censo, provisionales y definitivos, se realizó a través del sitio web del INDEC, CDs y publicaciones impresas. (INDEC, 2012) 2022: El INDEC difundió que Argentina tenía 47.327.407 habitantes a pocas horas de haber finalizado el Censo. Este dato que de acuerdo con fuentes oficiales, fue resultado de una tendencia de campo, que puede variar en un millón de personas, o incluso más, según especialistas. (La Nación, 24 de octubre de 2022) Según el calendario de divulgación de datos del Censo, las cifras deberían haber sido publicadas a mediados del mes de agosto, a 90 días del día del Censo, pero una serie de imprevistos e inconsistencias como falta de fondos, problemas de capacitación, errores y dudas en el día del operativo, ausencias en los domicilios e imposibilidad de cruzar los datos, entre otros inconvenientes, provocaron la demora de los primeros resultados y llevaron a suspender la publicación de los resultados preliminares (La Nación, 24 de octubre de 2022). Los resultados básicos preliminares, tradicionalmente se basan en las planillas resúmenes que elabora la estructura censal al finalizar la jornada de barrido. Según el INDEC, en el caso del Censo 2022, estos formatos no cumplieron con los estándares que requiere el Instituto para la difusión de una información estadística precisa, al no haberse incluido un porcentaje de los habitantes de las viviendas que respondieron el Censo digital, no reflejando de esta manera los totales preliminares de la población existente en cada una de las jurisdicciones del territorio nacional. (INDEC, 18/08/2022) 316 El 31 de enero de 2023 el INDEC publicó los resultados provisionales de los operativos de viviendas particulares, de viviendas colectivas y de población en situación de calle del CENSO 2022, donde se presentó el total de viviendas y de población por sexo para los niveles nacional, provincial y por departamento, partido y comuna. Los resultados provisionales se produjeron a partir de la agregación de los datos recogidos a través de la modalidad digital y de la información de los cuestionarios censales en papel captada por escáner que fue completado de manera presencial durante el barrido territorial. Por otra parte, los resultados definitivos se obtendrán una vez que se cuente con la totalidad de los datos de las variables censales consistidas y validadas, correspondientes a las vivienda, hogar y población, las cuales podrían llegar a mostrar alguna diferencia con respecto a los resultados provisionales (INDEC, 2023, p.9). Según el cronograma de difusión propuesto por el INDEC, los resultados ampliados definitivos estarán disponibles en el mes de junio de 2023, 13 meses después de haberse llevado a cabo el operativo censal (INDEC 2022a, p. 25), sin embargo al 31 de mayo de 2023 lo último que se publicó fueron Resultados Provisionales en valores porcentuales sobre una serie de Indicadores de las condiciones habitacionales de las viviendas particulares ocupadas.