Metadatos DDI - Dublin Core DANE
Metadatos DDI - Dublin Core DANE
Metadatos DDI - Dublin Core DANE
documentación de metadatos
a partir de los estándares DDI
y Dublin Core
Equipo técnico
Paola Fernanda Medina Tovar
Marly Johana Téllez López
Diana Cristina Prieto Peña
Rafael Humberto Zorro
Revisión de coherencia
Sonia Marcela Naranjo Morales
2 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
CONTENIDO
PRESENTACIÓN.......................................................................................... 6
INTRODUCCIÓN......................................................................................... 7
1. OBJETIVOS............................................................................................. 8
2. ALCANCE............................................................................................... 9
3. CONCEPTOS BÁSICOS........................................................................... 10
4. IDENTIFICACIÓN DE ACTORES............................................................... 11
6. PROCESO DE DOCUMENTACIÓN............................................................ 13
BIBLIOGRAFÍA.......................................................................................... 47
3 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
INDÍCE DE TABLAS
Tabla 1. Colaboradores............................................................................ 28
Tabla 2. Financiamiento........................................................................... 29
Tabla 3. Periodo de recolección................................................................ 32
Tabla 4. Periodo de referencia................................................................. 34
Tabla 5. Recolección de datos................................................................... 34
Tabla 6. Institución propietaria................................................................. 35
4 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
INDÍCE DE GRÁFICAS
5 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
PRESENTACIÓN
6 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
INTRODUCCIÓN
Esta guía proporciona, tanto a entidades públicas, privadas como académicas, los lineamientos
necesarios para la documentación de metadatos y microdatos mediante los estándares DDI
y Dublin Core, con el fin de facilitar su implementación y tener un recurso estandarizado con
un vocabulario común.
7 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
1. OBJETIVOS
Objetivo general
Objetivos específicos
8 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
2. ALCANCE
9 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
3. CONCEPTOS BÁSICOS
Estándar estadístico:
Proporciona, a nivel estadístico, un conjunto completo de directrices para las encuestas y fuentes
administrativas recogiendo información sobre un tema en particular. El uso de estándares
estadísticos permite repetir la recolección de estadísticas sobre una base constante. También
permiten la integración de datos a lo largo del tiempo y entre diferentes fuentes de datos, lo
que permite el uso de datos más allá del objetivo inmediato para el que se haya producido.
Las normas también reducen las necesidades de recursos relacionados con muchos aspectos
de desarrollo y mantenimiento de la encuesta (OCDE).
Metadatos:
Información necesaria para el uso e interpretación de las estadísticas. Los metadatos describen
la conceptualización, calidad, generación, cálculo y características de un conjunto de datos
estadísticos (DANE, 2012e).
Microdatos:
Datos sobre las características de las unidades de estudio de una población (individuos,
hogares, establecimientos, entre otros), que constituyen una unidad de información en una
base de datos y que son recogidos por medio de una operación estadística (DANE, 2012e).
Operación estadística:
10 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
4. IDENTIFICACIÓN DE ACTORES
11 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
El PAD cuenta como herramienta básica con el Nesstar Publisher que es un editor para la
documentación y preparación de los metadatos y los datos para su publicación en el catálogo
en línea llamado Archivo Nacional de Datos (ANDA), que fue desarrollado por el Grupo de
Datos para la Red Internacional de Encuesta de Hogares (IHSN).
12 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
6. PROCESO DE DOCUMENTACIÓN
Este inicia con la clasificación de la información que será documentada y luego ingresada
en el Nesstar Publisher, en donde se encuentran configurados los estándares DDI y DCMI
para iniciar el proceso de documentación. Es importante contar con la siguiente información
respecto a la operación estadística a documentar: su metodología, las bases de datos y el
material de referencia usados.
Metodología
Se debe disponer de la descripción de los elementos necesarios para este documento. Puede
ser consultada en la Guía para la elaboración de documentos metodológicos estándar de las
operaciones estadísticas1.
Base de datos
• Bases de datos (con o sin microdatos): contiene las variables y registros de una operación
estadística. Debe surtirse un proceso de anonimización de las bases de datos con el fin
de subirlas a un estándar estadístico internacional y difundirlos para la consulta de los
usuarios.
• Diccionario de datos: contiene información de la base de datos como puede ser el nombre
de la tabla o archivo de donde viene la variable, el nombre del campo, la descripción del
campo, el tipo y medida del dato y la longitud del campo.
13 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Material de referencia
Corresponde a aquellos documentos que constituyen el apoyo temático del proceso estadístico
de la operación. Aquí se incluyen:
• Manuales.
• Documentos de diseño.
• Especificaciones de indicadores.
• Guías.
• Instructivos.
• Presentaciones.
14 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Versión: esta opción permite hacer un seguimiento a la versión del documento, lo que
facilita a los usuarios la capacidad de determinar si cuentan con la versión más reciente.
También incluye un listado de cambios hechos en cada revisión. Esta información puede
ayudar a los usuarios a determinar si los errores en versiones anteriores fueron la fuente de
errores en el análisis.
15 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
16 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Gráfica 5. Identificación
Gráfica 6. Título
Gráfica 7. Subtítulo
17 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Gráfica 8. Abreviación
18 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
19 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Descripción general: los elementos en este grupo proporcionan un resumen general sobre
la operación estadística.
Resumen: esta sección presenta una idea general, pero precisa de los diversos aspectos que
componen la operación estadística, es decir, debe presentar de forma clara y resumida una
visión general de lo que se trata la operación o investigación estadística. Se trata de realizar
un planteamiento claro y ordenado del tema y de la importancia de sus implicaciones, así
como de la manera como se han abordado los diferentes elementos que componen la misma.
20 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Objetivos:
21 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
UNIDAD DE ANÁLISIS
Fincas y lotes dedicados al cultivo de flores bajo invernadero y a cielo abierto.
UNIDAD DE MUESTREO
Fincas productoras de flores bajo invernadero y a cielo abierto.
Clases de datos: se describe el tipo de datos (encuesta por muestreo, censo, operación
estadística basada en registros administrativos con fines estadísticos, otros) recolectados
durante el estudio. La plantilla incluye un vocabulario controlado para este elemento.
Cobertura temática: este ítem permite la documentación de los tópicos que fueron
cubiertos por la operación estadística.
22 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
23 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Cuestionarios: identifica por nombre y tipo de cuestionario (no el contenido del cuestionario)
y los módulos principales. Se deben usar uno de los siguientes tres términos para describir el
tipo de instrumento de recolección de datos utilizado:
• Estructurado: indica un instrumento en el que a todos los encuestados se les aplicó las
mismas preguntas/pruebas, posiblemente con respuestas precodificadas. Si una porción
pequeña del cuestionario incluye preguntas abiertas, provea los comentarios apropiados.
• Semiestructurado: indica que el documento de investigación contiene, principalmente,
preguntas abiertas.
• No estructurado: indica que se condujeron entrevistas exhaustivas.
24 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Clasificación de los tópicos: esta casilla muestra un listado amplio de tópicos cubiertos por
los datos. El listado de términos suministra a los usuarios un listado de valores predeterminados
a escoger. El atributo «vocabulario URI» especifica la ubicación del vocabulario controlado.
Cobertura geográfica: los elementos en este grupo pueden ser utilizados para proporcionar
una descripción del área geográfica y la población cubierta por esta operación estadística.
25 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
País: todos los países incluidos en la operación estadística deben estar listados. La plantilla DDI
utiliza un vocabulario controlado para este elemento. Se pone el nombre del país en mayúscula y
su respectiva abreviación en código ISO que corresponde a las tres primeras letras.
En las encuestas por muestreo, el número de dominios tiene una influencia importante en el
tamaño y la distribución de la muestra. Normalmente, las estadísticas se presentan para los
distintos subgrupos de la población, llamados dominios de estudio.
Los dominios de estudio elegidos pueden coincidir con el estrato de muestreo estratificado o
grupos que se encuentran en ellos. Estos dominios pueden ser geográficos o no geográficos.
A menudo, estos subgrupos están relacionados con una clasificación, por ejemplo, las
unidades territoriales, la actividad económica, etc., (Eurostat, “Evaluación de la calidad de
las estadísticas: Glosario”, Grupo de Trabajo, Luxemburgo, octubre de 2003).
Unidad geográfica: se usará este elemento para proporcionar información acerca de las
áreas que fueron cubiertas y para mencionar las razones por las que la encuesta no cubrió
el área geográfica total del país. Especificar el nivel más pequeño de agregación cubierto
por los datos.
Productores y auspiciadores: este grupo contiene elementos que pueden ser utilizados
para reconocer la labor de personas y organizaciones responsables del diseño, implementación
y financiamiento de la operación estadística. Este grupo cuenta con cuatro elementos:
26 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
27 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Tabla 1. Colaboradores
Departamento
Dirección de Metodologías
Administrativo
y Producción Estadística - Gran DIMPE - GEIH Equipo Técnico
Nacional de
Encuesta Integrada De Hogares
Estadística (DANE)
Tabla 2. Financiamiento
Departamento Administrativo
Nacional de Estadística DANE Ejecutor
(DANE)
Muestreo: en este Ítem se debe documentar el diseño y definición del tamaño de la muestra,
incluyendo marco muestral, tipo de muestreo y tamaño final de la muestra, como también,
pérdida de muestra, procedimiento de estimación y cálculo de precisión de los resultados.
Este Ítem solo aplica para encuestas por muestreo.
28 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Pérdida de muestra: este elemento se usará para describir la correspondencia entre las
unidades que fueron encuestadas exitosamente y la muestra planeada. Cualquier desviación
importante debe ser mencionada aquí.
29 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
30 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
31 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
32 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Departamento Administrativo
DANE Gobierno Nacional
Nacional de Estadística
• La consolidación de archivos.
• Las normas de validación y consistencia.
• La verificación de la consistencia interna de los datos y ajustes.
• La imputación y/o ajustes de cobertura.
33 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
34 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Departamento
Gobierno
Administrativo Nacional dane@dane.gov.co www.dane.gov.co
Nacional
de Estadística
Confidencialidad: describe las normas que establecen el anonimato del informante y los
compromisos de la institución para garantizar la confidencialidad de los resultados.
Condiciones de acceso y uso: proporciona una descripción de los términos bajo los
cuales se permite a los usuarios el acceso a los datos de la operación estadística.
Por ejemplo, algunas bases de datos pueden ser obtenidas gratuitamente en Internet, mientras
que a otras únicamente se puede acceder desde computadoras designadas
en instalaciones especiales.
Contactos: este grupo puede ser utilizado para proporcionar a los usuarios información
acerca de quién puede responder preguntas adicionales sobre la operación estadística.
35 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Esta sección contiene todos los archivos de datos asociados con la operación estadística,
además de una descripción detallada de cada variable en los archivos de datos. Los elementos
en esta sección son obtenidos de las especificaciones DDI. Cada archivo de datos tiene
cuatro grupos de elementos: descripción del archivo, variables clave y relaciones, variables
y entrada de datos.
Descripción del archivo: los elementos en este grupo son utilizados para proporcionar
información básica acerca de cada archivo. La Plantilla DDI cuenta con los siguientes
elementos en este grupo:
36 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Versión: se ingresa una descripción de cada versión del archivo de datos en este elemento.
La información debe incluir fecha, origen y tipo de datos (Validados, Parcialmente validados,
originales, etc.). Idealmente, un número de versión debe ser asignado a cada archivo de
datos. Se recomienda que una numeración formal sea utilizada para identificar diferentes
publicaciones de la base de datos. Se debe poner la palabra «versión» y el año de la
operación estadística, así: Versión 2005.
Datos perdidos: se emplea este elemento para describir las causas por la que existen datos
perdidos en el archivo de datos. Los datos perdidos particulares son definidos al documentar
cada variable.
Notas: se puede ingresar algún comentario adicional acerca del archivo de datos.
• Variables clave base: son variables que identifican individualmente, cada observación
en el archivo de datos. Por ejemplo, una variable clave base en el archivo de hogares
sería la variable que contiene un número de identificación único para cada hogar. Si
el archivo de datos no contiene esta variable, una nueva puede ser creada mediante
una combinación única de variables; por ejemplo, la combinación de variables como
región, área y número de identificación del hogar en el área.
37 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
• Variable clave externa: se refiere a aquellos casos en los que las variables que
pueden ser utilizadas para relacionar bases de datos no incluyen una variable con un
número de identificación único para cada observación. Estas variables permiten que una
fusión de archivos no contenga valores duplicados.
Es importante crear variables clave y definir las relaciones entre bases de datos en un proyecto
correctamente. Pues las «variables clave base» serán utilizadas por los analistas de datos
para fusionar los archivos en STATA, SPSS, SAS o cualquier otro programa estadístico.
Variables: este grupo de elementos es utilizado para ingresar metadatos relacionados con
cada variable.
• El nombre es el medio principal para referirse a una variable. No debe tener más que
8 caracteres, no debe empezar con un número y no debe contener espacios en blanco.
• La etiqueta es la descripción de la variable. Esta descripción debe ser breve, pero
descriptiva.
• El ancho es el máximo número de caracteres que pueden ser incluidos en una variable.
• Los decimales corresponde al número de lugares utilizados por decimales en cada
variable.
Descripción de la variable: esta opción cuenta con campos para definir las etiquetas
de los valores o categorías de una variable y para ingresar otra información, como datos
perdidos o nivel de medición. Las categorías permiten definir etiquetas de los valores de una
variable.
38 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
39 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Descripción
• El elemento definición permite que la variable sea descrita en mayor detalle que el
proporcionado por la etiqueta variable.
• El elemento universo permite que los usuarios especifiquen la población exacta a la que
la variable es aplicable.
• El elemento encuestado idóneo debe documentar información respecto a la persona/
entidad que proporciona la información de la variable. En encuestas de hogares, la
fuente podrá ser el jefe del hogar o un miembro del hogar. Pero también puede ser el
entrevistador a través de observaciones visuales, el gerente o representante legal de una
empresa, etc.
40 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Preguntas:
Imputación y derivación:
Muchos archivos de datos incluirán variables derivadas o generadas, además de las variables
con información recolectada. Asimismo, algunas variables pueden incluir valores imputados.
Documentar tales imputaciones es crucial para generar confianza y asegurar que los usuarios
pueden reproducir la construcción de datos.
Si los datos perdidos han sido reemplazados con estimaciones, entonces el proceso utilizado
para realizar estas estimaciones debería ser descrito con tanto detalle como fuese posible
en el elemento de imputación. Este elemento puede incluir una referencia a un documento
técnico más detallado.
41 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Las variables también pueden ser obtenidas recodificando o combinando otras variables. En
tal situación, el elemento de «Recodificación» y «Derivación» debe contener una descripción
clara y completa de todas las acciones realizadas al preparar la variable.
Otros:
• Use el elemento Seguridad para describir el nivel del acceso apropiado para una variable.
• El elemento Notas puede ser utilizado para indicar alguna otra información acerca de
la variable no mencionada en ninguna otra parte.
Grupo de variables: los archivos de datos pueden incluir cientos de variables. El Nesstar
Publisher proporciona una herramienta para organizar variables en grupos. La agrupación de
variables permite que los usuarios naveguen a través de los listados de variables rápidamente
y ayuda a controlar el análisis proporcionando una indicación de qué artículos en una base
de datos están conceptualmente conectados. Una variable puede pertenecer a más de un
grupo y un grupo de variables puede incluir variables de más de un archivo de datos.
42 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Esta sección se utiliza para proporcionar un listado y una descripción de materiales como:
documentos (manuales, cuestionarios, informes técnicos y analíticos), programas de computadora
(entrada de datos, edición, tabulación, análisis), y fotos y mapas relacionados de la operación
estadística. En esta se usa la especificación del DCMI y, a diferencia de los archivos de datos,
los materiales de referencia externos no son guardados en el archivo de Nesstar Publisher.
Solamente los metadatos que describen estos recursos son guardados con el proyecto.
43 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
De acuerdo con lo anterior, el nombre de los documentos que contenga cada una de las
carpetas, debe iniciar en mayúscula y el mismo debe ser representativo, como se muestra a
continuación.
1. Tipo: este elemento se usa para indicar la clase de material de referencia que está siendo
documentado.
44 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
5. País: en este elemento se listan todos los países dentro del alcance del material de
referencia en el elemento.
6. Idioma: en este elemento se listan todos los idiomas en que aparecen los materiales de
referencia.
7. Formato: se debe seleccionar un objeto del listado para identificar el formato del archivo
del material de referencia.
45 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
Contenido:
Resumen: proporciona información resumida sobre cada uno de los principales aspectos
del material de referencia.
Tabla de contenido: este elemento es usado para listar todas las secciones del informe,
cuestionario y otro documento.
46 DIRPEN DSO-050-LIN-01
Lineamientos para la definición y aplicación de pruebas
en las operaciones estadísticas
BIBLIOGRAFÍA
47 DIRPEN DSO-050-LIN-01