Informe Big Data
Informe Big Data
Informe Big Data
AUTORES
ASESOR
LÍNEA DE INVESTIGACIÓN
TRUJILLO -
PERÚ 2024-1
ANEXO – 01: METODOLOGÍA DE DESARROLLO RALPH KIMBALL
1.1.1. Propósito.
1.1.2. Descripción.
1.1.3. Resultados
1.1.5.1. Visión
◻ Requerimientos Funcionales
◻ Requerimientos No Funcionales
Requerimientos Requerimiento
Funcional
Funcional 05. Determinar la forma de pago más usada para las citas
médicas en el año 2023.
1.3. FASE III: DISEÑO TÉCNICO DE LA ARQUITECTURA
● DimPaciente
● DimTipoPago
● DimConsultorio
● DimMedico
● DimUsuario
● DimTiempo
Dimensiones CitaMedica
DimPaciente X
DimTipoPago X
DimConsultorio X
DimMedico X
DimUsuario X
DimTiempo X
Almacenar y proporcionar
registros detallados de las citas
CitaMedica médicas realizadas para facilitar
el análisis, seguimiento y toma
de decisiones.
Dimensiones
DimPaciente
DimTipoPago
DimConsultorio
DimMedico
DimUsuario
DimTiempo
Hecho
Tabla de Hechos
CitaMedica
estado varchar no 45
fecha date no -
idPaciente int no 4
idTipoPago int no 4
idConsultorio int no 4
idMedico int no 4
idUsuario int no 4
idTiempo int no 4
costoCita varchar no 45
1.4.3. Dimensiones
➔ DimPaciente
➔ DimConsultorio
➔ DimMedico
➔ DimUsuario
➔ DimTiempo
➔ DimPaciente
idPaciente int no 45
nombres varchar no 45
apellidos varchar no 45
dni varchar no 45
edad int no 4
correo varchar no 45
celular char no 9
➔ DimTipoPago
idTipoPago int no 4
formaPago varchar no 45
➔ DimConsultorio
idConsultorio int no 4
numcon varchar no 45
➔ DimMedico
idMedico varchar no 45
nombresm varchar no 45
apellidosm varchar no 45
dnim varchar no 45
celular varchar no 9
correom varchar no 45
➔ DimUsuario
idusuario int no 4
usuario varchar no 45
estado varchar no 45
nombres varchar no 45
apellidos varchar no 45
dni varchar no 45
celular char no 9
➔ DimTiempo
idTiempo int no 4
fecha date no -
anio int no 4
trimestre int no 4
mes int no 4
día int no 4
MODELO ESTRELLA DEL DATA MART
22
apellidosm VARCHAR(45),
dnim VARCHAR(45),
celular CHAR(9),
correom VARCHAR(45),
);
24
idPaciente INT REFERENCES DimPaciente(idPaciente),
idTipoPago INT REFERENCES DimTipoPago(idTipoPago),
idConsultorio INT REFERENCES DimConsultorio(idConsultorio),
idMedico INT REFERENCES DimMedico(idMedico),
idUsuario INT REFERENCES
DimUsuario(idUsuario), idTiempo INT REFERENCES
DimTiempo(idTiempo), costoCita VARCHAR(45)
);
25
1.6. FASE VI: PROCESO DE EXTRACCIÓN, TRANSFORMACIÓN Y CARGA DE
DATOS.
26
➔ Se seleccionó la DB de destino y se configuró el modo de acceso de datos utilizando
carga rápida de tabla o vista y se selecciono la tabla correspondiente.
27
➔ En “DimPaciente” se agregó “Origen de OLE DB” , “Conversión de datos” y
“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.
28
➔ Se ejecutó la tarea para verificar la conexión.
29
➔ Se ejecutó la tarea para verificar la conexión.
30
1.4 DIMENSIÓN CONSULTORIO
➔ En el flujo de control se añadió la tarea de flujo de datos, denomina
“DIM_CONSULTORIO”.
31
➔ Se ejecutó la tarea para verificar la conexión.
32
➔ En “DIM_TIPOPAGO” se agregó “Origen de OLE DB” , “Conversión de datos” y
“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.
33
➔ Se ejecutó la tarea para verificar la conexión.
34
➔ Se ejecutó la tarea para verificar la conexión.
35
1.6 HECHO_CITAMED
36
➔ Se ejecutó la tarea para verificar la conexión.
37
2. Poblar nuestro Data Mart
38
Al final ejecutamos todo conjuntamente y debe salirnos de la siguiente manera.
➔ DIM_TIEMPO
39
➔ DIM_PACIENTE
➔ DIM_MEDICO
40
➔ DIM_CONSULTORIO
➔ DIM_TIPOPAGO
41
➔ DIM_USUARIO
➔ HECHO_CITAMED
42
1.7. FASE VII: APLICACIÓN DEL USUARIO FINAL
43
44
Creación de Vistas del origen de datos
45
Creación del cubo
46
47
48
Editamos DIM_PACIENTE
48
EDITAMOS DIM_TIPO_PAGO
EDITAMOS DIM_TIEMPO
49
EDITAMOS DIM_USUARIO
EDITAMOS DIM_MEDICO
50
EDITAMOS DIM_USUARIO
PROCESAR DATOS
51
REQUERIMIENTOS
52
- Cantidad de citas por paciente en el año 2022.
53
- Determinar los consultorios más usados en las citas médicas en el año 2023.
- Determinar la forma de pago más usada para las citas médicas en el año 2023.
54