Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Informe Big Data

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 55

FACULTAD DE INGENIERÍA Y ARQUITECTURA

ESCUELA PROFESIONAL DE INGENIERÍA DE SISTEMAS

Business Intelligence para la mejora de decisiones en el área de reserva


de citas médicas en el Hospital Provincial de Cascas

AUTORES

Chigne Navarro Lesly Coraima (orcid.org/0000-0003-4961-5500) Moncada

Castañeda Eduardo Miguel (orcid.org/0000-0002-1957-1626)

ASESOR

Ing. Araujo Vásquez Eduardo Franco (orcid.org/0000-0001-9200-9384)

LÍNEA DE INVESTIGACIÓN

TRUJILLO -
PERÚ 2024-1
ANEXO – 01: METODOLOGÍA DE DESARROLLO RALPH KIMBALL

1. Desarrollo de Metodología Propuesta.

1.1. FASE I: PLANIFICACIÓN DEL PROYECTO.

1.1.1. Propósito.

El propósito del proyecto es desarrollar Data Marts, aplicando la


metodología de Ralph Kimball, que se enfoque en el proceso de
programación de citas médicas en un hospital. Este Data Mart, permitirá
almacenar, organizar y analizar datos específicos relacionados con las citas
médicas. Nuestro objetivo principal es utilizar estos datos para generar
información valiosa y accesible que facilite y apoye la toma de decisiones
dentro del hospital.

1.1.2. Descripción.

● Nombre del establecimiento: Hospital Provincial de Cascas.


● Clasificación: Hospital o Clínica de Atención General.
● Tipo: Establecimiento de Salud con Internamiento.
● Categoría: II-1 y pertenece a la dirección de Salud DISA La Libertad.
● Ubicación: Av. Libertad N.º 249, Cascas, Gran Chimú, La Libertad.

1.1.3. Resultados

● Desarrollo de un Data Mart especializado en la programación de citas


médicas, utilizando la metodología de Ralph Kimball, que se adaptará a
las necesidades específicas del Hospital.
● Optimización del proceso de programación de citas médicas, lo que se
traducirá en una mayor eficiencia operativa y una mejor experiencia
para los pacientes.
● Generación de informes detallados y personalizados basados en los
datos recopilados, proporcionando al hospital información valiosa y
accesible que facilite la toma de decisiones y la planificación.
1.1.4. Actividades.

● Programación de citas médicas. Permite que los pacientes


reserven sus citas para consultas, exámenes o tratamientos.
● Atención médica general: Proporciona servicios médicos de
atención primaria y secundaria para pacientes con diversas afecciones
y
necesidades de salud.
● Emergencias: El hospital está disponible las 24 horas para atender
emergencias médicas, accidentes y situaciones críticas.
● Consultas médicas: Ofrece consultas con médicos especialistas en
diferentes áreas, como pediatría, medicina interna, ginecología, cirugía,
entre otras.
● Laboratorio clínico: Realiza análisis de sangre, orina y otros estudios
para el diagnóstico y seguimiento de enfermedades.
● Imágenes médicas: Dispone de equipos de rayos X, ecografías y otros
métodos de diagnóstico por imágenes.
● Cirugías: Realiza intervenciones quirúrgicas programadas y de
emergencia.
● Farmacia: Proporciona medicamentos recetados a los pacientes.

1.1.5. Definir el ámbito del negocio.

1.1.5.1. Visión

“Ser un referente en la atención integral de la salud en la provincia de


Gran Chimú, destacándose por su calidad, eficiencia y compromiso con la
comunidad. Buscamos ser reconocidos como un centro de excelencia en la
prestación de servicios médicos y promoción de la salud”.

1.1.5.2. Antecedente Tecnológico.

Según Yanayaco, k. (2023) en su trabajo titulado “Business


Intelligence basado en la metodología Ralph Kimball para mejorar la
efectividad de la unidad de estadística del Hospital Regional Daniel
Alcides Carrión Pasco, 2023.” Estudia cómo la inteligencia de negocios
puede mejorar la eficiencia en un hospital. El estudio utiliza un diseño
pre-experimental para medir el impacto de la implementación de un
sistema de BI. Los resultados muestran una significativa reducción en el
tiempo de generación de reportes, pasando de 3,703 segundos a 190
segundos, indicando una notable mejora en la efectividad y en la cantidad
de reportes generados por semana.

La investigación concluye que el uso de la metodología Ralph Kimball


para estructurar y gestionar datos es fundamental para mejorar la toma de
decisiones, brindando información confiable y segura a las áreas que la
necesitan. Esto demuestra que las soluciones de BI pueden tener un
impacto positivo en la operación y en la calidad del servicio en entornos
hospitalarios, ayudando a optimizar procesos y permitiendo respuestas
más rápidas y eficaces a las demandas de información.

Según Tingo, E. (2022) en su trabajo titulado "Implementación de


una Solución de Business Intelligence para la Toma de Decisiones en el
Servicio de Consulta Externa de un Hospital", enfatiza la importancia de
BI para mejorar la toma de decisiones en un hospital.

La problemática consistía en que el servicio de consulta externa,


responsable de atender a 500,000 asegurados de Essalud, sufría de
demoras e inconsistencias en sus informes. Los datos para informes
médicos y de tratamiento, extraídos mediante SQL-Server y otras
herramientas, requerían procesos adicionales, lo que generaba un flujo de
trabajo lento y dificulta el acceso a información confiable para la toma de
decisiones

Ante ello, se implementó una solución de BI basada en la metodología de


Ralph Kimball, utilizando herramientas como SQL Server Enterprise 2016
para procesos ETL (Extracción, Transformación y Carga), y Reporting
Services, Power BI y Excel para facilitar la generación de reportes. Esto
permitió una mejor gestión de citas médicas y redujo el tiempo de
diferimiento, optimizando el proceso de toma de decisiones y la eficiencia
general del servicio de consulta externa, además de ofrecer información
centralizada y confiable a los diversos usuarios que dependían de ella.
1.1.5.3. Analizar los escenarios problemas.

Escenario 1: Integridad y Accesibilidad de Datos

● Problema: Inconsistencias, datos dispersos y falta de datos pueden


afectar la calidad y disponibilidad de datos en el Data Mart.
● Impacto: Datos de mala calidad provocan informes incorrectos,
errores en la toma de decisiones y tiempo adicional para corregirlos.
● Señal de Problema: Dificultades para obtener datos precisos y
confiables, alto porcentaje de datos faltantes o duplicados.

Escenario 2: Seguridad y Confidencialidad de Datos

● Problema: El Data Mart puede ser vulnerable a problemas de


seguridad, poniendo en riesgo datos confidenciales de pacientes.
● Impacto: Multas legales, pérdida de confianza de pacientes y daño
a la reputación del hospital.
● Señal de Problema: Acceso no autorizado, registros médicos
expuestos y datos sensibles sin cifrar.

Escenario 3: Integración con Sistemas Existentes

● Problema: El Data Mart puede enfrentar problemas de integración


con otros sistemas hospitalarios, lo que puede llevar a errores o
incompatibilidades.
● Impacto: Retrasos en el proyecto, aumento de costos y dificultades
para recopilar datos.
● Señal de Problema: Fallos en la comunicación entre sistemas,
diferencias en formatos de datos, dificultad para extraer datos.

1.1.5.4. Descripción general del Sistema de Toma de Decisiones.

El sistema de toma de decisiones para el Hospital Provincial de Cascas


busca optimizar el proceso de programación de citas médicas mediante la
implementación de un Data Mart especializado. Este sistema está diseñado
para centralizar datos específicos relacionados con la programación
de
citas, permitiendo un análisis más profundo y, por ende, una toma de
decisiones informada y eficiente.

Los componentes clave del sistema incluyen:

● Data Mart especializado: Almacena información detallada sobre la


programación de citas médicas, como horarios de médicos, cantidad
de citas por paciente, distribución de consultorios y métodos de pago
para las citas. Su función es organizar y proporcionar datos
específicos para el análisis.

● Procesos ETL (Extracción, Transformación y Carga): Estos


procesos son esenciales para recoger datos de diversas fuentes,
transformarlos para asegurar coherencia y calidad, y luego cargarlos
en el Data Mart. Garantizan que el sistema tenga datos precisos y
consistentes, creando una base confiable para el análisis y la toma de
decisiones.

● Herramientas de Business Intelligence (BI): El sistema utiliza


herramientas como SQL Server Enterprise 2016 para procesos ETL,
además de Reporting Services, Power BI y Excel, para facilitar la
creación de informes, gráficos y otros elementos visuales.

1.1.5.5. Realizar Cronograma de Trabajo.


1.2. FASE II: DEFINICIÓN DE REQUERIMIENTOS.

1.2.1. Requerimientos del propietario

A continuación, responderemos a algunas preguntas que pueden surgir entre los


empleados de la empresa en estudio:

● ¿Por qué es importante crear un DataMart y qué beneficios ofrece?

La creación de un DataMart tiene como objetivo principal extraer datos


de una fuente específica, con un enfoque en un área funcional
determinada, lo que brinda múltiples ventajas.

● ¿Cómo afecta esta acción a la empresa?

Esta iniciativa tiene un impacto positivo al proporcionar información


debidamente procesada, lo que mejora significativamente la calidad de
los informes generados.

1.2.2. Requerimientos del Usuario Final

◻ Requerimientos Funcionales

- Determinar la cantidad de citas médicas de los médicos en el


2024.
- Cantidad de citas por paciente en el año 2022.
- Cantidad de citas por usuario en el año 2023.
- Determinar los consultorios más usados en las citas médicas en el
año 2023.
- Determinar la forma de pago más usada para las citas médicas en
el año 2023.

◻ Requerimientos No Funcionales

- Implementara seguridad en configuración del DataMart.


- El Data Mart fue creado en Sql Server 2022 y para desarrollar el
proceso de traspaso de datos y su transformación usaremos ETL.
- Se usó un programa para presentar reportes para toma de
decisiones.
1.2.3. Análisis de los

Requerimientos Requerimiento

Funcional

Funcional 01. Determinar la cantidad de citas médicas de los médicos en el


2024.

Funcional 02. Cantidad de citas por paciente en el año 2022.


Funcional 03.Cantidad de citas por usuario en el año 2023.

Funcional 04.Determinar los consultorios más usados en las citas médicas


en el año 2023.

Funcional 05. Determinar la forma de pago más usada para las citas
médicas en el año 2023.
1.3. FASE III: DISEÑO TÉCNICO DE LA ARQUITECTURA

1.3.1. Modelo Starnet


1.3.2. Nivel de Datos
1.3.3. Nivel Técnico

1.4. FASE IV: MODELADO DIMENSIONAL

1.4.1. Identificación de los componentes del modelo

1. Elección del Data Mart

a) Listado de los Data mart

● Data Mart para el área de reserva de citas médicas:


Enfocado en mejorar la gestión de citas y facilitar la toma
de decisiones.

b) Listado de las Dimensiones

● DimPaciente
● DimTipoPago
● DimConsultorio
● DimMedico
● DimUsuario
● DimTiempo

c) Marcado de las Intersecciones

Dimensiones CitaMedica

DimPaciente X

DimTipoPago X
DimConsultorio X

DimMedico X

DimUsuario X

DimTiempo X

2. Elección de los objetivos de la tabla de Hechos

Tabla de Hechos Objetivo

Almacenar y proporcionar
registros detallados de las citas
CitaMedica médicas realizadas para facilitar
el análisis, seguimiento y toma
de decisiones.

3. Elección de las dimensiones

Dimensiones

DimPaciente
DimTipoPago
DimConsultorio
DimMedico
DimUsuario
DimTiempo

4. Elección de los hechos

Hecho
Tabla de Hechos
CitaMedica

1.4.2. Diagrama de la Tabla de Hechos

Tabla Hecho con sus dimensiones y su respectiva conexión.


◻ Detalle de la Tabla de Hechos

Nombre de la Nombre de las Descripción de las columnas


tabla columnas

estado Describe el estado de la cita médica.

fecha Representa la fecha en la que se realizó


la cita médica.

idPaciente Hace referencia a la clave primaria de la


tabla DimPaciente

idTipoPago Hace referencia a la clave primaria de la


HechoCitaMedica tabla DimTipoPago

idConsultorio Hace referencia a la clave primaria de la


tabla DimConsultorio.

idMedico Hace referencia a la clave primaria de la


tabla DimMedico

idUsuario Hace referencia a la clave primaria de la


tabla DimUsuario

idTiempo Hace referencia a la clave primaria de la


tabla DimTiempo

costoCita Indica el costo asociado a la cita médica


realizada.
◻ Valores de la Tabla de Hechos

Columnas Tipo de dato Valores Null Longitud

estado varchar no 45

fecha date no -

idPaciente int no 4

idTipoPago int no 4

idConsultorio int no 4

idMedico int no 4

idUsuario int no 4

idTiempo int no 4

costoCita varchar no 45

1.4.3. Dimensiones

➔ DimPaciente

Atributos Descripción Valores de muestra

idPaciente Identificador único para cada paciente. 11

nombres Representa los nombres de los pacientes Alejandro

apellidos Representa los apellidos del paciente. Moreno

dni Representa el dni del paciente. 23781459

edad Representa la edad del paciente. 20

correo Representa el correo electrónico del paciente. alejandro@gmail.com

celular Representa el número de celular del paciente. 910987654


➔ DimTipoPago

Atributo Descripción Valores de muestra

idTipoPago Representa un identificador único para cada 4


tipo de pago.

formapago Representa el tipo de pago aceptado para Efectivo


las citas médicas.

➔ DimConsultorio

Atributo Descripción Valores de muestra

idConsultorio Representa un identificador único para 9


cada consultorio.

numcon Representa el número de consultorio del 9


médico.

➔ DimMedico

Atributo Descripción Valores de muestra

idMedico Representa un identificador único para cada 5


médico.

nombresm Representa los nombres del médico. Carlos

apellidosm Representa los apellidos del médico. Rodríguez García

dnim Representa el Dni del médico. 01234565

celular Representa el número de celular del 956789012


médico.

correom Representa el correo electrónico del carlos_r@example.com


médico.

➔ DimUsuario

Atributo Descripción Valores de muestra

idUsuario Representa un identificador único para cada 2


usuario.
usuario Representa al usuario que registra la cita jlopezlo
médica.

estado Representa el estado del usuario. activo

nombres Representa el nombre del usuario. Juan

apellidos Representa el apellido del usuario. Lopez Lopez

dni Representa el dni del usuario. 87654321

celular Representa el celular del usuario. 912345678

➔ DimTiempo

Atributo Descripción Valores de muestra

idTiempo Representa un identificador único para el 2001


tiempo.

fecha Representa la fecha de la cita médica. 2022-02-16

anio Representa el año de la cita médica. 2022

trimestre Representa el trimestre en el que se 1


programó la cita.

mes Representa el mes de la cita. 2

dia Representa el día de la cita. 16


1.4.4. Esquema Estrella
1.5. FASE V: DISEÑO FÍSICO

Tabla N° 23: Diseño Lógico y Físico.

DISEÑO LÓGICO DISEÑO FÍSICO

Tabla de Hechos Cita Médicas HechoCitaMedica

Dimensión Paciente DimPaciente

Dimensión Tipo Pago DimTipoPago

Dimensión Consultorio DimConsultorio

Dimensión Medico DimMedico

Dimension Usuario DimUsuario

Dimensión Tiempo DimTiempo

Dimensiones en el SQL server con sus respectivos atributos:

➔ DimPaciente

Atributos Tipo de dato Valores Null Longitud

idPaciente int no 45

nombres varchar no 45

apellidos varchar no 45

dni varchar no 45

edad int no 4

correo varchar no 45

celular char no 9
➔ DimTipoPago

Atributos Tipo de dato Valores Null Longitud

idTipoPago int no 4

formaPago varchar no 45

➔ DimConsultorio

Atributos Tipo de dato Valores Null Longitud

idConsultorio int no 4

numcon varchar no 45

➔ DimMedico

Atributos Tipo de dato Valores Null Longitud

idMedico varchar no 45

nombresm varchar no 45

apellidosm varchar no 45

dnim varchar no 45

celular varchar no 9

correom varchar no 45

➔ DimUsuario

Atributos Tipo de dato Valores Null Longitud

idusuario int no 4

usuario varchar no 45

estado varchar no 45

nombres varchar no 45

apellidos varchar no 45

dni varchar no 45
celular char no 9

➔ DimTiempo

Atributos Tipo de dato Valores Null Longitud

idTiempo int no 4

fecha date no -

anio int no 4

trimestre int no 4

mes int no 4

día int no 4
MODELO ESTRELLA DEL DATA MART

Construcción de las tablas y la base de datos en SQL

create database DBhospitalDM;


use DBhospitalDM;
GO

-- Creación de la tabla DimTiempo


CREATE TABLE DimTiempo
( idTiempo int primary key
identity(1,1), fecha DATE,
anio int,
trimestre
int, mes int,
dia int
);

-- Creación de la tabla DimPaciente


CREATE TABLE DimPaciente (
idPaciente int primary key identity(1,1),
nombres VARCHAR(45),
apellidos VARCHAR(45),
dni VARCHAR(45),
edad int,
correo VARCHAR(100),
celular CHAR(9),
);

-- Creación de la tabla DimMedico


CREATE TABLE DimMedico
( idMedico int primary key
identity(1,1), nombresm
VARCHAR(45),

22
apellidosm VARCHAR(45),
dnim VARCHAR(45),
celular CHAR(9),
correom VARCHAR(45),
);

-- Creación de la tabla DimConsultorio


CREATE TABLE DimConsultorio
( idConsultorio int primary key
identity(1,1), numcon VARCHAR(45)
);

-- Creación de la tabla DimTipoPago


CREATE TABLE DimTipoPago
( idTipoPago int primary key identity(1,1),
formapago VARCHAR(45)
);

-- Creación de la tabla DimUsuario


CREATE TABLE DimUsuario
( idUsuario int primary key
identity(1,1), usuario VARCHAR(45),
estado VARCHAR(45),
nombres
VARCHAR(45),
apellidos
VARCHAR(45), dni
VARCHAR(45),
celular CHAR(9)
);

-- Creación de la tabla HechoCitaMedica


CREATE TABLE HechoCitaMedica (
estado VARCHAR(45),
23
fecha DATE,

24
idPaciente INT REFERENCES DimPaciente(idPaciente),
idTipoPago INT REFERENCES DimTipoPago(idTipoPago),
idConsultorio INT REFERENCES DimConsultorio(idConsultorio),
idMedico INT REFERENCES DimMedico(idMedico),
idUsuario INT REFERENCES
DimUsuario(idUsuario), idTiempo INT REFERENCES
DimTiempo(idTiempo), costoCita VARCHAR(45)
);

25
1.6. FASE VI: PROCESO DE EXTRACCIÓN, TRANSFORMACIÓN Y CARGA DE
DATOS.

1. Creación de los Paquetes de Servicio de Transformación de Datos

1.1 DIMENSIÓN TIEMPO


En el flujo de control se añadieron las tareas de flujo de datos, la primera se denomina
“DimTiempo”.

➔ Se seleccionó la DB transaccional y se configuró el modo de acceso de


datos utilizando comando SQL.

26
➔ Se seleccionó la DB de destino y se configuró el modo de acceso de datos utilizando
carga rápida de tabla o vista y se selecciono la tabla correspondiente.

➔ Se ejecutó la tarea para verificar la conexión.

1.2 DIMENSIÓN PACIENTE

➔ En el flujo de control se añadió la tarea de flujo de datos, denomina “DimPaciente”.

27
➔ En “DimPaciente” se agregó “Origen de OLE DB” , “Conversión de datos” y
“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.

28
➔ Se ejecutó la tarea para verificar la conexión.

1.3 DIMENSIÓN MEDICO


➔ En el flujo de control se añadió la tarea de flujo de datos, denomina “DimMedico”.

➔ En “DimMedico” se agregó “Origen de OLE DB” , “Conversión de datos” y


“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.

29
➔ Se ejecutó la tarea para verificar la conexión.

30
1.4 DIMENSIÓN CONSULTORIO
➔ En el flujo de control se añadió la tarea de flujo de datos, denomina
“DIM_CONSULTORIO”.

➔ En “DIM_CONSULTORIO” se agregó “Origen de OLE DB” , “Conversión de datos”


y “Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.

31
➔ Se ejecutó la tarea para verificar la conexión.

1.5 DIMENSIÓN TIPO PAGO

➔ En el flujo de control se añadió la tarea de flujo de datos, denomina


“Dim_TIPOPAGO”.

32
➔ En “DIM_TIPOPAGO” se agregó “Origen de OLE DB” , “Conversión de datos” y
“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.

33
➔ Se ejecutó la tarea para verificar la conexión.

1.6 DIMENSIÓN USUARIO

➔ En el flujo de control se añadió la tarea de flujo de datos, denomina


“DIM_USUARIO”.

➔ En “DIM_USUARIO” se agregó “Origen de OLE DB” , “Conversión de datos” y


“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.

34
➔ Se ejecutó la tarea para verificar la conexión.

35
1.6 HECHO_CITAMED

➔ En el flujo de control se añadió la tarea de flujo de datos, denomina


“HECHO_CITAMED”.

➔ En “HECHO_CITAMED” se agregó “Origen de OLE DB” , “Conversión de datos” y


“Destino de OLE DB” se realizaron las conexión y se procedió a su configuración.

36
➔ Se ejecutó la tarea para verificar la conexión.

37
2. Poblar nuestro Data Mart

POBLAMIENTO DEL DATA MART

Para limpiar se agregó “Tarea Ejecutar Sql” en la cual se asignó la DB de destino y su


respectiva consulta.

38
Al final ejecutamos todo conjuntamente y debe salirnos de la siguiente manera.

➔ DIM_TIEMPO

39
➔ DIM_PACIENTE

➔ DIM_MEDICO

40
➔ DIM_CONSULTORIO

➔ DIM_TIPOPAGO

41
➔ DIM_USUARIO

➔ HECHO_CITAMED

42
1.7. FASE VII: APLICACIÓN DEL USUARIO FINAL

✔ Estructura del cubo.

Creacion de origen de datos

43
44
Creación de Vistas del origen de datos

45
Creación del cubo

46
47
48
Editamos DIM_PACIENTE

48
EDITAMOS DIM_TIPO_PAGO

EDITAMOS DIM_TIEMPO

49
EDITAMOS DIM_USUARIO

EDITAMOS DIM_MEDICO

50
EDITAMOS DIM_USUARIO

PROCESAR DATOS

51
REQUERIMIENTOS

- Determinar la cantidad de citas médicas de los médicos en el 2024.

52
- Cantidad de citas por paciente en el año 2022.

- Cantidad de citas por usuario en el año 2023.

53
- Determinar los consultorios más usados en las citas médicas en el año 2023.

- Determinar la forma de pago más usada para las citas médicas en el año 2023.

54

También podría gustarte