Final Mic FFF
Final Mic FFF
Final Mic FFF
Docente:
Ing. Wildo Sucasaire Monroy
Presentado:
● Huayta Quispe, Carlos
● Castillo Atención, Jhon Carlos
● Condori Maquera, Junior Enrique
● Yancapallo Manuel, Joel Marcos
PUNO - PERÚ
2020
ÍNDICE
Contenido
1. Introducción: .................................................................................................................... 3
2. Título: ................................................................................................................................ 4
4. Objetivos: .......................................................................................................................... 4
5.2.6. Diabetes................................................................................................................... 7
1
6.1.1. Hipótesis general: .................................................................................................. 8
7.6. Índices....................................................................................................................... 11
14,-Bibliografia
15.-Anexos
2
Aplicación de un Modelo Predictivo para la Detección de Pacientes con
de la ciudad de Puno
1. Introducción:
La presente investigación tiene como propósito desarrollar una aplicación de un modelo
predictivo para el diagnóstico de la diabetes, soportado con el método Decisión Tree
Classifier. Este proyecto está definido y aplicado especialmente para el Hospital
Manuel Nuñez Butron de la ciudad de Puno y como también para el contexto peruano,
enfocado directamente a las instituciones prestadoras de servicios de salud tanto
públicas como privadas, esta aplicación se basa en el análisis sintomático del paciente,
identificando aquellos factores que intervienen en el desarrollo y desenlace de la
diabetes tipo 1, con el propósito de brindar al Hospital Manuel Nuñez Butron de la
ciudad de Puno y entidades prestadoras de servicios de salud información que les sea
de utilidad para determinar perfiles de riesgo por cliente, además de ser aplicable
también para mejorar la situación de salud pública en el país al poderse usar como base
para investigaciones científicas a futuro que motiven la concientización del riesgo real
que se tiene de desarrollar la enfermedad. Al mismo tiempo con el fin de brindar un
modelo de trascendencia para la realidad peruana, se desarrolla una investigación sobre
la enfermedad crónica de mayor factor epidemiológico en el Perú, identificándose como
la diabetes y además se identificó que sus causas podían ser identificadas o deducidas
por ser propias de los hábitos diarios. Asimismo, para esta aplicación se desarrolló una
clasificación de árboles de decisiones, además de algunas herramientas de Predictive
Analytics para identificar el mejor soporte al modelo planteado y a la realidad del
Hospital Manuel Nuñez Butron de la ciudad de Puno identificadas como foco.
3
2. Título:
Aplicación de un modelo predictivo para la detección de pacientes con diabetes usando
árboles de decisión en el Hospital Manuel Nuñez Butron de la ciudad de Puno.
3. El problema de investigación:
3.1. Planteamiento del Problema
¿Cómo podría ayudar el método de los árboles de decisiones en la detección de
diabetes en un paciente del Hospital Manuel Nuñez Butron de la ciudad de
Puno?
3.2. Descripción del problema
La diabetes se está convirtiendo rápidamente en la epidemia del siglo XXI y en
un reto de salud global. La Organización Mundial de la Salud indica que, a nivel
mundial, de 1995 a la fecha casi se ha triplicado el número de personas que
viven con diabetes, y es por esta causa que el proyecto a desarrollar trata de
identificar la diabetes de un paciente con la ayuda de los árboles de decisiones
y que por supuesto más adelante se podrá hacer un análisis más profundo de
este proyecto.
3.3. Formulación del problema
En los últimos años, la utilización de técnicas estadísticas en el análisis y
predicción de diabetes en la salud pública ha tomado fuerzas y en este modelo
predictivo se pretende tomar variables como la glucosa, presión sanguínea,
insulina, índice de masa corporal, edad y sexo. Los desenlaces que se pretende
a partir de este modelo es la de predecir la diabetes a partir de los árboles de
decisiones
4. Objetivos:
4.1. Objetivo general:
Elaborar un modelo predictivo que permita pronosticar el diagnóstico de
pacientes con diabetes en el Hospital Manuel Nuñez Butron de la ciudad de
Puno usando árboles de decisión
4.2. Objetivos secundarios:
1: Analizar los principales tipos de enfermedades crónicas y las herramientas
desklearn.tree que permitan la implementación de un modelo predictivo de
enfermedades crónicas para el contexto de instituciones del rubro de salud
públicas y privadas en el Perú.
4
2: Diseñar un modelo predictivo que tenga una precisión de asertividad de más
del 80%.
3: Validar el modelo predictivo a través del juicio de un experto en medicina.
4: Asegurar la continuidad del modelo permitiendo diagnosticar el desarrollo de
la diabetes a través de un modelo dinámico, escalable y de mejora continua.
5. Marco teórico
5.1. Antecedentes de la investigación
Haciendo una revisión de la literatura sobre esta investigación se encontró pocas
referencias directamente relacionadas con el tema de estudio y para aumentar la
relevancia la investigación se hizo uso de estudios indirectamente relacionados, como
por ejemplo hace un énfasis a la clasificación de los árboles de decisión
5.2. Bases teóricas
5.2.1. Árboles de decisión
Los árboles de decisión son modelos predictivos formados por reglas binarias
(si/no) con las que se consigue repartir las observaciones en función de sus
atributos y predecir así el valor de la variable respuesta.
Muchos métodos predictivos generan modelos globales en los que una única
ecuación se aplica a todo el espacio maestral. Cuando el caso de uso implica
múltiples predictores, que interaccionan entre ellos de forma compleja y no
lineal, es muy difícil encontrar un único modelo global que sea capaz de reflejar
la relación entre las variables. Los métodos estadísticos y de machine learning
basados en árboles engloban a un conjunto de técnicas supervisadas no
paramétricas que consiguen segmentar el espacio de los predictores en regiones
simples, dentro de las cuales es más sencillo manejar las interacciones. Es esta
característica la que les proporciona gran parte de su potencial.
6
separados (Elkan, 2013), siendo esto algo cotidiano si se trata de un conjunto de
información proveniente de diversas fuentes. Asimismo, no es inusual que,
según el algoritmo empleado para realizar la predicción, se deba hacer una
transformación de las variables hacia valores discretos o hacia valores binarios
que sean soportados por el algoritmo. Resulta cotidiano tener intervención
humana en esta fase debido a la complejidad de la información con la que se
puede trabajar.
5.2.6. Diabetes
La diabetes mellitus es un grupo de enfermedades metabólicas caracterizadas
por hiperglucemia resultante de defectos de segregación de insulina, la acción
de la insulina o ambos. La hiperglucemia crónica de la diabetes se asocia con
daño a largo plazo, disfunción e insuficiencia de varios órganos, especialmente
los ojos, riñones, nervios, corazón y vasos sanguíneos. La mayoría de
diagnósticos/casos de diabetes se divide en dos categorías etiopatogénicos. En
la diabetes tipo 1, la causa es una deficiencia absoluta de la secreción de
Insulina. En la diabetes tipo 2, mucho más frecuente, la causa es una
combinación de resistencia a la acción de la insulina y una respuesta secretora
inadecuada de la insulina compensatoria. En este tipo de diabetes, se puede
7
presentar un grado de hiperglucemia suficiente para causar cambios patológicos
y funcionales en diferentes tejidos afectados, pero sin síntomas clínicos,
pudiendo estar presente por varios años antes de que se detecte la diabetes.
(Mellitus, 2005).
6. Hipótesis de la investigación
6.1. Definición de la hipótesis
6.1.1. Hipótesis general:
La aplicación del modelo predictivo ayudará positivamente en la
detección de pacientes con diabetes usando árboles de decisión en el
Hospital Manuel Núñez Butrón de Puno
6.1.2. Hipótesis específicas:
● los exámenes que hacen a los pacientes para el diagnóstico de
diabetes no muestran resultados exactos.
● modelo predictivo es una buena alternativa que ayudará en la
detección de pacientes con diabetes
● se espera que el diseño del modelo predictivo tenga una precisión
de asertividad de más del 80%
6.2. Características de la hipótesis
El proyecto tiene como título: “aplicación de un Modelo Predictivo para el
diagnóstico de la Diabetes usando árboles de decisión el cual plantea realizar un
análisis sobre la incidencia de enfermedades crónicas en el Hospital Manuel
Núñez Butrón de Puno.
6.3. Requisitos que deben reunir las hipótesis.
Uno de los principales requisitos que se une a la hipótesis vendría a ser la
Necesidad de la optimización del diagnóstico de la diabetes a través de un
proceso de evaluación de rasgos sintomáticos y hábitos cotidianos empleando
el modelo predictivo con las técnicas de Predictive Analytics.
6.4. Elementos de la hipótesis.
● Enfermedades Crónicas: Las enfermedades crónicas son enfermedades de
larga duración y por lo general de progresión lenta. Las enfermedades cardíacas,
los infartos, el cáncer, las enfermedades respiratorias y la diabetes, son las
8
principales causas de mortalidad en el mundo, siendo responsables del 63% de
las muertes.
● Predictive Analytics: este elemento es parte del modelo predictivo que es un
conjunto de tecnologías de inteligencia de negocios que descubren relaciones y
patrones en largos volúmenes de datos que pueden ser usados para predecir
comportamiento y eventos.
7. Variables e Indicadores
7.1. Definición de las variables
La tarea más tediosa que encontramos es la adquisición y preparación de un
conjunto de datos (variables). Aunque hay una gran cantidad de datos en esta
Área, todavía es difícil encontrar un conjunto de datos adecuado que se adapte
al problema que está tratando de abordar. Si no se encuentran conjuntos de datos
adecuados, se propuso la posibilidad que se debieran crear los suyos propios.
En este tutorial no vamos a crear nuestro propio conjunto de datos, en su lugar,
usaremos un conjunto de datos existente llamado " Pima Indians Diabetes Data
base " proporcionado por el Repositorio de Aprendizaje Automático de la UCI
(famoso repositorio de conjuntos de datos de aprendizaje automático).
Realizaremos el flujo de trabajo de aprendizaje automático con el conjunto de
datos de diabetes proporcionado anteriormente.
7.4. Variables
Variable independiente:
X: enfermedad sobre la diabetes
Variable dependiente:
Y: uso del modelo predictivo
10
7.5. Indicadores
X1: tipos de enfermedades sobre la diabetes
X2: agentes causal
y1: implementación del modelo predictivo soportado por SAP predictive
analytics
y2: diseño y validación del modelo predictivo que permita pronosticar el
diagnóstico de diabetes
7.6. Índices
11
8. Tipo y Diseño de la Investigación
Una vez obtenida la base de datos con los pacientes con diagnóstico de
12
funcionamiento y la eficiencia del método predictivo aplicando los árboles
O1
M r
O2
DONDE:
M = población de estudio.
9. Justificación de la Investigación
Población
La población está constituida por todas las personas que acuden al Hospital
Manuel Nuñez Butron de Puno. Y la muestra de estudio del presente trabajo
es de una cantidad de pacientes que se harán el diagnóstico de diabetes
aplicando este nuevo método predictivo basado en los árboles de decisión.
Muestra
Para nuestra investigación se utilizará la muestra no probabilística, también llamadas
muestras dirigidas, suponen un procedimiento de selección orientado por las
características de la investigación, más que por un criterio estadístico de generalización
(Sampieri & Collado, 1996).
Por otro lado, en la mayoría de los hospitales de Puno y demás departamentos del Perú
no cuentan con suficiente tecnología ni mucho menos programas que faciliten en el
diagnóstico de diabetes y es por eso que en este proyecto ponemos a prueba nuestro
modelo predictivo teniendo resultados positivos.
14
N = 50
Meses (2021)
Actividad
1 2 3 4 5 6 7 8 9 10 11 12
12. Presupuesto
15
Total 3999.00
BIBLIOGRAFIA
https://repositorioacademico.upc.edu.pe/bitstream/handle/10757/624417/Vizcarra_IE.
pdf?sequence=5&isAllowed=y
https://47jaiio.sadio.org.ar/sites/default/files/cais-8.pdf
16
ANEXOS
PLANIFICADOR DE PROYECTOS APLICANDO EL DIAGRAMA DE GANTT
17
DIAGRAMA
18
OBTENCION DE LOS DATOS E IMPLEMENTACION DEL CODIGO EN PYTHON
19
20
21
22
23
24
25