1 Bioestadistica KDJKFDF
1 Bioestadistica KDJKFDF
1 Bioestadistica KDJKFDF
2015
Contenidos:
I.- INTRODUCCIÓN
VII.- BIBLIOGRAFÍA
I.- INTRODUCCIÓN
La bioestadística es una rama de la estadística que se ocupa de los problemas planteados dentro de
las ciencias de la vida, como la biología, la medicina, entre otros, aquellos procedimientos propios de
la estadística tradicional. Desde esa perspectiva este tipo de conocimiento es una aplicación práctica
de aquellos postulados, ya conocidos, de recolección de datos e inferencia futura. En este contexto,
la bioestadística tiene una estrecha relación con el método científico, conjunto de procedimientos
que se realizan con el fin de asegurar un aumento o mejora del conocimiento, de modo sistemático y
coherente.
La estadística es una ciencia destinada a la recolección y análisis de datos de modo eficiente con el
fin de lograr resultados significativos y, a partir de ellos, lograr interpretaciones que permitan
obtener explicaciones verosímiles y fundamentadas. Las estadísticas son de gran importancia a la
hora de definir planes de acción, tomar decisiones y tener un panorama claro del contexto en que se
opera. Sus orígenes se remontan al siglo XVII lo que implica un recorrido suficientemente largo
como para garantizar un desarrollo significativo. En la actualidad tiene aplicación en variados ámbitos
y, con el desarrollo de la informática, ha alcanzado mayor eficacia y sencillez ya que le permite
realizar cálculos complejos y de análisis de manera más fácil y rápida.
Cuando esta disciplina se combina con ciencias de la vida se logra una colección sistematizada de
datos, un ordenamiento y, finalmente, una interpretación de los mismos que es útil a la hora de
elaborar o contrastar diversas hipótesis de trabajo. En este sentido la bioestadística tiene, como fin
último, transformar la realidad partiendo de los datos que la misma suministra para elaborar un
campo de acción en función de un diagnóstico o modelo inferido.
Registrar datos obtenidos de estudios relacionados con la biología y las ciencias relacionadas
con ella y, a partir de ellos, inferir, predecir o asociar estos datos con fenómenos que afecten
a los individuos o las poblaciones.
También se preocupa de establecer algunas características que pueden presentar los datos
registrados como, por ejemplo, cuál es el dato u observación que más se registra, entre qué
valores se registran los datos, cuál es el promedio aritmético de los datos, etc.
También se refiere a a los métodos utilizados para obtener los datos, la forma de
organizarlos, analizarlos y hacer inferencias o predicciones a partir de ellos.
Lo anterior implica que el cconocimiento de la Estadística es esencial para personas que hacen
investigación, dirigen estudios o deben hacer una presentación efectiva, ya que ayuda a discriminar
entre hechos y suposiciones de la vida diaria o saber cuándo se debe consultar a un estadístico para
estos fines
Escala de medida. Una escala de medida es el conjunto de valores que puede tomar una determinada
medida. Las escalas de medidas pueden ser:
Categóricas: nominales u ordinales.
Las escalas categóricas sólo asignan una categoría o clasifican el fenómeno o propiedad que se mide.
Pueden ser nominales u ordinales Los valores de una escala ordinal tienen un orden natural. La
escala nominal clasifica los objetos o fenómenos según ciertas características, tipologías o nombres,
dándoles una denominación o símbolo sin que implique ninguna relación de orden, distancia o
proporción entre los objetos o fenómenos.
Las escalas numéricas asignan números. Si la escala tiene un cero absoluto la escala es de razón, si el
cero es arbitrario la escala es de intervalo. La escala de intervalo representa un nivel de medición más
preciso, matemáticamente hablando, que las anteriores: no sólo se establece un orden en las
posiciones relativas de los objetos o individuos, sino que se mide también la distancia entre los
intervalos o las diferentes categorías o clases. Una escala de intervalo se caracteriza por una unidad
de medida común y constante que asigna un número real a todos los pares de objetos en un
conjunto ordenado. En esta clase de medida la proporción de dos intervalos cualquiera es
independiente de la unidad de medida y del punto cero. En una escala de intervalo, el punto cero y la
unidad de medida son arbitrarios.
Si tomamos una persona como ejemplo, cuando determinamos el color de sus ojos se está midiendo
en una escala categórica nominal, mientras su fecha de nacimiento se mide en una escala categórica
ordinal. Su temperatura corporal en grados centígrados se mide en una escala numérica de intervalos.
Su estatura, en una escala numérica de razón. En esta escala tiene sentido decir que una persona mide
la mitad que otra.
Población. Es el conjunto de todos los valores de un fenómeno o propiedad que se quiera observar.
Muestra. Es la parte de la población que se mide de manera efectiva, con el objeto de obtener
información acerca de toda la población. Es un conjunto de medidas u observaciones tomadas a
partir de una población determinada. La selección de la muestra se hace por un procedimiento que
asegure un alto grado de representatividad de la población.
Censo. Es el proceso de observar la población completa. Es decir, tomar una muestra igual a la
población.
Variable estadística. Es cada una de las características o cualidades que poseen los individuos de una
población.
1.-Variables Cualitativas: se refieren a características o cualidades que no pueden ser medidas con
números.
a.- Variable cualitativa nominal: una variable cualitativa nominal presenta modalidades no numéricas
que no admiten un criterio de orden.
Ejemplo: el estado civil de una persona; soltero, casado, separado, divorciado y viudo.
b.-Variable cualitativa ordinal: una variable cualitativa ordinal presenta modalidades no numéricas, en
las que existe un orden.
2.- Variable cuantitativa: una variable cuantitativa es la que se expresa mediante un número y, por
tanto, se puede realizar operaciones aritméticas con ella. Es posible distinguir dos tipos:
a.- Variable discreta: una variable discreta es aquella que toma valores aislados, es decir que no
admite valores intermedios entre dos valores específicos.
b.- Variable continua: es aquella que puede tomar valores comprendidos entre dos números.
La muestra es el conjunto menor de individuos de una población determinada. La muestra debe ser
representativa de la población y con ello se quiere decir que cualquier individuo de la población, en
estudio, debe haber tenido la misma probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas se puede
señalar:
1. Ahorrar tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.
2. Ahorro de recursos: para ello se debe estudiar menos individuos.
3. Cuando las poblaciones son muy grandes, estudiar la totalidad de los individuos con una
característica determinada puede ser una tarea inaccesible o imposible de realizar.
4. Aumentar la calidad. Al disponer de más tiempo y recursos las observaciones y mediciones
realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las
tuviésemos que realizar a una población.
5. La selección de muestras específicas permite reducir la heterogeneidad de una población al
indicar los criterios de inclusión y/o exclusión.
OBSERVACION: para variables numéricas en las que puede haber un gran número de valores
observados distintos se opta por un método de análisis diferente, respondiendo a las siguientes
preguntas:
Cuando los datos recolectados han sido organizados en una tabla de distribución de frecuencias
simples, la media para poblaciones y para muestras se puede calcular por gracias a la fórmula:
media o promedio = x.
suma de las frecuencias por f x∑ su correspondiente dato no minal.
n = suma de todas las frecuencias (número de datos recolectados).
En otras palabras, la media es la medida que se obtiene al dividir la suma de todos los valores de una
variable por la frecuencia total. En palabras más simples, corresponde a la suma de un conjunto de
datos dividida por el número total de dichos datos.
Ejemplo
Mediante los siguientes datos hallar la media aritmética de los siguientes datos numéricos de
frecuencia simple: 10, 8, 6, 5, 10, 7
Solución
Cuando los datos recolectados han sido organizados en una tabla de frecuencias por intervalos, la
media para poblaciones y para muestras se puede calcular gracias a la fórmula:
x = media
x = punto medio del intervalo
∑fx = suma de las frecuencias por su correspondiente dato nominal
N = suma de todas las frecuencias (número de datos recolectados). .
Ejemplo:
La mediana es la medida de tendencia central que se define como aquel valor nominal que tiene,
dentro de un conjunto de datos ordenados, arriba y abajo de él, el mismo número de datos
nominales. En otras palabras, es el dato que está a la mitad y que divide en dos partes iguales a un
conjunto de datos. Es la observación equidistante de los extremos. Según el número de valores que
se tengan se pueden presentar dos casos:
EJEMPLO:
Hallar la mediana en los siguientes datos: 15, 25, 30, 28, 21, 226, 32
SOLUCIÓN:
12,15,25,26,28,30,32 . Mediana = 26
EJEMPLO:
El cinco remarcado en rojo y subrayado es el que está en mitad del conjunto ordenado, ya que antes
de él existen 9 datos y 9 después de él.
EJEMPLO:
ai es la amplitud de la clase.
c.- Moda: Mo
La moda es el valor que tiene la mayor frecuencia absoluta.Se representa por Mo. .Se puede hallar la
moda para variables cualitativas y cuantitativas.
Si en un grupo hay dos o más puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la
distribución es bimodal o multimodal, es decir, tiene varias modas.
Ejemplo: 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9 Mo= 1, 5, 9
En el caso de que todas las puntuaciones de un grupo tengan la misma frecuencia, no hay moda.
Ejemplo: 2, 2, 3, 3, 6, 6, 9, 9
Si dos puntuaciones adyacentes tienen la frecuencia máxima la moda es el promedio de las dos
puntuaciones adyacentes, dispuestas ordenadamente.
0, 1, 3, 3, 5, 5, 7, 8 Mo = 4
Así como las medidas de tendencia central nos permiten identificar el punto central de los datos, las
medidas de dispersión nos permiten reconocer cuánto se dispersan los datos alrededor del punto
central: es decir, nos indican cuánto se desvían las observaciones alrededor de su promedio
aritmético (media).
Este tipo de medidas son parámetros informativos que nos permiten conocer cómo los valores de los
datos se reparten a través de eje X, mediante un valor numérico que representa su promedio de
dispersión. Las medidas de dispersión más importantes y utilizadas son la varianza y la desviación
estándar (o típica).
a.-Varianza
Cabe destacar que las medidas de dispersión (también identificadas con el nombre de medidas de
variabilidad) se encargan de expresar la variabilidad de una distribución mediante un número, en los
casos en que las diferentes puntuaciones de la variable estén muy alejadas de la media. A mayor
valor de la medida de dispersión, mayor variabilidad. En cambio, a menor valor, más homogeneidad.
Uno de los conceptos más importantes relacionados con la varianza es la desviación estándar,
también conocida como típica, que representa la magnitud de la dispersión de variables de intervalo
y de razón, y resulta muy útil en el campo de la estadística descriptiva. Para obtenerla, simplemente
se comienza desde la varianza y se calcula su raíz cuadrada.
Si tenemos, por ejemplo, los valores (expresados en milímetros) 14 mm, 11 mm, 10 mm, 6 mm y 4
mm, podemos calcular su promedio sumándolos y dividiendo el resultado por 5, que es la cantidad
de elementos. Obtendríamos 9 mm, que es la media aritmética. Para conocer la varianza restamos
cada valor a la media recién calculada y elevamos cada resultado al cuadrado (para evitar números
negativos que afecten el estudio), sumándolos entre sí y se dividiendo por 5, que es el número de
datos. La varianza es 93,8 milímetros cuadrados. Por último, para obtener la desviación estándar,
calculamos la raíz cuadrada lo que nos deja con 9.68 mm (nótese que la unidad vuelve a ser
milímetros).
VI.-MEDIDAS DE FRECUENCIA, DE ASOCIACIÓN E IMPACTO
Este tipo de medidas se usa en Salud Publica, especialmente en Epidemiologia, y sirven para:
Es el cociente con que el numerador está incluido en el denominador. Es decir, el cociente entre el
número de casos y el total de la población.
Por ejemplo, si en una población de 25.000 habitantes se diagnostican 1.500 pacientes con diabetes,
la proporción de diabetes en la población es de 1.500/25.000 = 0.06. El valor de una proporción
puede variar de 0 a 1. Si multiplicamos este valor por 100 obtenemos el tanto por ciento: en este
caso sería, el 6%
a.- 2.-RAZÓN
El concepto de “tasa” es similar al de una proporción, con la diferencia de que las tasas llevan
incorporado el concepto de tiempo. El numerador lo constituye la frecuencia absoluta de casos del
problema a estudiar. A su vez, el denominador está constituido por la suma de períodos individuales
de riesgo a los que han estado expuestos los sujetos susceptibles de la población en estudio. De su
cálculo se desprende la velocidad con que se produce el cambio de una situación clínica a otra.
La prevalencia (P) mide la proporción de individuos de una población que padecen una enfermedad
en un momento o periodo de tiempo determinado. Para su cálculo se usa la fórmula:
Ejemplo: en una población de 240 adultos mayores se encontró que 80 de ellos eran obesos. La
prevalencia de obesidad en ese grupo, será:
Como toda proporción, la prevalencia no tiene dimensión y sus valores fluctúan entre 0 y 1. Se
puede expresar en porcentaje, en tanto por ciento, tanto por mil, etc., según el tamaño del número
de casos y las poblaciones. La prevalencia de un problema de salud, en una comunidad, suele
medirse a partir de estudios transversales para determinar su importancia, en un momento concreto,
y no puede utilizarse con fines predictivos.
a.-5.-INCIDENCIA
La incidencia se define como el número de casos nuevos de una enfermedad o evento, que se
desarrolla en una población durante un período de tiempo determinado. Hay dos tipos de medidas
de incidencia: la incidencia acumulada y la tasa de incidencia o densidad de incidencia.
EJEMPLO: el año 2010 se tomó un grupo de 400 individuos, entre 40 y 59 años, con niveles de
colesterol normal. Durante el año 2015, en este grupo se habían presentado 10 casos de cardiopatía
isquémica producto del aumento en los niveles de colesterol. La IA, este caso, sería:
Representa la frecuencia con la que se presentan nuevos casos, en una población. El valor se obtiene
dividiendo el número de los nuevos casos, ocurridos en un período definido, por la población en
riesgo en el mismo período: a veces se expresa como personas/tiempo. La tasa de incidencia más
habitual, en la práctica de la salud pública, es la obtenida mediante la siguiente fórmula:
En una población dinámica, el denominador incluye el tamaño medio de la misma (que suele ser el
valor calculado de población en la mitad del periodo). Si el periodo es de un año el resultado es la
llamada tasa de incidencia anual, y así sucesivamente. Esta tasa representa un cálculo de la tasa de
incidencia por persona-tiempo, es decir: la tasa por cada 10 npersonas-años, decenios, etc. Si la tasa
es baja, tal y como ocurre con muchas enfermedades crónicas, puede servir al cálculo de la tasa de
incidencia acumulativa.
De lo anterior se deduce que la prevalencia no es útil para confirmar hipótesis etiológicas, por lo que
resulta más adecuado trabajar con casos incidentes. Los estudios de prevalencia pueden obtener
asociaciones que reflejen los determinantes de la supervivencia y no las causas de la misma,
conduciendo a conclusiones erróneas. Sin embargo, su relación con la incidencia en ocasiones
permite que se pueda utilizar como una buena aproximación del riesgo para evaluar la asociación
entre causas y enfermedad.
El razonamiento causal es complemento indispensable del análisis estadístico de una relación entre
dos o más fenómenos. La explicación etiológica de una enfermedad es, en la mayoría de los casos un
proceso largo, progresivo y a menudo sin posibilidad de prueba final por ensayo, generalmente por
razones éticas. Una asociación causal, en epidemiología, es seguida por el estudio de riesgo; el riesgo
y su cuantificación es la medida e indicador de la asociación que se está analizando.
Son medidas que se usan para evaluar la asociación entre un evento y un factor de estudio, por
ejemplo: mutación de un gen (factor) y una enfermedad (evento); tratamiento (factor) y curación
(evento).
Establecer si existe una asociación causal entre un factor de riesgo y una enfermedad o
evento.
Establecer la dirección de esta asociación.
Establecer la magnitud de la asociación.
Ejemplos de medidas de asociación son:
b.-1.-Tablas de contingencia
Las tablas de contingencia, también denominadas tetracóricas o de doble entrada, se emplean para
registrar y analizar la asociación entre dos o más variables, generalmente de carácter cualitativa
(nominales u ordinales).
En general, el interés al utilizar este tipo de tablas al ordenar los datos se centra en estudiar si existe
alguna asociación entre una variable fila y otra variable columna, y/o partir de allí calcular la
intensidad de dicha asociación.
Casos controles
Expuestos A b a+b
No expuestos C d c+d
a+c b+c a+b+c+d
b.-2.-Riesgo
Ejemplo: durante un paseo de fin de año una delegación de 120 niños visitó un balneario y, después
de bañarse en la piscina del lugar, 80 de ellos presentó irritación ocular. ¿Cuál es el riesgo al que se
expusieron los niños que hicieron uso de la piscina?
R = 80/120 = 0,66
Este valor no tiene unidad y sólo representa la probabilidad que tiene cada niño de sufrir irritación
ocular. También se denomina “riesgo individual”.
Se le denomina también razón de incidencia acumulada, o bien razón entre dos riesgos. Compara la
frecuencia en que sucede el daño entre los que tienen el factor de riesgo y los que no lo tienen.
Responde a la pregunta: ¿cuántas veces es mayor el riesgo en las personas expuestas a un factor de
riesgo que en las no expuestas al mismo? Para su análisis se utiliza la tabla de contingencia, o tabla
de 2X2, en la que se comparan las incidencias:
a.-
Controles Casos
Expuestos 360 40 400
No expuestos 940 60 1000
1300 100 1400
La razón de tasas de incidencia (RTI), también denominada densidad de incidencia (RDI), se utiliza en
estudios analíticos en que no se sigue a todos los individuos durante el mismo periodo de tiempo. Es
el cociente entre los grupos que se comparan, poniendo en el denominador el grupo de referencia.
La Odds Ratio (OR), o razón de oportunidades, razón de productos cruzados u oportunidad relativa,
entre otras traducciones, es una medición relativa del efecto. En los estudios de casos y controles,
debido a que la incidencia es desconocida, el método de estimación del riesgo relativo es diferente y
se estima calculando el OR, que corresponde al cociente de dos odds o chances, o “probabilidades de
ocurrencia”. En el caso de los estudios epidemiológicos usualmente se dispone de dos grupos, uno de
ellos utilizado como referencia o comparación del otro:
Casos controles
Expuestos a b
No expuestos c d
Casos controles
Expuestos 40 360
No expuestos 100 1300
Esto significa que las personas que consumieron el medicamento tienen 1.44 veces más
probabilidades de sufrir un IAM. O lo que es lo mismo, la droga actúa más como un factor de riesgo
que como un factor protector. En general, para que una exposición sea considerada un factor
protector o de prevención, debe presentar valores inferiores a 1.
La razón de prevalencia (RP) es una medida utilizada en estudios de corte transversal. Se obtiene
calculando el cociente entre la prevalencia encontrada en un grupo, expuesto a un eventual factor,
en relación a la prevalencia de grupos no expuestos o con diferente nivel de exposición:
RP = Prevalencia en expuestos
Prevalencia en no expuestos
Se les denomina también medidas absolutas de riesgo, es decir, hablamos de medidas de impacto sólo
cuando queda demostrado que el factor es verdaderamente de riesgo. Éstas informan sobre los
cambios en la distribución de la enfermedad que podemos esperar al variar el factor de exposición,
midiendo el aporte de un factor de riesgo a la génesis de una enfermedad o evento en los individuos
o la población expuesta, así como también cuál sería el aporte de las acciones preventivas, de
acuerdo al siguiente esquema:
FEE = RAE
Incidencia acumulada en expuestos
o también:
FEE = RR – 1
RR
El riesgo atribuible poblacional (RAP), o exceso de riesgo poblacional, establece la frecuencia con que
se presenta la enfermedad en toda la población como consecuencia del factor de exposición, es
decir, la frecuencia de la enfermedad que se evitaría al eliminar el factor de exposición:
o también:
El RAP es una medida del impacto del factor de riesgo en la población general, el que debe ser menor
que en los expuestos al factor de riesgo debido a estar formada por expuestos y no expuestos a
dicho factor. Representa el "exceso" de incidencia de enfermedad que se evitaría, en la población
general, al eliminar la exposición al factor de riesgo. Junto con la proporción de riesgo atribuible
poblacional (RAP%), que corresponde al porcentaje de población afectada por la exposición a un
factor de riesgo, es la medida de efecto con mayor importancia en Salud Publica.
VII.-BIBLIOGRAFÍA