Estadistica 14 A Edicion
Estadistica 14 A Edicion
Estadistica 14 A Edicion
MANUAL AMIR
ESTADÍSTICA Y EPIDEMIOLOGÍA
(14.ª edición)
ISBN
978-84-18278-10-5
DEPÓSITO LEGAL
M-22139-MMXIX
(1) H. G. U. Gregorio Marañón. Madrid. (15) H. Central U. de Valencia. Valencia. (28) H. U. Infanta Sofía. Madrid. (40) Psiquiatra en ámbito privado. Madrid.
(2) H. Ruber Internacional. Madrid. (16) H. U. Virgen de la Victoria. Málaga. (29) H. U. de Bellvitge. (41) H. C. U. Lozano Blesa. Zaragoza.
(3) H. U. del Sureste. Arganda del Rey, Madrid. (17) H. U. Fundación Jiménez Díaz. Madrid. L’Hospitalet de Llobregat, Barcelona. (42) H. Infanta Cristina. Parla, Madrid y
(4) H. U. La Paz. Madrid. (18) H. U. Doctor Peset, Valencia. (30) H. U. San Juan de Alicante. Alicante. H. Central de la Cruz Roja. Madrid.
(5) H. U. Severo Ochoa. Madrid. (19) H. de Manacor. Mallorca. (31) H. U. de Basurto. Bilbao. (43) H. G. U. de Alicante. Alicante.
(6) H. U. Virgen del Rocío. Sevilla. (20) H. U. Fundación Alcorcón. Madrid. (32) H. Virgen de los Lirios. Alcoy, Alicante. (44) Clínica U. de Navarra. Madrid.
(7) H. U. Ramón y Cajal. Madrid. (21) H. U. de Getafe. Madrid. (33) H. U. Central de Asturias. Oviedo. (45) H. U. de Torrejón. Torrejón, Madrid y
(34) H. U. Virgen de las Nieves. Granada. H. HM Puerta del Sur. Móstoles, Madrid.
(8) Phoenix Children´s Hospital. Phoenix, EE.UU. (22) H. U. Puerta de Hierro. Madrid.
(35) H. U. Vall d’Hebron. Barcelona. (46) H. C. U. de Valladolid. Valladolid.
(9) H. Infanta Cristina. Parla, Madrid. (23) H. U. Son Espases. Palma de Mallorca.
(36) Clínica Alemana. Santiago de Chile, Chile. (47) H. Infantil U. Niño Jesús. Madrid.
(10) H. Clinic. Barcelona. (24) H. Can Misses. Ibiza.
(37) Parc de Salut Mar. Barcelona. (48) H. U. Rey Juan Carlos. Móstoles, Madrid.
(11) H. U. de Fuenlabrada. Madrid. (25) Centre d’Ophtalmologie Sainte Odile.
Alsacia, Francia. (38) H. U. Infanta Elena. Madrid. (49) H. Moisès Broggi. Sant Joan Despí, Barcelona.
(12) H. U. 12 de Octubre. Madrid.
(13) H. C. San Carlos. Madrid. (26) H. U. Joan XIII. Tarragona. (39) Instituto de Neuropsiquiatría y
(27) H. Quironsalud A Coruña. La Coruña. Adicciones, PSMAR. Barcelona.
(14) H. Vithas Ntra. Sra. de América. Madrid.
5
CURSOS MÉDICOS 2022
CURSOS MÉDICOS 2022
ORIENTACIÓN MIR
Rendimiento por asignatura Número medio de preguntas Eficiencia MIR
(preguntas por página) (de los últimos 11 años) (rendimiento de la asignatura
corregido por su dificultad en el MIR)
3,3 18 10
Estadística y Epidemiología es actualmente una asignatura de importancia intermedia dentro del examen MIR. Previamente era la
segunda asignatura por detrás de Digestivo, pero en las últimas convocatorias el número de preguntas se ha reducido aproximada-
mente a la mitad (debido a la inclusión del nuevo bloque de Bioética en el MIR, que ocupa preguntas tradicionalmente de Estadística).
El tema estrella es el de Tipos de Estudios Epidemiológicos, que incluye preguntas teóricas. También son muy importantes temas
en los que pueden caer problemas: Medidas en Epidemiología y Estudio de una Prueba Diagnóstica. Dentro del bloque de
Estadística, lo más importante es Contraste de Hipótesis. En los últimos años, por otra parte, son habituales 1-2 preguntas vincula-
das a imágenes (interpretación de resultados y gráficos de estudios epidemiológicos).
La asignatura tiene una alta rentabilidad de estudio al ser la mayoría de conceptos repetidos y similares año tras año. El manual
debe trabajarse de manera distinta al resto: cualquier tema de este manual se debe estudiar al detalle (salvo el tema 4), y por ello el
manual está estructurado con dos colores de texto: texto en negro, que se debe estudiar íntegro; y texto en color aguamarina, que
es simplemente texto aclaratorio o con ejemplos, que no se debe estudiar.
7
CURSOS MÉDICOS 2022
CURSOS MÉDICOS 2022
ÍNDICE
ESTADÍSTICA .........................................................................................................................................................11
TEMA 1 ESTADÍSTICA DESCRIPTIVA..............................................................................................................11
1.1. Técnicas de muestreo estadístico............................................................................................................ 12
1.2. Tipos de variables................................................................................................................................... 13
1.3. Medidas de análisis de los datos............................................................................................................. 14
1.4. Principales distribuciones de probabilidad............................................................................................... 16
Autores: Héctor Manjón Rubio, Julio Sesma Romero, Carlos Corrales Benítez.
TEMA 2 ESTADÍSTICA INFERENCIAL..............................................................................................................18
2.1. Estadística inferencial para variables cuantitativas................................................................................... 18
2.2. Estadística inferencial para variables cualitativas...................................................................................... 19
2.3. Cálculo del tamaño muestral para estudios de inferencia........................................................................ 19
Autores: Julio Sesma Romero, Carlos Corrales Benítez, Héctor Manjón Rubio.
TEMA 3 CONTRASTE DE HIPÓTESIS..............................................................................................................20
3.1. Errores en contraste de hipótesis............................................................................................................ 20
3.2. Cálculo del tamaño muestral en el contraste de hipótesis....................................................................... 21
3.3. Tests para contraste de hipótesis............................................................................................................ 22
Autores: Eduardo Franco Díez, Héctor Manjón Rubio, Julio Sesma Romero.
TEMA 4 PROBABILIDADES.............................................................................................................................25
Autores: Julio Sesma Romero, Carlos Corrales Benítez, Héctor Manjón Rubio.
EPIDEMIOLOGÍA....................................................................................................................................................27
TEMA 5 ESTUDIOS DE VALIDACIÓN DE UNA PRUEBA DIAGNÓSTICA...........................................................27
5.1. Parámetros de validez de una prueba diagnóstica................................................................................... 28
5.2. Curvas ROC (de rendimiento diagnóstico)............................................................................................... 29
5.3. Test de screening y test de confirmación................................................................................................ 30
Autores: Carlos Corrales Benítez, Eduardo Franco Díez, Julio Sesma Romero.
TEMA 6 MEDIDAS EN EPIDEMIOLOGÍA.........................................................................................................31
6.1. Medidas de frecuencia de una enfermedad............................................................................................ 31
6.2. Medidas de fuerza de asociación (medidas de efecto)............................................................................. 31
6.3. Criterios de causalidad de Bradford Hill.................................................................................................. 32
6.4. Medidas de impacto............................................................................................................................... 34
Autores: Eduardo Franco Díez, Héctor Manjón Rubio, Elena Masana Flores.
TEMA 7 TIPOS DE ESTUDIOS EPIDEMIOLÓGICOS..........................................................................................35
7.1. Estudios observacionales......................................................................................................................... 35
7.2. Estudios experimentales.......................................................................................................................... 37
7.3. Niveles de evidencia científica................................................................................................................. 38
7.4. Estructura metodológica de un trabajo científico.................................................................................... 41
7.5. Fases de realización de los estudios epidemiológicos............................................................................... 41
7.6. Fases de desarrollo de un tratamiento (fases del ensayo clínico).............................................................. 42
7.7. Diseños especiales en estudios experimentales........................................................................................ 44
7.8. Realización de muchas comparaciones en los estudios epidemiológicos.................................................. 46
7.9. Estudios de bioequivalencia.................................................................................................................... 46
7.10. Estudios farmacoeconómicos.................................................................................................................. 47
Autores: Héctor Manjón Rubio, Eduardo Franco Díez, Elena Masana Flores.
TEMA 8 ERRORES EN LOS ESTUDIOS EPIDEMIOLÓGICOS.............................................................................49
8.1. Errores aleatorios.................................................................................................................................... 49
8.2. Errores sistemáticos (sesgos)................................................................................................................... 49
8.3. Sesgos específicos de los estudios de validación de pruebas diagnósticas............................................... 52
Autores: Carlos Corrales Benítez, Elena Masana Flores, Eduardo Franco Díez.
BIBLIOGRAFÍA........................................................................................................................................................57
9
CURSOS MÉDICOS 2022
CURIOSIDAD
10
CURSOS MÉDICOS 2022
ESTADÍSTICA
Tema 1
Estadística descriptiva
Autores: Héctor Manjón Rubio, H. U. Ramón y Cajal (Madrid). Julio Sesma Romero, H. U. G. de Alicante (Alicante). Carlos Corrales Benítez, H. U.
Fundación Jiménez Díaz (Madrid).
Enfoque MIR
Muestra
El objetivo de la Estadística es el estudio de una o varias
características (variables) en una o varias poblaciones diana.
Habitualmente el estudio de todos los individuos de dichas Estadística descriptiva
poblaciones es imposible por problemas logísticos, así que se
suele estudiar sólo a un grupo reducido de individuos de cada
población (muestra).
Resultados de la muestra
La Estadística descriptiva se ocupa de estudiar las variables
que nos interesan de dicha muestra; como podemos estudiar a
cada uno de los individuos de la muestra, todos los datos que
Estadística inferencial
obtengamos serán verídicos y no tendremos que extrapolar
Probabilidad de error
nuestros resultados, por lo que en Estadística descriptiva no
existe probabilidad de cometer errores.
La Estadística inferencial intenta extrapolar cómo serían los Resultados de la población
resultados de la población objetivo si fuéramos capaces de
estudiar a todos sus individuos. Para ello parte de los resultados
obtenidos en la muestra. Así, los resultados estarán sujetos a Contraste de hipótesis
una probabilidad de error, ya que si la muestra seleccionada Probabilidad de error
no fuera representativa de la población, sus resultados no
serían extrapolables a la misma.
Por último, el contraste de hipótesis compara los resultados Comparación de resultados
de varias variables en una única población, o bien los resulta-
dos obtenidos para la misma variable en varias poblaciones. Al
igual que en Estadística inferencial, para obtener los datos
poblacionales se parte de resultados de las muestras estudia-
das, por lo que existe probabilidad de error. Figura 1. Esquema de realización de un estudio estadístico.
11
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
12
CURSOS MÉDICOS 2022
Tema 1 · Estadística descriptiva
30
Variables cualitativas nominales
Los valores de la variable no siguen un orden, y por tanto los 25
nombraremos con palabras y no con números (p. ej., el color
20
de pelo).
Cuando una variable cualitativa sólo puede tomar dos valores 15
(p. ej., sexo: masculino o femenino) se denomina dicotómica
10
o binaria (MIR). Si puede tomar más de dos valores se deno-
mina no dicotómica. 5
0
Recuerda...
Complicaciones mayores Sin complicaciones
Las variables expresadas como porcentajes
suelen ser variables cualitativas. Complicaciones menores Exitus
Ejemplo: si la prevalencia de EPOC es del 10%,
la variable es tener o no tener EPOC, esto es, cualitativa. Figura 2. Diagrama de rectángulos y diagrama de sectores.
13
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
distribución.
375
400
215
Recuento
100
54
Media aritmética
24
23
17
Moda
Es el valor más repetido de todos los valores de la variable. Puede
250 ser un valor único o haber varias. Es útil para distribuciones con
varios “picos” de frecuencia, esto es, con varias modas.
200
Medidas de dispersión
150
Recuento
14
CURSOS MÉDICOS 2022
Tema 1 · Estadística descriptiva
Ejemplo: la media de presión arterial sistólica de una muestra queremos expresar un porcentaje en tanto por 1, deberemos
de pacientes puede ser de 130 mmHg porque la mitad tiene dividir el resultado por 100.
129 mmHg y la otra mitad 131 mmHg (esta muestra tiene una
PAS muy bien controlada), pero también puede ser 130 mmHg
porque la mitad de pacientes tenga 90 mmHg y la otra mitad
Recuerda...
170 mmHg (a pesar de tener la misma media, esta muestra es
muy diferente de la otra, ya que los valores individuales están En variables cuantitativas de distribución simétrica,
muy “alejados” del centro). los resultados se expresan con la media y la desviación típica.
Las principales medidas de dispersión son (MIR 10, 178): En variables cuantitativas de distribución asimétrica, los
resultados se expresan con la mediana y el rango intercuartílico.
0,5
Coeficiente de variación (MIR)
Se utiliza para comparar la dispersión de varias distribuciones, 0,4
ya que no tiene unidades (es adimensional). Indica qué
porcentaje respecto de la media supone la desviación típica de
una distribución. 0,3
Ejemplo: no es lo mismo separarse (DT) 10 kg respecto a 50 kg
de media (un 20% de separación) que respecto a 100 kg de 0,2
media (un 10% de separación).
0,1
CV = σ / x–
0
¡Ojo! Cuando queremos expresar cualquier resultado en %, -4 -3 -2 -1 0 1 2 3 4
tenemos que multiplicar el resultado por 100, y viceversa, si
Figura 5. Dispersión de distribuciones.
15
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
• Es simétrica.
• La media aritmética, mediana y moda coinciden (MIR).
• Es unimodal (tiene una única moda).
media < mediana media = mediana mediana < media • El área bajo la curva de la distribución es igual a 1.
La distribución normal, aplicada a la estadística descriptiva re-
Figura 6. Asimetría. presenta el porcentaje de observaciones que tiene cada valor
posible, por lo que la suma de todos los porcentajes (área
bajo la curva) será = 100% = 1.
Curtosis o apuntamiento (MIR 13, 177)
La curtosis mide el grado de agudeza o achatamiento de una La principal utilidad matemática de la distribución normal es
distribución en relación a la distribución normal (determina que permite definir una serie de intervalos que encierran un
cuán puntiaguda es una distribución). Se mide con el coeficien- área bajo la curva conocida. En estadística descriptiva, esto
te de curtosis de Fisher (g2). Se dice que una curva es mesocúr- implica que si nuestros resultados se distribuyen de un modo
tica cuando posee un grado de apuntamiento igual a la “normal”, podremos establecer unos intervalos que indiquen
distribución normal (g2 = 0). Se denomina leptocúrtica si es entre qué valores se encuentra un determinado porcentaje
más apuntada o puntiaguda (g2 >0). Se denomina platicúrtica de las observaciones de nuestra muestra (MIR 13, 175;
si es más achatada (g2 <0). MIR):
16
CURSOS MÉDICOS 2022
Tema 1 · Estadística descriptiva
Distribución binomial
17
CURSOS MÉDICOS 2022
Tema 2
Estadística inferencial
Autores: Julio Sesma Romero, H. U. G. de Alicante (Alicante). Carlos Corrales Benítez, H. U. Fundación Jiménez Díaz (Madrid). Héctor Manjón Rubio,
H. U. Ramón y Cajal (Madrid).
18
CURSOS MÉDICOS 2022
Tema 2 · Estadística inferencial
2.2. Estadística inferencial Para el cálculo de los intervalos de confianza (IC) se utilizan
para variables cualitativas las propiedades matemáticas de la distribución normal:
p(A) · p (1-A)
eep =
n
19
CURSOS MÉDICOS 2022
Tema 3
Contraste de hipótesis
Autores: Eduardo Franco Díez, H. U. Ramón y Cajal (Madrid). Héctor Manjón Rubio, H. U. Ramón y Cajal (Madrid). Julio Sesma Romero, H. U. G. de
Alicante (Alicante).
20
CURSOS MÉDICOS 2022
Tema 3 · Contraste de hipótesis
El ejemplo más típico de diseño de equivalencia terapéutica son Potencia estadística (poder estadístico) (MIR 10, 179; MIR)
los estudios de bioequivalencia, que se utilizan para autori-
zar la comercialización de los fármacos genéricos comparando
sus propiedades farmacocinéticas con los respectivos fármacos Es la probabilidad de detectar diferencias (en el estudio se
originales (ver tema 7. Tipos de estudios epidemiológicos). acepta H1 y se rechaza H0) cuando en realidad existen (en la
realidad, H1 es cierta): es la probabilidad de rechazar la
hipótesis nula siendo falsa. Por lo tanto, es un resultado
Error tipo I (error alfa) “verdadero positivo”.
(MIR 13, 174; MIR 12, 173; MIR 11, 172; MIR 10, 176) La potencia estadística y el error beta son complementarios
(potencia + β = 1). Por lo tanto:
Es el error que se comete cuando las diferencias observadas se
deben al azar (en la realidad, H0 es cierta), pero el investigador Potencia estadística = 1 – β
lo interpreta como debido a una diferencia o asociación (en el β = 1 – potencia estadística
estudio, se acepta H1 y se rechaza H0): es la probabilidad de
rechazar la hipótesis nula siendo cierta. Por lo tanto, es un
resultado “falso positivo”. Así, de forma análoga al error beta, cuando se realizan estu-
dios epidemiológicos y se concluye que no existen diferencias,
La probabilidad de cometer este error es α, que define el nivel se suele requerir que la potencia estadística sea al menos de
de significación estadística de los estudios epidemiológicos. un 80%.
Una vez realizado cualquier estudio epidemiológico de com-
paración, se calcula mediante un test estadístico el valor “p”,
que es la probabilidad de que una diferencia igual o mayor
a la observada en el estudio no exista en la realidad (esto es, Recuerda...
de que estemos incurriendo en un error α). Si el valor de “p” Los errores alfa y beta son errores aleatorios, esto es, debidos
es inferior al nivel de significación estadística α que hayamos al azar (es el azar el que hace que el estudio falle y detecte
predefinido antes de iniciar el estudio (en general se define diferencias cuando no las hay, o no las detecte cuando las hay).
α = 0.05), diremos que los resultados del estudio han sido Los errores aleatorios se solucionan aumentando el tamaño
estadísticamente significativos (MIR). muestral, por lo que ante un estudio cuyos resultados no sean
estadísticamente significativos (p >0,05), si diseñamos un nuevo
• p <0,05: se acepta H1 y se rechaza H0. estudio incluyendo un mayor tamaño muestral, es posible que
• p >0,05: no se acepta H1 y no se rechaza H0. consigamos alcanzar entonces la significación estadística.
↑ n → ↓ α, ↓ β, ↑ potencia estadística
El nivel de significación de un contraste de hipótesis es inde-
pendiente de la magnitud de las diferencias encontradas
entre las intervenciones que se comparan.
Recuerda...
Regla mnemotécnica
Trucos para acertar las preguntas sobre
Para recordar el error alfa: α-fetoproteína (α-FP). contraste de hipótesis en el MIR:
• Las opciones categóricas (“siempre”, “nunca”, “sin lugar a
El error tipo α es un resultado falso positivo (FP). dudas”) son falsas. Se debe tener en cuenta que existe un
margen de error que podemos cometer.
• Las opciones correctas suelen aplicar la definición de error alfa o
Error tipo II (error beta) (MIR) error beta al ejemplo del enunciado, y para ello nos “traducen”
la tabla 1 de este tema. Son por ello opciones que parecen
Es el error que se comete cuando las diferencias observadas trabalenguas y que tienen el siguiente esquema con dos par-
son reales (en la realidad, H1 es cierta), pero el investigador tes, la primera que nos habla de lo que ocurre en la realidad, y
lo interpreta como debido al azar (en el estudio, no se acepta la segunda que nos habla sobre los resultados de nuestro estu-
H1 y no se rechaza H0): es la probabilidad de no rechazar dio: “En el caso de que no existieran diferencias entre los dos
la hipótesis nula siendo falsa. Por lo tanto, es un resultado fármacos (= si en la realidad se cumple H0), existiría una proba-
“falso negativo”. bilidad de encontrar unos resultados como los obtenidos (= si,
p. ej., en nuestro estudio hemos visto diferencias significativas
Cuando se realizan estudios epidemiológicos y se concluye que -H1-) inferiores al 5% (= hemos obtenido una p <0.05)”.
no existen diferencias, se suele requerir una probabilidad de
haber cometido un error beta <0,20 (menos del 20%)
(MIR 19, 115). No obstante, el error beta es menos importante
que el error alfa y en muchas ocasiones ni siquiera se calcula.
3.2. Cálculo del tamaño muestral
en el contraste de hipótesis
Recuerda...
La hipótesis nula nunca se puede aceptar, Como en cualquier estudio epidemiológico, se debe analizar
y la hipótesis alternativa nunca se puede rechazar. Así pues: antes de comenzar el estudio cuál es el tamaño muestral míni-
• La hipótesis nula se rechaza o “no se rechaza”. mo necesario para conseguir unos resultados suficientemente
• La hipótesis Alternativa se Acepta o “no se acepta”. precisos.
21
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
En los estudios de contraste de hipótesis (p. ej., comparar 3.3. Tests para contraste de hipótesis
qué fármaco “A” o “B” es mejor) es necesario conocer los
siguientes datos para calcular el tamaño muestral:
Tests para estudios de comparación de variables
1. Aquellos parámetros que hacía falta conocer para estadís-
tica inferencial: Los principales tests para comparación de variables se exponen
- Nivel de precisión que queremos que tenga el intervalo de en la tabla 2. Para elegir el tipo de test a utilizar nos debere-
confianza. mos fijar en dos criterios fundamentales:
- Nivel de confianza deseado (68%, 95%, 99%). • Qué tipo de variable (cualitativa o cuantitativa) es la va-
riable resultado que tenemos que comparar. Los tests para
- Variabilidad del parámetro estudiado (según estudios pre-
variables cuantitativas aportan una mayor potencia estadís-
vios), si la variable de interés es cuantitativa.
tica (permiten alcanzar la significación estadística con menor
- Porcentaje esperado del parámetro que se va a medir tamaño muestral y sus resultados son más precisos) que los
(según estudios previos), si la variable de interés es cuali- utilizados para variables cualitativas.
tativa.
Cuando la variable es cuantitativa, además, tendremos que
2. Parámetros específicos del contraste de hipótesis: elegir entre los siguientes grupos de tests estadísticos:
- Tipo de diseño del estudio y si el análisis será de una cola - Tests paramétricos: se utilizan cuando la variable sigue
o de dos colas. una distribución normal (MIR), o bien si n >30 (pese a que
la distribución no sea normal). Aportan una mayor potencia
- Error tipo α y tipo β permitidos: nivel de potencia estadís-
estadística que los no paramétricos.
tica deseado. Cuanta mayor potencia, y cuanto menor α
y β deseados, mayor tamaño muestral (MIR 10, 190). - Tests no paramétricos: se utilizan cuando la variable no
sigue una distribución normal y además n <30.
- Magnitud de la diferencia mínima clínicamente relevante
que se desea demostrar entre los dos fármacos (δ). Las variables ordinales se consideran como si fueran cuan-
titativas, pero con la restricción de que sólo se puede em-
Aclaración: se llama también delta, pero es un concepto
plear con ellas tests no paramétricos (MIR).
distinto al límite de no inferioridad.
- Porcentaje de pérdidas previsto (d) (MIR).
Recuerda...
No es necesario conocer: nivel de enmascaramiento del Las variables resultado cualitativas nos las plantearán
estudio (MIR), número de pacientes que somos capaces de habitualmente como porcentajes (comparar varios porcentajes),
reunir (MIR), número de centros participantes (MIR). mientras que las variables resultado cuantitativas nos las
Si al finalizar el estudio se obtiene un resultado no significativo, plantearán habitualmente como medias (comparar varias medias).
no se deben añadir pacientes hasta que lo sea, sino revisar la
hipótesis de trabajo y la determinación del tamaño muestral y
realizar un nuevo estudio (MIR). • Si estamos comparando entre sí los resultados obtenidos en
esa variable en varios grupos de individuos (datos inde-
pendientes), o bien en un único grupo de individuos pero
en varios momentos del tiempo (datos apareados).
VARIABLE CUANTITATIVA
VARIABLE
CUALITATIVA 2 GRUPOS O >2 GRUPOS O
2 MOMENTOS DEL t >2 MOMENTOS DEL t
*Corrección de Yates: corrección que se aplica al test de chi2 cuando el tamaño muestral es n <200.
**Test exacto de Fisher: cuando en la tabla de contingencia de la chi2 hay menos de cinco individuos en >25% de las casillas [expresado matemáticamente: n · p <5 ó
n · (1-p) <5] no se puede utilizar el test de chi2 y hay que utilizar el test exacto de Fisher.
Tabla 2. Tests de contraste de hipótesis para comparación de variables (MIR 17, 122; MIR 17, 123; MIR 17, 124; MIR 10, 177).
22
CURSOS MÉDICOS 2022
Tema 3 · Contraste de hipótesis
a = ordenada en el origen
y=a+b·x
En este caso, lo que se pretende es demostrar si los cambios
que se produzcan en una o varias variables (variables
independientes, xi) van a influir sobre el valor que tome
otra variable (variable dependiente, y); además, se pretende b = pendiente
cuantificar dicha influencia. Todas las variables se recogen
de una misma muestra.
Regresión
x
La regresión trata de expresar mediante ecuaciones la aso- 0 1 2 3 4
ciación existente (mostrar mediante una fórmula matemática
cómo varía la variable “y” con cada unidad de aumento de Figura 1. Regresión lineal simple.
las variables “xi”). Además, las ecuaciones obtenidas nos
permitirán predecir el valor que tomará la variable “y” en
un individuo para el que conocemos las variables “xi”. Las Evidentemente, los cambios que ocurran en una muestra de
variables introducidas pueden ser tanto cuantitativas como pacientes en la variable “y” (p. ej., en el colesterol), no se
cualitativas (en cuyo caso habrá que asignar a cada categoría deberán en su totalidad a los cambios apreciados en la variable
un número que nos inventemos). “x” (p. ej., el peso). Sólo un cierto porcentaje de esa variación
se deberá a la variable “x”, y el resto se deberá a otras variables
Por ejemplo: en una muestra de individuos, analizar cuánto
que no estamos estudiando (p. ej., la dieta, la realización o no
aumenta el colesterol (variable y) con cada kg que aumente el
de ejercicio físico, etc.).
peso medio (variable x) en dicha muestra.
Los tests de correlación más utilizados son los empleados
Si existe sólo una variable independiente (xi) en la ecuación se
para evaluar la correlación existente entre dos variables
habla de regresión univariante o simple. Si existen dos o
cuantitativas.
más variables independientes (xi) en la ecuación se habla de
regresión multivariante o múltiple (MIR 16, 194). Si se uti-
• Coeficiente “r” de Pearson (MIR): es un test paramétrico
liza regresión multivariante, todas las variables independientes
que mide el grado de correlación lineal entre las variables (se
incluidas en la ecuación quedan “ajustadas entre sí” de modo
emplea cuando las dos variables siguen una distribución nor-
que el coeficiente que acompaña a cada variable indicará el
mal o bien si n >30). No descarta otros tipos de correlación
efecto que tiene exclusivamente dicha variable sobre la variable
que no sea la lineal.
“y”, eliminando el efecto de cualquier otra variable indepen-
diente introducida en la ecuación: sirve por tanto para evitar • Coeficiente “ρ” de Spearman: es un test no paramétrico (se
sesgos por factor de confusión. emplea cuando alguna de las variables sigue una distribución
El tipo de variable de la variable dependiente (y) define el tipo no normal y además n <30).
de regresión:
El signo del coeficiente de correlación (+/-) indica si la
• Regresión logística: si la variable “y” es cualitativa (MIR 12, 176; correlación es positiva (cuando la variable “x” aumenta, la
MIR). variable “y” aumenta) o si es negativa (cuando la variable “x”
• Regresión lineal (ver figura 1): cuando la variable “y” es aumenta, la variable “y” disminuye).
cuantitativa, la fórmula matemática más empleada es la ecua- El valor absoluto del coeficiente indica, si lo elevamos al
ción de una recta: cuadrado, el porcentaje de los cambios de la variable “y”
que se explican por los cambios de la variable “x” (p. ej., un
coeficiente de 0,8 = 80%, indica que el 64% de los cambios en
y = a + b1 · x1 + b2 · x2 + b3 · x3 + … + bi · xi
la variable “y” se explican por los cambios en la variable “x”):
23
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Análisis de supervivencia (MIR 14, 33; MIR) Ejemplo (ver figura 3): imaginemos un estudio que compara
2 grupos de 100 pacientes, que dura 2 unidades de tiempo, y
que tiene un HR de 0.7 (sin pérdidas). Pongamos que observa-
Se utiliza cuando en un estudio epidemiológico la variable mos, por ejemplo, 30 eventos en el grupo control en cada
respuesta es el tiempo que transcurre hasta que sucede un periodo de tiempo. En este caso, en el grupo experimental
evento de interés (la muerte, la aparición de enfermedad, la habría 21 eventos en el periodo de tiempo 1 (un 70% de 30)
curación, el alta hospitalaria…). Así pues, las variables tienen y quedarían 79 pacientes para el periodo de tiempo 2. En dicho
una parte cuantitativa (tiempo que transcurre) y una parte periodo de tiempo habría 24 eventos (en el grupo control hay
cualitativa (aparición o no de un evento). 30 eventos de 70 pacientes que quedan, esto es, un riesgo del
Cuando el tiempo de seguimiento de alguno de los pacientes 42,8%; el riesgo del grupo experimental debe ser el 70% de
del estudio termina antes de que haya tenido lugar el evento ese 42,8%: un 30% sobre 79 pacientes, que son 24 eventos).
de interés se habla de observaciones incompletas o censu- El HR del estudio es 0.7, pero el RR sería igual al cociente de
radas. Si un paciente fallece por una causa distinta a la enfer- incidencias acumuladas: 45 eventos en el grupo experimental /
medad estudiada se considerará como censurado, ya que, en 60 eventos en el grupo control = 0.75. Así, vemos que el HR y
caso contrario, se estaría cometiendo un sesgo de información. el RR son similares, pero no son la misma cosa.
En la representación gráfica de las curvas de supervivencia,
se suele anotar al principio de cada unidad de tiempo los pa-
cientes que siguen en el estudio y todavía no han presentado
el evento de interés (pacientes en riesgo). Para calcular los 100% 21 eventos
pacientes en riesgo al inicio de cada unidad de tiempo, se
deben eliminar tanto los pacientes que han tenido el evento 80% 79%
de interés como los pacientes censurados. 30 eventos
70%
24 eventos
Los métodos estadísticos no paramétricos son los más
60%
frecuentemente utilizados en análisis de supervivencia. Entre 55%
ellos los más destacados son: 30 eventos
40% 40%
24
CURSOS MÉDICOS 2022
Tema 4
Probabilidades
Autores: Julio Sesma Romero, H. U. G. de Alicante (Alicante). Carlos Corrales Benítez, H. U. Fundación Jiménez Díaz (Madrid). Héctor Manjón Rubio,
H. U. Ramón y Cajal (Madrid).
Enfoque MIR
A B = + -
Tema no preguntado en el MIR desde hace más de 10 años. Por lo
tanto, no lo estudies. Sólo si te sobra tiempo realiza una lectura
comprensiva. p (A U B) = p(A) + p(B) -
U
p(A B)
25
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
26
CURSOS MÉDICOS 2022
EPIDEMIOLOGÍA
Tema 5
Estudios de validación de una prueba diagnóstica
Autores: Carlos Corrales Benítez, H. U. Fundación Jiménez Díaz (Madrid). Eduardo Franco Díez, H. U. Ramón y Cajal (Madrid). Julio Sesma Romero,
H. U. G. de Alicante (Alicante).
27
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
5.1. Parámetros de validez de verdaderos negativos (sanos), pudiendo por tanto descartar
una prueba diagnóstica enfermedad.
La sensibilidad es análoga a la potencia estadística de un
estudio de contraste de hipótesis (MIR).
Para evaluar la validez de una prueba diagnóstica, se realiza un
estudio transversal mediante el cual se comparan los resul-
tados obtenidos por el test (que cataloga a los individuos en Especificidad (E) (MIR 19, 131; MIR)
“+” o “−“) con los resultados obtenidos por el mejor método
diagnóstico que esté disponible, llamado gold standard o Es la capacidad del test de detectar a los sujetos sanos. Es la
patrón oro (que va a catalogar a los individuos del estudio en probabilidad de que un sujeto sano (según el gold standard)
“enfermos” o “sanos”) (MIR). saque “−” en el test. La probabilidad complementaria a la es-
pecificidad (esto es, la probabilidad de que un sujeto sano sa-
Dicho estudio debe realizarse en las condiciones más similares
que “+“ en vez de “−” en el test) es la tasa de falsos
posibles a la práctica clínica habitual. Además, la comparación
positivos (TFP).
debe ser ciega e independiente y abarcar todo el espectro de
la enfermedad (MIR).
E = VN / total de sanos
TFP = FP / total de sanos
GOLD STANDARD E + TFP = 1 → E = 1 – TFP; TFP = 1 – E
28
CURSOS MÉDICOS 2022
Tema 5 · Estudios de validación de una prueba diagnóstica
Valor predictivo negativo (VPN) (MIR) Cuando se define enfermedad o salud utilizando una variable
cuantitativa continua, se debe definir un punto de corte a
Capacidad del test de predecir si un sujeto que ha sacado ne- partir del cual consideramos que un sujeto es “positivo” y por
gativo en el test va a estar realmente sano. Es la probabilidad tanto predecimos que estará enfermo.
de que un sujeto “−“ (según el test) sea sano según el gold
Ejemplo: se considera diabético a un individuo que tenga ≥ 126
standard.
mg/dl de glucemia en ayunas en al menos dos determinaciones
separadas en el tiempo.
VPN = VN / total de negativos En las variables cuantitativas, a medida que llevamos el punto
de corte que define enfermedad a niveles más “enfermos”,
seremos más específicos pero menos sensibles (MIR 14, 206;
Valor global (VG) MIR 12, 193). Por el contrario, si llevamos el punto de corte a
niveles más “sanos”, seremos más sensibles y menos específi-
Es la proporción de resultados verdaderos (verdaderos positivos cos. Así, podemos afirmar que para las variables cuantitativas
y verdaderos negativos) del total de resultados de un test. la S y la E son inversamente proporcionales: al aumentar la S
Indica, por tanto, el porcentaje de veces que el test “acierta” disminuye la E, y viceversa.
en sus predicciones.
Antes hemos indicado que los tests muy sensibles son útiles
cuando su resultado es negativo (descartan enfermedad), y los
tests muy específicos cuando su resultado es positivo (confir-
man enfermedad). Esto es así por la relación entre la S y E con
los valores predictivos de un test:
0 100
1-E
↑ S → ↓ TFN → ↑ VPN
↑ E → ↓ TFP → ↑ VPP Figura 1. Curva ROC.
29
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Las curvas ROC muestran el nivel de S y de E que obtenemos Así, no todas las enfermedades son susceptibles de screening,
con cada posible punto de corte de la variable cuantitativa, sino que se deben cumplir una serie de requisitos para que éste
lo que nos permite escoger el mejor punto de corte (aquel se pueda instaurar:
con una mejor relación entre sensibilidad y especificidad).
Gráficamente se representan poniendo la S en el eje de orde-
Criterios de la enfermedad
nadas, y la TFP (1 – E) en el eje de abscisas. El mejor punto de
corte es aquel que corta la bisectriz de la curva ROC.
• Enfermedad frecuente en la población estudiada.
El área bajo la curva de las curvas ROC representa el grado
de validez global del test (MIR). Cuando comparamos varios • Enfermedad grave que no debe pasar desapercibida (si no se
tests diagnósticos, será mejor aquel cuya área bajo la curva diagnostica a tiempo empeora el pronóstico).
ROC sea mayor (el vértice de la curva estará situado más cerca
• La fase presintomática no debe ser corta (MIR).
del ángulo superior izquierdo).
• Se debe conocer la historia natural de la enfermedad.
• La enfermedad debe tener un tratamiento más eficaz si se
Mejor aplica en fase presintomática que si se aplica en fase sinto-
100
Peor mática.
• Fácil de realizar.
S
• Inocuo.
• De coste razonable (pero no tiene por qué ser menos costoso
que tratar un caso de la enfermedad) (MIR).
• Buenos valores de validez (primando la S sobre la E) y repro-
ducibilidad.
• Aceptable y visto como necesario por la comunidad.
0 100
1-E
Test de confirmación
Figura 2. Comparación de la validez global de varios tests mediante sus curvas ROC.
30
CURSOS MÉDICOS 2022
Tema 6
Medidas en epidemiología
Autores: Eduardo Franco Díez, H. U. Ramón y Cajal (Madrid). Héctor Manjón Rubio, H. U. Ramón y Cajal (Madrid). Elena Masana Flores, H. U. Virgen
de las Nieves (Granada).
• Mejora de los métodos diagnósticos de una enfermedad (se n.º de casos nuevos a lo largo
descubrirán más casos). de un periodo de tiempo
DI =
• Inmigración de casos enfermos o emigración de sujetos ∑ t de observación de cada individuo
sanos. susceptible de enfermar
Es la proporción de casos nuevos de una enfermedad que 6.2. Medidas de fuerza de asociación
aparecen en una población en un determinado periodo de
tiempo, con respecto al total de la población que es suscep- (medidas de efecto)
tible de enfermar (MIR 20, 31; MIR). Por ejemplo, si se desea
medir la incidencia de una enfermedad crónica, habrá que Todas ellas son razones que se calculan mediante el cociente
calcular la proporción de casos nuevos respecto de los sujetos entre el riesgo que presentan los sujetos expuestos a un deter-
que no tengan dicha enfermedad (los que ya la tienen no son minado factor (de riesgo o protector), y el riesgo que presentan
susceptibles de volver a enfermar). los no expuestos.
31
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Así, miden cuántas veces es más frecuente la enfermedad en totalmente por debajo de 1,2 (MIR 11, 187) (menos de un
el grupo expuesto respecto al no expuesto (MIR). Miden pues 20% de riesgo adicional respecto al fármaco control), si el
la “fuerza de asociación” entre un factor causal y su efecto límite de no inferioridad (delta) se establece en el 20%.
(MIR).
Su resultado oscila entre 0 e infinito (rango) (MIR 20, 34), y no Diseño de equivalencia terapéutica
tienen unidades (MIR):
Para poder establecer que dos tratamientos son equivalentes
• Si el resultado es <1: el factor estudiado es un factor protector. terapéuticos entre sí, el IC de cualquiera respecto al otro
debe encontrarse delimitado entre 0,8 y 1,2 (MIR) (si hemos
• Si el resultado es >1: el factor estudiado es un factor de establecido unos límites del 20%)
riesgo.
Según qué medida de frecuencia de la enfermedad (del
• Si el resultado es = 1: no existe relación causal entre el factor “riesgo” de enfermar) estemos utilizando, usaremos una u
y la enfermedad (no es factor de riesgo ni de protección). otra medida de asociación:
32
CURSOS MÉDICOS 2022
Tema 6 · Medidas en epidemiología
ENFERMOS SANOS
FACTOR a b
PRESENTE
FACTOR c d
AUSENTE
IA expuestos (Ie) a / (a + b)
RR = =
IA en no expuestos (Io) c / (c + d)
Tabla 2. Medidas de fuerza de asociación (MIR 15, 181; MIR 15, 189; MIR 13, 181).
33
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
6.4. Medidas de impacto Número necesario de pacientes a tratar (NNT) (MIR 19, 119;
MIR 17, 118; MIR 16, 191; MIR 13, 182; MIR 11, 184)
Cuantifican cuál es el impacto de una medida preventiva al Es el número de pacientes que se debe tratar con un factor
aplicarla en una población (al suprimir un determinado factor protector para prevenir un evento. Se obtiene a partir del inver-
de riesgo, o al implementar un determinado factor protector). so de la RAR:
Utilizan incidencias acumuladas, por lo que se calculan
sólo en estudios con seguimiento prospectivo (estudio de NNT = 100 / RAR (expresando el RAR en %)
cohortes, ensayos clínicos, etc.).
En el cálculo de todas ellas existe una resta entre la incidencia
en expuestos y no expuestos. Por tanto, el “valor de no Se debe redondear al entero superior. Al igual que para el resto
significación” (aquel que indica que el riesgo en expuestos y de medidas de impacto, el “0” contenido en el intervalo de
no expuestos es el mismo), es el “0”. En estadística inferencial, confianza indica no significación estadística.
y para los estudios de superioridad (MIR): Al igual que podemos calcular el número de pacientes que hay
que tratar con un factor protector para prevenir un evento,
• Si el IC incluye el 0, no es estadísticamente significativo. usando para ello la RAR, también podemos calcular el número
de pacientes que hay que “dañar” con un factor de riesgo para
• Si el IC no incluye el 0, es estadísticamente significativo.
provocar un caso de enfermedad (NNH: número necesario de
pacientes a dañar) (MIR 15, 198), usando para ello el RA:
Medidas de impacto absolutas
NNH = 100 / RA (expresando el RA en %)
Indican el beneficio absoluto (número de casos evitados por
cada 100 personas en riesgo) que se obtiene al retirar un factor
de riesgo o implementar un factor protector totalmente en
Medidas de impacto relativas
una muestra o población en riesgo. Por lo tanto, son medidas
útiles en Salud Pública (al permitirnos calcular, si conocemos
el tamaño de una población, el número total de casos que Indican el beneficio relativo (porcentaje de casos evitados del
evitaríamos en ella). total de casos que padece una población en riesgo) que se
obtiene al retirar un factor de riesgo o implementar un factor
protector en una población en riesgo. Por lo tanto, son medi-
Riesgo atribuible, exceso de riesgo o diferencia de
das útiles en Epidemiología Clínica (al sernos un indicador
incidencias (RA, ER) (MIR 17, 134; MIR 15, 181)
del porcentaje de riesgo de enfermar que evitamos en cada
Medida de impacto absoluta utilizada para factores de ries- sujeto en riesgo).
go. Indica el exceso de riesgo asociado a la exposición, y que
podría evitarse si se eliminara ésta (número de casos evitados
por cada 100 pacientes con el factor de riesgo a los que les Fracción atribuible o fracción etiológica de riesgo (FA, FER)
quitas dicho factor). Medida de impacto relativa utilizada para factores de riesgo.
Es la proporción de casos nuevos entre los expuestos que es
RA = Ie − Io atribuible a la exposición.
FA = (Ie − Io) / Ie
Ejemplo: RA = 6% significa que por cada 100 expuestos hay
seis casos más de enfermedad que por cada 100 no expuestos.
Si elimináramos el factor de riesgo en un grupo de expuestos, Ejemplo: FA = 40% significa que de cada 100 casos de
evitaríamos por cada 100 expuestos esos seis casos de más. enfermedad que aparecen en un grupo de expuestos, 40 se
deben a esa exposición (60 se deberán a otras causas). Así, si
un individuo expuesto elimina su factor de riesgo (p. ej., deja
Reducción absoluta de riesgo (RAR)
de fumar) su riesgo de enfermar disminuirá un 40%.
(MIR 14, 195; MIR 11, 186)
Medida de impacto absoluta utilizada para factores de pro-
tección. Indica la reducción en la incidencia de enfermedad Reducción relativa de riesgo (RRR) (MIR)
que conseguiríamos al implementar un factor protector en un Medida de impacto relativa utilizada para factores de protec-
grupo en riesgo (número de casos evitados por cada 100 pa- ción. Es la proporción de casos nuevos, entre los sujetos que
cientes no protegidos, a los que se les proporciona el factor no tienen el factor protector, que es atribuible a la ausencia de
protector). la protección que dicho factor confiere.
Ejemplo: RAR = 5% significa que por cada 100 personas no Ejemplo: RRR = 35% significa que de cada 100 casos de enfer-
protegidas hay cinco casos más de enfermedad que por cada medad que aparecen en un grupo sin el factor protector (p. ej.,
100 personas con el factor de protección. Si a las personas no vacunados), 35 se deben a no tener el factor protector. Así,
no protegidas les proporcionáramos el factor de protección, si un individuo adquiere el factor protector (p. ej., se vacuna)
evitaríamos esos cinco casos que tienen de más. su riesgo de enfermar disminuirá un 35%.
34
CURSOS MÉDICOS 2022
Tema 7
Tipos de estudios epidemiológicos
Autores: Héctor Manjón Rubio, H. U. Ramón y Cajal (Madrid). Eduardo Franco Díez, H. U. Ramón y Cajal (Madrid). Elena Masana Flores, H. U. Virgen
de las Nieves (Granada).
• Estudios descriptivos (MIR 18, 213): su objetivo es descri- Estudio transversal (estudio de prevalencia,
bir la naturaleza y magnitud de un problema de salud, entre estudio de corte) (MIR 17, 131; MIR 16, 193; MIR 13, 178)
quiénes y dónde se produce y otras características similares.
Se consideran descriptivos los siguientes estudios epidemio- Es un estudio observacional de base individual (la unidad
lógicos: del estudio es el individuo) que no presenta seguimiento
de los pacientes, esto es, que sólo estudia las características
- Comunicación de un caso/serie de casos: siempre des- que tienen los pacientes en el presente: trata de describir o
criptivos. estudiar relaciones causales entre exposiciones y problemas de
- Estudio transversal y estudio ecológico: pueden ser tam- salud presentes en un momento puntual.
bién analíticos, pero en dicho caso no pueden demostrar Utiliza como medida de fuerza de asociación la razón de
hipótesis. prevalencias.
• Estudios analíticos: su objetivo es establecer la relación
entre una determinada exposición y la aparición de un deter- Ventajas
minado problema de salud.
Se consideran analíticos los siguientes estudios epidemiológicos: • Rápido, barato y reproducible, al prescindir del seguimiento
de los pacientes.
- Casos y controles.
• Tipo de diseño adecuado para evaluar la validez de una
- Cohortes (MIR 10, 185). prueba diagnóstica.
- Estudios experimentales. • Tipo de diseño más eficiente para estimar la prevalencia
- Estudios cuasi-experimentales. de una enfermedad (MIR 10, 182; MIR) (cualquier estudio
puede medir en un momento puntual la prevalencia de en-
fermedad, pero el estudio transversal es el más barato).
7.1. Estudios observacionales (MIR 15, 197) • Útil para el estudio de enfermedades crónicas.
• Útil para planificación sanitaria (Salud Pública), ya que
Se distinguen de los estudios experimentales en la ausencia permite de forma barata el estudio de enfermedades cróni-
de intervención por parte del investigador, que se limita a cas, que son las que más recursos sanitarios consumen.
observar lo que ocurre en la práctica clínica habitual (MIR).
Existen distintos estudios observacionales que se diferencian
por el tipo de seguimiento realizado a los pacientes. Inconvenientes
• Sin seguimiento (estudios transversales): estudio trans- • Muy sensible a los sesgos.
versal y estudio ecológico. • No permite valorar la secuencia temporal (ya que estudia
la presencia de la exposición y la enfermedad en el mismo
35
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
momento). Por lo tanto, no permite demostrar hipótesis Estudio de casos y controles anidado en una cohorte
etiológicas (causalidad), sino que sólo las genera (MIR). (MIR 19, 120; MIR 17, 132; MIR 13, 184; MIR 11, 180)
• No es útil para el estudio de enfermedades agudas (ya que no Es un caso particular del estudio de casos y controles que se
permite medir incidencias por no tener seguimiento) ni raras. utiliza cuando en el momento actual no existe un número
de casos suficiente para realizar el estudio. Esto suele ocurrir
cuando se estudian enfermedades agudas y epidémicas, en las
Estudio ecológico (estudio de riesgo agregado) que los casos van apareciendo poco a poco a lo largo de un
(MIR 16, 192; MIR 13, 183; MIR 11, 181) periodo de tiempo.
Este estudio consiste en realizar un seguimiento prospectivo
Es un estudio idéntico al estudio transversal, con la única de una cohorte de sujetos (de la población diana de nuestro
diferencia de tener una base comunitaria en lugar de tener estudio), e ir seleccionando los casos a medida que aparecen
una base individual. hasta alcanzar el tamaño muestral deseado. Cada vez que
Por lo tanto, es útil para generar hipótesis de trabajo pero no aparece un caso, se seleccionan de manera aleatoria entre los
las demuestra (MIR). sujetos sanos de la cohorte el número de controles que se haya
previsto para cada caso, y en ese momento se recogen los
Características de una base comunitaria:
datos de forma retrospectiva (se pregunta al caso y a los
controles por su pasado).
• Utiliza datos recogidos de grupos de personas (en lugar
de individuos), formados en general por criterios geográficos Así, sus características son idénticas a las del estudio de
(países, comunidades autónomas, ciudades...). casos y controles convencional, y sólo se diferencia en que los
pacientes se reclutan poco a poco en lugar de todos a la vez.
• Para recopilar los datos, se acude a registros, que son quie- Los estudios de casos y controles realizados utilizando los
nes proporcionan los datos (esto es, otra persona ha recogido datos de los registros poblacionales de enfermedades suelen
los datos individuales previamente y ha extrapolado los datos considerarse anidados, dado que los registros poblacionales
poblacionales, que son los que utilizaremos). suelen elaborarse de forma prospectiva (MIR 14, 199).
• Utilizan datos indirectos o secundarios (MIR) (recogidos
por otras personas). Los datos indirectos son de peor calidad
(más riesgo de sesgos) que los directos ya que no podemos Estudio de cohortes
controlar los criterios o instrumentos de medida utilizados por (MIR 20, 30; MIR 19, 121; MIR 18, 212; MIR 15, 182;
la persona que los recogió. MIR 13, 179; MIR 12, 179; MIR 11, 179; MIR 10, 180)
36
CURSOS MÉDICOS 2022
Tema 7 · Tipos de estudios epidemiológicos
Peores para Mejores para Se puede definir como un estudio de cohortes pero que tiene
demostrar hipótesis demostrar hipótesis una base comunitaria (aplicándose por tanto las característi-
cas de la base comunitaria). Así, es también similar al estudio
Más sensible a sesgos (MIR) Menos sensible a sesgos ecológico, pero con un seguimiento prospectivo.
Son grandes registros con seguimientos prospectivos largos en
Útiles para estudiar los que se trata de establecer cómo evoluciona un problema de
enfermedades raras o con Útiles para estudiar salud en una o varias poblaciones a lo largo del tiempo (MIR).
largo periodo de latencia exposiciones raras y para
En el MIR nos lo suelen mostrar relacionado a la evolución
(MIR 17, 120; enfermedades agudas
temporal de problemas medioambientales más que de en-
MIR 17, 133; MIR 11, 182)
fermedades. Ejemplos: evolución temporal de los niveles de
contaminación de un río o de un mar.
Permiten estudiar multi- Permiten estudiar multi-
causalidad (varias causas efectividad (varios efectos
de una enfermedad) de la misma exposición) 7.2. Estudios experimentales
Dificultad: Dificultad:
establecer el grupo control* sensible a pérdidas** Se distinguen de los estudios observacionales en la presencia
de intervención por parte del investigador (MIR 14, 193):
el investigador introduce de forma directa una nueva medida
*La principal dificultad de los estudios de casos y controles es seleccionar el
diagnóstica, terapéutica o preventiva en una determinada
grupo control, ya que óptimamente debe tener las mismas características que
el grupo de casos para minimizar el riesgo de aparición de sesgos de selección muestra de individuos.
o de sesgos por factor de confusión. Para conseguirlo se emplean técnicas de Son los mejores estudios para demostrar hipótesis
apareamiento (ver tema 8.2. Errores sistemáticos (sesgos)). (MIR 10, 181; MIR), y son menos sensibles a los sesgos
**Los estudios de cohortes (y cualquier estudio prospectivo) son sensibles a (MIR 13, 180) que los estudios observacionales. Por el
la aparición de pérdidas, ya que requieren ver a los pacientes en el futuro y eso contrario, todos requieren un seguimiento prospectivo y son
puede no ser posible (fallecimientos, cambio de domicilio, incomparecencia del caros, lentos y poco reproducibles. Además, están sujetos a
paciente…). En cambio, los estudios de casos y controles sólo requieren ver a problemas éticos (ya que se interviene activamente sobre la
cada paciente una vez, por lo que no pueden tener pérdidas.
salud de las personas).
Tabla 1. Diferencias entre los estudios de casos y controles y los estudios de Los tipos de estudios experimentales que se diferencian por el
cohortes (MIR). modo de asignación de la intervención:
Pasado Presente
Presente Futuro
37
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
38
CURSOS MÉDICOS 2022
Tema 7 · Tipos de estudios epidemiológicos
Seguimiento prospectivo
d i
Asignación no aleatorizada
(estudios cuasi-experimentales) Ensayo clínico no aleatorizado
Base individual
(estudio antes-después)
e j
Experimentales
Fines preventivos Ensayo de campo
Asignación aleatorizada
M
(estudios experimentales) A
Fines terapéuticos Ensayo clínico
39
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
A la hora de combinar los estudios y obtener el resultado distribuyen los estudios incluidos en el metaanálisis. Se parte
agrupado global del metaanálisis, los estudios son ponderados del supuesto de que los estudios con mayor probabilidad de no
según el tamaño muestral, la dispersión y la calidad de los ser publicados son los que no muestran diferencias (estudios
mismos, dando diversos grados de importancia a cada factor “negativos”), sobre todo si son de pequeño tamaño; si no
en los diferentes modelos. El factor principal que nos hace encontramos en nuestro gráfico estudios con esas característi-
elegir el modelo estadístico de combinación de los resultados cas, es probable que estemos incurriendo en un sesgo de pu-
es el grado de heterogeneidad de los estudios, existiendo un blicación. Como este gráfico presenta una subjetividad
modelo de efectos fijos y uno de efectos aleatorios. “visual”, en ocasiones se utilizan también pruebas analíticas
El modelo de efectos fijos se utiliza cuando la heterogenei- para verificar el sesgo de publicación, como el test de Begg o
dad es baja (MIR 11, 195); no tiene en cuenta la variabilidad el test de Egger.
entre los estudios (inter-estudios), sino que su ponderación
se basa principalmente en la variabilidad intra-estudio y en el
tamaño muestral. El modelo de efectos fijos se utiliza por tanto
cuanto los estudios incluidos son muy parecidos entre sí y con 0
el mismo tipo de pacientes (similar a un ensayo clínico con
criterios de selección muy estrictos), lo que le confiere mayor
validez interna y una mayor potencia estadística y precisión en
1
Error estándar
sus resultados.
Por otro lado, el modelo de efectos aleatorios tiene en
cuenta que los estudios pueden ser variables entre sí (varia-
bilidad inter-estudios). De este modo, los modelos de efectos 2
aleatorios son menos potentes, con intervalos de confianza
más amplios para el efecto combinado, y al no ponderarse por
tamaño muestral, pueden dar excesiva importancia a estudios
de pequeño tamaño. 3
0,1 0,33 0,6 1 3 10
Efecto
Análisis de sensibilidad
Este análisis pretende estudiar la influencia de cada uno de
0
los estudios incluidos en la estimación global del efecto y así
la estabilidad de la medida final. Consiste en la repetición del
metaanálisis tantas veces como estudios se hayan incluido, de
forma que cada vez se omite un estudio combinándose todos 1
Error estándar
Figura 4. Funnel plot (MIR 17, 18). El gráfico representa cada estudio (pun-
Sesgo de publicación tos) incluido en el metanálisis en función de su tamaño (que es inversamente
proporcional al error estándar del resultado, mostrado en el eje de ordenadas:
Es un tipo de sesgo de selección que consiste en no incluir estudios pequeños “abajo” y estudios grandes “arriba”) y de la medida del
artículos que no se hayan publicado (si no los buscamos en efecto que se obtuvo (RR, OR, etc., representado en el eje de abscisas). La
sitios muy concretos nunca vamos a encontrar esos artículos). medida del efecto agregado del metanálisis suele representarse como una
Dichos artículos suelen ser desfavorables para el tratamiento línea vertical punteada. Si la distribución de los estudios sigue una forma
experimental (simplemente porque los estudios en los que triangular y simétrica (esquema de arriba) a ambos lados de dicha medida de
el fármaco no muestra diferencias significativas no se suelen efecto agregado, existen pocas probabilidades de sesgo de publicación, pero
si “faltan” estudios en alguna región del teórico triángulo (esquema de abajo,
publicar); por tanto, si existe sesgo de publicación sobreesti-
círculo rojo) es probable la presencia de un sesgo de publicación.
maremos el efecto del fármaco experimental.
Existen varios métodos para investigar la presencia de un sesgo
de publicación. El más simple consiste en realizar un análisis
Metaanálisis acumulado
de sensibilidad para calcular el número de estudios negativos
realizados y no publicados que debería haber para modificar el Se define como aquel proceso en el cual se lleva a cabo un
sentido de una posible conclusión “positiva” del metaanálisis nuevo metaanálisis cada vez que aparece un nuevo estudio
(si este número es muy elevado, se considera que la proba- publicado. No requiere de técnicas estadísticas especiales para
bilidad de que el sesgo de publicación haya modificado los combinar los estudios. Permite estudiar de forma retrospectiva
resultados es baja, y se acepta la existencia de las diferencias el momento en el que el efecto de un nuevo tratamiento
sugeridas por el metaanálisis). supera al control.
También se puede examinar con el método conocido como el Esta forma de presentación de los resultados pone de mani-
gráfico en embudo (Funnel-plot) (MIR 15, 200), en el que se fiesto lo difícil que es para cualquier estudio individual, una vez
40
CURSOS MÉDICOS 2022
Tema 7 · Tipos de estudios epidemiológicos
se han alcanzado resultados relativamente estables, aportar aúna los componentes que debe tener toda pregunta que guía
información adicional. una investigación (MIR 20, 150):
El metaanálisis acumulado sería similar en planteamiento a un
• Pacientes: criterios de inclusión/exclusión. Cuando realizamos
ensayo clínico secuencial.
una revisión sistemática, los criterios de inclusión y exclusión
son referidos a los estudios que seleccionaremos (que pasan
a ser nuestros “pacientes”).
7.4. Estructura metodológica de
un trabajo científico (MIR 18, 225) • Intervención: tratamiento en el brazo experimental.
• Comparación: tratamiento en el brazo sin intervención.
Un proyecto de investigación debe situar las bases de la inves- • Outcome (resultado): resultado en el que nos fijaremos para
tigación a realizar. Su valor se establece en la medida en que evaluar nuestra intervención; idealmente debe contener uno
tiene plena claridad y concreción en las razones para analizar o dos objetivos primarios, y otros secundarios.
el objeto de estudio elegido, la perspectiva teórica desde
donde se sitúa el investigador, el paradigma investigativo
que sustenta todo el estudio y, por tanto, la metodología de Además, antes de empezar el estudio (a priori), se deben
aproximación a la realidad: población, muestra, estrategias de especificar todos sus aspectos metodológicos, con un cuidado
recogida de información, técnicas de análisis de la información especial en explicar todas las mediciones que se van a realizar y
y temporalidad de todo el proceso. Por orden, los elementos el método estadístico por el que se van a analizar los resultados.
fundamentales en esta estructura son: Si se extraen conclusiones de un estudio epidemiológico a pos-
teriori (estudios post hoc), dichas conclusiones no servirán
1. Introducción: contiene una descripción clara de la estruc- para confirmar hipótesis, sino que sólo sirven para generarlas
tura general del proyecto. y se deberán confirmar con nuevos estudios específicamente
diseñados para ello. Por ejemplo: realizar un análisis de subgru-
2. Justificación: contiene los argumentos fundamentales que
pos que no estaba planificado inicialmente y observar que un
sustentan la investigación a realizar.
determinado subgrupo se beneficia del fármaco.
3. Planteamiento del problema: formulación del problema
que se pretende resolver con la investigación.
2. Reclutamiento (inclusión de sujetos participantes)
4. Objeto de estudio: delimita la parte de la realidad que
interesa estudiar.
Una vez definidas las características del estudio, se realiza la
5. Preguntas de investigación: son las interrogantes básicas
inclusión de los sujetos participantes. Para incluir a un paciente
que se derivan de la justificación y el problema planteado.
en un estudio experimental, deben seguirse por este orden
6. Objetivos: las acciones concretas que se realizarán para (MIR) los siguientes pasos:
intentar responder a las preguntas de investigación. En este
apartado se incluye la hipótesis de investigación. A. Criterios de selección: verificar que el paciente cumpla
todos los criterios de inclusión y no tenga ningún criterio
7. Fundamentación teórica: directrices teóricas que guían el
de exclusión.
estudio, con las evidencias de la literatura.
B. Consentimiento informado (MIR 18, 208): el paciente
8. Metodología de la investigación: descripción y argumen-
debe expresar libremente y por escrito su consentimiento
tación de las principales decisiones metodológicas.
para participar en el estudio.
9. Población y muestra: selección de la población objetivo.
En el caso de que se utilice placebo, los sujetos deben saber
Justificación del tamaño muestral elegido.
que pueden ser tratados con éste (MIR), aunque luego no
10. Diseño de la investigación: representación gráfica que podrán conocer si están tomando el placebo o el fármaco
presenta la metodología completa, la forma en que se or- (enmascaramiento). Además, si se utiliza placebo deben in-
ganiza todo el proceso de investigación y los aspectos me- cluirse en el diseño del estudio “cláusulas de rescate” que
todológicos esenciales. permitan pasar a un sujeto del grupo placebo al grupo de
fármaco experimental si su evolución clínica empeora cla-
11. Cronograma o carta Gantt y presupuesto: estimación ramente y hay datos provisionales de mayor eficacia con el
del tiempo y dinero que tomarán cada una de las etapas de fármaco experimental.
la investigación.
Cuando administramos un fármaco en un ensayo clínico,
12. Bibliografía: fuentes documentales consideradas, cum- su efecto farmacológico total (respuesta global) tendrá los
pliendo las normas estandarizadas (p. ej., el estilo Vancouver). siguientes componentes (MIR 19, 117):
- Efecto farmacodinámico: es el efecto real terapéutico del
7.5. Fases de realización de fármaco.
los estudios epidemiológicos - Efecto placebo: es la suma de varios efectos distintos:
• Efecto placebo absoluto: se debe a la suma del efecto
1. Diseño inespecífico del fármaco (el efecto placebo que supone
recibir un fármaco) y al efecto inespecífico del médico
Idealmente, todo proyecto de investigación debería iniciarse (el efecto placebo que supone sentirse tratado por un
con una pregunta. Se ha propuesto el acrónimo PICO, que médico).
41
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
42
CURSOS MÉDICOS 2022
Tema 7 · Tipos de estudios epidemiológicos
efectos adversos se realizará con voluntarios enfermos (MIR) relevancia clínica de los resultados, pero al ser en general
(p. ej., quimioterápicos). cualitativas (p. ej., muerte: sí/no) proporcionan menor potencia
estadística. Estas variables clínicas son muchas veces subjeti-
vas (dolor, calidad de vida…), lo cual dificulta su correcta de-
Fase II y fase III terminación; son útiles en este caso las escalas de evaluación
multidimensionales, que aportan una alta relevancia clínica,
Son las fases que tienen diseño de ensayo clínico. Por lo pero pueden ser difíciles de interpretar y tener problemas de
tanto, su objetivo es valorar la eficacia y seguridad del validez para nuestra muestra concreta (MIR).
tratamiento en un grupo de enfermos. Las dos fases pueden En ocasiones, en vez de utilizar variables duras se utilizan
tener un grupo control y un diseño idéntico. En el caso de variables resultado blandas pero que han demostrado asociarse
tener grupo control, éticamente se debe emplear el fármaco de manera significativa a una determinada variable dura en
activo que sea actualmente de elección (MIR 12, 185; estudios previos (“validadas”): es lo que se llaman variables
MIR 12, 189). La utilización de placebo se reserva para los subrogadas o intermedias (MIR). Al ser variables en general
casos en los que no hay fármacos con eficacia demostrada, cuantitativas, aportarán mayor potencia estadística y por tanto
y también se permite para enfermedades que no sean graves permitirán utilizar un menor tamaño muestral en el estudio,
(sin riesgo de secuelas) y en las que exista una alta tasa de pero son siempre peores que la utilización de la variable
respuesta a placebo (MIR 14, 202; MIR 12, 232). dura en sí misma (más riesgo de sesgos). Ejemplo: analizar si
un nuevo betabloqueante consigue disminuir la PAD en 10
Las diferencias entre la fase II y la fase III son las siguientes:
mmHg (variable subrogada) en sujetos hipertensos, lo cual
ha demostrado en estudios previos aumentar la supervivencia
(variable dura).
Fase II (MIR 14, 203; MIR 13, 190)
Así, los estudios de fase III demuestran si el nuevo tratamiento
Empleo del tratamiento en un grupo reducido de enfermos va a ser útil para los pacientes desde el punto de vista clínico
(en general <100) muy seleccionados, esto es, con criterios de y constituyen la evidencia fundamental del beneficio-riesgo
selección estrictos (estudios explicativos) (MIR). del medicamento, por lo que son los que permiten que se
Además, suelen utilizar variables resultado “blandas” (MIR) comercialice un fármaco o tratamiento.
(determinaciones de laboratorio, pruebas de imagen…), que La utilización de criterios de selección laxos hace que la muestra
aportan menor relevancia clínica de los resultados, pero al sea muy heterogénea (los pacientes serán muy diferentes entre
ser en general cuantitativas proporcionan mayor potencia sí), lo cual confiere las siguientes ventajas e inconvenientes:
estadística.
En ocasiones se distingue una primera fase IIa (la que hemos • Ventajas:
mencionado hasta ahora), y una segunda fase IIb (MIR 17, 116; - Mayor validez externa: los resultados serán generaliza-
MIR 10, 187), cuyo objetivo es probar varias dosis del fármaco bles a un amplio sector de la población (así, cuando se
para establecer la relación dosis-respuesta (titulación de do- comercialice el fármaco una gran parte de la población se
sis) y elegir la dosis más adecuada para su empleo en la fase III. podrá beneficiar de él).
La utilización de criterios de selección estrictos hace que • Inconvenientes:
la muestra sea muy homogénea (los pacientes se parecerán
mucho entre sí), lo cual confiere las siguientes ventajas e - Menor validez interna: mayor riesgo de sesgos de selec-
inconvenientes: ción o por factor de confusión.
43
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
a un tratamiento por parte del personal sanitario. Intenta 7.7. Diseños especiales en estudios experimentales
detectar reacciones adversas poco frecuentes (que no se
detectaron en los ensayos clínicos realizados por su limitado
tamaño muestral) y que sólo se podrán detectar cuando el Diseño paralelo vs. diseño cruzado
fármaco se administre a miles de personas en la práctica clí-
nica habitual. El diseño paralelo es el utilizado habitualmente, por el cual
La notificación espontánea de reacciones adversas la debe un grupo de sujetos recibe un único tratamiento o interven-
realizar cualquier personal sanitario mediante la cumplimen- ción, y el otro grupo que recibe el otro tratamiento.
tación de una “tarjeta amarilla” (MIR) que se envía a la En el diseño cruzado, sin embargo, todos los sujetos reciben
Agencia Española del Medicamento y Productos Sanitarios los dos tratamientos o intervenciones en comparación (MIR).
(AEMPS), o bien a través de la aplicación web y móvil FEDRA. Un grupo recibe primero un tratamiento y luego el otro, y el
Ésta recopila las notificaciones recibidas y las reenvía a la otro grupo recibe la secuencia de tratamientos inversa. Así, lo
Agencia Europea del Medicamento, que es el organismo res- que se aleatoriza en este caso es la secuencia de administración
ponsable de la Farmacovigilancia a nivel europeo. de los tratamientos (MIR).
Si se reciben varias notificaciones que parecen sugerir que un
medicamento produce una reacción adversa, se lanza una
advertencia al respecto (“warning”) y se diseña un estudio Aleatorización Seguimiento Comparación
epidemiológico para demostrar la posible relación causal. Al
querer estudiar un problema de salud raro (reacción adversa
Grupo “A” A A
poco frecuente) el diseño habitual de dichos estudios es de
Paralelo “A” vs “B”
casos y controles.
Grupo “B” B B
Los estudios farmacoeconómicos (ver tema 7.10. Estu-
dios farmacoeconómicos) son útiles para labores de farma-
covigilancia porque permiten estudiar la utilización de un Grupo “A-B” A A A
fármaco en la población y por tanto calcular cuántas personas Cruzado “A” vs “B”
están expuestas al mismo (MIR). Grupo “B-A” B B B
FASE POBLACIÓN CARACT. OBJETIVOS Ventajas del diseño cruzado respecto al paralelo
• Características
• Requiere la mitad de tamaño muestral. En un diseño cru-
farmaco-ciné-
Voluntarios Diseño zado, cada individuo recibe los dos tratamientos, por lo que
I (sanos) transversal
ticas
sirve como su propio control y ahorra la inclusión de otro
• Toxicidad
individuo para servir de control. Si necesitamos 100 pacientes
preliminar
que tomen la medicación “A” y 100 pacientes que tomen la
medicación “B”, en un diseño paralelo tendremos que incluir
• Criterios de se- • IIa: eficacia
200 pacientes (100 por ramo de tratamiento), mientras que
lección estrictos y seguridad
en un diseño cruzado sólo necesitaremos 100 pacientes (50
•↓ n • IIb: titular dosis
II Enfermos
• Variables
en el grupo A-B y 50 en el grupo B-A).
blandas • Muestra más homogénea. El grupo de individuos que toma
el fámaco “A” es igual que el que toma el fármaco “B” (son
las mismas personas); esta circunstancia hace surgir el con-
• Criterios de se- cepto de “variabilidad intraindividual o intragrupal”
lección laxos (MIR), que hace referencia al hecho de que en los diseños
Eficacia y
III Enfermos •↑ n cruzados cada individuo es su propio control y por tanto la
seguridad
• Variables re- variabilidad que existe entre cada individuo y su control (o
sultado duras entre cada grupo y su control) es nula (son las mismas perso-
nas). Sin embargo, la “variabilidad interindividual o intergru-
• Efectividad pal” (entre dos sujetos o grupos diferentes del estudio) no
Práctica • Nuevas varía respecto al estudio paralelo.
IV clínica indicaciones
Como ya hemos visto previamente, el disponer de una mues-
habitual • Farmaco-
tra homogénea aporta ventajas:
vigilancia
- Menor riesgo de sesgos de selección y por factor de confusión.
Tabla 2. Fases del ensayo clínico. - Mayor potencia estadística y precisión de los resultados.
44
CURSOS MÉDICOS 2022
Tema 7 · Tipos de estudios epidemiológicos
Inconvenientes del diseño cruzado respecto al paralelo mientras que el siguiente ejemplo de diseño factorial utilizaría
220 pacientes (50 A, 50 B, 50 C, 20 AB, 20 AC, 20 BC, 10
• Mayor duración: dura el doble de tiempo, ya que cada su- ABC; sigue habiendo 100 pacientes en total que toman A,
jeto recibe una intervención y luego debe recibir la otra. 100 que toman B y 100 que toman C).
• Muy sensible a las pérdidas: si se pierde un paciente, se
pierde en los dos grupos de comparación “A” y “B”, por lo Diseño con n = 1 (MIR 10, 193)
que es como perder dos pacientes en un diseño paralelo.
• Efecto residual o de arrastre: efecto que deja el primer Ensayo clínico de diseño cruzado (sus características son
fármaco sobre el organismo. Tras dejar de tomar el primer totalmente aplicables) con un único individuo como muestra.
fármaco, se debe esperar un cierto tiempo (periodo de la- Se realiza cuando un paciente crónico es refractario a los trata-
vado) para que se elimine el fármaco y desaparezca su efecto mientos habituales, y su objetivo es encontrar un tratamiento
residual. que le sea útil desde el punto de vista clínico (se evalúan
Por lo tanto, el tratamiento no puede ser curativo ni dejar variables duras).
un efecto irreversible (MIR 17, 117; MIR). Además, el A diferencia del resto de estudios epidemiológicos, el objetivo
periodo de lavado de los dos fármacos debe ser similar del estudio es mejorar la salud de nuestro paciente, en lugar
(MIR). de mejorar la salud de la población.
• Efecto periodo: los dos tratamientos se administran al pa-
ciente en dos periodos de tiempo distintos, por lo que las Diseño polietápico
características clínicas de la enfermedad no deben cambiar
entre esos dos periodos para poder comparar el efecto de los
dos fármacos en las mismas condiciones basales. Los tratamientos se administran primero con dosis de in-
ducción, y posteriormente con dosis de mantenimiento (en
Por lo tanto, la enfermedad debe ser crónica. No es útil para varias “etapas”). Se utiliza principalmente en tratamientos
enfermedades agudas o que cursen con brotes, a menos que antineoplásicos.
los brotes sean predecibles (MIR) (si los brotes son prede-
cibles es el escenario más favorable para utilizar un diseño
cruzado, ya que el periodo entre los brotes funciona como Utilización de controles históricos
periodo de lavado).
45
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Análisis de subgrupos
Para poder registrar un fármaco genérico, éste debe demostrar
su equivalencia terapéutica con la especialidad de referencia
Se analizan los resultados obtenidos en subconjuntos de la mediante los correspondientes estudios de bioequivalencia.
muestra (p. ej., en ancianos, en diabéticos, en pacientes con En ellos, no es necesario demostrar la eficacia y la relación benefi-
insuficiencia renal…). cio/riesgo del producto (MIR), siendo suficiente demostrar que
Puede ser útil para conocer el comportamiento de un fármaco las características farmacocinéticas (MIR 16, 38; MIR 15, 208)
en distintos grupos poblacionales, pero su realización es muy del genérico (concentración plasmática máxima alcanzada,
sensible a los sesgos, especialmente si los subgrupos no se tiempo que se tarda hasta alcanzar esa concentración, y
han previsto desde el inicio del estudio. cantidad total de fármaco absorbida –área bajo la curva–) no
En general, el análisis de subgrupos plantea nuevas hipótesis son significativamente distintas a la del producto original.
de trabajo, pero no sirve para confirmarlas. Dichas hipótesis Los estudios de bioequivalencia suelen realizarse en voluntarios
deberán confirmarse en nuevos estudios realizados específica- sanos y con un diseño cruzado (MIR 17, 36). El análisis de los
mente en pacientes del subgrupo de interés. datos se realiza para demostrar equivalencia terapéutica con
un límite bilateral de un 20% de diferencias. Dichas diferencias
se miden en el intervalo de confianza del 90% (IC 90%)
Análisis intermedios (MIR) del cociente de medias de los parámetros farmacocinéti-
cos mencionados, que debe encontrarse entre el 80-125%
(MIR 12, 200). Se divide la media de los resultados obtenidos
Son análisis de los resultados que se realizan en momentos
en el fármaco original entre la media de los resultados obteni-
intermedios del seguimiento de un estudio, cuando dicho
dos con el genérico.
seguimiento es muy largo (por ello, se realizan sobre todo
en los estudios de fase III). La demostración de bioequivalencia permite suponer que,
ante similar indicación y con la misma pauta posológica, esos
Se realizan para evitar que pasen desapercibidas diferencias
productos presentarán la misma eficacia clínica.
importantes entre los grupos en comparación (que pueden
haber surgido antes de que finalice el seguimiento del estudio), Las diferentes formas farmacéuticas orales de liberación inmediata
y por tanto incurrir en problemas éticos (seguir tratando a (comprimidos, cápsulas…) podrán considerarse la misma forma
un grupo de pacientes con un fármaco inferior a otro): en farmacéutica siempre que hayan demostrado su bioequivalencia.
46
CURSOS MÉDICOS 2022
Tema 7 · Tipos de estudios epidemiológicos
Tmáx t
Análisis coste-utilidad (MIR 19, 124)
Administración del
fármaco Analiza la cantidad y calidad de vida. La utilidad es un concepto
estadístico que combina la probabilidad de un desenlace o
Cp: concentración plasmática. Cmáx: concentración plasmática máxima. Tmáx: resultado con las preferencias del paciente respecto a este
tiempo que se tarda hasta alcanzar la Cmáx. ABC: área bajo la curva, que es desenlace (muerte, curación, secuelas…). Una de las medidas
proporcional a la cantidad total de fármaco absorbida.
de utilidad más empleadas son los AVAC o QALY, años de
Figura 7. Parámetros analizados en un estudio de bioequivalencia.
vida ajustados por calidad de vida (MIR 19, 20; MIR 18, 217;
MIR 14, 208; MIR 12, 195). La calidad de vida relacionada
con la salud se evalúa mediante cuestionarios genéricos o
7.10. Estudios farmacoeconómicos específicos estandarizados.
Otra medida utilizada en este tipo de estudios son los años de
Los estudios farmacoeconómicos permiten analizar los resul- vida ajustados por discapacidad (AVAD o DALY en inglés
tados de un fármaco en función de su eficacia y también sus -disability adjusted life years-). Esta unidad comprende los años
costes; esto es conocido como eficiencia. en los que se acorta la esperanza de vida por la enfermedad
(años potenciales de vida perdidos: APVP o YLL en inglés -years
Estos análisis pueden ser de dos tipos. of life lost-) sumados a los años en los que el paciente vivirá
con algún tipo de discapacidad fruto de la enfermedad (años
ANÁLISIS PARCIALES ANÁLISIS COMPLETOS vividos con discapacidad: AVD o YLD en inglés -years lived with
disability-). Es la medida que mejor valora la carga global de
Descripción de costes una enfermedad (MIR 20, 178).
Descripción de consecuencias Al igual que sucede con los estudios de análisis coste-efectivi-
Descripción de costes Minimización de costes dad, para calcular si la mayor “utilidad” de un fármaco es ren-
y consecuencias Análisis coste-efectividad table con respecto a otro, realizaremos los estudios de análisis
Evaluación de eficacia Análisis coste-utilidad incremental que calculan el ratio de coste-utilidad incremental
y efectividad Análisis coste-beneficio (MIR 17, 125). Este indicador nos proporciona información
Análisis de costes sobre si los costes adicionales, originados por un cambio del
(MIR 11, 193) tratamiento A al tratamiento B, pueden ser justificados por los
beneficios clínicos subjetivos adicionales obtenidos.
Tabla 3. Tipos de análisis.
Análisis coste-beneficio
Los análisis más importantes son los completos: Mide los costes y los efectos en términos económicos
(MIR 13, 192; MIR).
Minimización de costes
Cuantifica los costes de dos o más procedimientos cuyas
consecuencias son equivalentes (MIR 17, 126; MIR). Recuerda...
PISTA MÍRICA TIPO DE ANÁLISIS
Análisis coste-efectividad
Compara el coste que supone en condiciones reales obtener Consecuencias similares Minimización de costes
un año de vida ganado, una curación, una muerte evitada, etc.
Años de vida ganados Coste-Efectividad
Para calcular si la mayor efectividad de un fármaco es rentable
respecto a otro, realizamos los estudios de análisis incremen-
Años de vida+
tal (MIR 10, 198; MIR), que calculan el ratio de coste-efectivi- Coste-Utilidad
Calidad de vida (AVAC)
dad incremental (MIR 15, 188). Este indicador nos proporciona
información sobre si los costes adicionales, originados por un Unidades monetarias (Euros)
cambio del tratamiento A al tratamiento B, pueden ser justifi- Valora hacer algo- Coste-Beneficio
cados por los beneficios clínicos adicionales obtenidos. Si los No hacer nada (MIR)
costes adicionales originados no superan el umbral de coste-
47
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Es valo-
Valora Costes tangibles
COSTE- EUROS AVAC enfermeda-
ración
UTILIDAD subjetiva de
des crónicas • Directos.
resultados
- No sanitarios: aquellos que inciden sobre pacientes o en-
Compara fermos, pero que no implican factores o recursos sanitarios.
Difícil trans-
progra- Ejemplo: apoyo social, adaptaciones en el hogar, desplaza-
formación
COSTE- EUROS EUROS
mas con
de unidades
miento para buscar atención, etc.
BENEFICIO diferentes
físicas a - Sanitarios (MIR 13, 193; MIR 10, 197): aquellos que
unidades de
monetarias representan factores o productos sanitarios que son uti-
resultados
lizados, consumidos o desgastados. Ejemplo: consumo de
fármacos o material sanitario, salarios del personal sanita-
Tabla 4. Tipos de análisis de evaluación y sus características. rio, etc.
- Negativos: aquellos que representan ahorros en los recur-
Análisis de sensibilidad sos sanitarios. Ejemplos: ahorro en servicios e intervencio-
en evaluaciones farmacoeconómicas nes evitadas, tratamientos sustituidos, etc.
• Indirectos: aquellos derivados de la reducción de la capaci-
Es el estudio del impacto de las variaciones en las variables dad para generar ingresos, la disminución del rendimiento la-
más importantes y/o con mayor incertidumbre en el resultado boral o del aumento de los costes empresariales (MIR 15, 187;
final del estudio. Variables con mayor incertidumbre: costes MIR). Ejemplos: tiempo laboral perdido, productividad redu-
más importantes (hospitalización, pruebas diagnósticas caras), cida…
efectividad, tasa de descuento.
Los resultados serán robustos cuando las modificaciones en el Costes intangibles
valor de las variables con mayor incertidumbre tengan poco
efecto en los resultados. Las modificaciones en las variables de Aquellos no valorables por los mecanismos de precio del
incertidumbre afectarán al coste y a los resultados, modifican- mercado. Ejemplos: miedo, dolor, incomodidad, ansiedad,
do el RCEI. El análisis de sensibilidad estudia cómo se modifica molestias, ocio perdido, etc.
el RCEI modificando las variables de incertidumbre (a mayor En los estudios farmacoeconómicos la perspectiva va a definir el
robustez, menor alteración del RCEI; a menor robustez mayor punto de vista desde donde se realiza el estudio. Dependiendo
alteración del RCEI). de la perspectiva escogida será necesario incluir unos costes u
Ejemplo. El fármaco A tiene un coste medio de 5000 euros y otros. Siempre que sea posible debería elegirse la perspectiva
produce una efectividad media de 3 años de vida ganados; el de la sociedad en global, ya que es la que incluye todo tipo de
fármaco B tiene un coste medio de 6000 euros y produce una costes (MIR 16, 195).
efectividad media de 4 años de vida ganados. Con estos datos,
el RCEI entre los fármacos A y B es = 1000 euros/año vida • Perspectiva hospitalaria: incluye costes directos hospitala-
ganado. Si modificamos el valor de variables incertidumbre que rios (gastos de médicos, investigadores, pacientes, farmacéu-
afecten al coste o la efectividad el RCEI se alterará. Por ejemplo, ticos, dirección hospitalaria).
si el coste del fármaco B subiera a 8000 euros, el RCEI sería = • Perspectiva extrahospitalaria: incluye costes directos
3000 euros/año de vida ganado. extrahospitalarios (ayudas de hogar, traslados en ambulan-
cias…) y costes de administración y aseguradoras.
• Perspectiva de la sociedad: incluye tanto costes directos
como indirectos (falta de productividad del paciente enfermo).
48
CURSOS MÉDICOS 2022
Tema 8
Errores en los estudios epidemiológicos
Autores: Carlos Corrales Benítez, H. U. Fundación Jiménez Díaz (Madrid). Elena Masana Flores, H. U. Virgen de las Nieves (Granada). Eduardo Franco
Díez, H. U. Ramón y Cajal (Madrid).
Tema con importancia creciente, de moda en los últimos años. Son errores debidos a un diseño inadecuado del estudio.
Últimamente lo más preguntado es el sesgo por factor de confusión
y las técnicas de enmascaramiento, pero todos los sesgos han sido • Consecuencia: afectan a la validez interna del estudio (por
preguntados y por tanto debes dominarlos. lo que, secundariamente, afectan también a la validez externa).
• No se ven influidos por el tamaño muestral (MIR).
Validez y reproducibilidad en los estudios epidemiológicos
Sesgos de selección
Al igual que en un estudio de validación de un nuevo test
diagnóstico, en cualquier estudio epidemiológico se tiene en Aparece cuando existen diferencias en las características
cuenta su validez y reproducibilidad: que tienen los distintos grupos en estudio (aparte de la caracte-
rística estudiada), y dichas diferencias influyen en los resultados
Validez (exactitud) (MIR) (MIR). Por ejemplo, un grupo es más anciano que el otro, lo
que influye en que se mueran más sujetos en dicho grupo.
Grado en que un estudio mide lo que realmente tenía como
Siempre que realizamos un estudio comparando varios grupos,
objetivo medir.
debemos confirmar al inicio del análisis de resultados que
las características de los grupos sean homogéneas (grupos
• La validez interna hace referencia a la exactitud de los re-
“comparables” entre sí (MIR 11, 185; MIR)), en cuyo caso no
sultados para los pacientes del estudio (que los resultados
habrá posibilidad de que existan sesgos de selección.
sean aplicables a la muestra), y depende de que el diseño del
estudio sea correcto (ausencia de sesgos) (MIR 12, 181).
• Solución. La aleatorización (MIR 14, 197) a la hora de
• La validez externa hace referencia a que los resultados sean formar los grupos disminuye las probabilidades de que las
aplicables a la población diana (MIR), y depende de lo re- características de los pacientes se distribuyan de forma dis-
presentativa que sea la muestra de la población (ausencia de homogénea entre los grupos.
errores aleatorios) (MIR 11, 177). La validez interna es un
El análisis de subgrupos y el análisis estratificado per-
prerrequisito de la validez externa.
miten, a posteriori (tras finalizar el estudio), comprobar si las
diferencias en las características de los grupos participantes
Reproducibilidad (fiabilidad, precisión) influyen en los resultados (MIR) (y por tanto si suponen un
sesgo de selección), pero no permiten eliminar el sesgo.
Grado de un estudio de obtener el mismo resultado si se
repitiera en otras muestras distintas en las mismas condiciones.
Depende de lo representativa que sea la primera muestra Ejemplos de sesgos de selección
respecto a la población de la que se obtienen las siguientes
muestras para repetir el estudio (por tanto, de la presencia de • Sesgo de autoselección (del voluntario). Cuando se re-
errores aleatorios) (MIR). cluta a pacientes voluntarios para participar en un estudio,
suelen ser pacientes que no encuentran alivio con los trata-
mientos disponibles y buscan “a la desesperada” una solu-
8.1. Errores aleatorios ción. Dichos pacientes suelen por tanto estar más graves
que la media, lo cual puede afectar a los resultados (cualquier
fármaco tenderá a ser menos efectivo).
El hecho de que estudiemos muestras de individuos y no a la
población completa puede hacer que nuestra muestra no sea • Sesgo del obrero sano. Si para estudiar una enfermedad
representativa de la población. laboral se acude al lugar de trabajo para seleccionar a los
individuos, se infraestimará la frecuencia de enfermedad, ya
• Tipos de errores aleatorios: error de tipo I (alfa) y error de tipo que aquellos sujetos enfermos no estarán trabajando sino
II (beta) (ver tema 3.1. Errores en contraste de hipótesis). de baja.
• Consecuencia: afectan a la validez externa del estudio (no • Sesgo diagnóstico (de Berkson). Sesgo que ocurre cuando
afectan a la validez interna). se seleccionan los individuos de un estudio de entre pacien-
tes hospitalizados, y el factor que se está estudiando es un
• Solución: el aumento del tamaño muestral disminuye el factor de riesgo para hospitalizarse.
riesgo de cometer errores aleatorios y aumenta la potencia
estadística del estudio.
49
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Ejemplo: se analiza la posible relación causal entre el VIH no la presentan o viceversa. Por ejemplo, el esfingomanómetro
y los linfomas en pacientes hospitalizados mediante un del estudio está estropeado y siempre marca PAS 150 mmHg;
estudio de casos (pacientes con linfoma) y controles (hos- clasificaremos mal a los sujetos no hipertensos ya que pensare-
pitalizados por otras causas), analizando la frecuencia de mos que son hipertensos.
VIH en cada grupo. Tanto el VIH como los linfomas son
por sí mismos factores de riesgo de ingresar en el hospital
Sesgo de clasificación incorrecta no diferencial
(si un individuo con VIH o con linfoma enferma por otras
causas, es probable que le ingresen porque su enfermedad Aparece por errores en los aparatos de medida que condi-
de base le convierte en un paciente de alto riesgo). Así, cionan el mismo nivel de error en la clasificación de todos los
entre los pacientes “hospitalizados por otras causas” habrá grupos del estudio.
un subgrupo de pacientes cuyo motivo de hospitalización Dichos errores tienden a diluir el efecto de la exposición o
será VIH (mientras que el grupo de pacientes con linfoma tratamiento estudiados, por lo que infraestiman la asociación
ya tienen bastante con su tumor para ingresar). Esto hará (MIR 17, 121; MIR).
que infraestimemos la asociación entre linfoma y VIH, al
encontrar más pacientes VIH en el grupo control. Su solución pasa por mejorar los aparatos de medida (MIR)
(aumentar su S y E).
• Sesgo de incidencia/prevalencia (falacia de Neyman)
(MIR). Sesgo que ocurre en los estudios de casos y contro-
les al estudiar enfermedades que tienen una fase aguda con Sesgo de clasificación incorrecta diferencial
altas tasas de letalidad y una fase crónica posterior (p. ej., Aparece por errores subjetivos de los pacientes o del inves-
IAM, ictus, disección de aorta), ya que sólo podremos estu- tigador a la hora de clasificar las variables resultado de los
diar a los casos “prevalentes” (crónicos que han sobrevivido a pacientes. Estos sesgos suelen aparecer cuando el paciente
la fase aguda) mientras que se nos pasarán desapercibidos los o el investigador conoce a qué grupo pertenece el pa-
casos “incidentes” (agudos que fallecieron). Las característi- ciente, de modo que los pacientes que reciban la intervención
cas de los casos prevalentes pueden ser distintas a las de los experimental o los investigadores pueden interpretar una
casos incidentes y eso tener implicaciones en los resultados. falsa mejoría en variables subjetivas (bienestar, dolor, etc.)
Ejemplo: al analizar la relación causal de la FA con el ictus, respecto de los pacientes del grupo control (que reciben o bien
infraestimaremos la asociación porque los ictus cuya causa nada, o placebo, o un fármaco activo control): la clasificación
es cardioembólica por FA tienen una mayor letalidad que los de las variables es distinta en cada uno de los grupos.
ictus por otras causas. Así, los casos “prevalentes” de ictus Así, este sesgo sobreestima los resultados (MIR 19, 116),
tendrán una prevalencia de FA menor que la del conjunto ya que el grupo experimental verá sus variables resultado
de pacientes con ictus (sumando los casos incidentes y los subjetivas artificialmente mejoradas.
prevalentes). Su solución consiste en emplear técnicas de enmascaramien-
to (ciego) (MIR 11, 234):
50
CURSOS MÉDICOS 2022
Tema 8 · Errores en los estudios epidemiológicos
• Sesgo de memoria o amnésico (MIR 14, 198; MIR 10, 186). Soluciones a priori del sesgo por factor de confusión
En los estudios de casos y controles, los casos suelen recordar (MIR 18, 210; MIR)
más la exposición al factor de riesgo que los controles.
• Restricción: el FC supone un criterio de exclusión para el es-
• Sesgo de atención o efecto Hawthorne. Los participantes
tudio. Así, ningún paciente (ni del grupo expuesto ni del no
de un estudio pueden actuar de modo distinto del habitual
expuesto) tendrá el FC y éste no podrá influir en los resultados.
simplemente por sentirse observados.
• Apareamiento (MIR 11, 178; MIR): por cada paciente in-
Por ejemplo: un ensayo clínico estudia la eficacia de la rosu-
cluido en el grupo expuesto que posea el FC, incluiremos
vastatina para el tratamiento de la hipercolesterolemia. Todos
un paciente en el grupo no expuesto que lo posea. Así, el
los pacientes deberán seguir una dieta baja en grasas y reali-
porcentaje de pacientes con el FC será el mismo en ambos
zar ejercicio, y a un grupo de pacientes, además, se les admi-
grupos, y se eliminará la influencia del FC sobre la asociación
nistrará rosuvastatina. Los pacientes que sepan que les ha
exposición-enfermedad.
tocado el fármaco experimental realizarán en mayor propor-
ción ejercicio físico que los que sepan que no reciben trata-
miento, ya que tratarán de “ayudar” al fármaco con más La aleatorización puede contribuir a minimizar la posibilidad
ilusión y esperanza para mejorar su salud. de cometer un sesgo por factor de confusión, pero no es un
método que permita controlarlo por sí misma.
Recuerda...
Figura 2. Trabajadoras de la fábrica Hawthorne Works, de la compañía Western El análisis de subgrupos y el análisis estratificado permiten, a
Electric. El efecto Hawthorne recibe su nombre por unos estudios sobre produc-
posteriori, detectar el sesgo de selección (pero no eliminarlo),
tividad industrial realizados en dicha fábrica de la localidad de Cicero (Illinois)
entre 1924 y 1932. El estudio más famoso consistió en comparar la productividad
así como detectar y eliminar el sesgo por factor de confusión.
industrial con iluminación ambiental más alta o más baja, y sus resultados fueron
que la productividad aumentó tanto en el grupo sometido a alta iluminación,
como en el sometido a baja iluminación; fue el hecho de saberse observados el Tanto el sesgo de selección como el sesgo por factor de confu-
que propició que las trabajadoras aumentaran su productividad. sión se sospechan cuando existen diferencias significativas en
alguna característica de los grupos en comparación. Los resul-
tados del análisis de subgrupos o estratificado que realicemos
Sesgo por factor de confusión (FC) permitirán saber si estamos ante un factor de confusión o un
sesgo de selección.
Un factor de confusión es un factor de riesgo para la enfer- El resultado del sesgo de selección se denomina factor modi-
medad en estudio, y que además se asocia estadísticamente ficador del efecto, y actúa (al contrario que el factor de
a la exposición cuya asociación causal con la enfermedad confusión) de forma dependiente a la exposición (potenciando
queremos estudiar (MIR 14, 200; MIR). Además, el factor su efecto). Puede ser además un factor de riesgo independien-
de confusión debe actuar de forma independiente a la te de la enfermedad, pero no tiene por qué serlo.
exposición en cuanto al mecanismo por el que provoca la
enfermedad (no puede ser un paso intermedio en la relación Factor de Factor modificador
exposición-enfermedad). confusión del efecto
51
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
Sesgo de atricción • A todos los pacientes se les debería realizar la nueva prueba
diagnóstica y la prueba gold standard (de otro modo no es
posible conocer la sensibilidad/especificidad real).
En cualquier estudio epidemiológico puede haber pérdidas,
y dichas pérdidas pueden ser de dos tipos: las pérdidas pre- • Los estudios deberían ser siempre enmascarados; no se
aleatorización se producen cuando los pacientes no cumplen debe conocer el resultado del gold estándar al realizar el test
los criterios de selección del estudio, y afectan por tanto a su nuevo, ni viceversa.
validez externa. Las pérdidas post-aleatorización se producen
en los estudios prospectivos tras la asignación del tratamiento,
y pueden afectar a la validez interna. Sesgos de selección en estudios
de validación de pruebas diagnósticas
Cuando existen diferencias en el porcentaje de pérdidas
post-aleatorización de los distintos grupos de un estudio
prospectivo, y las pérdidas no se incluyen en el análisis esta- Afectan específicamente a estudios de validación de pruebas
dístico de los resultados, aparece un sesgo de atricción (MIR). de screening.
Habitualmente, si los dos grupos tienen características homo-
géneas, la diferencia en las pérdidas se deberá a un efecto
adverso del tratamiento experimental por el cual los sujetos de Sesgo de duración de la enfermedad (length-time bias)
dicho grupo abandonan más el estudio que los del otro grupo. (MIR 20, 33)
La solución del sesgo de atricción consiste en estudiar los Sobreestima el efecto de los tests de screening en enfer-
resultados mediante un análisis por intención de tratar en medades leves respecto a las graves. Las enfermedades
lugar de un análisis por protocolo. leves suelen tener una evolución más lenta y por tanto una
mayor duración total que las enfermedades graves (cuya
• Análisis por protocolo (MIR). Sólo se estudian los resulta- evolución suele ser más rápida). Por ello, como los pacientes
dos de los pacientes que finalizan el estudio. Si existe dife- con enfermedades leves viven más años con la enfermedad,
rente proporción de pérdidas entre el grupo experimental y tendrán más posibilidades de ser diagnosticados con pruebas
el control y estas pérdidas se deben a efectos adversos del de screening realizadas con una determinada periodicidad que
fármaco experimental, sobreestimaremos el beneficio del los pacientes con enfermedades graves.
fármaco experimental al no tener en cuenta a los pacientes De este modo, parece que la realización del test y su diagnós-
que tienen que dejar de tomarlo (y por tanto dejan de bene- tico precoz supone un aumento en la supervivencia solo en las
ficiarse de él). enfermedades leves.
Es un peor tipo de análisis y sólo se permite realizarlo en los Este sesgo es mayor a medida que la prueba es menos sensi-
estudios con diseño de no inferioridad (MIR). ble. Las pruebas poco sensibles detectan peor la enfermedad,
tanto los casos leves como los graves. Los casos graves duran
• Análisis por intención de tratar (MIR 13, 188). Se estudian
menos tiempo y por tanto reciben menos número de tests de
los resultados de todos los pacientes reclutados en el estudio
screening (menos probabilidades de ser detectados); sin em-
(todos los pacientes aleatorizados) (MIR), incluyendo a los
bargo los casos leves duran mucho tiempo y reciben varios
pacientes que cursen pérdida o que sean traspasados entre
tests de screening durante la duración de la enfermedad, por
grupos, considerándose cada paciente como perteneciente al
lo que tendrán más probabilidades de ser detectados. Así, se
grupo al que fue aleatorizado (p. ej., un paciente aleatorizado
sobreestima aún más la ventaja del screening en las enferme-
a tratamiento médico al que finalmente se somete a cirugía
dades leves respecto a las graves.
por fracaso del tratamiento médico se considera un fracaso
del tratamiento médico y no un éxito de la cirugía). Permite
estudiar la causa de las pérdidas y el efecto global del fár-
maco teniendo en cuenta que un porcentaje de pacientes no
se lo tomará (situación que simula a la que se observará en la
práctica clínica real una vez se comercialice el fármaco).
Es el mejor tipo de análisis y el único permitido en los estudios
con diseño de superioridad.
52
CURSOS MÉDICOS 2022
Tema 8 · Errores en los estudios epidemiológicos
(p.ej. cáncer de próstata en un hombre de 100 años) detectada Sesgo de verificación o de validación (MIR 19, 130)
por una prueba de screening supone un sobrediagnóstico: su
Ocurre en estudios retrospectivos. En la práctica clínica
detección no aporta beneficios al paciente, ya que iba a fallecer
habitual, a los pacientes que dan positivo en las pruebas
por otra causa sin llegar a presentar síntomas.
diagnósticas iniciales se les realizan pruebas adicionales (más
Por tanto, se infraestima la utilidad del test. específicas) para confirmar el diagnóstico, mientras que a los
pacientes que dan negativo, en cambio, no se les realizan
más pruebas. Esto hace que sea imposible calcular de manera
Sesgo del voluntario sano
correcta la sensibilidad y especificidad de las pruebas iniciales
Habitualmente, los sujetos que se presentan como volunta- (no sabemos el total de enfermos ni de sanos, al no haber
rios a estudios de pruebas de screening son personas más hecho la prueba gold standard en los pacientes negativos);
comprometidas con su estado de salud y a cooperar para sólo permitirá calcular su valor predictivo positivo (en los
mejorarla. Esto lleva a que, independientemente del cribado, pacientes que dieron positivo sí hemos realizado el test gold
estos pacientes tengan una expectativa de vida mayor (hábitos standard y sabemos cuántos son enfermos y cuántos sanos).
de vida más saludables). Si realizamos estudios prospectivos, en cambio, podremos in-
El efecto de este sesgo actúa, por tanto, sobreestimando el cluir en el protocolo del estudio que se realizará la prueba gold
efecto del screening. standard en todos los pacientes, sean positivos o negativos en
¡OJO! No confundáis este sesgo con el sesgo de autoselección el test diagnóstico que queremos validar; esto evitará incurrir
(del voluntario) en los ensayos clínicos; en dicho caso, los pa- en un sesgo de verificación.
cientes que suelen prestarse a participar en los ensayos clínicos
son los más graves (se infraestima la eficacia del tratamiento
Sesgo de sospecha diagnóstica
experimental).
Sobreestima el efecto del test diagnóstico. Ocurre en estudios
tanto prospectivos como retrospectivos, cuando no se en-
Sesgos de clasificación en estudios mascara el resultado del gold standard a los evaluadores de
de validación de pruebas diagnósticas los resultados del test diagnóstico que estamos evaluando, o
viceversa. Conocer el resultado de un de las pruebas puede
influir en la interpretación de la otra prueba realizada sobre el
Son sesgos de clasificación incorrecta diferencial. mismo paciente. Este sesgo se corrige enmascarando dichos
resultados.
Sesgo de adelanto diagnóstico (lead-time bias) Por ejemplo, si un médico debe decidir si una prueba diagnós-
tica con componente subjetivo (por ejemplo una radiografía
Ocurre cuando realizamos pruebas diagnósticas de screening de tórax) es positiva o negativa, y conoce que previamente al
a pacientes en fase pre-clínica. En este caso estamos realizando sujeto se le realizó otra prueba que dio positivo, tendrá mayor
un diagnóstico cuando el paciente está todavía asintomático tendencia a informar la radiografía de tórax también como
y, por tanto, la duración confirmada de la enfermedad será positiva en los casos dudosos.
mayor que si realizásemos la prueba solamente a pacientes que
ya están en fase clínica. Así, se alarga el tiempo que el paciente
vive con la enfermedad cuando hemos realizado un test del
screening, y con ello parece que mejora la supervivencia.
Este sesgo sobreestima el efecto que tiene el método de
screening, pareciendo que aumenta la supervivencia de la en-
fermedad, cuando en realidad lo que aumenta es el tiempo en
que somos conscientes de la presencia de la enfermedad.
Diagnóstico por
aparición de
síntomas a los
Sin screening 73 años
Muerte a
los 75 años
Inicio Supervivencia
del cáncer a 5 años = 0%
Diagnóstico por
test de
screening a los
Con screening 65 años
Muerte a
los 75 años
Inicio Supervivencia
del cáncer a 5 años = 100%
53
CURSOS MÉDICOS 2022
Manual AMIR · Estadística y Epidemiología
54
CURSOS MÉDICOS 2022
Valores normales en
Estadística y Epidemiología
Error β β <0,2
Intervalo 99% (de confianza en est. inferencial) μ +/- 2,5σ (2,5eem en inferencial)
EEM EEM = σ / √n
55
CURSOS MÉDICOS 2022
Reglas mnemotécnicas
Estadística y Epidemiología
Regla mnemotécnica
Para recordar el error alfa: α-fetoproteína (α-FP).
56
CURSOS MÉDICOS 2022
BIBLIOGRAFÍA
• Manual de Epidemiología y Salud Pública para grados en ciencias de la salud, 3.ª edición. I Hernández-Aguado, B Lumbreras
Lacarra. Editorial Médica Panamericana, 2018.
• Métodos de investigación clínica y epidemiológica, 4.ª edición. JM Argimón Pallás, J Jiménez Villa. Elsevier España, 2012.
• El método estadístico en la investigación médica, 6.ª edición. JL Carrasco de la Peña. Ciencia 3 Distribución, 1995.
57
CURSOS MÉDICOS 2022
NOTAS
Oviedo
Bilbao
Santiago
Navarra
Valladolid Zaragoza
Barcelona
Salamanca
Madrid
Valencia
Albacete
Alicante
Córdoba Murcia
Sevilla
Granada
Málaga
Las Palmas
de Gran Canaria