Características de Pruebas Diagnósticas
Características de Pruebas Diagnósticas
Características de Pruebas Diagnósticas
diagnsticas
A. Gmez de la Cmara
Unidad de Investigacin. Hospital Doce de Octubre y Atencin Primaria. Insalud rea 11. Madrid.
Introduccin
Entendemos por prueba diagnstica o test
(PD) cualquier procedimiento para la obtencin de informacin clnica en un paciente. Las PD pueden ser procedimientos
diagnsticos instrumentales, exploraciones fsicas, cuestionarios, etc. Las PD aportan informacin que permite distinguir pacientes con diferentes probabilidades de
enfermar.
La validez operativa de una PD puede expresarse en trminos de exactitud diagnstica. Entendemos por validez operativa la propiedad de clasificar correctamente
a los sujetos en el grupo clnicamente correspondiente. Entendemos por exactitud
diagnstica el grado de calidad de la informacin provista por la PD (sensibilidad,
especificidad). La utilidad diagnstica de
una prueba diagnstica se refiere al valor
prctico de la informacin que no tiene por
qu coincidir con el de la exactitud diagnstica. La validez operativa nos permite
clasificar a los pacientes en grupos distintos con implicaciones diagnsticas, pronsticas o teraputicas diferentes, por
ejemplo, presencia o no de metstasis, de
infecciones o grado de afectacin neurolgica mediante la escala de Glasgow. Para
ello queremos pruebas con una gran exactitud diagnstica, alta sensibilidad y especificidad, o desde otro punto de vista
con la mnima proporcin de falsos positivos y negativos posible. Sin embargo, la
persecucin de la mnima cantidad de resultados falsos puede hacer que la prueba, con alta exactitud diagnstica, sea
poco til desde un punto de vista prctico; por ejemplo, toracotoma exploradora
sistemtica en busca de ganglios afectados para hacer el estudio de la extensin
de un carcinoma broncognico.
Pruebas diagnsticas
o de cribaje?
Hay diferencias entre una prueba diagnstica o de cribaje (screening en lengua
inglesa)? En esencia no, sus propiedades
son comunes, slo las aplicaciones son
distintas. Las pruebas diagnsticas se
realizan para verificar la naturaleza de un
sntoma, sndrome o consulta en pacientes bajo sospecha de enfermedad. En general se trata de personas seleccionadas
en funcin de una sospecha diagnstica o
por presentar sntomas, signos u otras
pruebas diagnsticas previas que modifican la imagen de normalidad. Las pruebas de screening, por el contrario, se
realizan en general, para identificar individuos con riesgos distintos de padecer
una enfermedad pero asintomticos. En
cualquiera de las dos situaciones nos puede interesar ms la sensibilidad o la especificidad (visin instrumental) o bien
nos puede preocupar las consecuencias de
un falso positivo o negativo (visin clnica). Esto depende de la situacin especfica en la que trabajemos independientemente de que sea con intenciones
diagnsticas o de cribaje.
No prueba
No trato
Caractersticas operativas
de las pruebas diagnsticas
Las caractersticas o prestaciones de las
pruebas diagnsticas sirven de base metodolgica para la toma de decisiones en
la prctica clnica. Se asume, que un individuo sano y otro enfermo pueden ser
distinguidos de manera vlida (exacta y
reproducible por una determinada prueba
diagnstica).
Las pruebas diagnsticas:
1. Deben ser expresadas en trminos de
variable o parmetro, es decir, deben presentar la capacidad de ser medidas en relacin con una enfermedad o estado particular; este es el caso de la hipertensin,
que medimos a partir de la tensin arterial diastlica en milmetros de mercurio,
o de la presencia de tuberculosis que se
mide en funcin del tamao en milmetros
Necesidad de prueba
diagnstica
No prueba
S trato
100%
Presencia de enfermedad
Fig. 1. Espectro continuo de la probabilidad de enfermar. Obsrvense los umbrales de decisin: en la izquierda de la
flecha la probabilidad de la enfermedad es baja, no se hacen pruebas diagnsticas ni se trata. En el extremo derecho
la probabilidad de padecer la enfermedad es alta, se trata directamente sin hacer pruebas diagnsticas. La toma de
decisiones se puede ver favorecida por la presencia de pruebas diagnsticas en el medio del espectro donde la incertidumbre es ms grande.
4872
Idepsa 98
Cualitativa
Clasifica a un paciente sano o enfermo si
el valor de la prueba diagnstica cae por
encima o por debajo de un criterio, valor
umbral, punto de corte, valor de referencia, etc.
Por qu dicotomizamos? Al dicotomizar
se simplifica el anlisis de la informacin
clnica reduciendo el conjunto de probabilidades a manejar. De esta manera, slo
tenemos en consideracin la probabilidad
de la enfermedad (P[E]), la probabilidad de un resultado positivo (P[PD+]), la
probabilidad condicional de tener la enfermedad dado un test o prueba con resultado positivo (P[EuPD+]) y la probabilidad condicional de tener la enfermedad
dado una prueba con resultado negativo
(P[EuPD]). Las ventajas de esta fragmentacin de informacin es que se adapta a la toma de decisiones en la clnica:
tratar o no tratar. La desventaja es que se
pierde parte de la informacin que albergan resultados con un espectro de posibilidades mas amplio.
Para caracterizar a una prueba diagnstica, es necesario disponer de un patrn de
Enfermedad
Presente
Ausente
Positiva
Verdadero
positivo
Falso
positivo
Negativa
Falso
negativo
Verdadero
negativo
Prueba
Fig. 2. Clasificacin de los resultados de una prueba diagnstica al contrastarlos con el estndar de referencia. Vase
explicacin en el texto.
TABLA 1
Caracterizacin de pruebas diagnsticas
P(E)
P(PD+|E)
P(PD+|E)
P(PD-|E)
P(PD-|E)
P(E|PD+)
P(E|PD-)
P(PD+|E)/P(PD+|E)
P(PD-|E)/P(PD-|E)
4873
Idepsa 98
Pruebas combinadas
Combinacin en serie
La prueba A se utiliza en primer lugar y
a todos los positivos se les aplica la prueba B; (++) = +. Las pruebas en serie se
realizan de manera secuencial. Estn ms
indicadas cuando no urgen y/o una prueba es cara o peligrosa, todas las pruebas
diagnsticas de la secuencia deben ser positivas para confirmar la enfermedad. Las
pruebas en serie disminuyen la sensibilidad al aumentar la proporcin de falsos
negativos. Aumentan la especificidad e incrementan el valor predictivo positivo.
Combinacin en paralelo
Las pruebas A y B se aplican simultneamente. Aportan mucha informacin a
la vez (urgencias). Un resultado positivo
en cualquiera de las pruebas se considera
evidencia de la enfermedad. Todos los positivos en una de ambas se les considera
positivos:
(+ ) = +; (+ +) = +; ( +) = +
Las pruebas en paralelo aumentan la sensibilidad, aumentan el valor predictivo ne-
Procedimiento bayesiano
Valores predictivos
Valor predictivo-positivo
de una prueba diagnstica
TABLA 2
Cul es la probabilidad de que un individuo con un resultado positivo tenga la enfermedad? Clculo del valor predictivo positivo
mediante el teorema de Bayes
Conocemos
P(PD+uE)
P(PDuE)
P(E)
Necesitamos
Probabilidad de un resultado positivo dado
que se tiene la enfermedad
Probabilidad de un resultado negativo dado
que no se tiene la enfermedad
Probabilidad a priori
Sensibilidad
P(EuPD+)
Especificidad
P(E uPD)
Prevalencia
P(PD+)
Sabemos que:
Queremos saber:
4874
Idepsa 98
Examen
+
Examen
Maltrato
285
(2,85%)
970
(9,7%)
1.255
(12,55%)
15
(0,15%)
8,730
(87,3%)
8,745
(87,45%)
300
9.700
10.000
3%
97%
100%
P(PD+uE) . P(E)
P(EuPD+) =
TABLA 4
Distribucin de los resultados de una
prueba diagnstica frente a prevalencias
diferentes de la enfermedad
Enfermedad
A
PD+
PDTotales
Totales
570
150
720
30
850
880
600
1.000
1.600
(prevalencia de la enfermedad:
600/1.600 = 0,38 = 38%)
Enfermedad
B
PD+
PDTotales
Totales
270
195
465
30
1.105
1.135
300
1.300
1.600
(prevalencia de la enfermedad:
300/1.600 = 0,19 = 19%)
TABLA 5
Distribucin de los cocientes de probabilidad positivos y negativos en distintos puntos de corte
Niveles
500
400
300
200
100
Enfermedad presente
(PD+)
Enfermedad ausente
(PD)
CP (+)
Sens./1Esp.
240/600
162/600
90/600
114/600
30/600
10/1.000
15/1.000
25/1.000
100/1.000
850/1.000
34
18
6
1,9
0,05
0,6
0,74
0,87
0,90
6,3
Distribucin de los valores de los cocientes de probabilidad positivos y negativos segn punto de corte del parmetro diagnstico. En este
ejemplo, la prueba diagnstica son los niveles de concentracin en sangre de un marcador biolgico utilizado para la deteccin de cncer. Obsrvese la evolucin de los cocientes. En el CP (+) los niveles superiores tienden a confirmar la presencia de enfermedad. El CP () expresa
que la presencia de una prueba diagnstica negativa PD () tiende a descartar la enfermedad. En los niveles inferiores la situacin es inversa.
TABLA 6
Caractersticas operativas de los resultados de una prueba diagnstica (tabla 4A)
Sensibilidad
Especificidad
Cociente de probabilidad positivo
Cociente de probabilidad negativo
Valor predictivo positivo
Valor predictivo negativo
Prevalencia. Probabilidad a priori
Pre-test odds
Post-test odds
Probabilidad Post-test: valor
predictivo positivo
a / (a+c)
d / (b+d)
sens/(1-espec) [a/(a+c)]/[b/(b+d)]
(1-sens)/(espec) [c/(a+c)]/[d(b+d)]
a/(a+b)
d/(c+d)
(a+c) / (a+b+c+d)
prevalencia / (1-prevalencia)
pre-test odds * Cociente de Prob. (+)
post-test odds / (post-test odds + 1)
570/600
850/1.000
0,95/0,15
0,5/0,85
570/720
850/880
600/1.600
95%
85%
6,3
0,58
79%
96%
37,5%
0,6
0,6*6,3=3,78
3,78/1+3,78 = 0,79
79%
Especificidad
*
*
Sensibilidad
proporcin de
verdaderos
positivos
Otros indicadores
de pruebas diagnsticas
*
*
Cociente de probabilidad
(Likelihood ratio)
El cociente o razn de probabilidad o cociente de verosimilitud es la razn entre la probabilidad de un resultado en
CP ()
Esp./1Sens.
*
0
Fig. 3. Curva de rendimiento
diagnstico.
1- Especificidad
Proporcin de falsos positivos
4875
Idepsa 98
A)
1,0
Espec.
0,0
Sensib.
Procedimiento bayesiano
El cociente de probabilidad resulta muy
til para calcular la probabilidad a posteriori de una enfermedad, o lo que es lo
mismo, el valor predictivo de una prueba
diagnstica. Para ello tenemos que hacer
algunas transformaciones previas. La prevalencia de la enfermedad (probabilidad a
priori) la transformamos en Odds. Odds
es otra forma de expresar una probabilidad, resulta de dividir una probabilidad P
por su complementario (1-P), de tal forma que la Odds de prevalencia u odds preprueba sera:
Odds preprueba = P/(1-P).
Esta cantidad es multiplicada por el cociente de probabilidad para darnos la
Odds post prueba. La odds postprueba
la reconvertimos en probabilidades, encontrndonos as el valor predictivo positivo de una prueba diagnstica (tablas 4
y 6).
B)
1,0
Espec.
0,0
Sensib.
C)
1,0
Espec.
0,0
Sensib.
Estrategias diagnsticas
Especificidad
Confirmar un diagnstico
Sensibilidad
Valor de un resultado positivo. Un resultado positivo en una situacin de alta prevalencia procedente de una prueba con
alta especificidad tendr un valor predictivo positivo muy elevado, con carcter
confirmatorio. Elegiremos pruebas con cociente de probabilidad elevados, en general procedentes de pruebas en serie. El
mismo razonamiento nos sirve para reducir falsos positivos cuando sus consecuencias clnicas son muy nocivas. Por
ejemplo, la presencia de tres o ms respuestas positivas en el cuestionario de
CAGE para la deteccin del alcoholismo
entre los pacientes de un servicio de Medicina Interna tiene una especificidad del
99%. Los que respondan en tres o cuatro
respuestas afirmativamente pueden ver
confirmado el diagnstico de dependencia
alcohlica.
Descartar un diagnstico
Valor de un resultado negativo. Un resultado negativo en situaciones de baja prevalencia y procedente de pruebas con alta
sensibilidad debe hacernos tender a descartar un diagnstico. Exigiremos un alto
4876
Idepsa 98
Fig. 4. Tres pruebas diagnsticas diferentes. Una prueba ideal (A) separa claramente aquellos que tienen la
enfermedad de los que no la
tienen, la curva ROC se
aproxima o superpone al
ngulo superior izquierdo. El
rea bajo la curva es igual
a 1. La curva (C) muestra
una prueba diagnstica sin
ningn poder de discriminacin. El rea bajo la curva
tiene un valor de 0,5. En la
mayora de las ocasioness
una prueba diagnstica dibuja una curva como la (B)
en algn lugar entre (A) y
(B), con un rea bajo la curva entre 0,5 y 1. La mejor
prueba diagnstica es aquella que presenta el mayor
rea bajo la curva.
estndar; que los procedimientos de verificacin del resultado de la prueba diagnstica y del patrn de referencia sean independientes; que dichas comparaciones
sean ciegas. Exigiremos precisin (fiabilidad) es decir, disminucin del error aleatorio, generalmente aumentando el tamao de la muestra (exigir siempre intervalos
de confianza en los parmetros de una
prueba diagnstica). Para caracterizar una
prueba diagnstica elegiremos una muestra que abarque el espectro ms completo
de enfermedad y haremos una eleccin
adecuada y suficiente de la poblacin de
estudio (aplicabilidad). Es necesario una
clarsima y estable definicin de lo que se
considere normal.
Los distintos puntos de corte de la sensibilidad y de la especificidad trazan un polgono cuya rea bajo la curva nos da una
idea de la calidad de la informacin de dicha prueba diagnstica. Cuanto ms grande sea esa rea, es decir, cuanto ms se
acerque el grfico de la curva hacia el vrtice superior izquierdo de la grfica, mejor ser esa prueba. En ese vrtice, la sensibilidad y la especificidad son del 100%.
Para comparar dos pruebas diagnsticas,
se comparan las reas bajo la curva. La
curva con mayor rea es la mejor (valorar intervalo de confianza de la diferencia
y significacin estadstica) (fig. 4).
Curvas de rendimiento
diagnstico o curvas ROC
Las pruebas diagnsticas no tienen slo
un valor de sensibilidad y especificidad
sino varios. Se trata de observar la distribucin de la sensibilidad y la especificidad de una prueba diagnstica en relacin
con diferentes puntos de corte. Las curvas
ROC representan un ndice de la exactitud
con que una prueba diagnstica discrimina los estados de salud a lo largo del espectro de trabajo de una prueba diagnstica. Slo el espectro entero de pares
sensibilidad/especificidad aporta una imagen de la exactitud de una prueba. Las
curvas ROC se construyen para cada punto de corte deseado situando la proporcin
de verdaderos positivos en el eje de la Y
y la proporcin de falsos positivos en el
eje de las X (fig. 3).
En unas ocasiones nos interesa ms trabajar sobre la sensibilidad y en otras sobre la especificidad.
BIBLIOGRAFA RECOMENDADA
Fletcher RH, Fletcher SW. Epidemiologa clnica. Ed espaola. Barcelona: Ediciones Consulta, 1989.
Hanley JA, McNeil BJ. The meaning and use of the area
under a receiver operating characteristic (ROC) curve.
Radiology 1982; 143: 29-36.
Queralt JM. Pruebas diagnsticas cuantitativas. Curvas
de rendimiento diagnstico. Medicine 1990; 6(9): 7077.
Pozo Rodrguez F. Utilizacin clnica de pruebas diagnsticas. En: Tratado de Epidemiologa Clnica. Universidad de Alicante 1996.
Sackett DL, Haynes RB, Tugwell P. Clinical Epidemiology: A Basic Science for Clinical Medicine (2nd. ed.).
Boston: Little, Brown Co, 1991.
Sox HC, Blatt MA, Higgins MC, Marton KI. Medical Decision Making. Boston: Butterworth-Heinemann, 1980.
Weinstein MC, Fineberg HV. Clinical Decision Analysis.
Philadelphia: Saunders Company, 1980.
4877
Idepsa 98