Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Aspectos Estadísticos Del Cuestionario de Calidad de Vida Relacionada Con Salud Short Form

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 46

ESTADSTICA ESPAOLA

Vol. 50, Nm. 167, 2008, pgs. 147 a 192

Aspectos estadsticos del Cuestionario


de Calidad de Vida relacionada con
salud Short Form36 (SF-36)(*)
por
INMACULADA AROSTEGUI MADARIAGA
Departamento de Matemtica Aplicada y Estadstica e Investigacin Operativa
Universidad del Pas Vasco UPV/EHU

VICENTE NEZ-ANTN
Departamento de Economa Aplicada III (Econometra y Estadstica)
Universidad del Pas Vasco UPV/EHU

RESUMEN
La Calidad de Vida Relacionada con Salud (CVRS) es un parmetro destacado en la medicin de resultados en salud. Es un concepto
difcil de medir y su medicin se realiza a travs de cuestionarios. Las
propiedades psicomtricas de un cuestionario, su adaptacin cultural,
el diseo del estudio y el anlisis de los resultados plantean cuestiones estadsticas importantes que deben tratarse con cautela. El Cuestionario de Salud SF-36 es uno de los instrumentos ms utilizados, va(*) Agradecemos al editor de la revista y a los dos evaluadores annimos por sus comentarios y sugerencias, que han servido de ayuda para mejorar considerablemente el trabajo
que exponemos en este artculo. Asimismo, agradecemos a los investigadores de los proyectos aqu mencionados que nos han permitido utilizar los datos de CVRS recogidos de los
pacientes reclutados en sus estudios, que nos han servido para ilustrar las caractersticas del
SF-36 desde una perspectiva estadstica. En particular, este agradecimiento se extiende a: J.
M. Quintana, C. Anitua, N. Gonzlez, A. Padierna, A. Valdivieso, A. Escobar, M. Garca, J.
Prez Izquierdo y C. Badiola. Este trabajo ha sido parcialmente financiado por el Ministerio de
Educacin y Ciencia y fondos FEDER (MTM2004-00341 y MTM2007-60112) y el Departamento
de Educacin del Gobierno Vasco UPV/EHU Econometrics Research Group IT-3334-07).

148

ESTADSTICA ESPAOLA

lidados y traducidos en el campo de la medicin de la CVRS. Este


trabajo quiere recalcar la importancia de contrastar las hiptesis del
modelo a la hora de elegir y valorar un anlisis estadstico en aquellos
estudios donde se ha utilizado el SF-36. Se presentan ejemplos de
aplicacin del SF-36, as como anlisis ms concretos para mostrar
las diferencias obtenidas mediante distintas tcnicas de anlisis estadstico y su repercusin en el mbito clnico.
Palabras clave: calidad de vida, SF-36, anlisis estadstico, bondad de
ajuste.
Clasificacin AMS: 62J05, 62J12, 62P10.

1. INTRODUCCIN
La Organizacin Mundial de la Salud (OMS) defini hace ya varias dcadas la
salud como un estado de completo bienestar fsico, mental y social, y no simplemente la ausencia de enfermedad o discapacidad (World Health Organization
1952). El modelo biosicosocial en medicina enmarca aspectos referidos al bienestar del paciente, como sus relaciones como persona, su comportamiento, el entorno
en el que se desenvuelve y sus relaciones sociales, en lo que se conoce con el
nombre de Calidad de Vida (CV) (Sanz 1991). Si bien el concepto de CV no es
nuevo, en la dcada de los 80 se produjo un creciente e inusitado inters popular y
mdico por la CV, especialmente en los pacientes con cncer. En 1973 eran nicamente 5 los artculos que aparecan en la base de datos Medline con la palabra
clave quality of life. Este nmero se increment de forma casi exponencial, siendo
durante los siguientes periodos de cinco aos 195, 273, 490 y 1.252 los artculos
localizados mediante el mismo criterio.
Lo que significa CV es una cuestin personal. As, el sentido subjetivo de bienestar de cada persona derivado de la experiencia diaria de su vida, se abre camino
entre la medicina y las ciencias sociales. La evaluacin de la CV debe incluir todas
las reas de la vida impactadas por la enfermedad o su tratamiento: la fsica, la
psicolgica, la social y la espiritual. El problema para medir la CV estaba en la falta
de un instrumento nico y global capaz de acomodar todas las componentes que
definen el concepto de CV. Desde mediados del siglo pasado, existen mltiples
pruebas psicomtricas objetivas que incluyen las diferentes categoras funcionales
del paciente y calculan una puntuacin global de CV. La ms antigua es el ndice
funcional de Karnofsky (Karnofsky y Burchernal 1949), que es aplicado por el
mdico y slo mide capacidad fsica. En 1976 Katz y Akpom describen el Activities
Daily Living (ADL) Index que mide las actividades sociobiolgicas de la vida diaria:

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

149

baarse, vestirse, alimentarse, etc. Durante la dcada de los aos 80 se desarrollaron mltiples instrumentos para medir la CV en pacientes con cncer, buscando el
cumplimiento de las siguientes caractersticas: (i) evaluar la morbilidad subjetiva e
impacto del tratamiento sobre el enfermo en sus aspectos fsicos, psquicos y
sociales; (ii) basarse en el paciente como fuente de informacin, reflejando su
opinin; y (iii) ser vlido, sensible, sencillo y convincente.
La CV, globalmente considerada, es algo difcil de definir, y depende en gran
medida de la escala de valores por la que cada individuo ha optado, ms o menos
libremente, y de los recursos emocionales y personales de cada uno. Adems, est
sometida a determinantes econmicos, sociales y culturales y se modifica, con el
paso del tiempo, para un mismo individuo. Durante la dcada de los 90 se desarrolla un nuevo concepto, el de Calidad de Vida Relacionada con la Salud (CVRS) o
salud percibida. Este integra aquellos aspectos de la vida directamente relacionados con el funcionamiento fsico y mental y con el estado de bienestar (Guyatt et al.
1993). La medicin de la CVRS hace posible obtener informacin sobre la enfermedad y su impacto en la vida del paciente de una forma estandarizada, comparativa y objetiva (Goldsmith 1972 y 1973). La mejor forma de medir la CVRS es
utilizar un enfoque multidimensional, valorando tanto el estado objetivo de salud, de
funcionalidad y de interaccin del individuo con su medio, como los aspectos ms
subjetivos de satisfaccin del individuo y la percepcin de su propia salud (Testa y
Simonson 1996). La CVRS tiene un lugar destacado en la investigacin de resultados en salud (Clancy y Eisenberg 1998) como un parmetro de medicin de los
estados de salud y evaluacin de los resultados de los cuidados mdicos, en
especial en el campo de las enfermedades crnicas. En Estados Unidos la Food
and Drug Administration obliga a incluir la CVRS como un resultado para la evaluacin de los nuevos tratamientos aplicables a las enfermedades crnicas. En Europa, la Agencia Europea del Medicamento no obliga an, pero s recomienda la
inclusin de esta medida en la evaluacin de nuevos tratamientos contra el cncer.
La evaluacin de la CVRS es una disciplina joven y, por tanto, con muchas cuestiones sin resolver que muestran campos de investigacin en desarrollo.
El mtodo clsico para determinar y evaluar de una forma vlida el impacto de
la enfermedad en la vida diaria del individuo y en la sensacin de bienestar es la
administracin de cuestionarios. A travs de stos se pone de manifiesto que el
estado de salud de los pacientes no siempre se corresponde con los datos que
proporcionan las medidas biolgicas habitualmente utilizadas para su evaluacin
clnica, y que los ndices de actividad de la enfermedad no siempre son buenos
predictores de la CVRS de los pacientes (Wilson y Kaplan 1995).
Existen muchas publicaciones que recalcan la importancia de contrastar las hiptesis y las limitaciones de las medidas de CVRS y los mtodos asociados al

150

ESTADSTICA ESPAOLA

diseo del estudio y al anlisis de los datos antes de utilizar dichas medidas de
CVRS como variables dependientes de inters (Testa y Nackley 1994). Tanto al
disear un estudio, como al analizar los datos de CVRS existen cuestiones estadsticas importantes que deben considerarse con suma cautela (Cox et al. 1992). Una
primera cuestin es el estudio de las propiedades psicomtricas de los cuestionarios existentes, as como su adaptacin cultural a nuestro entorno. Una segunda
cuestin, no menos importante, es el plan de anlisis estadstico de los datos
recogidos que permita presentar los resultados de forma adecuada. Es en este
punto donde el estudio de las propiedades estadsticas de las medidas de CVRS
utilizadas adquiere especial importancia. Por ejemplo, la distribucin de probabilidad de la variable resultado CVRS. Si se utilizan tcnicas de anlisis estadstico
que requieren que la variable tenga una distribucin normal, ser necesario comprobar el cumplimiento de esta hiptesis y, en caso de que no se cumpla, habr
que estudiar la robustez de las tcnicas utilizadas, adems de las consecuencias
prcticas de este incumplimiento en los resultados obtenidos. Otro aspecto, ms
especfico, es la multiplicidad de la respuesta, debido a la naturaleza multivariante
de las variables de CVRS. Existe bibliografa diversa sobre el tipo de anlisis
estadstico que debe utilizarse cuando se dispone de mltiples respuestas de
CVRS (OBrien 1984 y Pocock et al. 1987). Finalmente, aquellos estudios con un
diseo longitudinal tienen un problema aadido en el tratamiento de los datos
faltantes y prdidas de seguimiento de carcter no aleatorio. Este tema se desarrolla de forma detallada por Mesbah et al. (2002) y Fairclough (2002) como aspectos
importantes a tener en cuenta en el diseo y anlisis de estudios de CVRS.
Este trabajo se centra en la segunda de las cuestiones anteriormente mencionadas. En este sentido, es necesario recalcar la importancia de contrastar las
hiptesis del modelo al elegir y valorar un anlisis estadstico en aquellos trabajos
donde la variable de estudio sea la CVRS. En la seccin 2, se describen los distintos tipos de instrumentos de evaluacin de la CVRS y sus caractersticas generales. La seccin 3 se centra en uno de los cuestionarios de salud genricos ms
difundidos, el denominado Short Form - 36 (SF-36). En esta seccin se describe el
cuestionario de salud SF-36, incluyendo su desarrollo, validacin y adaptacin
cultural. Adems, se incluye una revisin detallada de trabajos publicados en los
que se ha utilizado el SF-36 como cuestionario de medicin de CVRS y los mtodos de anlisis estadstico que se han aplicado para analizar los datos recogidos en
estos estudios. Tambin se incluye y comenta la bibliografa existente en la actualidad sobre las diferentes alternativas de anlisis estadstico de datos de CVRS en
general, y del cuestionario de salud SF-36 en particular. En la seccin 4, se presentan ejemplos de aplicacin del cuestionario SF-36. Ms concretamente, se profundiza en las caractersticas de la distribucin emprica de las reas de CVRS obtenidas mediante el cuestionario de salud SF-36 en las diferentes muestras analizadas.

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

151

De esta forma, nos interesaremos en mostrar que, en general, los datos de CVRS
recogidos por medio del cuestionario de salud SF-36 no siguen una distribucin de
probabilidad normal. Esta hiptesis se ilustrar con doce ejemplos procedentes de
diferentes campos de la medicina, incluyendo reas mdicas y quirrgicas, as
como poblacin sana. Asimismo, utilizaremos algunos ejemplos concretos para
mostrar las diferencias obtenidas de resultados procedentes de distintas tcnicas
de anlisis estadstico y su repercusin en el mbito clnico. Finalmente, en la
seccin 5, presentamos algunas conclusiones del trabajo.

2. CUESTIONARIOS DE CVRS
2.1

Conceptos bsicos: tipos de cuestionarios

Un cuestionario diseado para medir CVRS debe basarse en el paciente como


fuente de informacin, reflejando su opinin. Hay que tener en cuenta algunas
consideraciones prcticas cuando se pretende administrar el cuestionario en condiciones habituales de la prctica clnica. Es decir, ste debe ser aceptado por los
pacientes, profesionales sanitarios y por los investigadores. Por tanto, al disear el
estudio y seleccionar el/los cuestionario/s de CVRS a utilizar es fundamental maximizar la informacin conseguida y minimizar la carga para investigadores y pacientes. Como norma general, se deben seleccionar instrumentos que hayan sido
evaluados debidamente. Lohr (2002) realiza una revisin sobre los atributos para
evaluar instrumentos.
Los cuestionarios de CVRS pueden ser autoadministrados o realizarse mediante
entrevista personal o telefnica. En general un cuestionario que pueda ser completado por el paciente es ms prctico (Sanz 1991). Los cuestionarios de CVRS
tienen dos partes. La primera parte contiene unas instrucciones de administracin
para el usuario, o el entrevistador si los datos se recogieran mediante entrevista. El
formulario debe ir tambin acompaado de una declaracin explcita de confidencialidad y garanta de anonimato. La segunda parte es el cuestionario propiamente
dicho, que consta de unas dimensiones de la CVRS y unos tems o preguntas que
describen los diferentes niveles de estas dimensiones. Cada pregunta es respondida en forma de una escala. Al describir las respuestas obtenidas o compararlas
entre grupos de individuos, pueden utilizarse los tems originales, las dimensiones
de salud especficas o incluso una medida global de CVRS.
Los cuestionarios de CVRS se pueden clasificar en funcin de si se desea explorar las distintas dimensiones o aspectos del dao que ocasiona una enfermedad,
o de si se pretende integrar las dimensiones en un nico indicador que resuma y
cuantifique las consecuencias de padecer una determinada enfermedad. El primer

152

ESTADSTICA ESPAOLA

caso es un enfoque multidimensional que refleja la naturaleza de la CVRS como un


concepto tridimensional, recogiendo aspectos fsicos, mentales y sociales (McDowell y Newell 1996). El segundo es un enfoque unidimensional donde se busca
colapsar las distintas dimensiones para buscar un nico indicador que pueda servir
para medir o comparar distintas actuaciones o estados de salud. La obtencin de
las dimensiones y una medida global requieren de tcnicas de ponderacin. En
muchas ocasiones la puntuacin en una dimensin se obtiene simplemente sumando los resultados de los tems correspondientes a dicha dimensin; mientras
que, en otras ocasiones, los resultados de los tems se ponderan de forma ms o
menos compleja. Sin embargo, la mayora de los expertos coinciden en que es
preferible obtener puntuaciones de manera simple y razonablemente justificada,
realizando un anlisis de sensibilidad posterior de los resultados bajo diferentes
supuestos, que conducir experimentos muy elaborados para derivar escenarios de
ponderacin sofisticados (Cox et al. 1992). Una cuestin a debate a finales de la
dcada de los 90 ha sido la fiabilidad de tcnicas estadsticas como el anlisis
factorial mltiple como mtodo de reduccin de tems y construccin de escalas de
CVRS (Juniper et al. 1997 y Fayers y Hand 1997). Como norma general, Fayers et
al. (1998), en su respuesta al trabajo de Juniper et al. (1997), sugieren que la
construccin de escalas de CVRS no debe confiar ciegamente en la psicometra,
sino que debe apoyarse ms firmemente en la clinimetra.
Los instrumentos de CVRS se pueden clasificar en genricos y especficos (Patrick y Deyo 1989). Se denominan instrumentos genricos aquellos que miden
mltiples dimensiones o categoras y estn diseados para su aplicacin en una
gran variedad de pacientes. Los instrumentos especficos se centran en la medida
de aspectos concretos de una determinada enfermedad (como, por ejemplo, cncer
o asma), de una poblacin (como, por ejemplo, ancianos o adolescentes), una
funcin (como, por ejemplo, sueo o actividad sexual) o un aspecto clnico (como,
por ejemplo, dolor o disnea). En general, los instrumentos especficos tienen un
mayor poder de discriminacin; es decir, son ms capaces de detectar diferencias
entre tratamientos alternativos (Ferrer et al. 1997 y Torres et al. 1999). Sin embargo, cuando se pretende comprobar el impacto que una determinada intervencin
tiene en el estado de salud, hay que tener en cuenta que sta tambin influye en
las caractersticas ms generales del paciente. Por tanto, al evaluar el estado de
salud ser conveniente utilizar tambin algn instrumento genrico (Guyatt et al.
1993). Cuando se pretende dar respuesta a problemas especficos de salud, se
buscan instrumentos que sean sensibles a variaciones de CVRS en enfermedades
especficas. Sin embargo, cuando el objetivo es comparar estados de salud entre
s, de cara al establecimiento de prioridades sanitarias o sociales, se busca un nivel
de comparacin abstracto y global sobre el dao que producen las enfermedades.
Por tanto, los instrumentos deben ser generales. Como norma general, es aconse-

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

153

jable incluir en el estudio tanto instrumentos especficos como genricos. Aunque


los investigadores debern tener en cuenta el tiempo necesario para realizar este
trabajo en condiciones habituales de prctica clnica, siempre buscando un equilibrio entre conseguir la mxima informacin a su alcance y entorpecer al mnimo la
labor de los profesionales sanitarios.
Bowling (1991) muestra con detalle los instrumentos de CVRS existentes, su
contenido, caractersticas y propsito y McHorney (1999) presenta un cronograma
del desarrollo de los diferentes instrumentos de medicin de CVRS, tanto genricos
como especficos, desde los aos 40 hasta finales de la dcada de los 90.
2.2

Propiedades psicomtricas

Las caractersticas bsicas que definen a un buen instrumento de medida de la


CVRS segn Donovan et al. (1989) son: a) vlido, en el sentido de ser capaz de
medir aquellas caractersticas que se pretende medir y no otras; b) preciso o fiable,
es decir con un mnimo error de medida; y c) sensible, o sea, capaz de detectar
cambios tanto entre diferentes individuos como en la respuesta de un mismo
individuo a lo largo del tiempo (sensibilidad al cambio o responsiveness). Los
criterios de evaluacin de un instrumento de medida de la salud se han estudiado
ampliamente en el campo de la psicometra (Streiner y Norman 1992) y han sido
tambin aplicados concretamente en el rea de CVRS (van Knippenberg y de Haes
1988 y Hays et al. 1993). A continuacin presentamos un breve resumen de estos
criterios.
De las caractersticas de un instrumento de CVRS anteriormente mencionadas,
probablemente la validez es la caracterstica ms importante que debe exigirse a un
buen cuestionario. El concepto de validez se puede desglosar en tres aspectos
diferentes: validez de criterio, validez de contenido y validez de constructo. La
validez de criterio, significa que el cuestionario es adecuado al problema que se
quiere medir. Esto se comprueba comparando el instrumento con un patrn de
referencia o gold standard. Teniendo en cuenta que los instrumentos de CVRS
miden fenmenos subjetivos o abstractos, resulta difcil valorar hasta qu punto una
medicin representa el fenmeno de inters, dado que no existe tal patrn de
referencia. La validez de contenido (face validity) consiste en comprobar si los
tems en un instrumento o una dimensin concreta cubren el rea que se pretende
cubrir de forma clara y precisa. Los expertos sugieren que la validez de contenido
mejora considerablemente cuando se dispone de asesoramiento de origen diverso
en el desarrollo del instrumento de CVRS (personal mdico, de enfermera, asistentes sociales, pacientes, etc.) (Aaronson 1989). La validez de constructo se comprueba comparando el instrumento con otras medidas. Por ejemplo, se comprueba
que los resultados de CVRS difieren entre grupos de individuos con diferentes

154

ESTADSTICA ESPAOLA

estados de salud, o se comprueba su correlacin con resultados clnicos, radiolgicos o de laboratorio que representen gravedad de la enfermedad. De manera
formal, estos conceptos pueden contrastarse con tcnicas estadsticas ampliamente utilizadas en la psicometra para tal fin (Campbell y Fiske, 1959 y McDowell y
Newel, 1996)
La segunda de las caractersticas de un instrumento es la fiabilidad o capacidad
para medir lo mismo en repetidas ocasiones bajo las mismas condiciones. La
opcin bsica para medir la fiabilidad interna de un instrumento es el coeficiente
alfa de Cronbach (Cronbach, 1951). Una alternativa es el test-retest, aunque esto
puede ser difcil de llevar a la prctica en contextos como el de los ensayos clnicos.
Cuando el cuestionario no es autoadministrado hay que tener en cuenta que el
grado de acuerdo entre entrevistadores tambin afecta a la fiabilidad.
La tercera caracterstica de un instrumento de CVRS es la sensibilidad al cambio o responsiveness. Un instrumento de CVRS debe ser capaz de detectar cambios en la CV, cuando los haya, especialmente cuando se utiliza para medir la
efectividad de un tratamiento (Guyatt et al. 1987). Existe bibliografa reciente sobre
cmo debe medirse e interpretarse la sensibilidad al cambio de un instrumento en
cada contexto (Murawski y Miederhoff 1998 y Beaton et al. 2001).
Adems de las tres caractersticas bsicas mencionadas, hay una cuarta que
debemos mencionar: el grado de generalizacin de un instrumento. En general, un
cuestionario no debe usarse en otro contexto a aquel para el cual ha sido diseado
(de Vet et al. 2001).
2.3

Validacin de la traduccin y adaptacin cultural

El proceso de traduccin y adaptacin cultural de un cuestionario ha sido tratado


con detalle en referencias diversas (Gandek y Ware, 1998). Bada et al. (1999)
realizan una excelente recopilacin de los instrumentos de evaluacin de la CVRS
adecuadamente traducidos al castellano. La lista incluye versiones castellanas de
instrumentos genricos y especficos.

3. CUESTIONARIO DE SALUD SF-36


3.1

Desarrollo, validacin y adaptacin cultural

El cuestionario de salud SF-36 es un instrumento genrico de medicin de


CVRS, que consta de 36, preguntas diseado por Ware et al. a principios de los
noventa (Ware y Sherbourne 1992 y Ware et al. 1993). El SF-36 proporciona un

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

155

perfil del estado de salud y es aplicable tanto a pacientes como a poblacin sana.
El cuestionario cubre 8 dimensiones, que representan los conceptos de salud
empleados con mayor frecuencia cuando se mide CVRS, as como aspectos relacionados con la enfermedad y su tratamiento. Las dimensiones evaluadas son
funcionamiento fsico, rol fsico, dolor corporal, salud general, vitalidad, funcionamiento social, rol emocional y salud mental del paciente. Adicionalmente, el SF-36
incluye una pregunta de transicin sobre el cambio en el estado de salud general
con respecto al ao anterior. Este tem no se utiliza para el clculo de ninguna de
las 8 dimensiones principales. Las puntuaciones de las 8 dimensiones del SF-36
estn ordenadas de forma que a mayor valor mejor es el estado de salud. Para
cada dimensin, los tems son codificados, agregados y transformados en una
escala con un rango de 0 (el peor estado de salud) a 100 (el mejor estado de
salud). Adems, el cuestionario permite el clculo de dos puntuaciones resumen,
fsica y mental, mediante la suma ponderada de las puntuaciones de las ocho
dimensiones principales. Los pesos incorporados en el clculo de las puntuaciones
resumen se obtienen a partir de una poblacin de referencia (Ware et al. 1994). La
tabla 1 muestra las caractersticas de las ocho dimensiones principales, las dos
resumen y la pregunta de transicin del cuestionario de salud SF-36. El SF-36 est
dirigido a personas de 14 o ms aos de edad y preferentemente debe ser autoadministrado, aunque tambin es aceptable la administracin mediante entrevista
personal o telefnica.
Tabla 1

CARACTERSTICAS PRINCIPALES DEL CUESTIONARIO DE SALUD SF-36


Funcionamiento fsico
Rol fsico
Dolor corporal
Salud general
Vitalidad
Funcionamiento social
Rol emocional
Salud mental
Transicin
Resumen Fsico
Resumen Mental

N TEMS

N NIVELES

PUNTUACIN(1)

10
4
2
5
4
2
3
5
1
35
35

21
5
11
21
21
9
4
26
5

0 100
0 100
0 100
0 100
0 100
0 100
0 100
0 100

50 (10)
50 (10)

(1) Las puntuaciones 0 100 tienen ese rango y se interpretan como el peor o mejor estado
de salud, respectivamente; en las puntuaciones 50 (10) la poblacin de referencia tiene una
media de 50 con una desviacin estndar de 10, por lo que valores superiores o inferiores a
50 indican un mejor o peor estado de salud, respectivamente, que la poblacin de referencia.

156

ESTADSTICA ESPAOLA

Ware et al. (1993) incluyen estudios de validacin del SF-36 como herramienta
para medir CVRS. Adems, se han publicado diversos estudios de validacin del
SF-36 por otros autores, que lo comparan con otros instrumentos de medicin de
salud ms generales y complejos (Brazier et al. 1992 y Stansfeld et al. 1997). Otros
autores han utilizado el SF-36 en pacientes enfermos para medir su capacidad de
discriminar entre diferentes diagnsticos o niveles de gravedad, validando as el
instrumento en diferentes diagnsticos. Algunos ejemplos son: Harper et al. (1997)
para la Enfermedad Pulmonar Obstructuva Crnica (EPOC), Dawson et al. (1996)
para prtesis total de cadera y Wachtel et al. (1992) para infeccin por Virus de
Inmunodeficiencia Humana (VIH). McDowell y Newell (1996) realizan una exhaustiva descripcin del desarrollo del SF-36, incluyendo comentarios crticos. Ware
(2000) ofrece un resumen actualizado y bien documentado de aspectos diversos
relacionados con el cuestionario de salud SF-36. Ms recientemente, el SF-36 ha
sido calificado como la medida de salud genrica basada en el paciente ms evaluada en un estudio bibliogrfico sobre el incremento de las medidas de CVRS
publicado en el British Medical Journal (Garratt et al. 2002). Sus buenas propiedades psicomtricas, que han sido evaluadas en ms de 400 artculos, y la multitud
de estudios ya realizados, lo convierten en uno de los instrumentos con mayor
potencial y aceptacin en el campo de la CVRS.
El cuestionario SF-36 ha sido traducido en ms de 50 pases como parte del International Quality of Life Assessment (IQOLA) Project (Aaronson et al. 1992, Ware
et al. 1995 y 1996a y Gandek y Ware 1998). Este proyecto incluye investigadores
de 14 pases, incluyendo Espaa. Las adaptaciones validadas y publicadas por el
proyecto IQOLA incluyen el castellano (Alonso et al. 1995), el francs (Perneger et
al. 1995), el alemn (Bullinger 1995), el sueco (Sullivan et al. 1995) y el italiano
(Apolone et al. 1997), as como diferentes variaciones del ingls para su uso en
Canad, Reino Unido, Australia y Nueva Zelanda (McCallum 1995). Una dcada
despus de su creacin, Vilagut et al. (2005) realizan una revisin crtica del contenido, propiedades mtricas y nuevos desarrollos de la versin castellana del SF-36.
Asimismo, existe una versin en cataln, que fue desarrollada a partir de la castellana. Recientemente, el SF-36 ha sido traducido al euskera y su validez contrastada, a partir de la versin original inglesa, siguiendo un mtodo similar al utilizado
para la versin castellana (Gonzlez et al. 2005). Actualmente existen ms de 500
publicaciones que usan traducciones o adaptaciones al ingls del SF-36.
En 1996 se desarroll la versin 2.0 del cuestionario original SF-36 con el objetivo, entre otros, de mejorar las caractersticas mtricas de las escalas de rol fsico
y emocional (Ware et al. 2000). Actualmente ya se ha desarrollado la versin 2.0
del cuestionario en castellano, aunque por el momento no hay datos sobre su
validacin, ni estudios comparativos con la versin original (Vilagut et al. 2005).

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

157

La pgina web del SF-36 (http://www.sf-36.org) ofrece informacin detallada y


peridicamente actualizada sobre el cuestionario de salud, as como un foro de
discusin de antiguas y nuevas publicaciones e interpretacin de resultados.
3.2

El SF-36 como medida de CVRS

Durante la ltima dcada, gran parte de la investigacin en CVRS se ha concentrado en la evaluacin de la CVRS como medida de resultado en ensayos clnicos
(Fairclough 2002). El anlisis estadstico de datos de CVRS en el mbito de los
ensayos clnicos est tambin ampliamente documentado (Olschewski y Schumacher 1990, Cox et al. 1992, Fayers y Machin 2000 y Mesbah et al. 2002). Asimismo,
la informacin combinada sobre calidad de vida y cantidad de vida en lo que se
denomina aos de vida ajustados por calidad de vida se ha utilizado ampliamente
en la evaluacin econmica y la toma de decisiones en la asignacin de recursos
sanitarios (Torrance 1987). Sin embargo, existe mucha menos literatura publicada
en el mbito de medicin de resultados de CVRS en poblaciones tanto sanas como
enfermas. Hay muchos contextos en los cuales no es posible disear un experimento en forma de ensayo clnico y, por tanto, donde la decisin sobre el tratamiento a seguir se toma basndose en estudios observacionales donde la CVRS se
mide como resultado. Los estudios observacionales donde se recoge la CVRS
tienen como objetivo, no slo medir y comparar la CVRS entre las diferentes poblaciones, sino tambin estudiar la relacin de la CVRS y su evolucin con otras
caractersticas del sujeto o la enfermedad. En este tipo de estudios no experimentales hay infinidad de variables que no pueden ser controladas por el investigador en
la fase de diseo, como lo son en los ensayos clnicos. Es en este contexto donde
se centra este trabajo, utilizando como medida de la CVRS el cuestionario de salud
SF-36. El anlisis de los datos obtenidos en estudios no experimentales de CVRS
se resume en tres etapas: en primer lugar se pretende identificar las variables que
influyen sobre la CVRS de los pacientes; en segundo lugar, se pretende realizar un
anlisis multivariante de los diversos factores que influyen en la CVRS, incluyendo
en el modelo todos aquellos factores susceptibles de modificar la calidad de vida
detectados en el primer paso; y en tercer lugar estudiar la evolucin de la CVRS
durante el periodo de seguimiento del estudio, realizando un anlisis de medidas
repetidas sobre el modelo seleccionado en el paso anterior.
3.3

Anlisis estadstico del SF-36 como variable dependiente

La lista de publicaciones sobre estudios no experimentales de CVRS en los cuales se ha utilizado el cuestionario SF-36 como variable dependiente es muy larga.
Aqu hemos revisado algunos de estos trabajos con unos objetivos similares a los

158

ESTADSTICA ESPAOLA

mencionados en la seccin 3.2, resumiendo los mtodos de anlisis estadstico que


se han utilizado en los mismos.
Algunos autores realizan nicamente un anlisis de la varianza simple. Por
ejemplo, Wilson et al. (1999) comparan la CVRS en personas con diferentes niveles
de consumo de tabaco; Laforge et al. (1999) comparan la CVRS en funcin del
ejercicio fsico realizado; Hassan et al. (1998) comparan la CVRS en pacientes con
fatiga crnica y dos niveles de inmunologa intracelular. Otros autores incluyen un
anlisis mltiple de la varianza o un anlisis de la covarianza y realizan un anlisis
estadstico clsico. Por ejemplo, Mozes et al. (1999) analizan el SF-36 en funcin
de los sntomas urinarios ajustando por otras variables socio-demogrficas y clnicas en ancianos; Wahl et al. (1999) analizan el SF-36 en funcin del grado de
disfuncin ajustando por variables socio-demogrficas y clnicas en pacientes con
soriasis; Leidy et al. (1999) analizan el SF-36 en funcin de la frecuencia de las
convulsiones, tiempo transcurrido desde la ltima convulsin, sexo, edad y enfermedades asociadas en pacientes con epilepsia; Lee et al. (1997) comparan la
CVRS de pacientes con visin borrosa con pacientes con visin normal ajustando
por variables socio-demogrficas y clnicas; Mahler y Mackowiak (1995) analizan el
SF-36 en funcin del nivel de disnea ajustando por otras variables clnicas en
pacientes con EPOC; Revicki et al. (1995) comparan la CVRS en pacientes con
dos niveles de infeccin por VIH ajustando por variables socio-demogrficas y
clnicas; Lyons et al. (1994) comparan la CVRS de pacientes con 11 diagnsticos
comunes ajustando por edad y sexo; y Jacobson et al. (1994) comparan la CVRS
en pacientes con dos niveles de diabetes ajustando por nmero y gravedad de las
complicaciones debidas a la diabetes. Por ltimo, hay una gran cantidad de trabajos con un diseo longitudinal, que estudian la influencia de diversos factores en la
evolucin de la CVRS por medio de un anlisis de la varianza de medidas repetidas, como, por ejemplo, Coulehan et al. (1997) estudian el efecto del tratamiento en
la evolucin de la CVRS en pacientes con trastorno de depresin; Komaroff et al.
(1996) comparan la evolucin de la CVRS en pacientes con sndrome de fatiga
crnica con otros seis diagnsticos; y Bubien et al. (1996) estudian la evolucin de
la CVRS en pacientes con arritmias recurrentes.
Todas las tcnicas estadsticas mencionadas hasta el momento son casos particulares del modelo de Regresin Lineal Mltiple (RLM), el cual asume que la
distribucin de la variable dependiente es normal. Algunos de los trabajos citados
mencionan en sus limitaciones el hecho de que la distribucin de ninguna de las
reas del SF-36 sea normal. Parte de los trabajos con un diseo longitudinal han
utilizado como variable dependiente el cambio en CVRS, cuya distribucin se
acerca ms a la normalidad exigida en las tcnicas de anlisis clsicas. Por ejemplo, Hemingway et al. (1997) han estudiado la evolucin de la CVRS en una gran
cohorte de funcionarios; Anderson et al. (1998) han estudiado la evolucin de la

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

159

CVRS comparando el SF-36 y el Quality of Well Being Scale (QWB), en pacientes


con enfermedades graves, SIDA y cncer, entre otras; Ware et al. (1996b) han
comparado la evolucin de la CVRS en pacientes crnicos tratados en sistemas de
salud privados y pblicos; Tsevat et al. (1996) han comparado la evolucin de la
CVRS en pacientes con infeccin por VIH asintomticos, sintomticos pero sin SIDA
y con SIDA; Patrick et al. (1995) han estudiado la evolucin de la CVRS en pacientes
con citica y dolor lumbar; Mangione et al. (1994) han estudiado el efecto de la
intervencin de cataratas en la evolucin de la CVRS; Quintana et al. (2003) han
estudiado los factores predictivos de mejora de la CVRS en pacientes intervenidos
de colecistectoma; Padierna et al. (2002) han estudiado la evolucin de la CVRS en
pacientes en tratamiento por trastornos de alimentacin; y Quintana et al. (2006) han
estudiado tambin la relacin entre la adecuacin de la indicacin de prtesis total de
cadera o rodilla y la mejora de la CVRS en pacientes con osteoartrosis.
El trabajo de Cox et al. (1992) hace referencia al anlisis estadstico de datos de
CVRS, recomendando tcnicas de anlisis simples pero robustas, y asumiendo
normalidad de la variable dependiente. Aunque este trabajo se concentra en el
mbito de los ensayos clnicos, este tipo de recomendacin es extensible a otros
contextos. Olschewski et al. (1992, p. 385), en la discusin que realizan del trabajo
de Cox et al. (1992), proponen alternativas basadas en los modelos lineales generalizados. Lall et al. (2002) publican una revisin sobre el uso de modelos de regresin ordinal en el anlisis de datos de CVRS. Esta alternativa exige, en muchos
casos, la categorizacin de la puntuacin de CVRS, inicialmente diseada como
continua. Ms concretamente, Walters et al. (2001) han usado varios modelos de
regresin ordinales y los han comparado con mtodos estadsticos convencionales
y tambin con mtodos bootstrap para analizar la dimensin de rol emocional del
SF-36. Este trabajo concluye que una escala debe ser tratada como continua si el
nmero de categoras es mayor o igual que 7 y como discreta en otro caso. El uso
de mtodos bootstrap en el anlisis del SF-36 ha sido tratado con profundidad por
Walters y Campbell (2005). Desde una perspectiva clnica es importante tener
mediciones estndar de las diferentes dimensiones de la CVRS, lo cual se traduce
en un instrumento multidimensional de medicin de la CVRS. Por tanto, es preferible utilizar una tcnica de anlisis estadstico comn a todas las dimensiones del
instrumento de CVRS seleccionado, independientemente de su distribucin de
probabilidad. Rose et al. (1999) han tratado los problemas estadsticos encontrados
en el anlisis del SF-36, entre ellos la no normalidad de las reas de CVRS.
Cheung et al. (2004) han utilizado la distribucin beta para modelizar las puntuaciones de las 8 dimensiones del SF-36 divididas por 100. El objetivo de este
trabajo es mostrar diferencias en la media y la varianza de las puntuaciones de CV
entre varios grupos, de forma que se incluye el efecto de algunas covariables en la
estimacin de los parmetros de la distribucin beta.

160

ESTADSTICA ESPAOLA

Ms all de los trabajos citados, no hemos encontrado en la literatura ningn


trabajo cuyo objetivo se centre en la distribucin de probabilidad de las puntuaciones del cuestionario de salud SF-36 o en la robustez de las tcnicas utilizadas en el
anlisis bajo supuestos de normalidad que no se verifican. Lo que, tal y como
ilustramos en la seccin 4, es un tema relevante dentro del anlisis de este tipo de
datos.

4. EJEMPLOS
Utilizaremos muestras de sujetos sanos y con diferentes patologas para ilustrar
las distintas posibles hiptesis sobre la distribucin emprica de las reas de CVRS
del cuestionario de salud SF-36. Se dispone de datos del SF-36, adems de la
edad y el sexo, de un total de 8.989 individuos. Las muestras que se presentan a
continuacin, en general, no provienen de estudios con un diseo aleatorio, por
tanto, las conclusiones obtenidas en ningn caso son generalizables a la poblacin
general. Los diferentes sesgos derivados de un diseo no experimental, entre ellos
el sesgo de informacin y la falta de respuesta, deben ser considerados antes de
obtener conclusiones a partir de los datos que aqu se presentan. Sin embargo, el
objetivo de este trabajo, en ningn caso es sacar conclusiones clnicas de los datos
presentados, ni su generalizacin a la poblacin general, ni a poblaciones especficas de las cuales las muestras pudieran ser representativas. Tal y como se ha
planteado anteriormente, el objetivo de este trabajo al mostrar estos ejemplos es,
por un lado, ilustrar que las puntuaciones del cuestionario de salud SF-36 no siguen
una distribucin normal y, por otro lado, destacar los posibles errores derivados de
utilizar tcnicas de anlisis que exigen una hiptesis de normalidad en estas circunstancias.

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

161

Tabla 2
EDAD Y SEXO DE LOS GRUPOS DE SUJETOS ANALIZADOS
GRUPO
Poblacin general
Donantes de sangre
HTA
TA
VIH
EIIC
Trasplante de hgado
Colecistectoma
Histerectoma
PTC
PTR
Cncer de pulmn

EDAD: MEDIA (DE)

SEXO: N(%) H

3.953

47,15 (18,97)

1.670 (42,2%)

106

35,83 (13,22)

54 (50,9%)

20

62,05 (8,54)

16 (80,0%)

2.98

23,10 (7,03)

6 (2,0%)

40

35,10 (4,52)

25 (62,5%)

165

41,53 (14,88)

93 (56,4%)

139

54,30 (13,27)

90 (64,7%)

1.123

57,75 (14,43)

310 (27,6%)

649

55,82 (13,26)

0 (0%)

1.266

67,34 (10,73)

669 (52,8%)

1.113

71,34 (7,17)

309 (27,8%)

64,45 (10,23)

112 (95,7%)

117

Se han utilizado las siguientes abreviaturas: Desviacin estndar (DE), Hombre (H), Hipertensin arterial (HTA), Trastornos de Alimentacin (TA), Virus de Inmunodeficiencia Humana
(VIH), Enfermedad Inflamatoria Intestinal Crnica (EIIC), Prtesis Total de Cadera (PTC) y
Prtesis Total de Rodilla (PTR).

La tabla 2 muestra un resumen de los grupos de sujetos con los que vamos a
realizar los anlisis. Los participantes se han reclutado de diversos estudios llevados a cabo en la Unidad de Investigacin del hospital Galdakao perteneciente al
Sistema Vasco de Salud Osakidetza, los cuales pasamos a detallar a continuacin. Los pacientes con Hipertensin Arterial (HTA) o con VIH, as como los donantes de sangre son individuos que han participado en un estudio de validacin del
Cuestionario de Salud SF-36 en euskera (Gonzlez et al. 2005). Los pacientes con
cncer de pulmn han participado en un estudio sobre la CV de los pacientes con
esta patologa (Etxebarria et al. 2001). Los pacientes con Trastornos de Alimentacin (TA) provienen de dos muestras independientes; aproximadamente dos tercios
(197) han participado en un estudio de seguimiento de la CVRS (Padierna et al.
2002), y el resto (101) han participado en el estudio de validacin del Cuestionario
de Salud SF-36 en euskera anteriormente mencionado (Gonzlez et al. 2005). Los
pacientes intervenidos de colecistectoma, Prtesis Total de Cadera (PTC) y Prtesis Total de Rodilla (PTR) son pacientes que estaban en lista de espera para
alguna de estas intervenciones quirrgicas, reclutados para un estudio de adecuacin de la intervencin en cuestin, en el cual se midi tambin la CVRS (Quintana
et al. 2005 y 2006). De la misma forma y con un objetivo similar a los anteriores se
reclutaron los pacientes intervenidos de histerectoma, aunque los resultados
obtenidos no han sido publicados hasta el momento. Los pacientes con Enfermedad Inflamatoria Intestinal Crnica (EIIC) fueron reclutados en un estudio de medi-

162

ESTADSTICA ESPAOLA

cin de la CV de este tipo de pacientes con distintos instrumentos de medida (datos


sin publicar). Los pacientes de trasplante de hgado se reclutaron de la lista de
espera de trasplante en un estudio con objetivos ms amplios que inclua la medicin de la CVRS (datos sin publicar). Los datos relativos a la poblacin general se
han recogido de la Encuesta de Salud realizada por el Gobierno Vasco en 1996
(Anitua y Quintana 1999).
Los anlisis estadsticos se han realizado con SAS System for Windows Version
8.02 (SAS Institute Inc. 1994) y las figuras se han obtenido con S-Plus 2000 (MathSoft Inc. 1999).
El nivel de significacin elegido para la realizacin de los contrastes de hiptesis
es de = 0,05.
Tabla 3

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


REAS FSICAS DEL SF-36
(Contina)
GRUPO

FUNCIONAMIENTO
FSICO
n

ROL FSICO

Media

DE

Media

DE

3.953

86,66

21,50

86,43

30,92

Donantes de sangre

106

92,88

13,61

91,67

20,41

HTA

20

74,63

24,17

80,88

20,78

TA

298

85,40

19,62

57,31

40,99

VIH

40

83,01

18,99

63,96

37,00

EIIC

165

84,82

19,22

66,06

42,23

Trasplante de hgado

139

59,96

26,99

30,74

40,83

1.123

72,16

24,90

52,78

43,88

649

73,91

24,62

59,73

42,06

PTC

1.266

21,86

21,60

12,63

28,99

PTR

1.113

24,27

20,96

15,78

30,53

117

55,21

27,25

32,69

42,23

Poblacin general

Colecistectoma
Histerectoma

Cncer de pulmn

Se han utilizado las siguientes abreviaturas: Desviacin estndar (DE), Hipertensin arterial
(HTA), Trastornos de Alimentacin (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crnica (EIIC), Prtesis Total de Cadera (PTC) y Prtesis Total de
Rodilla (PTR).

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

163

Tabla 3

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


REAS FSICAS DEL SF-36
(Conclusin)
GRUPO

DOLOR CORPORAL
n

SALUD GENERAL

Media

DE

Media

DE

3.953

78,83

25,30

66,54

19,73

Donantes de sangre

106

88,08

18,16

77,20

15,99

HTA

20

79,05

17,50

64,98

14,36

TA

298

65,46

28,57

50,86

21,81

VIH

40

74,70

24,59

47,80

19,63

EIIC

165

67,50

28,39

50,20

22,72

Trasplante de hgado

139

68,18

32,00

36,58

18,85

1.123

53,58

28,83

53,73

20,48

649

65,20

27,64

61,29

20,30

PTC

1.266

31,62

26,15

58,64

20,63

PTR

1.113

36,60

27,21

57,12

20,31

117

55,82

30,94

43,28

19,59

Poblacin general

Colecistectoma
Histerectoma

Cncer de pulmn

Se han utilizado las siguientes abreviaturas: Desviacin estndar (DE), Hipertensin arterial
(HTA), Trastornos de Alimentacin (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad
Inflamatoria Intestinal Crnica (EIIC), Prtesis Total de Cadera (PTC) y Prtesis Total de Rodilla
(PTR).

164

ESTADSTICA ESPAOLA

Tabla 4

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


REAS MENTALES DEL SF-36
GRUPO

VITALIDAD
n

Poblacin general
Donantes de sangre
HTA
TA
VIH
EIIC
Trasplante de hgado
Colecistectoma
Histerectoma
PTC
PTR
Cncer de pulmn

FUNCIONAMIENTO
SOCIAL

Media

DE

Media

DE

3.953

64,51

19,38

89,47

19,02

106

72,31

15,07

88,21

17,06

20

72,31

15,82

77,63

20,66

298

47,38

21,70

56,65

28,42

40

61,67

20,22

72,81

21,35

165

58,55

25,70

78,56

26,51

139

49,36

28,42

61,51

33,41

1.123

50,86

24,44

73,10

26,27

649

53,20

23,65

78,27

24,04

1.266

42,69

24,18

55,21

31,83

1.113

43,44

24,08

57,83

31,05

117

47,05

24,78

68,70

31,68

GRUPO

ROL EMOCIONAL
n

SALUD MENTAL

Media

DE

Media

DE

3.953

91,77

24,66

71,14

18,05

106

91,03

20,37

79,69

14,45

HTA

20

84,31

23,91

74,39

14,11

TA

298

46,58

42,16

45,87

22,71

VIH

40

60,83

43,94

62,98

19,37

EIIC

165

78,59

38,60

67,10

21,61

Poblacin general
Donantes de sangre

Trasplante de hgado
Colecistectoma
Histerectoma

139

74,63

40,91

67,23

20,77

1.123

70,16

41,89

61,53

22,91

649

73,71

39,78

60,52

21,42

PTC

1.266

69,53

43,44

60,11

23,80

PTR

1.113

66,89

45,04

59,88

23,83

117

66,67

42,21

60,03

24,92

Cncer de pulmn

Se han utilizado las siguientes abreviaturas: Desviacin estndar (DE), Hipertensin arterial (HTA),
Trastornos de Alimentacin (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad
Inflamatoria Intestinal Crnica (EIIC), Prtesis Total de Cadera (PTC) y Prtesis Total de Rodilla
(PTR).

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

165

Las tablas 3 y 4 muestran la media y la desviacin estndar de cada una de las


8 reas del SF-36 en cada una de las muestras analizadas. Las figuras 1 a 8
muestran la distribucin de las 8 reas del SF-36 en cada una de las muestras
analizadas, as como la curva de ajuste a una distribucin normal, donde los parmetros se han estimado utilizando los valores de las tablas 3 y 4.
Figura 1

FUNCIONAMIENTO FSICO DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

CVRS: Fu n cio n a mie n to Fsico

P obl ac i n no rm al (n=395 3)

20

40

60

80

100

20

20

VIH (n=40 )

20

40

60

40

60

80

100

Donantes de s angre ( n=106)

40

60

80

100

EIIC (n= 165)

80

Hi s te rec tom a (n= 649)

100

20

40

60

20

40

60

80

100

Hi pertens i n arteri al (n= 20)

20

40

60

80

100

Tra s pl ante de h igado (n=1 39)

80

100

Prtes i s total de c adera (n=1 266)

20

40

60

80

100

Prt es is total de ro d i l l a (n=1 113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

1 00

Tras tor nos al i m enti c i os (n=29 8)

20

40

60

80

1 00

Col ec i s tec to m a (n=1123 )

20

40

60

80

1 00

Cnc er de pul m n (n =117)

166

ESTADSTICA ESPAOLA

Figura 2

ROL FSICO DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS


BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y
LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

20

40

60

80

100

20

Donantes de sangre (n=106)

40

60

80

100

Hipertensin arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Rol Fsico

Poblacin normal (n=3953)

20

40

60

80

100

20

VIH (n=40)

20

40

60

40

60

80

100

20

EIIC (n=165)

80

Histerectoma (n=649)

100

20

40

60

40

60

80

100

Trasplante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Colecistectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

167

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

Figura 3

DOLOR CORPORAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

20

40

60

80

100

Donantes de sangre (n=106)

20

40

60

80

100

Hipertensin arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Dolor Corporal

Poblacin normal (n=3953)

20

40

60

80

100

20

VIH(n=40)

20

40

60

40

60

80

100

EIIC(n=165)

80

Histerectoma (n=649)

100

20

40

60

20

40

60

80

100

Trasplante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Colecistectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

168

ESTADSTICA ESPAOLA

Figura 4

SALUD GENERAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

20

40

60

80

100

Donantes de sangre (n=106)

20

40

60

80

100

Hipertensin arteri al (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Salud General

Poblaci n normal (n=3953)

20

40

60

80

100

20

VIH(n=40)

20

40

60

40

60

80

100

EIIC(n=165)

80

Histerectoma (n=649)

100

20

40

60

20

40

60

80

100

Traspl ante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesis total de rodi lla (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Coleci stectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

169

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

Figura 5

VITALIDAD DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS


BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y
LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

20

40

60

80

100

20

Donantes de sangre (n=106)

40

60

80

100

Hipertensi n arterial (n=20)

20

40

60

80

100

Trastornos alimentici os (n=298)

CVRS: Vitalida d

Poblacin normal (n=3953)

20

40

60

80

100

20

VIH (n=40)

20

40

60

40

60

80

100

EIIC(n=165)

80

Histerectoma (n=649)

100

20

40

60

20

40

60

80

100

Trasplante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesi s total de rodill a (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Col eci stectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

170

ESTADSTICA ESPAOLA

Figura 6

FUNCIONAMIENTO SOCIAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN
OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN
NORMAL

20

40

60

80

100

CVRS: Funcionamiento Social

Poblacin normal (n=3953)

20

40

60

80

100

20

20

VIH (n=40)

20

40

60

40

60

80

100

40

60

80

100

80

100

20

40

60

40

60

80

100

Hipertensin arterial (n=20)

EIIC (n=165)

Histerectoma (n=649)

20

Donantes de sangre (n=106)

20

40

60

80

100

Trasplante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Trastornos alimenticios (n=298)

20

40

60

80

100

Colecistectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

171

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

Figura 7

ROL EMOCIONAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

20

40

60

80

100

20

Donantes de sangre (n=106)

40

60

80

100

Hipertensi n arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Rol Emocion al

Poblacin normal (n=3953)

20

40

60

80

100

20

VIH (n=40)

20

40

60

40

60

80

100

20

EIIC(n=165)

80

Histerectoma (n=649)

100

20

40

60

40

60

80

100

Trasplante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Colec istectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

172

ESTADSTICA ESPAOLA

Figura 8

SALUD MENTAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS.


LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIN NORMAL

20

40

60

80

100

20

40

60

80

100

20

Donantes de sangre (n=106)

40

60

80

100

Hipertensi n arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Salud Mental

Poblaci n normal (n=3953)

20

40

60

80

100

20

VIH (n=40)

20

40

60

40

60

80

100

EIIC (n=165)

80

Histerectoma (n=649)

100

20

40

60

20

40

60

80

100

Trasplante de higado (n=139)

80

100

Prtesis total de cadera (n=1266)

20

40

60

80

100

Prtesi s total de rodil la (n=1113)

Se han utilizado las siguientes abreviaturas:


Virus de Inmunodeficiencia Humana (VIH),
Enfermedad Inflamatoria Intestinal Crnica (EIIC).

20

40

60

80

100

Col ecistectoma (n=1123)

20

40

60

80

100

Cncer de pulmn (n=117)

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

173

En funcionamiento fsico, vemos una distribucin muy sesgada a la izquierda


(poblacin general, donantes de sangre, TA, VIH, EIIC, colecistectoma e histerectoma) o a la derecha (PTC y PTR), dependiendo de la patologa, as como otros
grupos con una distribucin muy plana (cncer de pulmn y trasplante de hgado).
El rol fsico sigue una distribucin claramente discreta, con 5 categoras en la
mayora de los grupos. Adems, se observa que ninguna de estas distribuciones
tiene forma de campana, teniendo algunas de ellas justamente lo contrario, una
forma de campana invertida. En dolor corporal, se observan todo tipo de variaciones de la distribucin emprica, sesgadas a la izquierda (poblacin general, donantes, HTA, trasplante de hgado, EIIC y VIH), sesgadas a la derecha (PTC y PTR) y
distribuciones muy planas (cncer de pulmn, colecistectoma y TA). En salud
general es donde se observa una mayor proporcin de muestras con distribucin en
forma de campana, con mayor o menor sesgo, dependiendo del impacto que la
enfermedad tiene en la salud general, pero en cualquier caso, su distribucin
parece aceptablemente normal. La vitalidad es un rea en la que se observan
distribuciones aceptablemente normales, con una forma acampanada en muchos
de los casos, aunque se repite el patrn observado en el dolor corporal, con algunos de los grupos con una distribucin muy plana (trasplante de hgado y EIIC). El
funcionamiento social muestra una distribucin discreta que, tal y como se observa
en la tabla 1, consta de 9 posibles valores. Esto se refleja en el hecho de que, al
dividir la escala de 0 a 100 en 10 intervalos, ningn individuo de los 8989 que
forman la muestra total toma valores en el intervalo (50, 60). Al igual que lo que
hemos mencionado para el dolor corporal y la vitalidad, algunos grupos, como TA,
PTC y PTR, muestran una distribucin muy plana. El rol emocional sigue un patrn
similar al del rol fsico, una distribucin discreta con 4 categoras en la mayora de
los grupos y ninguno de ellos tiene forma acampanada. La salud mental muestra
distribuciones aceptablemente normales, con una forma acampanada en muchos
de los casos, aunque con colas mucho ms pesadas de lo que se espera en una
distribucin normal.
El contraste de bondad de ajuste a la distribucin normal de KolmogorovSmirnov (correccin de Lilliefors para el caso concreto de normalidad), rechaza la
normalidad en todas las reas y en todas las muestras analizadas al nivel de
significacin establecido de = 0,05, excepto en el rea de funcionamiento fsico
(para la muestra de HTA), en el rea de salud general (para las muestras de HTA,
VIH y trasplante de hgado) y en el rea de vitalidad (para las muestras de VIH y
cncer de pulmn).
El problema reside, por una parte, en el sesgo. As, se observan distribuciones
muy sesgadas a la izquierda en general en todas las reas, para la muestra de

174

ESTADSTICA ESPAOLA

poblacin general o la muestra de donantes de sangre (individuos sanos); lo mismo


ocurre en reas como el funcionamiento fsico en las muestras de TA, VIH o EIIC
(pacientes jvenes). Por otro lado, las mismas reas muestran distribuciones muy
sesgadas a la derecha en individuos en lista de espera para PTC o PTR (pacientes
mayores). Esto muestra el poder de discriminacin que tiene el instrumento en
diferentes diagnsticos. Otro de los problemas que se observa es que muchas de
las reas muestran distribuciones muy planas en algunos, e incluso muchos de los
grupos, como el dolor corporal y la vitalidad. Adems se observa un problema de
continuidad de la escala en las reas de rol fsico, rol emocional y funcionamiento
social. En las dos primeras la escala es claramente discreta, mientras que en la
tercera hay intervalos de la escala que no se cubren en ningn caso. Por ltimo,
muchas de las escalas muestran un efecto techo y/o suelo, esto quiere decir que un
porcentaje muy alto de los individuos se sita en los valores ms altos o ms bajos
de la escala, respectivamente. As, la distribucin de las reas rol fsico y rol emocional muestra, en ocasiones, un efecto techo, en otras ocasiones, un efecto suelo,
y, en algunas otras ocasiones, ambas, ofreciendo una forma de campana invertida.
Siguiendo el criterio de Walters et al. (2000) citado en la seccin 3.3, una escala
debe ser tratada como continua si el nmero de categoras es mayor o igual que 7 y
como discreta en otro caso. Se utiliza el criterio en el anlisis de muestras concretas de pacientes en los que se ha medido la CVRS con el SF-36 y otras variables
susceptibles de influir en la CVRS. Vamos a mostrar casos continuos y discretos de
CVRS, y se van a analizar con tcnicas de anlisis distintas, adecuadas a cada
situacin. Los resultados obtenidos se utilizan para ilustrar las diferentes alternativas de anlisis de datos del SF-36 y su interpretacin, con las limitaciones mencionadas previamente, en el mbito clnico.
El dolor y la limitacin fsica son parmetros muy importantes a tener en cuenta
en pacientes con osteoartrosis de cadera y/o rodilla, debido al impacto que ambas
tienen en la CVRS de estos pacientes (Quintana et al. 2006). Las reas de dolor
corporal y funcionamiento fsico del SF-36 miden el impacto que el dolor y la limitacin fsica tienen en la CVRS. Como podemos observar en la tabla 1, estas reas
tienen 11 y 21 niveles, respectivamente, por tanto ambas se analizan como variables continuas. As, se ha utilizado el modelo de regresin lineal mltiple para
estudiar la influencia de variables sociodemogrficas en el dolor corporal y el
funcionamiento fsico de pacientes con osteoartrosis en lista de espera para ser
intervenidos de PTC en alguno de los hospitales de la Comunidad Autnoma
Vasca. Para este anlisis se han utilizado los pacientes de la muestra que aqu se
presenta, para los cuales se dispona de las siguientes variables: fecha de nacimiento, sexo, fecha de indicacin de la intervencin, fecha de la intervencin, nivel
de estudios, situacin laboral, estado civil y situacin de convivencia familiar. Estas
son las variables destacadas por los expertos en el rea como factores susceptibles

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

175

de influir en la CVRS de los pacientes con osteoartrosis que van a ser intervenidos
de PTC. Tras un anlisis descriptivo y univariante exhaustivo de los datos recogidos, se han recodificado algunas de las variables originales hasta obtener las
versiones de las covariables que finalmente se consideran en el anlisis. La edad
se ha calculado a partir de la fecha de nacimiento y se ha considerado como variable continua, medida en aos y el tiempo de permanencia en lista de espera se ha
obtenido de la diferencia entre la fecha de indicacin de la intervencin y la fecha
de la intervencin. El nivel de estudios se ha agrupado en: ninguno, primarios, y
secundarios o ms. La situacin laboral se ha categorizado como laboralmente
activo o inactivo, incluyendo este ltimo grupo a las amas de casa. El estado civil y
la situacin de convivencia familiar se han unido para crear una nueva variable
categorizada en tres niveles de la siguiente manera: casado o vive en pareja;
soltero, separado o viudo pero que vive acompaado o en residencia; y soltero,
separado o viudo que vive solo. Las variables nominales han sido introducidas en el
modelo mediante variables indicador. Slamente se dispone de datos sociodemogrficos completos de 784 de los 1.266 individuos que componen la muestra inicial.
El mtodo de estimacin utilizado para el modelo de regresin lineal planteado ha
sido el de mxima verosimilitud, basado en la hiptesis de distribucin normal. Sin
embargo, y teniendo en cuenta que ninguna de estas dos reas del SF-36 se ajusta
a una distribucin normal, se ha utilizado tambin el mtodo bootstrap (Efron y
Tibshirani 1993 y Davison y Hinkley 1997), mtodo de distribucin libre, donde esta
hiptesis no es necesaria en la estimacin de los coeficientes del modelo. Basndonos en las hiptesis que disponemos, el mtodo de estimacin correcto sera el
bootstrap. El objetivo de utilizar ambos mtodos es comprobar la influencia del
incumplimiento de la hiptesis de normalidad en los resultados obtenidos y, consecuentemente, la robustez del mtodo de estimacin mximo verosmil bajo el
supuesto errneo de normalidad. Adems, tal y como puede observarse en las
figuras 1 y 3, ambas reas se diferencian en la magnitud del sesgo, el rea de dolor
corporal, an no siendo simtrica, tiene un sesgo moderado (coeficiente de asimetra de 0,8757), mientras que el rea de funcionamiento fsico tiene un sesgo ms
pronunciado (coeficiente de asimetra de 1,4582). La tabla 5 resume los resultados
obtenidos para estas dos reas del SF-36.

176

ESTADSTICA ESPAOLA

Tabla 5
ESTIMACIONES DE LOS COEFICIENTES Y SUS INTERVALOS DE CONFIANZA AL
95% PARA UN MODELO DE REGRESIN LINEAL MLTIPLE OBTENIDOS MEDIANTE MXIMA VEROSIMILITUD Y BOOTSTRAP PARA LAS DIMENSIONES DE
FUNCIONAMIENTO FSICO Y DOLOR CORPORAL DEL SF-36 EN UNA MUESTRA
DE 784 PACIENTES CON DIAGNSTICO DE OSTEOARTROSIS EN LISTA DE
ESPERA PARA INTERVENCIN DE PRTESIS TOTAL DE CADERA
(Contina)

VARIABLES
INDEPENDIENTES

MXIMA
VEROSIMILITUD
Coeficiente

IC 95%

Funcionamiento fsico:
Intercepto

34,063

(20,196, 47,929)

Edad (aos)

0,143

(0,339, 0,052)

0,009

(0,006, 0,024)

5,929

(9,177, 2,681)

Ninguno

6,631

(12,176, 1,087)

Primarios

6,084

(10,663, 1,505)

5,863

(1,221, 12,946)

1,867

(7,052, 3,317)

0,016

(5,825, 5,857)

23,770

(6,849, 40,691)

Edad (aos)

0,326

(0,088, 0,565)

Tiempo de espera (das)

0,003

(0,015, 0,022)

7,134

(11,097, 3,172)

Ninguno

9,924

(16,665, 3,183)

Primarios

5,605

(11,168, 0,041)

Trabajador inactivo

1,817

(10,470, 6,835)

Casado

5,242

(11,522, 1,039)

Soltero/vive acompaado

3,607

(10, 581, 3,583)

Tiempo de espera (das)


Mujer
Estudios:

Trabajador inactivo
Situacin familiar:
Casado
Soltero/vive acompaado

Dolor Corporal
Intercepto

Mujer
Estudios:

Situacin familiar:

Se ha utilizado la abreviatura de IC: Intervalo de Confianza

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

177

Tabla 5
ESTIMACIONES DE LOS COEFICIENTES Y SUS INTERVALOS DE CONFIANZA AL
95% PARA UN MODELO DE REGRESIN LINEAL MLTIPLE OBTENIDOS MEDIANTE MXIMA VEROSIMILITUD Y BOOTSTRAP PARA LAS DIMENSIONES DE
FUNCIONAMIENTO FSICO Y DOLOR CORPORAL DEL SF-36 EN UNA MUESTRA
DE 784 PACIENTES CON DIAGNSTICO DE OSTEOARTROSIS EN LISTA DE
ESPERA PARA INTERVENCIN DE PRTESIS TOTAL DE CADERA
(Conclusin)

VARIABLES
INDEPENDIENTES

BOOTSTRAP
Coeficiente

IC 95%

Funcionamiento fsico:
Intercepto

34,025

(21,579, 49,067)

Edad (aos)

0,146

(0,387, 0,034)

0,010

(0,004, 0,025)

5,839

(9,048, 2,844)

Ninguno

6,632

(13,069, 1,158)

Primarios

6,037

(11,581, 1,650)

5,839

(0,231, 12,016)

1,807

(7,354, 2,431)

0,074

(5,658, 5,647)

23,326

(7,362, 42,377)

Edad (aos)

0,330

(0,094, 0,558)

Tiempo de espera (das)

0,004

(0,014, 0,027)

7,077

(10,973, 3,575)

Ninguno

9,900

(17,480, 3,238)

Primarios

5,610

(12,122, 0,439)

Trabajador inactivo

1,910

(10,480, 5,640)

Casado

5,016

(11,068, 0,537)

Soltero/vive acompaado

3,385

(11,212, 3,352)

Tiempo de espera (das)


Mujer
Estudios:

Trabajador inactivo
Situacin familiar:
Casado
Soltero/vive acompaado

Dolor Corporal
Intercepto

Mujer
Estudios:

Situacin familiar:

Se ha utilizado la abreviatura de IC: Intervalo de Confianza

178

ESTADSTICA ESPAOLA

En el caso del dolor corporal, ambos mtodos muestran resultados similares,


reflejando la robustez del modelo de regresin lineal mltiple para el rea de dolor
corporal del SF-36. Las variables que resultan tener una influencia significativa en
el dolor corporal son la edad, el sexo y el nivel de estudios de los individuos. La
escala de dolor corporal del SF-36 se interpreta de forma inversa, es decir, que a
mayor puntuacin, mejor CV en lo que respecta a dolor, es decir, menor dolor. De
esta forma, a mayor edad se espera que el nivel de dolor sea menor, por cada 10
aos de incremento de la edad se espera que la CV en lo que respecta al dolor
mejore en 3,3 puntos (en una escala de 0 a 100) con un intervalo de confianza del
95% de 0,9 a 5,6, ajustando por sexo y nivel de estudios. Las mujeres tienen una
CV 7 puntos inferior a la de los hombres de su misma edad y nivel de estudios en lo
que respecta al dolor. Los individuos sin estudios o con slo estudios primarios
tienen una CV 9,9 5,6 puntos inferior a la de los individuos con estudios secundarios de su misma edad y sexo, respectivamente, en lo que respecta al dolor. En el
caso del funcionamiento fsico, hay diferencias considerables en los resultados
obtenidos entre ambos mtodos. En la tabla 5 se puede observar que la variable
situacin laboral no resulta significativa para el mtodo de estimacin de mxima
verosimilitud, mientras que s lo es para el bootstrap. Esto se debe al hecho mencionado anteriormente, de que la variable funcionamiento fsico tiene un sesgo
importante en pacientes que van a ser intervenidos de PTC. Tal y como se ha
mencionado anteriormente, consideramos vlidos los resultados obtenidos mediante bootstrap, por tanto, estos son los resultados que se van a interpretar. Las
variables que resultan tener una influencia significativa en el funcionamiento fsico
son el sexo, el nivel de estudios y la situacin laboral de los individuos. Las mujeres
tienen un funcionamiento fsico 5,8 puntos inferior a la de los hombres de su mismo
nivel de estudios y situacin laboral, en una escala de 0 a 100 y con un intervalo de
confianza del 95% de 2,8 a 9,0. Los individuos sin estudios o con slo estudios
primarios tienen un funcionamiento fsico aproximadamente 6 puntos inferior a los
individuos con estudios secundarios de su mismo sexo y situacin laboral. Los
individuos que trabajan de forma activa tienen un funcionamiento fsico 5,8 puntos
inferior a los individuos laboralmente inactivos de su mismo sexo y nivel de estudios. En las dos dimensiones analizadas, debemos hacer notar que las variables
situacin laboral y edad estn relacionadas entre s. Aunque la significacin de la
interaccin ha sido rechazada en todos los modelos mencionados, no se descarta
la existencia de colinealidad entre ambas, lo cual debiera ser tenido en cuenta a la
hora de sacar conclusiones clnicas de estos resultados. Sin embargo, nuestro
objetivo no se centra en las conclusiones clnicas, sino en la correcta eleccin de la
tcnica de anlisis.
Como hemos visto antes, el uso de modelos de regresin lineal mltiple permite
medir la influencia de determinadas caractersticas en la CVRS esperada en un

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

179

individuo. De esta forma podemos comparar, como en los ejemplos anteriores, la


diferencia de puntos esperada en la CVRS entre hombres y mujeres, y entre individuos con diferente nivel de estudios o situacin laboral.
Una alternativa de anlisis a la RLM para escalas ordinales es el modelo de
odds proporcionales, donde el logit de la probabilidad acumulada se representa
como una funcin lineal de las covariables. En este modelo se asume que Y es una
variable dependiente discreta ordinal con k, k > 2, categoras ordenadas de forma
natural. Sean y1, y2,..., yn los valores observados en una muestra aleatoria simple
de tamao n de la variable Y. Definimos las probabilidades acumuladas como

ji = p1i + ..... + pji = P (Yi j)

j = 1,2,....,k

El objetivo es encontrar un modelo para describir ji en funcin de una matriz de


datos correspondiente a p variables explicativas, X. La hiptesis principal del modelo de odds proporcionales es que la influencia de las variables explicativas es
independiente del punto de corte de la probabilidad acumulada. El modelo general
viene dado por la expresin:
logit(ji) = 0j + 1xi1 + 2xi2 + + pxip = 0j + X
y j = 1, 2, , k 1,

i = 1,

2, ., n,

donde los vectores de parmetros son: = (1, 2, ..., p)T, que mide la influencia de
las covariables en la probabilidad acumulada, comn para las (k 1) ecuaciones; y
el vector de los (k 1) trminos independientes, 0 = (01, 02, ..., 0,k-1)T, especficos
para cada una de las (k 1) ecuaciones.
La dimensin rol fsico del SF-36 se trata como una escala ordinal de 5 valores,
i. e. de 0 a 4. Se ha utilizado el modelo de odds proporcionales para estudiar la
influencia de variables sociodemogrficas y clnicas en el rol fsico de pacientes con
TA. Para este anlisis se han utilizado los pacientes con TA de la muestra anteriormente mencionada, para los cuales se dispone de las siguientes variables:
edad, sexo, tiempo de evolucin de la enfermedad, ndice de masa corporal, diagns-ti-co, gravedad, nivel de ansiedad y depresin. Estas son las variables destacadas por los expertos en el rea como potenciales factores predictivos de la CVRS
en pacientes con TA (Padierna et al. 2000). Las variables seleccionadas como
predictores significativos del rol fsico en pacientes con TA en el modelo de odds
proporcionales y la submuestra de 186 individuos en los que se tiene informacin
sobre todas las variables son: tiempo de evolucin de la enfermedad, gravedad y
nivel de depresin. Las hiptesis de odds proporcionales no se rechazan, al nivel

180

ESTADSTICA ESPAOLA

de significacin establecido, ni en general (p = 0,12), ni para ninguna de las 3


covariables en particular (p = 0,68, p = 0,18 y p = 0,41, respectivamente). La tabla 6
resume los resultados obtenidos en este anlisis.

Tabla 6

ESTIMACIONES DE LOS COEFICIENTES, DESVIACIONES ESTNDAR Y


NIVEL DE SIGNIFICACIN DEL MODELO DE ODDS PROPORCIONALES
SELECCIONADO PARA LA DIMENSIN DE ROL FSICO DEL SF-36 EN UNA
MUESTRA DE 186 PACIENTES CON TRASTORNOS DE ALIMENTACIN
ESTIMACIN

DESVIACIN
ESTNDAR

Intercepto 4

1,5474

0,3543

< 0,0001

Intercepto 3

2,2843

0,3765

< 0,0001

Intercepto 2

2,7966

0,3930

< 0,0001

COVARIABLE

Intercepto 1
Depresin
Gravedad: Moderada
Grave
Tiempo de evolucin

p-VALOR

3,5147

0,4175

< 0,0001

1,5381

0,3475

< 0,0001

1,8039

0,4131

< 0,0001

2,0093

0,4051

< 0,0001

0,0613

0,0222

0,0057

La interpretacin del coeficiente de la variable depresin en este modelo ( =


1,5381, por tanto una tasa de odds estimada de e-1,5381 = 0,215, con un intervalo
de confianza del 95% de 0,109 a 0,424), es que un paciente con depresin reduce
a una cuarta parte la probabilidad de mejorar en un punto su rol fsico con respecto
a otro sin depresin (en una escala de 0 a 4), en igualdad de condiciones de gravedad y tiempo de evolucin de la enfermedad, siendo esta reduccin estadsticamente significativa. Igualmente, los coeficientes de la variable gravedad en este
modelo ( MOD = 1,8039 y GRAV = 2,0093, por tanto una tasa de odds estimada
de e-1,8039 = 0,165, con un intervalo de confianza del 95% de 0,073 a 0,370 para
pacientes con gravedad moderada versus pacientes leves y e-2,0093 = 0,134, con un
intervalo de confianza del 95% de 0,061 a 0,297 para pacientes graves versus
pacientes leves), indican que un paciente con una gravedad moderada reduce a
una sexta parte y un paciente grave a una sptima parte la probabilidad de mejorar
en un punto su rol fsico con respecto a un paciente leve (en una escala de 0 a 4),
en igualdad de condiciones de depresin y tiempo de evolucin de la enfermedad,
siendo esta reduccin estadsticamente significativa en ambos casos. Por ltimo, en
el caso del tiempo de evolucin de la enfermedad, = 0,0613, correspondiente a
una tasa de odds estimada de e-0,0613 = 0,941, con un intervalo de confianza del

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

181

95% de 0,900 a 0,982, indica que cada ao de ms con la enfermedad reduce de 1


a 0,94 la probabilidad de mejorar en un punto su rol fsico (en una escala de 0 a 4),
en igualdad de condiciones de gravedad y depresin, siendo esta reduccin estadsticamente significativa.
El uso de mtodos ordinales como el modelo de odds proporcionales permite
obtener resultados sobre la influencia de determinadas caractersticas en la CVRS,
y medir esta influencia por medio de la tasa de odds, que como estimador del
riesgo relativo es un parmetro con muy buena aceptacin en el mbito clnico.

CONCLUSIONES
Los mtodos de anlisis clsicos basados en la distribucin normal, como la regresin lineal mltiple, son bastante robustos. Sin embargo, un incumplimiento de la
normalidad tan claro y sistemtico en casi todas las reas del SF-36, puede hacer
que los resultados obtenidos de un anlisis a otro varen de forma sustancial,
afectando esto de forma significativa a las conclusiones clnicas derivadas del
anlisis de datos. Por este motivo, se sugiere suma cautela en la utilizacin de la
regresin lineal mltiple y otras tcnicas basadas en la distribucin normal en el
anlisis de datos de CVRS recogidos mediante el cuestionario SF-36.
Este trabajo pone de manifiesto la importancia de comprobar las hiptesis de las
tcnicas de anlisis estadstico utilizadas en el anlisis de datos de CVRS, ms
concretamente en el anlisis de datos procedentes del cuestionario de salud SF-36.
En caso de incumplimiento de alguna de las hiptesis es necesario comprobar la
robustez de los mtodos utilizados.
El mtodo seleccionado para el anlisis de los datos tiene una importancia clara
en la interpretacin de los resultados obtenidos y, por tanto, en las conclusiones
obtenidas en los mismos. Es decir, mientras que los modelos de regresin lineal
mltiple, que utilizan una variable dependiente continua, ofrecen resultados en
trminos de diferencia esperada en la CV medida en una escala continua (habitualmente de 0 a 100) entre determinados grupos de individuos; los modelos de
regresin ordinal, que utilizan una variable dependiente ordinal ofrecen resultados
en trminos de tasa de odds o incremento/reduccin de la probabilidad de tener
mejor o peor CVRS para determinados grupos de individuos con respecto de otros.
Diferentes tcnicas de anlisis nos llevan a obtener diferentes resultados y conclusiones. Por tanto, el mtodo de anlisis a utilizar debe ser seleccionado basndonos, entre otras cosas, en los objetivos planteados y el tipo de conclusiones que se
desean obtener.

182

ESTADSTICA ESPAOLA

Por ltimo, en muchos casos se desea realizar un estudio sobre los factores de
influencia en la CVRS, considerando todas las dimensiones del cuestionario SF-36,
de forma independiente. En este caso, es preferible utilizar la misma tcnica de
anlisis para todas las dimensiones, puesto que de esta forma se podrn comparar
los resultados obtenidos en las 8 dimensiones conjuntamente. Resulta difcil cumplir
este cometido basndonos en las recomendaciones de Walters et al. (2001), puesto
que los niveles de las dimensiones del SF-36 varan de 4 a 26 (ver tabla 1). Por un
lado, se recomienda especial cautela al utilizar tcnicas de variables continuas para
el anlisis de dimensiones con 4 5 modalidades (como el rol emocional y el rol
fsico), comprobando, en la medida de nuestro alcance, la robustez de las tcnicas
utilizadas. Por otro lado, el utilizar alternativamente tcnicas de variables ordinales
exige una categorizacin de la dimensin, con los problemas que esto conlleva de
prdida de informacin y criterios subjetivos de puntos de corte. Adems, las
hiptesis de las tcnicas de modelos ordinales tambin deben ser comprobadas
previamente. Por ejemplo, en el modelo de odds proporcionales utilizado en uno de
los ejemplos que se muestra en este trabajo, la hiptesis principal es que la influencia de las variables explicativas sea independiente del punto de corte de la probabilidad acumulada. En muchas ocasiones esta hiptesis no se verifica para alguna de
las covariables de inters que se desea incluir en el modelo. Por tanto, se debera
pensar en otras alternativas como un modelo de odds parcialmente proporcionales.
Nosotros proponemos una alternativa de anlisis de las reas del SF-36 basada en
la distribucin beta-binomial. En una publicacin reciente (Arostegui et al. 2007) se
muestra la adaptacin de los datos del SF-36 a la distribucin beta-binomial, con el
cumplimiento de las hiptesis necesarias para la aplicacin del mtodo de regresin
beta-binomial, y los resultados obtenidos mediante la regresin beta-binomial son
muy similares a los obtenidos mediante la regresin lineal mltiple en aquellas
reas del SF-36 aceptablemente continuas y con un sesgo moderado, y similares a
los obtenidos mediante el modelo de odds proporcionales o parcialmente proporcionales en las reas ordinales del SF-36, con la ventaja aadida de que todas las
reas se analizan con la misma tcnica. Adems, el mtodo de regresin betabinomial permite obtener resultados en trminos de la tasa de odds, que como
hemos indicado anteriormente, es un parmetro con muy buena aceptacin en el
mbito clnico.
Finalmente, los autores debemos mencionar que el objetivo de este trabajo, en
ningn caso es sacar conclusiones clnicas de los datos aqu presentados, ni su
generalizacin a la poblacin general, ni a poblaciones especficas de las cuales las
muestras pudieran ser representativas; dado que, tal y como hemos indicado
anteriormente, esta labor es propia de los especialistas clnicos respectivos. Si se
han interpretado resultados concretos, ha sido con el objeto de mostrar al lector
poco familiarizado con este tipo de anlisis de datos, las diferentes formas de

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

183

obtener conclusiones de diversas tcnicas de anlisis de datos en el mbito de la


epidemiologa clnica.

REFERENCIAS
AARONSON, N.K. (1989). Quality of life assessments in clinical trials: Methodological
issues. Controlled Clinical Trials 10 (Suppl.), 195S-208S.
AARONSON, N.K., ACQUADRO, C., ALONSO, J., APOLONE, G., BUCQUET, D., BULLINGER,
M., BUNGAY, K., FUKUHARA, S., GANDEK, B., KELLER, S., RAZAVI, R., SANSONFISHER, M., SULLIVAN, S., WOOD-DAUPHINEE, S., WAGNER, A. Y WARE, J.E. (1992).
International quality of life assessment (IQOLA) project. Quality of Life Research 1(5), 349-351.
ALONSO, J., PRIETO, L. Y ANT, J.M. (1995). La versin espaola del SF-36 Health
Survey (Cuestionario de Salud SF-36): Un instrumento para la medida de los
resultados clnicos. Medicina Clnica 104(20), 771-776.
ANDERSON, J.P., KAPLAN, R.M., COONS, S.J. Y SCHNEIDERMAN, L.J. (1998). Comparison of the Quality of Well Being Scale and the SF-36 results among two samples of ill adults: AIDS and other illnesses. Journal of Clinical Epidemiology
51(9), 755-762.
ANITUA, C. Y QUINTANA, J.M. (1999). Valores poblacionales del ndice de salud SF36 en el Pas Vasco: Importancia y aplicacin en la prctica clnica. Osasunkaria 17, 10-17.
APOLONE, G., CIFANI, S., LIBERATI, M.C. Y MOSCN, P. (1997). Questionario sullo
stato di salute SF-36. Traduzione e validazione della versione italiana: Risultati
del progetto IQOLA. Metodologia e Didattica Clinica 5, 86-94.
AROSTEGUI, I., NEZ-ANTN, V. Y QUINTANA, J.M. (2007). Analysis of the Short
Form 36 (SF-36): The beta-binomial distribution approach. Statistics in Medicine 26(6) 1318-1342.
BADA, X., SALAMERO, M. Y ALONSO, J. (1999). La Medida de la Salud. Gua de
Escalas de Medicin en Espaol (2 edicin). Edimac: Barcelona.
BEATON, D.E., BOMBARDIER, C., KATZ, J.N. Y WRIGHT, J.G. (2001). A taxonomy for
responsiveness. Journal of Clinical Epidemiology 54(12), 1204-1217.
BOWLING, A. (1991). Measuring Health: A Review of Quality of Life Measurements
Scales. Open University Press: Philadelphia.

184

ESTADSTICA ESPAOLA

BRAZIER, J.E., HARPER, R., JONES, N.M.B., OCATHAIN, A., THOMAS, K.J., USHERWOOD,
T. Y WESTLAKE, L. (1992). Validating the SF-36 Health Survey questionnaire:
New outcome measure for primary care. British Medical Journal 305(6846),
160-164.
BUBIEN, R.S., KNOTTS-DOLSON, S.M., PLUMB, V.J. Y KAY, G.N. (1996). Effect of
radiofrequency catheter ablation on health-related quality of life and activities of
daily living in patients with recurrent arrhythmias. Circulation 94(7), 1585-1591.
BULLINGER, M. (1995). German translation and psychometric testing of the SF-36
Health Survey: Preliminary results from the IQOLA project, international quality
of life assessment. Social Science and Medicine 41(10), 1359-1366.
CAMPBELL, D. Y FISKE, D. (1959). Convergent and discriminant validation by the
multitrait-multimethod matrix. Psychological Bulletin 56(2), 81-105.
CHEUNG, Y. -B., THUMBOO, J., MACHIN, D., FENG, P.-H., BOEY, M.L., THIO, S.T. Y FONG,
K.-Y. (2004). Modelling variability of quality of life scores: A study of questionnaire version and bilingualism. Quality of Life Research 13(5), 897-906.
CLANCY, C.M. Y EISENBERG, J.M. (1998). Outcomes research: Measuring the end
results of health care Science 282(5387), 245-246.
COULEHAN, J.L., SCHULBERG, H.C., BLOCK, M.R., MADONIA, M.J. Y RODRIGUEZ, E.
(1997). Treating depressed primary care patients improves their physical,
mental and social functioning. Archives of Internal Medicine 157(10), 11131120.
COX, D.R., FITZPATRICK, R., FLETCHER, A.E., GORE, S.M., SPIEGELHALTER, D.J. Y
JONES, D.R. (1992). Quality-of-life assessment: Can we make it simple?. Journal of the Royal Statistical Society: Series A 155(3), 353-393 (with discussion).
CRONBACH, L.J. (1951). Coefficient alpha and the internal structure of tests.
Psychometrika 16(2), 297-334.
DAVISON, A.C. Y HINKLEY, D.V. (1997). Bootstrap Methods and Their Applications.
Cambridge University Press: Cambridge.
DAWSON, J., FITZPATRICK, R., CARR, A. Y MURRAY, D. (1996). Questionnaire on the
perceptions of patients about total hip replacement The Journal of Bone and
Joint Surgery. British volume 78(2), 185-190.
DE VET, H.C., BOUTER, L.M., BEZEMER, P.D. Y BEURSKENS, A.J. (2001). Reproducibility and responsiveness of evaluative outcome measures. International Journal
of Technology Assessment in Health Care 17(4), 479-487.

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

185

DONOVAN, K., SANSON-FISHER, R.W. Y REDMAN, S. (1989). Measuring quality of life


in cancer patients. Journal of Clinical Oncology 7(7), 959-968.
EFRON, B. Y TIBSHIRANI, R.J. (1993). An Introduction to the Bootstrap. Chapman &
Hall: New York.
ETXEBARRIA, Y., PREZ-IZQUIERDO, J., BADIOLA, C., QUINTANA, J.M., PADIERNA, A.,
AROSTEGUI, I. Y CAPELASTEGUI, A. (2001). Evaluacin de la calidad de vida en
pacientes con cncer de pulmn. Gaceta Sanitaria 15 (1), 25-31.
FAIRCLOUGH, D. (2002). Design and Analysis of Quality of Life Studies in Clinical
Trials. Chapman and Hall: London.
FAYERS, P.M. Y HAND, D.J. (1997). Factor analysis, causal indicators, and quality of
life. Quality of Life Research 6(2), 139-150.
FAYERS, P.M. Y MACHIN, D. (2000). Quality of Life. Assessment, Analysis and
Interpretation Wiley: London.
FAYERS, P.M., GROENVOLD, M., HAND, D.J. Y BJORDAL, K. (1998). Clinical impact
versus factor analysis for quality of life questionnaire construction. Journal of
Clinical Epidemiology 651(3), 285-286.
FERRER, M., ALONSO, J., MORERA, J., MARRADES, R.M., KHALAF, A., AGUAR, M.C.,
PLAZA, V., PRIETO, L. Y ANT, J.M. (1997). Chronic obstructive pulmonary disease stage and health-related quality of life. The quality of life of chronic obstructive pulmonary disease study group. Annals of Internal Medicine 127(12),
1072-1079.
GANDEK, B. Y WARE, J.E. (1998). Methods for validating and norming translations of
health status questionnaires: The IQOLA project approach. Journal of Clinical
Epidemiology 51(11), 953-959.
GARRATT, A.M., SCHMIDT, L., MACKINTOSH, A. Y FITZPATRICK, R. (2002). Quality of life
measurement: Bibliographic study of patient assessed health outcome measures British Medical Journal 324(7351), 1417-1421.
GOLDSMITH, S.B. (1972). The status of health status indicators Health Services
Reports 87(3), 212-220.
GOLDSMITH, S.B. (1973). A reevaluation of health status indicator. Health Services
Reports 88(10), 937-941.
GONZLEZ, N., QUINTANA, J.M., AROSTEGUI, I., PADIERNA, A., MARTNEZ E., CRESPO, I. Y
VESGA, M.A. (2005). Translation and psychometric testing of the Basque version of the SF-36 health survey. Quality of Life Research 14(2), 549-554.

186

ESTADSTICA ESPAOLA

GUYATT, G.H., WALTER, S.D. Y NORMAN, G.R. (1987). Measuring change over time:
Assessing the usefulness of evaluative instruments. Journal of Chronic Diseases 40(2), 171-178.
GUYATT, G.H., FEENY, D.H. Y PATRICK, D.L. (1993). Measuring health-related quality
of life. Annals of Internal Medicine 118(8), 622-629.
HARPER, R., BRAZIER, J.E., WATERHOUSE, J.C., WALTERS, S.J., JONES, N.M.B. Y
HOWARD, P. (1997). Comparison of outcome measures for patients with
Chronic Obstructive Pulmonary Disease (COPD) in an outpatient setting. Thorax 52(10), 879-887.
HASSAN, I.S., BANNISTER, B.A., AKBAR, A., WEIR, W. Y BOFILL, M. (1998). A study of
the immunology of the chronic fatigue syndrome: Correlation of immunologic parameters to health dysfunction. Clinical Immunology and Immunopathology
87(1), 60-67.
HAYS, R.D., ANDERSON, R. Y REVICKI, D. (1993). Psychometric considerations in
evaluating health-related quality of life measures. Quality of Life Research
2(6), 441-449.
HEMINGWAY, H., STAFFORD, M., STANSFELD, S., SHIPLEY, M. Y MARMOT, M. (1997). Is
the SF-36 a valid measure of change in population health? Results from the
Whitehall II study. British Medical Journal 315(7118), 1273-1279.
JACOBSON, A.M., DE GROOT, M. Y SAMSON, J.A. (1994). The evaluation of two measures of quality of life in patients with type I and type II diabetes. Diabetes Care
17(4), 267-274.
JUNIPER, E.F., GUYATT, G.H., STREINER, D.L. Y KING, D.R. (1997). Clinical impact
versus factor analysis for quality of life questionnaire construction. Journal of
Clinical Epidemiology 50(3), 233-238.
KARNOFSKY, D.A. Y BURCHERNAL, J.H. (1949). The clinical evaluation of chemotherapeutic agents in cancer. En: Evaluation of Chemotherapeutic Agents
(C.M. McLeod ed.). Columbia University Press: New York, 191-205.
KATZ, S. Y AKPOM, C.A. (1976). A measure of primary sociobiological functions.
International Journal of Health Services 6(3), 493-507.
KOMAROFF, A.L., FAGIOLI, L.R., DOOLITTLE, T.H., GANDEK, B., GLEIT, M.A., GUERREIRO,
R.T., KORNISH, J., WARE, N.C., WARE, J.E. Y BATES, D.W. (1996). Health status
in patients with chronic fatigue syndrome and in general population and disease
comparison groups. American Journal of Medicine 101(3), 281-290.

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

187

LAFORGE, R.G., ROSSI, J.S., PROCHASKA, J.O., VELICER, W.F., LEVESQUE, D.A. Y
MCHORNEY, C.A. (1999). Stage of regular exercise and health-related qualityof-life. Preventive Medicine 28(4), 349-360.
LALL, R., CAMPBELL, M.J., WALTERS, S.J., MORGAN, K. Y MRC CFAS (2002). A review
of ordinal regression models applied on health-related quality of life assessments Statistical Methods in Medical Research 11(1), 49-67.
LEE, P.P., SPRITZER, K. Y HAYS, R.D. (1997). The impact of blurred vision on functioning and well-being Ophthalmology 104(3), 390-396.
LEIDY, N.K., ELIXHAUSER, A., VICKREY, B., MEANS, E. Y WILLIAN, M.K. (1999). Seizure
frequency and the health-related quality of life of adults with epilepsy. Neurology 53(1), 162-166.
LOHR, K.N. (2002). Assessing health status and quality-of-life instruments: Attributes and review criteria. Quality of Life Research 11(3), 193-205.
LYONS, R.A., LO, S.V. Y LITTLEPAGE, B.N.C. (1994). Comparative health status of
patients with 11 common illnesses in Wales. Journal of Epidemiology and
Community Health 48(4), 388-390.
MAHLER, D.A. Y MACKOWIAK, J.I. (1995). Evaluation of the Short-Form 36-item
questionnaire to measure health-related quality of life in patients with COPD
Chest 107(6), 1585-1589.
MANGIONE, C.M., PHILLIPS, R.S., LAWRENCE, M.G., SEDDON, J.M., ORAV, E.J. Y GOLDMAN, L. (1994). Improved visual function and attenuation of declines in healthrelated quality of life cataract extraction. Archives of Ophthalmology 112(11),
1419-1425.
MATHSOFT INC. (1999). S-PLUS 2000 Users Guide. MathSoft, Data Analysis
Products Division: Seattle, WA.
MCCALLUM, J. (1995). The SF-36 in an Australian sample: Validating a new generic
health status measure. Australian Journal of Public Health 19(2), 160-166.
MCDOWELL, I. Y NEWELL, C. (1996). Measuring Health: A Guide to Rating Scales
and Questionnaires (2nd edition). Oxford University Press: New York.
MCHORNEY, C.A. (1999). Health status assessment methods for adults: Past accomplishments and future challenges. Annual Review of Public Health 20,
309-335.
MESBAH, M.F., COLE, B. Y TING LEE, M. (2002). Statistical Methods for Quality of Life
Studies. Design, Measurements and Analysis. Kluwer Academic Publishers:
Boston, MA.

188

ESTADSTICA ESPAOLA

MOZES, B., MAOR, Y SHMUELI, A. (1999). The competing effects of disease states on
quality of life of the elderly: The case of urinary symptoms in men. Quality of
Life Research 8(1-2), 93-99.
MURAWSKI, M.M. Y MIEDERHOFF, P.A. (1998). On the generalizibility of statistical
expressions of the health related quality of life instrument responsiveness: A
data synthesis. Quality of Life Research 7(1), 11-22.
OBRIEN, P.C. (1984). Procedures for comparing samples with multiple endpoints.
Biometrics 40(4), 1079-1087.
OLSCHEWSKI, M. Y SCHUMACHER, M. (1990). Statistical analysis of quality of life data
in cancer clinical trials. Statistics in Medicine 9(7), 749-763.
PADIERNA, A., QUINTANA, J.M., AROSTEGUI, I., GONZLEZ, N. Y HORCAJO, M.J. (2000).
The health-related quality of life in eating disorders. Quality of Life Research
9(6), 667-674
PADIERNA, A., QUINTANA, J.M., AROSTEGUI, I., GONZLEZ, N. Y HORCAJO, M.J. (2002).
Changes in health related quality of life among patients treated for eating disorders. Quality of Life Research 11(6), 545-552.
PATRICK, D.L. Y DEYO, R.A. (1989). Generic and disease-specific measures in
assessing health status and quality of life. Medical Care 27(3 Suppl.), S217S232.
PATRICK, D.L., DEYO, R.A., ATLAS, S.J., SINGER, D.E., CHAPIN, A. Y KELLER, R.B.
(1995). Assessing health-related quality of life in patients with sciatica. Spine
20(17), 1899-1909.
PERNEGER, T.V., LEPLEGE, A., ETTER, J.F. Y ROUGEMONT, A. (1995). Validation of a
French language version of the MOS 36 item short form health survey (SF-36)
in young healthy adults Journal of Clinical Epidemiology 48(8), 1051-1060.
POCOCK, S.J., GELLER, N.L. Y TSIATIS, A. (1987). The analysis of multiple endpoints
in clinical trials. Biometrics 43(3), 487-498.
QUINTANA, J.M., AROSTEGUI, I., CABRIADA, J., LPEZ DE TEJADA, I. Y PRDIGO, L.
(2003). Predictors of health-related quality of life improvement among patients
undergoing cholecystectomy. British Journal of Surgery 90(12), 1549-1555.
QUINTANA, J.M., AROSTEGUI, I., ORIBE, V., LPEZ DE TEJADA, I., BARRIOS, B. Y GARAI, I.
(2005). Influence of age and gender on quality of life outcomes after cholecystectomy. Quality of Life Research 14(3), 815-825.

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

189

QUINTANA, J.M., ESCOBAR, A., AROSTEGUI, I., BILBAO, A., AZKARATE, J., GOENAGA, J.I. Y
ARENAZA, J.C. (2006). Health-related quality of life and appropriateness of knee
or hip joint replacement. Archives of Internal Medicine 166(2), 220-226.
REVICKI, D.A., WU, A.W. Y MURRIA, M.I. (1995). Change in clinical status, health
status, and health utility outcomes in HIV-infected patients. Medical Care
33(4), 173-182.
ROSE, M.S., KOSHMAN, M.L., SPRENG, S. Y SHELDOM, R. (1999). Statistical issues
encountered in the comparison of health-related quality of life in disease patients to published general population norms: Problems and solutions. Journal
of Clinical Epidemiology 52(5), 405-412.
SANZ, J. (1991). Valor y cuantificacin de la calidad de vida en medicina. Medicina Clnica 96, 66-69.
SAS INSTITUTE INC. (1994). SAS Procedures Guide, Version 6. SAS Institute: Cary, NC.
STANSFELD, S.A., ROBERTS, R. Y FOOT, S.P. (1997). Assessing the validity of the
SF-36 general Health Survey. Quality of Life Research 6(3), 217-224.
STREINER, D.L. Y NORMAN, G.R. (1992). Health Measurement Scales. Oxford
University Press: New York.
SULLIVAN, M., KARLSSON. J. Y WARE, J.E. (1995). The Swedish SF-36 Health Survey. I. Evaluation of data quality, scaling assumptions, reliability and construct
validity across general population in Sweden. Social Science and Medicine
41(10), 1349-1358.
TESTA, M.A. Y NACKLEY, J.F. (1994). Methods for quality of life studies. Annual
Review of Public Health 15, 535-559.
TESTA, M.A. Y SIMONSON, D.C. (1996). Assessment of quality of life outcomes.
New England Journal of Medicine 334(13), 835-840.
TORRANCE, G.W. (1987). Utility approach to measuring health-related quality-oflife. Journal of Chronic Diseases 40(6), 593-600.
TORRES, X., ARROYO, S., ARAYA, S. Y DE PABLO, J. (1999). The Spanish version of
the Quality of Life in Epilepsy Inventory (QOLIE-31): Translation, validity and reliability. Epilepsia 40(9), 1299-1304.
TSEVAT, J., SOLZAN, J.G., KUNTZ, K.M., RAGLAND, J., CURRIER, J.S., SELL, R.L. Y
WEINSTEIN, M.C. (1996). Health values of patients infected with human immunodeficiency virus. Relationship to mental health and physical functioning. Medical Care 34(1), 44-57.

190

ESTADSTICA ESPAOLA

VAN KNIPPENBERG, F.C. Y DE HAES, J.C. (1988). Measuring quality of life of cancer
patients: Psychometric properties of instruments. Journal of Clinical Epidemiology 41(11), 1043-1055.
VILAGUT, G., FERRER, M., RAJMIL, L., REBOLLO, P., PERMANYER-MIRALDA, G., QUINTANA, J.M., SANTED, R., VALDERAS, J.M., RIBERA, A., DOMINGO-SALVANY, A. Y ALONSO, J. (2005). El cuestionario de salud SF-36 espaol: Una dcada de experiencia y nuevos desarrollos. Gaceta Sanitaria 19(2), 135:150.
WACHTEL, T., PIETTE, J., MOR, V., STEIN, M., FLEISHMAN, J. Y CARPENTER, C. (1992).
Quality of life in persons with human immunodeficiency virus infection: Measurement by the Medical Outcomes Study instrument. Annals of Internal Medicine 116(2), 129-137.
WAHL, A., MOUM, T., HANESTAD, B.R. Y WIKLUND, I. (1999). The relationship between
demographic and clinical variables, and quality of life aspects in patients with
psoriasis. Quality of Life Research 8(4), 319-326.
WALTERS, S.J. Y CAMPBELL, M.J. (2005). The use of bootstrap methods for estimating sample sizes and analyzing health related quality of life outcomes. Statistics in Medicine 24(7), 1075-1102.
WALTERS, S.J., CAMPBELL, M.J., Y LALL, R. (2001). Design and analysis of trials with
quality of life as an outcome: A practical guide. Journal of Biopharmaceutical
Statistics 11(3), 155-176.
WARE, J.E. (2000). SF-36 Health Survey update. Spine 25(24), 3130-3139.
WARE, J.E. Y SHERBOURNE, C.D. (1992). The MOS 36-item Short Form Health
Survey (SF-36): I. Conceptual framework and item selection. Medical Care
30(6), 473-483.
WARE, J.E., KOSINSKI, M.A. Y KELLER, S.K. (1994). Physical and Mental Health
Summary Scales: A Users Manual. The Health Institute, New England Medical
Center: Boston, MA.
WARE, J.E., KOSINSKI, M.A. Y DEWEY, J.E. (2000). How to score version 2 of the SF36 Health Survey Quality Metric Incorporated: Lincoln, RI.
WARE, J.E., SNOW, K.K., KOSINSKI, M.A. Y GANDEK, B. (1993). SF-36 Health Survey,
Manual and Interpretation Guides. The Health Institute, New England Medical
Center: Boston, MA.

ASPECTOS ESTADSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD

191

WARE, J.E., GANDEK, B., KELLER, S.D. Y THE IQOLA Project Group. (1996a). Evaluating instruments used cross-nationally: Methods from the IQOLA project. En:
Quality of Life and Pharmacoeconomics in Clinical Trials (2nd edition) (B.
Spilker ed.). Raven Press: New York, 681-692.
WARE, J.E., BAYLISS, M.S., ROGERS, W.H., KOSINSKI, M. Y TARLOV, A.R. (1996b).
Differences in 4-year health outcomes for elderly and poor, chronically ill patients treated in HMO and fee-for-service systems. Results from the MOS
Journal of the American Medical Association 276(13), 1039-1047.
WARE, J.E., KELLER, S.D., GANDEK, B., BRAZIER, J.E., SULLIVAN, M. Y THE IQOLA Project Group (1995). Evaluating translations of health status questionnaires:
Methods from the IQOLA project. International Journal of Technology Assessment in Health Care 11(3), 525-551.
WILSON, I.B. Y KAPLAN, S. (1995). Clinical practice and patients health status: How
are the two related?. Medical Care 33 (4 Suppl.), AS209-AS214.
WILSON, D., PARSONS, J. Y WAKEFIELD, M. (1999). The health-related quality-of-life
of never smokers, ex-smokers and light, moderate and heavy smokers. Preventive Medicine 29(3), 139-144.
WORLD HEALTH ORGANIZATION (1952). En: World Health Organization. Handbook
of Basic Documents. (5th edition). Palais des Nations: Ginebra, 3-20.

192

ESTADSTICA ESPAOLA

STATISTICAL ASPECTS OF THE HEALTH RELATED QUALITY OF


LIFE QUESTIONNAIRE SHORT FORM- 36 ( SF-36)
ABSTRACT
Health Related Quality of Life (HRQoL) is an important parameter
to measure health outcomes. It is a difficult concept to measure and
questionnaires are used to measured it. The psychometric properties
of a questionnaire, its cultural adaptation, the design of the study and
the analysis of the results are relevant statistical issues that must be
treated with caution. The Health Survey SF-36 is one of the most
widely used, validated and translated instrument in the field of HRQoL
measurements. This work intends to highlight the importance of testing
the hypothesis of a model before choosing and evaluating a given statistical analysis in those studies where the SF-36 has been used. Examples of application of the SF-36 are provided, as well as more specific analysis to show that, depending on the statistical analysis used,
results can be different and, in addition, they can also have different
clinical relevance in the context of the application.
Key words: quality of life, SF-36, statistical analysis, goodness of fit.
AMS Classification: 62J05, 62J12, 62P10.

También podría gustarte