Analisis Multivariado
Analisis Multivariado
Analisis Multivariado
INTRODUCCION
En esta leccin se va a dar una breve visin general de dicho conjunto de tcnicas
exponiendo, brevemente, cul es su finalidad, ilustrada con ejemplos.
1) 1) Mtodos de dependencia
Suponen que las variables analizadas estn divididas en dos grupos: las
variables dependientes y las variables independientes. El objetivo de los mtodos
de dependencia consiste en determinar si el conjunto de variables independientes
afecta al conjunto de variables dependientes y de qu forma.
2) 2) Mtodos de interdependencia
Estos mtodos no distinguen entre variables dependientes e independientes
y su objetivo consiste en identificar qu variables estn relacionadas, cmo lo
estn y por qu.
3) 3) Mtodos estructurales
Suponen que las variables estn divididas en dos grupos: el de las variables
dependientes y el de las independientes. El objetivo de estos mtodos es anlizar,
no slo como las variables independientes afectan a las variables dependientes,
sino tambin cmo estn relacionadas las variables de los dos grupos entre s.
Anlisis de Regresin
Dependiente Anlisis de Supervivencia
Mtrica MANOVA
Correlacin Cannica
Mtodos de
Dependencia Anlisis Discriminante
Dependiente Regresin Logstica
No Mtrica Anlisis Conjoint
A. Comp. Principales
Tcnicas Anlisis Factorial
Datos Mtricos
Multivariantes Escalas Multidimensionales
Mtodos de Anlisis Cluster
Interdependencia
Anlisis de Correspondencias
Datos No Modelos log-lineales
Mtricos Escalas Multidimensionales
Anlisis Cluster
Modelos estructurales
2.1 Mtodos de dependencia
Se pueden clasificar en dos grandes subgrupos segn que la variable (s)
dependiente (s) sea (n) cuantitativas o cualitativas.
Si la variable dependiente es cuantitativa algunas de las tcnicas que se
pueden aplicar son las siguientes:
1) Anlisis de Regresin
Es la tcnica adecuada si en el anlisis hay una o varias variables
dependientes mtricas cuyo valor depende de una o varias variables
independientes mtricas.
Por ejemplo, intentar predecir el gasto anual en cine de una persona a
partir de su nivel de ingresos, nivel educativo, sexo y edad.
2) Anlisis de Supervivencia
Es similar al anlisis de regresin pero con la diferencia de que la variable
independiente es el tiempo de supervivencia de un individuo objeto.
Por ejemplo, intentar predecir el tiempo de permanencia en el desempleo
de un individuo a partir de su nivel de estudios y de su edad.
3) Anlisis de la varianza
Se utilizan en situaciones en las que la muestra total est dividida en
varios grupos basados en una o varias variables independientes no mtricas y las
variables dependientes analizadas son mtricas. Su objetivo es averiguar si hay
diferencias significativas entre dichos grupos en cuanto a las variables
dependientes se refiere.
Por ejemplo, hay diferencias en el nivel de colesterol por sexos? afecta,
tambin, el tipo de ocupacin?.
4) Correlacin Cannica
Su objetivo es relacionar simultneamente varias variables mtricas
dependientes e independientes calculando combinaciones lineales de cada
conjunto de variables que maximicen la correlacin existente entre los dos
conjuntos de variables.
Por ejemplo, analizar cmo estn relacionadas el tiempo dedicado al
trabajo y al ocio de una persona con su nivel de ingresos, su edad y su nivel de
educacin
Si la variable dependiente es cualitativa algunas de las tcnicas que se
pueden aplicar son las siguientes:
1) Anlisis Discriminante
Esta tcnica proporciona reglas de clasificacin ptimas de nuevas
observaciones de las que se desconoce su grupo de procedencia basndose en la
informacin proporcionada los valores que en ella toman las variables
independientes.
Por ejemplo, determinar los ratios financieros que mejor permiten
discriminar entre empresas rentables y poco rentables.
3) Anlisis Conjoint
Es una tcnica que analiza el efecto de variables independientes no
mtricas sobre variables mtricas o no mtricas. La diferencia con el Anlisis de
la Varianza radica en dos hechos: las variables dependientes pueden ser no
mtricas y los valores de las variables independientes no mtricas son fijadas por
el analista. En otras disciplinas se conoce con el nombre de Diseo de
Experimentos.
Por ejemplo, una empresa quiere disear un nuevo producto y para ello
necesita especificar la forma del envase, su precio , el contenido por envase y su
composicin qumica. Presenta diversas composiciones de estos cuatro factores.
100 clientes proporcionan un ranking de las combinaciones que se le presentan.
Se quiere determinar los valores ptimos de estos 4 factores.
2.2 Mtodos de Interdependencia
Se pueden clasificar en dos grandes grupos segn que el tipo de datos que
analicen sean mtricos o no mtricos.
Si los datos son mtricos se pueden utilizar, entre otras, las siguientes
tcnicas:
2) Escalas Multidimensionales
Su objetivo es transformar juicios de semejanza o preferencia en distancias
representadas en un espacio multidimensional. Como consecuencia se construye
un mapa en el que se dibujan las posiciones de los objetos comparados de forma
que aqullos percibidos como similares estn cercanos unos de otros y alejados
de objetos percibidos como distintos.
Por ejemplo, analizar, en el mercado de refrescos, las percepciones que un
grupo de consumidores tiene acerca de una lista de refrescos y marcas con el fin
de estudiar qu factores subjetivos utiliza un consumidor a la hora de clasificar
dichos productos.
3) Anlisis Cluster
Su objetivo es clasificar una muestra de entidades (individuos o variables)
en un nmero pequeo de grupos de forma que las observaciones pertenecientes
a un grupo sean muy similares entre s y muy disimilares del resto. A diferencia
del Anlisis Discriminante se desconoce el nmero y la composicin de dichos
grupos.
Por ejemplo, clasificar grupos de alimentos (pescados, carnes, vegetales y
leche) en funcin de sus valores nutritivos.
Si los datos son no mtricos se pueden utilizar, adems de las Escalas
Multidimensionales y el Anlisis Cluster, las siguientes tcnicas:
1) Anlisis de Correspondencias
Se aplica a tablas de contingencia multidimensionales y persigue un
objetivo similar al de las escalas multidimensionales pero representando
simultneamente las filas y columnas de las tablas de contingencia.
Por ejemplo, analizar el paro en Aragn teniendo en cuenta la provincia,
sexo, edad y nivel de estudios del parado
2) Modelos log-lineales
Se aplican a tablas de contingencia multidimensionales y modelizan
relaciones de dependencia multidimensional de las variables observadas que
buscan explicar las frecuencias observadas.
GRIM, L. and YARNOLD, P.R. (1994). Reading and understanding multivariate statistics.
American Psycological Association. Washington D.C
HAIR, J., ANDERSON, R., TATHAM, R. y BLACK, W. (1999). Anlisis Multivariante. 5
Edicin. Prentice Hall.
MARTINEZ ARIAS, R. (2000). El Anlisis Multivariante en la Investigacin Cientfica.
Cuadernos de Estadstica. Editorial La Muralla
Otros libros interesantes son:
AFIFI, A.A. and CLARK, V. (1996) Computer-Aided Multivariate Analysis. Third Edition.
Texts in Statistical Science. Chapman and Hall.
EVERITT, B. And GRAHAM, D. (1991). Applied Multivariate Data Analysis. Arnold.
SHARMA, S. (1998). Applied Multivariate Techiques. John Wiley and Sons.
URIEL, E. (1995). Anlisis de Datos: Series temporales y Anlisis Multivariante. Coleccin
Plan Nuevo. Editorial AC.