Anaì Lisis Multivariante-3
Anaì Lisis Multivariante-3
Anaì Lisis Multivariante-3
Su razón de ser radica en un mejor entendimiento del fenómeno estudiado, obteniendo información
que los métodos estadísticos univariantes y bivariantes son incapaces de conseguir.
Se pueden clasificar en dos grandes subgrupos según que la variable (s) dependiente (s) sea (n)
cuantitativas o cualitativas.
1. Análisis de Regresión.
Es la técnica adecuada si en el análisis hay una o varias variables dependientes métricas cuyo valor
depende de una o varias variables independientes métricas. Por ejemplo, intentar predecir el gasto
anual en cine de una persona a partir de su nivel de ingresos, nivel educativo, sexo y edad.
2. Análisis de Supervivencia.
Es similar al análisis de regresión, pero con la diferencia de que la variable independiente es el tiempo
de supervivencia de un individuo u objeto. Por ejemplo, intentar predecir el tiempo de permanencia en
el desempleo de un individuo a partir de su nivel de estudios y de su edad.
3. Análisis de la varianza.
Se utilizan en situaciones en las que la muestra total está dividida en varios grupos basados en una o
varias variables independientes no métricas y las variables dependientes analizadas son métricas. Su
objetivo es averiguar si hay diferencias significativas entre dichos grupos en cuanto a las variables
dependientes se refiere. Por ejemplo, ¿hay diferencias en el nivel de colesterol por sexos? ¿Afecta,
también, el tipo de ocupación?
4. Correlación Canónica.
Su objetivo es relacionar simultáneamente varias variables métricas dependientes e independientes
calculando combinaciones lineales de cada conjunto de variables que maximicen la correlación
existente entre los dos conjuntos de variables. Por ejemplo, analizar cómo está relacionado el tiempo
dedicado al trabajo y al ocio de una persona con su nivel de ingresos, su edad y su nivel de educación.
1. Análisis Discriminante.
Esta técnica proporciona reglas de clasificación óptimas de nuevas observaciones de las que se
desconoce su grupo de procedencia basándose en la información proporcionada por los valores que en
ella toman las variables independientes. Por ejemplo, determinar los ratios financieros que mejor
permiten discriminar entre empresas rentables y poco rentables.
El objetivo del análisis discriminante es, por tanto, identificar cuáles son las características distintivas
de los individuos en cada grupo y, posteriormente, poder utilizarlas para estimar el grupo al que
pertenecen otros individuos de los que se conocen dichas características, pero no su
grupo de pertenencia.
Este método de análisis permite, en primer lugar, determinar cuáles son las variables (de entre una
serie de variables seleccionadas previamente por el investigador) que mejor explican la pertenencia de
un individuo a un determinado grupo.
En segundo lugar, también permite determinar el grupo al que pertenecerá un individuo pendiente de
clasificación sobre la base de las respuestas de dicho individuo a las variables que más explican la
pertenencia a cada grupo. Es una técnica muy potente puesto que permite considerar muchas variables
de forma simultánea.
3. Análisis Conjoint.
Es una técnica que analiza el efecto de variables independientes no métricas sobre variables métricas
o no métricas. La diferencia con el Análisis de la Varianza radica en dos hechos: las variables
dependientes pueden ser no métricas y los valores de las variables independientes no métricas son
fijadas por el analista. En otras disciplinas se conoce con el nombre de Diseño de Experimentos. Por
ejemplo, una empresa quiere diseñar un nuevo producto y para ello necesita especificar la forma del
envase, su precio, el contenido por envase y su composición química. Presenta diversas
composiciones de estos cuatro factores. 100 clientes proporcionan un ranking de las combinaciones
que se le presentan. Se quiere determinar los valores óptimos de estos 4 factores.
Por ejemplo, analizar, en el mercado de refrescos, las percepciones que un grupo de consumidores
tiene acerca de una lista de refrescos y marcas con el fin de estudiar qué factores subjetivos utiliza un
consumidor a la hora de clasificar dichos productos.
3. Análisis Clúster.
1. Análisis de Correspondencias.
2. Modelos log-lineales.
Se define el problema especificando los objetivos y las técnicas multivariantes que se van a utilizar. El
investigador debe establecer el problema en términos conceptuales definiendo los conceptos y las
relaciones fundamentales que se van a investigar. Se deben establecer si dichas relaciones van a ser
relaciones de dependencia o de interdependencia. Con todo esto se determinan las variables a
observar.
Se determina el tamaño muestral, las ecuaciones a estimar (si procede), las distancias a calcular (si
procede) y las técnicas de estimación a emplear. Una vez determinado todo esto se proceden a
observar los datos.
Se evalúan las hipótesis subyacentes a la técnica multivariante. Dichas hipótesis pueden ser de
normalidad, linealidad, independencia, homocedasticidad, etc. También se debe decidir qué hacer con
los datos perdidos (missing).
Se estima el modelo y se evalúa el ajuste a los datos. En este paso pueden aparecer observaciones
atípicas (outliers) o influyentes, cuya influencia sobre las estimaciones y la bondad de ajuste se debe
analizar.
Dichas interpretaciones pueden llevar a re-especificaciones adicionales de las variables o del modelo
con lo cual se puede volver de nuevo a los pasos 3) y 4).
Consiste en establecer la validez de los resultados obtenidos analizando si los resultados obtenidos
con la muestra se generalizan a la población de la que procede. Para ello se puede dividir la muestra
en varias partes en las que el modelo se vuelve a estimar y se comparan los resultados. Otras técnicas
que se pueden utilizar aquí son las técnicas de remuestreo (jacknife y bootstrap).