Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Análisis de Regresión y Correlación Tema 5 EA

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 31

Análisis de Regresión y Correlación

Los primeros trabajos que conciernen con el estudio de la regresión se remontan al siglo XIX, cuando sir
Francis Galton (1822–1917) imbricó sus dos grandes aficiones: el estudio de la herencia y la expresión
matemática de los fenómenos vinculados a ella. Él fue el primero en trabajar con un conjunto de variables
y asignar a la relación entre dos variables un número para así obtener una medida tocante a su grado de
relación. Sostenía la idea de que personas excepcionalmente altas solían tener hijos de estatura menor,
mientras que personas muy bajas solían tener hijos más altos; este hecho fue enunciado por Galton como
la regresión a la media, aplicable a las tallas de una generación respecto de las siguientes. La justificación
que se da hoy día a esta situación es que los valores extremos de una distribución se deben en gran parte
al azar.
El análisis de regresión lineal es una técnica estadística utilizada para estudiar la relación entre variables
cuantitativas. Se adapta a una amplia variedad de situaciones. En la investigación social, puede utilizarse
para predecir un amplio rango de fenómenos, desde medidas económicas hasta diferentes aspectos del
comportamiento humano.
Variable
Es la característica que se estudia u observa en los individuos (o elementos) que conforman el
conjunto de unidades a estudiar. En el caso que nos ocupa, la regresión lineal simple, se considera una
variable explicativa (X) y una variable de respuesta (Y); por tanto, las observaciones resultantes son
bidimensionales.

Datos
Son los valores numéricos asumidos por la variable en cada uno de los elementos que se estudian para
que puedan ser comparados, analizados e interpretados. Aquí utilizamos datos bivariados, esto es,
pares ordenados que pueden representarse como puntos en el plano cartesiano.

Gráfico de dispersión
El gráfico de dispersión o gráfico de la nube de puntos es una representación en un sistema de
coordenadas cartesianas de los datos numéricos observados sobre la relación entre dos variables.

Recta de regresión
El análisis de regresión consiste en una técnica estadística utilizada para investigar y modelar la
relación que hay entre una variable explicativa (X) y una variable de respuesta (Y). Para poder hacer tal
investigación, se debe postular un modelo que está formado por una componente determinística y
una componente aleatoria.
Variable
Es la característica que se estudia u observa en los individuos (o elementos) que conforman el conjunto de
unidades a estudiar. En el caso que nos ocupa, la regresión lineal simple, se considera una variable explicativa
(X) y una variable de respuesta (Y); por tanto, las observaciones resultantes son bidimensionales.

Datos
Son los valores numéricos asumidos por la variable en cada uno de los elementos que se estudian para que
puedan ser comparados, analizados e interpretados. Aquí utilizamos datos bivariados, esto es, pares
ordenados que pueden representarse como puntos en el plano cartesiano.
Gráfico de dispersión
El gráfico de dispersión o gráfico de la nube de puntos es una representación en un sistema de coordenadas
cartesianas de los datos numéricos observados sobre la relación entre dos variables.

Recta de regresión
El análisis de regresión consiste en una técnica estadística utilizada para investigar y modelar la
relación que hay entre una variable explicativa (X) y una variable de respuesta (Y). Para poder hacer
tal investigación, se debe postular un modelo que está formado por una componente determinística
y una componente aleatoria.
En la tabla inferior se muestran las puntuaciones recogidas a partir de una muestra de 27 sujetos en una
escala observacional de estrés y en un test orientado a evaluar la utilización de mecanismos de
afrontamiento. El rango de puntuaciones en ambas variables puede oscilar entre 0 a 100, significando
puntuaciones más altas mayor estrés y mayor capacidad de utilización de mecanismos de afrontamiento,
respectivamente.

Caso Estrés (Y) Afrontamiento (X) XY X2 Y2


1 61 38 2318 1444 3721
2 26 80 2080 6400 676
3 32 40 1280 1600 1024
4 22 84 1848 7056 484
5 38 62 2356 3844 1444
6 80 18 1440 324 6400
7 17 65 1105 4225 289
8 10 78 780 6084 100
9 47 22 1034 484 2209
10 15 60 900 3600 225
11 50 50 2500 2500 2500
12 25 58 1450 3364 625
423 655 19091 40925 19697
Estrés (Y) Afrontamiento (X)
61 38 Curva de regresión
26 80
90
32 40
22 84 80
38 62
70
80 18
17 65 60
10 78
47 22 50

Estrés
15 60
40
50 50 Estrés
25 58 30

20

10

0
0 10 20 30 40 50 60 70 80 90
Afrontamiento
423
𝑌ത = = 35,3
12
655
𝑋ത = 12 =54,6

𝑌෠ = 77,8 − 0,78 𝑋𝑖

19091 − 12 35,3 54,6 19091 − 12 35,3 54,6


𝛽1 = 𝑟=
40925 − 12 54,62 40925 − 12 54,6 2 19697 12 35,3 2

19091 − 23129 4038


𝛽1 = =− = −0,78 19091 − 23129 4038
40925 − 35774 5151 𝑟= =−
5151 4744 7178 68,89
4038
= − 0,8165
4945

𝑟 2 = 0,6668 = 66,68
𝛽0 = 35,3 − 0,78 54,6 = 77,8
Curva de regresión
90

80

70

60

50
Estrés

40
Estrés
30

20

10

0
0 10 20 30 40 50 60 70 80 90
Afrontamiento

También podría gustarte