Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Regresión Ecologia

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 12

Estudio conjunto de dos variables

 A la derecha tenemos una posible manera de recoger los


datos obtenido observando dos variables en varios
individuos de una muestra.
Altura Peso
en cm. en Kg.
 En cada fila tenemos los datos de un individuo
162 61
 Cada columna representa los valores que toma una variable 154 60
sobre los mismos. 180 78
158 62
 Las individuos no se muestran en ningún orden particular.
171 66
169 60
 Dichas observaciones pueden ser representadas en un
diagrama de dispersión (‘scatterplot’). En ellos, cada 166 54
individuos es un punto cuyas coordenadas son los valores 176 84
de las variables. 163 68
... ...
 Nuestro objetivo será intentar reconocer a partir del
mismo si hay relación entre las variables, de qué tipo, y si
es posible predecir el valor de una de ellas en función de
la otra.

Bioestadística. U. Málaga. Tema 3: Estadística bivariante 1


Diagramas de dispersión o nube de puntos

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de


dispersión.

100
90
80 Pesa 76 kg.

70

Mide 187 cm.


60
Pesa 50 kg.
50
40 Mide 161 cm.

30
140 150 160 170 180 190 200
Bioestadística. U. Málaga. Tema 3: Estadística bivariante 2
Relación entre variables.

Tenemos las alturas y los pesos de 30 individuos representados en un diagrama de


dispersión.

100 u r a
alt
n la
90 co
en ta
80
aum
es o
70
el p
que
60
re ce
P a
50
40
30
140 150 160 170 180 190 200
Bioestadística. U. Málaga. Tema 3: Estadística bivariante 3
Relación directa e inversa
330 100

Incorrelación 90 Fuerte relación


280
80 directa.
230
70
180
60
130 50
80 40

30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Para valores de X por encima de la media


•Para los valores de X mayores que la media le
tenemos valores de Y por encima y por
corresponden valores de Y mayores también.
debajo en proporciones similares.
Incorrelación.
•Para los valores de X menores que la media le
corresponden valores de Y menores también.
80
Cierta relación •Esto
70
se llama relación directa.
60 inversa
50
40
30 Para los valores de X mayores que la
20 media le corresponden valores de Y
10
0
menores. Esto es relación inversa o
140 150 160 170 180 190 200 decreciente.
Bioestadística. U. Málaga. Tema 3: Estadística bivariante 4
¿Cuándo es bueno un modelo de regresión?
r= 0.415  Lo adecuado del modelo depende de la
relación entre:
420

r^2 = 0.172
 la dispersión marginal de Y
400

 La dispersión de Y condicionada a X
380
y

360

 Es decir, fijando valores de X, vemos


cómo se distribuye Y
340
320

 La distribución de Y, para valores


150 160 170 180 190 fijados de X, se denomina distribución
r= 0.984 condicionada.
390

r^2 = 0.969

 La distribución de Y,
380

independientemente del valor de X, se


denomina distribución marginal.
370
y

360

 Si la dispersión se reduce notablemente,


el modelo de regresión será adecuado.
350

150
Bioestadística. U.160
Málaga. 170 180 190 Tema 3: Estadística bivariante 5
Coef. de correlación lineal de Pearson
 La coeficiente de correlación lineal de Pearson de
dos variables, r, nos indica si los puntos tienen una
tendencia a disponerse alineadamente
(excluyendo rectas horizontales y verticales).

 tiene el mismo signo que Sxy por tanto de su signo


obtenemos el que la posible relación sea directa o
inversa.

 r es útil para determinar si hay relación lineal entre


dos variables, pero no servirá para otro tipo de
relaciones (cuadrática, logarítmica,...)
S xy
r
SxS y
Bioestadística. U. Málaga. Tema 3: Estadística bivariante 6
Entrenando el ojo: correlaciones positivas
330 130
120
280 110
230 100
90
180 80
70
130 60
50
80 r=0,1 40
r=0,4
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

100 100
90 90
80 80
70 70
60 60
50 50
40 r=0,8 40 r=0,99
30 30
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Bioestadística. U. Málaga. Tema 3: Estadística bivariante 7


Entrenando el ojo: correlaciones negativas
90 80
80 70
70 60
60 50
50
40
40
30
30
20 20
10 r=-0,5 10 r=-0,7
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

80 80
70 70
60 60
50 50
40 40
30 30
20 20
10 r=-0,95 10 r=-0,999
0 0
140 150 160 170 180 190 200 140 150 160 170 180 190 200

Bioestadística. U. Málaga. Tema 3: Estadística bivariante 8


 Método de los Mínimos cuadrados

 Número sp Área

 69 4.884
 50 3.949
 41 2.790
 36 2.590
 20 2.255
 18 1.114
 13 o.954

Bioestadística. U. Málaga. Tema 3: Estadística bivariante 9


Bioestadística. U. Málaga. Tema 3: Estadística bivariante 10
 Correlación de Pearson

Bioestadística. U. Málaga. Tema 3: Estadística bivariante 11


Ejemplo. El número de libras de vapor utilizadas por mes por una planta química,está
relacionado con la temperatura ambiente promedio (en grados Farenheit) de ese mes. En la
tabla siguiente se muestra el uso del vapor de un año y la temperatura del mes corespondiente.

Consumo de
  Vapor por  
Mes

Mes Temperatura Uso/1000


Enero 21 185.79
Febrero 24 214.47
Marzo 32 288.03
Abril 47 424.84
Mayo 50 454.58
Junio 59 539.03
Julio 68 21.55
Agosto 74 675.06
Septiembre 62 562.03
Octubre 50 452.93
Noviembre 41 369.96
Diciembre 30 273.98

Bioestadística. U. Málaga. Tema 3: Estadística bivariante 12

También podría gustarte