Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tarea de Correlacion

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

14Ander(543-623).

qxd 2/28/08 7:17 PM Page 563

14.3 Coeficiente de determinación 563

donde

b1  pendiente de la ecuación de regresión estimada ŷ  b0  b1x

El signo del coeficiente de regresión muestral es positivo si la ecuación de regresión tiene pen-
diente positiva (b1  0) y es negativo si la ecuación de regresión estimada tiene pendiente nega-
tiva (b1 0).
En el ejemplo de Armand’s Pizza Parlor, el valor del coeficiente de determinación corres-
pondiente a la ecuación de regresión estimada ŷ  60 + 5x es 0.9027. Como la pendiente de la
ecuación de regresión estimada es positiva, la ecuación (14.13) indica que el coeficiente de co-
rrelación muestral es 0.9027 0.9501 Con este coeficiente de correlación muestral, rxy =
+0.9501, se concluye que existe una relación lineal fuerte entre x y y.
En el caso de una relación lineal entre dos variables, tanto el coeficiente de determinación
como el coeficiente de correlación muestral proporcionan medidas de la intensidad de la relación.
El coeficiente de determinación proporciona una medida cuyo valor va desde cero hasta uno,
mientras que el coeficiente de correlación muestral proporciona una medida cuyo valor va des-
de –1 hasta +1. El coeficiente de correlación lineal está restringido a la relación lineal entre dos
variables, pero el coeficiente de determinación puede emplearse para relaciones no lineales y
para relaciones en las que hay dos o más variables independientes. Por tanto, el coeficiente de
determinación tiene un rango más amplio de aplicaciones.

NOTAS Y COMENTARIOS

1. Al obtener la ecuación de regresión estimada implican el tamaño de la muestra y las pro-


mediante el método de mínimos cuadrados y piedades de la distribución muestral adecuada
calcular el coeficiente de determinación, no se de los estimadores de mínimos cuadrados.
hizo ninguna suposición probabilística acerca 2. Para fines prácticos, cuando se trata de datos
del término del error  ni tampoco una prueba que se encuentran en las ciencias sociales, va-
de significancia para la relación entre x y y. Los lores de r2 tan pequeños como 0.25 suelen
valores grandes de r2 implican que la recta de considerarse útiles. En datos de la física o de
mínimos cuadrados se ajusta mejor a los datos; las ciencias de la vida, suelen encontrarse va-
es decir, las observaciones se encuentran más lores de r2 de 0.60 o mayores; en algunos ca-
cerca de la recta de mínimos cuadrados. Sin sos pueden encontrarse valores mayores de
embargo, usando únicamente r2 no se pueden 0.90. En las aplicaciones a los negocios, los
sacar conclusiones acerca de si la relación entre valores de r2 varían enormemente dependien-
x y y es estadísticamente significativa. Tal con- do de las características particulares de cada
clusión debe basarse en consideraciones que aplicación.

Ejercicios

Método
15. Los datos a continuación son los datos del ejercicio 1.

Auto examen xi 1 2 3 4 5
yi 3 7 5 11 14
La ecuación de regresión estimada para estos datos es ŷ  0.20 + 2.60x.
a. Empleando las ecuaciones (14.8), (14.9) y (14.10) calcule SCE, STC y SCR.
b. Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del ajuste.
c. Calcule el coeficiente de correlación muestral.
14Ander(543-623).qxd 2/28/08 7:17 PM Page 564

564 Capítulo 14 Regresión lineal simple

16. Los datos a continuación son los datos del ejercicio 2.


xi 3 12 6 20 14
yi 55 40 55 10 15
La ecuación de regresión estimada para estos datos es ŷ = 68  3x.
a. Calcule SCE, STC y SCR.
b. Calcule el coeficiente de determinación r2. Haga un comentario sobre la bondad del ajuste.
c. Calcule el coeficiente de correlación muestral.
17. Los datos a continuación son los datos del ejercicio 3.
xi 2 6 9 13 20
yi 7 18 9 26 23
La ecuación de regresión estimada para estos datos es ŷ  7.6  0.9x. ¿Qué porcentaje de la
suma total de cuadrados puede explicarse mediante la ecuación de regresión estimada? ¿Cuál es
el valor del coeficiente de correlación muestral?

Aplicaciones
18. En los datos siguientes, y corresponde a los salarios mensuales y x es el promedio obtenido
Auto examen por los estudiantes que terminaron la licenciatura de administración con especialidad en siste-
mas de información. La ecuación de regresión estimada obtenida con estos datos es ŷ 
1790.5  581.1x.

Promedio Salario mensual ($)


2.6 3300
3.4 3600
3.6 4000
3.2 3500
3.5 3900
2.9 3600

a. Calcule SCE, STC y SCR.


b. Calcule el coeficiente de determinación r 2. Haga un comentario sobre la bondad del ajuste.
c. Calcule el coeficiente de correlación muestral.
19. Los datos a continuación son los datos del ejercicio 7.

Fabricante y modelo x ⴝ confiabilidad y ⴝ precio ($)


Acura TL 4 33 150
BMW 330i 3 40 570
Lexus IS300 5 35 105
archivo CD Lexus ES330
Mercedes-Benz C320
5
1
35 174
42 230
en Lincoln LS Premium (V6)
Audi A4 3.0 Quattro
3
2
38 225
37 605
Cars
Cadillac CTS 1 37 695
Nissan Maxima 3.5 SE 4 34 390
Infiniti I35 5 33 845
Saab 9-3 Aero 3 36 910
Infiniti G35 4 34 695
Jaguar X-Type 3.0 1 37 995
Saab 9-5 Arc 3 36 955
Volvo S60 2.5T 3 33 890
14Ander(543-623).qxd 2/28/08 7:17 PM Page 565

14.3 Coeficiente de determinación 565

La ecuación de regresión estimada para estos datos es ŷ  40 639  1301.2x. ¿Qué porcentaje
de la suma total de cuadrados puede explicarse mediante la ecuación de regresión estimada?
Haga un comentario sobre la bondad del ajuste ¿Cuál es el valor del coeficiente de correlación
muestral?
20. Consumer Reports publica pruebas y evaluaciones sobre televisores de alta definición. Para cada
modelo se elaboró una evaluación general basada principalmente en la calidad de la imagen. Una
evaluación más alta indica un mejor funcionamiento. En los datos siguientes se dan evaluación
general y precio de televisores de plasma de 45 pulgadas (Consumer Reports, marzo 2006).

Marca Precio Puntuación en la valuación


Dell 2800 62
Hisense 2800 53
archivo CD Hitachi
JVC
2700
3500
44
50
en LG
Maxent
3300
2000
54
39
PlasmaTV
Panasonic 4000 66
Phillips 3000 55
Proview 2500 34
Samsung 3000 39

a. Use estos datos para obtener una ecuación de regresión estimada que pueda emplearse
para estimar la puntuación en la evaluación general de una televisión de 42 pulgadas dado
el precio.
b. Calcule r2. ¿Proporcionó un buen ajuste la ecuación de regresión estimada?
c. Estime la puntuación en la evaluación general de un televisor cuyo precio es $3200.
21. Una aplicación importante del análisis de regresión a la contaduría es la estimación de costos.
Con datos sobre volumen de producción y costos y empleando el método de mínimos cuadrados
para obtener la ecuación de regresión estimada que relacione volumen de producción y costos,
los contadores pueden estimar los costos correspondientes a un determinado volumen de produc-
ción. Considere la siguiente muestra de datos sobre volumen de producción y costos totales de
una operación de fabricación.

Volumen de producción (unidades) Costos totales ($)


400 4000
450 5000
550 5400
600 5900
700 6400
750 7000

a. Con estos datos obtenga la ecuación de regresión estimada para pronosticar los costos tota-
les dado un volumen de producción.
b. ¿Cuál es el costo por unidad producida?
c. Calcule el coeficiente de determinación. ¿Qué porcentaje de la variación en los costos tota-
les puede ser explicada por el volumen de producción?
d. De acuerdo con el programa de producción de la empresa, el mes próximo se deberán pro-
ducir 500 unidades. ¿Cuál es el costo total estimado de esta operación?
22. PC World publicó evaluaciones de las cinco mejores impresoras láser de oficina y de las cinco
mejores impresoras láser corporativas (PC World, febrero 2003). La impresora de oficina mejor
evaluada fue la Minolta-QMS PagePro 1250W, que en la evaluación general obtuvo una puntua-
ción de 91 puntos. La impresora láser corporativa mejor evaluada fue la Xerox Phase 4400/N, que
14Ander(543-623).qxd 2/28/08 7:17 PM Page 566

566 Capítulo 14 Regresión lineal simple

en la evaluación general obtuvo una puntuación de 83 puntos. En la tabla siguiente se da rapi-


dez, en páginas por minuto (ppm), en la impresión de texto y precio de cada impresora.

Nombre Tipo Velocidad (ppm) Precio ($)


Minolta-QMS PagePro 1250W Oficina 12 199
Brother HL-1850 Oficina 10 499
archivo CD Lexmark E320 Oficina 12.2 299
en Minolta-QMS PagePro 1250E
HP Laserjet 1200
Oficina
Oficina
10.3
11.7
299
399
Printers Xerox Phaser 4400/N Corporativa 17.8 1850
Brother HL-2460N Corporativa 16.1 1000
IBM Infoprint 1120n Corporativa 11.8 1387
Lexmark W812 Corporativa 19.8 2089
Oki Data B8300n Corporativa 28.2 2200

a. Dé la ecuación de regresión estimada empleando velocidad como variable independiente.


b. Calcule r2. ¿Qué porcentaje de la variación del precio puede ser explicado por la velocidad
de la impresora?
c. ¿Cuál es el coeficiente de correlación muestral entre velocidad y precio? ¿Refleja este coe-
ficiente una relación fuerte o débil entre la velocidad de la impresora y el costo?

14.4 Suposiciones del modelo


En un análisis de regresión se empieza por hacer una suposición acerca del modelo apropiado pa-
ra la relación entre las variables dependientes e independientes. En el caso de la regresión lineal
simple, se supone que el modelo de regresión es
y  β0  β1x  
Después empleando el método de mínimos cuadrados se obtienen los valores de b0 y b1, que son
las estimaciones de los parámetros β0 y β1, respectivamente, del modelo. Así se llega la ecuación
de regresión estimada
ŷ  b0  b1x
Como se vio, el valor del coeficiente de determinación (r 2) es una medida de la bondad de ajus-
te de la ecuación de regresión estimada. Sin embargo, aun cuando se obtenga un valor grande
para r2, la ecuación de regresión estimada no debe ser usada hasta que se realice un análisis pa-
ra determinar si el modelo empleado es adecuado. Un paso importante para ver si el modelo em-
pleado es adecuado es probar la significancia de la relación. Las pruebas de significancia en el
análisis de regresión están basadas en las suposiciones siguientes acerca del término del error .

SUPOSICIONES ACERCA DEL TÉRMINO DEL ERROR EN EL ANÁLISIS


DE REGRESIÓN
y  β0  β1x  

1. El término del error  es una variable aleatoria cuya media, o valor esperado, es
cero; es decir, E()  0.
Implicación: β0 y β1 son constantes, por lo tanto E( β0)  β0 y E( β1)  β1; así, para
un valor dado de x, el valor esperado de y es

E( y)  β0  β1x (14.14)
(continúa)

También podría gustarte