Tarea 4 - Grupo - 1 Trabajo Colaborativo
Tarea 4 - Grupo - 1 Trabajo Colaborativo
Tarea 4 - Grupo - 1 Trabajo Colaborativo
PRESENTADO POR
CURSO
BIOMETRIA Y DISEÑO EXPERIMENTAL
GRUPO: 203018_1
PRESENTADO A
JESSICA ALMEIDA BRAGA
DIRECTORA
INTRODUCCIÓN
Con la realización de este trabajo se propone hacer un análisis didáctico siguiendo del enfoque
propuesto de diseño, desarrollo y evaluación de situaciones problemáticas de estadística, donde a
partir de análisis de regresión y correlación se pueda construir e interpretar diagramas de
dispersión, calcular e interpretar el coeficiente de regresión y correlación para un conjunto de
datos y hacer inferencia sobre la estimación de la recta de regresión.
El coeficiente de correlación es una de las herramientas que sirven para poder medir el grado de
asociación que existen entre las variables y en este trabajo se implementara en tres ejercicios
donde se exponen casos y sus variables.
CUESTIONARIO
La correlación y regresión son ideas básicas en estadística, utilizadas en las ciencias y un gran
número de campos de la actividad humana. Estas técnicas amplían la idea de dependencia
funcional a situaciones aleatorias y, con contenidos muy similares, Como son:
Análisis de regresión:
El análisis de regresión lineal es una técnica estadística que se utiliza vara realizar un análisis
entre variables. La cual se adapta a una amplia variedad de situaciones en las investigaciones
sociales, en el análisis de regresión se utiliza para predecir un amplio rango de fenómenos, entre
los que se encuentra las medidas económicas y aspectos del comportamiento humano.
Para el caso de dos variables( regresión simple) como el de más de dos variables (regresión
múltiple), el análisis de la regresión lineal se utiliza para explorar y cuantificar la relación de dos
variables una llamada la variable dependiente (Y) y una o más variables independientes o
predictoras( X1,x2….), como también el desarrollo de las ecuaciones lineales con fines
predictivos, este método de análisis lleva una serie de procedimientos de diagnóstico, que
informan sobre estabilidad e idoneidad del análisis .( Liliana orellana,2008).
Técnica que establece una ecuación para estimar el valor desconocido de una variable, a partir del
valor conocido de otra variable.
Análisis de regresión lineal simple: Es el proceso general de predecir una variable (Y) a partir
de otra (X).
Las relaciones entre las variables pueden ser directas o también inversas.
Modelo de Regresión:
y=a+bx
Análisis de Correlación:
Herramienta estadística utilizada para describir el grado o fuerza en el que una variable esta
linealmente relacionada con otra. El análisis de correlación: Describe el grado de relación que
hay entre dos variables.
Es el estudio que se tiene de una serie de asociaciones de variables que existe entre una o más
variables, en donde se pretende correlacionar si una es directamente proporcional sobre la otra, si
los cambios de una corresponden en la otra, se pueden presentar en la misma dirección( cuando
una aumenta y la otra aumenta correlación positiva) o en una dirección contraria (cuando una
aumenta y la otra disminuye: correlación negativa) o pueden no tener ningún tipo de
relación( cuando una aumenta, la otra disminuye, no aumenta o es igual (correlación nula). Para
poder entender un poco más este tipo de situaciones de describen en las siguientes graficas con
los criterios antes mencionados
Recuperadohttps://i2.wp.com/blogs.ugto.mx/enfermeriaenlinea/wp-content/uploads/sites/43/2018/09/Estadistica-UNI5-002.jpg?
w=473&ssl=1
b) ¿Por qué se requiere la regresión lineal y múltiple? ¿En qué casos se presenta?
Este método permite que se pueda generar un modelo lineal, en que los valores de las variables
dependientes o respuestas (y) se determinan a partir de un conjunto de variables de características
independiente o llamadas predictoras (X1, X2, X3..) los cuales son la extensión de una regresión
lineal simple, se realiza en la metodología de análisis de causas- efecto, en donde los modelos
lineales múltiples siguen con la siguiente ecuación, para su formulación y resolución ( estadística
FBA 2011).
Yi=(β0+β1X1i+β2X2i+⋯+βnXni)+ei
El análisis de regresión lineal múltiple, a diferencia del simple, se aproxima más a situaciones de
análisis real puesto que los fenómenos, hechos y procesos sociales, por definición, son complejos
y, en consecuencia, deben ser explicados en la medida de lo posible por la serie de variables que,
directa e indirectamente, participan en su concreción.
Los modelos de regresión múltiple pueden emplearse para predecir el valor de la variable
dependiente o para evaluar la influencia que tienen los predictores sobre ella (esto último se debe
que analizar con cautela para no malinterpretar causa-efecto
c) ¿Qué tipos de correlación existe, cite un ejemplo para cada uno de los casos? Use
ejemplos relacionados con el área de las Ciencias Agropecuarias.
Correlación lineal simple: es el grado de variación conjunta existente entre dos o más variables.
Está basado en la comparación de la varianza asociada de dos variables (covarianza) y las
desviaciones estándar de cada uno a través del cálculo del coeficiente r de Pearson.
Si entre dos variables cuantitativas existe una relación lineal, el análisis de correlación lineal
simple se usa para determinar la dirección y la magnitud de dicha relación. La dirección de la
relación se refiere a si ésta es positiva o negativa. La magnitud de la relación o grado de relación
entre las variables se refiere a la fuerza de la relación que existe entre las variables.
• Correlación positiva: Ocurre cuando las dos variables aumentan al mismo tiempo, Si el
coeficiente es mayor a 0 y este a su vez se relaciona con las dos variables en sentido
directo, donde a valores altos de la una le corresponden valores altos de la otra e igual que
los valores bajos. Cuánto más próximo a +1 esté el coeficiente de correlación más patente
será esta covariación.Si r = 1 hablaremos de correlación positiva perfecta.
• Correlación negativa: Ocurre cuando una variable aumenta y por el contrario la otra
disminuye lo que se conoce como una relación inversa. Cuando el coeficiente
correlaciona en sentido inverso y si el coeficiente es menor a 0, quiere decir que a los
valores altos de una de ellas le corresponden los valores bajos de la otra o viceversa.
Cuánto más próximo a -1 esté el coeficiente de correlación más patente será esta
covariación extrema. Si r= -1 hablaremos de correlación negativa perfecta lo que supone
una determinación absoluta entre las dos variables (en sentido inverso): Existe una
relación funcional perfecta entre ambas (una relación lineal de pendiente negativa).
• Nula - Sin correlación: Se presenta cuando no hay relación aparente entre las variables
El coeficiente de correlación es solamente uno de los estadísticos que existen para medir el grado
de asociación entre variables, lo cual depende de la clase de variables analizadas (categórica,
continua, etc.). (Lahura E. 2003.pag 5)
El coeficiente de correlación es una herramienta estadística elemental e importante para el estudio
econométrico de relaciones lineales bivariadas que involucran el uso de datos de corte transversal
o series de tiempo. (Lahura E. 2003.pag 5)
Interpretación
Con el uso de este método de análisis, se pretende estimar la acción lineal que existe entre dos
variables X y Y, donde el coeficiente de correlación trata de medir un índice de tendencia que se
obtienen al observar los puntos obtenidos sobre una recta, donde se puede obtener valores entre
los rangos de -1 y +1.
s xy
r=
sx s y
Si SXY >0 las dos variables crecen o decrecen a la vez (nube de puntos creciente).
Si SXY <0 cuando una variable crece, la otra tiene tendencia a decrecer (nube de puntos
decreciente.)
Si los puntos se reparten con igual densidad alrededor del centro de gravedad x, y), SXY =0 (no
hay relación lineal).
Esta es la medida más importante, en cual se desarrolla un ajuste muestral de la línea de regresión
estimada, se define como la porción de la variación total en los valores de la variable dependiente
(Y), que se puede aplicar por las asociación de Y con X medida por la línea de regresión
estimada, el coeficiente de determinación es la forma principal, para poder medir el grado de
fuerza que existe entre las variable de Y, para la determinación del coeficiente de determinación
se representa como r2, en donde se mide la fuerza que existe entre estas dos variable, para el
cálculo se aplica la siguiente formula:
2. REALIZAR LOS SIGUIENTES ESTUDIOS DE CASO.
2.1 La siguiente tabla muestra los pesos gatos recién nacidos (gramos) y los niveles del
inhibidor tipo 2 del activador del plasminógeno (PAI-2) (ng/ml) en 26 casos estudiados.
Datos tomados de Daniel, W. (2002)
Peso PAI-2
(gramos) (ng/ml)
Variable Variable
(x) (y)
2150 185
2050 200
1000 125
2300 25
900 25
2450 78
2350 290
2350 60
1900 65
2400 125
1700 122
1950 75
1250 25
1700 180
2000 170
920 12
1270 25
1550 25
1500 30
1900 24
2800 200
3600 300
3250 300
3000 200
3000 200
3050 230
En este caso la variable independiente (x) sería el Peso (peso de los gatos recién nacidos
representada en gramos) ya que es un valor conocido por lo cual contribuye a explicar o predecir
el valor de la variable dependiente (y) en este caso PAI-2 (Niveles del inhibidor tipo 2 del
activador del plásminógeno).
300
PAI-2 -Variable dependiente (y)
250
200
PAI-2 (ng/ml)
Linear (PAI-2 (ng/ml))
150
100
50
0
500 1000 1500 2000 2500 3000 3500 4000
Peso- Variable Independiente (x)
c) Identifique el modelo.
En este caso se identifica el modelo de regresión Lineal simple, y que está compuesto por dos
variables en las cuales se puede identificar un cambio positivo o negativo en la variable
dependiente Y.
ESTIMACIÓN DE PARAMETROS
Modelo:
n ∑ x 1 y 1− ∑ x 1 ∑ y 1
m=
n ∑ x 2I −¿ ¿
Dónde:
26 ( 8169390 )−(54290)(3296)
m=
26 ( 126874300 )−¿ ¿
b= ý−m x́
b=−72,1
Interpretación:
Variabl 215 205 100 230 245 235 235 190 240 170 195 170 200 92 155 150 190 280 360 325 300 300
900 1250 1270 3050 54290
e (x) 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Variabl
185 200 125 25 25 78 290 60 65 125 122 75 25 180 170 12 25 25 30 24 200 300 300 200 200 230 3296
e (y)
n ∑ x 1 y 1− ∑ x 1 ∑ y 1
m=
n ∑ x 2I −¿ ¿
b= ý−m x́=(−72.1)
g) Verifique los supuestos para realizar en ANOVA y determine las hipótesis
h) ¿Es significativo del modelo?
i) Realice la regresión con fórmulas en archivo Excel y con la herramienta “regresión de análisis
de datos” de Excel.
Resumen
Estadísticas de la regresión
Coeficiente de
correlación múltiple 0.737980261
Coeficiente de
determinación R^2 0.544614865
Observaciones 26
ANÁLISIS DE VARIANZA
Grados Valor
de Suma de Promedio de crítico
libertad cuadrados los cuadrados F de F
1.686E-
Regresión 1 122596.409 122596.409 28.702643 05
Total 25 225106.6154
2.2 La siguiente tabla presenta los resultados obtenidos en una investigación de suelos. Se
deseaba conocer el efecto residual de fósforo en suelos donde previamente se cultivó maíz.
Para esto se midió la concentración de fósforo inorgánico (X1) y orgánico (X2) en varios
suelos calcáreos. Se midió el contenido de fósforo del maíz sembrado en esos suelos y se
estimó el fósforo aprovechable por la planta (ppm) en suelos a una temperatura de 20 °C
(Y). Datos adaptados de Martínez (1997)
Muestr
a X1 X2 Y
1 0.4 53 64
2 0.4 23 60
3 3.1 19 71
4 0.6 34 61
5 4.7 24 54
6 1.7 65 77
7 9.4 44 81
8 10.1 31 93
9 11.6 29 93
10 12.6 58 51
11 10.9 37 76
12 23.1 46 96
13 23.1 50 77
14 21.6 44 93
15 23.1 56 95
16 1.9 36 54
17 26.8 58 168
18 29.9 51 99
a) ¿Cuál es la variable dependiente (y) respuesta y cuál es (son) la (s) variable (s)
independiente (s)(x) o predictora (s) en este caso?
En este caso hay dos variables independientes (x) sería el X1 (Concentración de Fosforo
inorgánico) y X2 (Concentración de Fosforo orgánico) ya que son variables donde su valor es
conocido por lo cual contribuye a explicar o predecir el valor de la variable dependiente (y) en
este caso Y (Fosforo Aprovechable por la planta).
160
140
120
100
80
60
40
20
0
0 5 10 15 20 25 30 35
c) Identifique el modelo
d) Estime los parámetros del modelo e interprételos
e) Redacte las hipótesis que interesa contrastar en el análisis de varianza
f) Especifique matemáticamente el modelo y especifique cada término
g) Verifique los supuestos para realizar en ANAVA y determine las hipótesis
h) ¿Es significativo el modelo?
i) Realice la regresión con fórmulas en archivo Excel y con la herramienta “regresión de análisis
de datos”
Regresión Variable X1
Resumen
Estadísticas de la regresión
Coeficiente de correlación
múltiple 0.68464908
Coeficiente de
determinación R^2 0.46874437
R^2 ajustado 0.43332733
Error típico 20.6787016
Observaciones 17
ANÁLISIS
DE
VARIANZA
Promedio
Grados de Suma de de los Valor
libertad cuadrados cuadrados F crítico de F
5659.3989
Regresión 1 5659.39893 3 13.2349949 0.00242889
427.60869
Residuos 15 6414.13048 9
Total 16 12073.5294
Resumen
Estadísticas de la regresión
Coeficiente de 0.3993725
correlación múltiple 2
Coeficiente de 0.1594984
determinación R^2 1
0.1034649
R^2 ajustado 7
26.010024
Error típico 5
Observaciones 17
ANÁLISIS
DE
VARIANZ
A
Promedio Valor
Grados de Suma de de los crítico de
libertad cuadrados cuadrados F F
1925.7087 1925.7087 0.112252
Regresión 1 8 8 2.84648623 7
10147.820 676.52137
Residuos 15 6 5
12073.529
Total 16 4
Longitud Longitud
Estatur
del radio del fémur
a (Y)
(X1) (X2)
149.00 21.00 42.50
152.00 21.79 43.70
155.70 22.40 44.75
159.00 23.00 45.00
163.30 23.70 47.00
166.00 24.30 47.90
169.00 24.92 48.95
172.00 25.50 49.90
174.50 25.80 50.30
176.10 26.01 50.90
176.50 26.15 50.85
179.00 26.30 51.10
x12
CONCLUSIONES
REFERENCIAS BIBLIOGRAFICAS
https://www.cienciadedatos.net/documentos/25_regresion_lineal_multiple b
Blogs Mejores Opiniones Chile .,(23-11-2018)¿Cómo interpretar y para qué sirve el coeficiente
de correlación?coeficiente de relación; https://www.rankia.cl/blog/mejores-opiniones-
chile/4090045-como-interpretar-para-que-sirve-coeficiente-correlacion#:~:text=El
%20coeficiente%20de%20correlaci%C3%B3n%20o,variables%20que%20est%C3%A9n
%20relacionadas%20linealmente.
(CORRELACIÓN Y REGRESIÓN LINEAL Autor: Clara Laguna 4.1 INTRODUCCIÓN, n.d.)
CORRELACIÓN Y REGRESIÓN LINEAL Autor: Clara Laguna 4.1 INTRODUCCIÓN. (n.d.).
Orellana, L. (2008). Regresión Lineal Simple. (Carmen Carollo Limeres Página, 2011). Carmen
Carollo Limeres Página, M. (2011). Regresión lineal simple REGRESIÓN LINEAL SIMPLE.