Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Medidas de Relación (CORRELACIÓN Y REGRESIÓN)

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 88

UNIVERSIDAD DE CARABOBO

FACULTAD DE CIENCIAS DE LA EDUCACIÓN


DEPARTAMENTO DE EVALUACIÓN Y MEDICIÓN
CÁTEDRA: ANÁLISIS DE DATOS EDUCATIVOS

Medidas de Relación

Profesora: Migzu Méndez


• Distribución Unidimensional: Estudio de
una distribución correspondiente a un
mismo grupo de registro.

• Distribución Bidimensional: Estudio de dos


distribuciones correspondiente a un mismo
grupo; es decir pareja de datos

• Distribución Multidimensional: Estudio de


más variables.
Introducción
Habitualmente en las investigaciones se procede a realizar un
análisis estadístico unidimensional describiendo el
comportamiento de una serie de datos, inclusive a variables que
provienen de una misma población.

´ ´
Medidas de Relación

Son medidas que surgen de la necesidad de estudiar


dos distribuciones correspondientes a un mismo grupo
de registro, es decir, parejas de datos. En esta unidad se
estudiará la correlación y la regresión entre variables.
Correlación

Es la técnica estadística que estudia la relación o


dependencia que existe entre dos variables, por los
tanto expresa si lo que ocurre en una variable
ocurre o no en la otra, y esto se expresa a través de un
coeficiente de correlación.
Coeficiente de Correlación

Es una expresión numérica que expresa el grado de


relación existente entre por los menos dos variables,
dicho coeficiente expresa el sentido, tipo y magnitud.
Coeficiente Grado de Relación
0 Nula
± 0.01 - ± 0.20 Muy baja
± 0.21 - ± 0.40 Baja
Imperfecta
± 0.41 - ± 0.60 Moderada
± 0.61 - ± 0.80 Alta
± 0.81 - ± 0.99 Muy alta
± 1.00 Perfecta
Criterios para la interpretación
de un Coeficiente de Correlación
Primer criterio: En cuanto al valor y el grado:

Valor de la Correlación Grado de Relación


0 Nula
± 0,01 - ± 0,20 Muy Baja o Despreciable
± 0,21 - ± 0,40 Baja o Leve
± 0,41 - ± 0,60 Media o Sustancial
± 0,61 - ± 0,80 Alta o Importante
± 0,81 - ± 0,99 Muy Alta
±1 Perfecta
Fuente: Apuntes Estadística con Aplicaciones de Procesadores Pinto y Pernalete (2007)
Segundo criterio: En cuanto a la dirección de la relación

Directa: Si es de signo positivo (perfecta o imperfecta). La


variación se produce en el mismo sentido en ambas variables.

Inversa: Si es de signo negativo (perfecta o imperfecta). La


variación se produce en sentido inverso entre las variables.

En
resumen DIRECCIÓN Y SENTIDO
Directa Inversa
(positiva) (negativa)

Perfecta Posiciones coinciden Posiciones coinciden


GRADO O perfectamente inversamente
FORTALEZA No existe correspondencia exacta de lugares o
Imperfecta
posiciones
La selección de cada uno de ellos dependerá:

• Escala de medidas.

• Naturaleza de las variables.

• Relación lineal o no de la distribución


bidimensional.
Cuando se estudia una variable hay que
tomar en cuenta el comportamiento de la
variable de acuerdo con su definición.

Estudio y proyección de la variable


dependerá de:

• Tipo de Variable
• Escala de medida
Consideran a los datos clasificados en
categorías que han recibido algún tipo
de nomenclatura
Describen un orden
de los casos o valores
q se esta trabajando
Solo se pueden NO se permiten
asumir números valores intermedios
enteros entre uno y otro
numero

Numero de hijos Numero de libros

Numero de casos
Describen comportamientos

Consideran en su rango un
numero infinito y no
contable de elementos.

peso a edad
t u r e s
r a io n
p e a c estatura
c
te m lifi
ca
Se deriva de las La división se realiza a partir
continuas y de las del estadístico de la muestra
discretas
Coeficiente de Correlación según el tipo de
Variable
Variables o Escalas Coeficientes
Dos Cuantitativas (Intervalo o Coeficiente de correlación de
Razón) Pearson
Cuantitativas y Ordinal o dos Coeficiente de correlación de
Ordinales Sperman
Cuantitativa y Cualitativa con Coeficiente de correlación Biserial
Dicotómica Autentica puntual
Dos Nominales de Dicotómica Coeficiente fi o Phi
Autentica
Dos variables numéricas cuando se controla o se Coeficiente de correlación Parcial
elimina la influencia de una tercera

Una variable dependiente y dos variables Coeficiente de correlación Múltiple


independientes formadas de forma conjunta
Cuadro de los Coeficientes de Correlación
para Distribuciones Bidimensionales

Variable 1 Variable 2 Coeficiente


Continua Continua Pearson
Continua Dicotomizada Biserial
Continua Dicótoma Biserial puntual
Ordinal Ordinal Spearman
Ordinal Ordinal Kendall
Dicótoma Dicótoma Phi
Fuente: Trabajo de ascenso. Martínez (1997)
Formulas
Pearson Nxy  (x )(y )
xy 
 Nx 2
 ( x ) 2  Ny 2
 ( y ) 2 
Spearman 6d 2
s  1 
n(n 2  1)
Biserial puntual Xp X q
bp  * p*q
st
Phi
b a p ( a * d )  (b * c )
 
d c p * q * p´ * q
q
Parcialp´ q´
12  (13 * 23 )
12.3 
(1  13
2
)(1  23
2
)
Múltiple
12
2
 13
2
 (12 * 13 * 23 )
1.23 
1  23
2
Diagrama de Dispersión

Es la representación gráfica de la correlación.


1. Pulse el botón gráficos de la
barra de menú.
Perfecta Positiva 2. Del menú emergente
seleccione Dispersión .
3. Seleccione a continuación
simple
4. Inserte las variables objeto
de estudio en las casillas
ejes de categorías.
Imperfecta Positiva 5. Coloque el título y la fuente
Nula 6. Pulse continuar y luego
aceptar.
Una vez que aparezca el gráfico
usted lo puede modificar
haciendo clic sobre el, luego
clic icono derecho de
mouse, seleccionar objeto
Imperfecta Negativa gráfico de SPSS, abrir. Allí
Perfecta Negativa podrá modificar el gráfico
empleando las barra de
menú y herramientas.
Sentido de la Correlación
Positiva o directa: indica que los
cambios que ocurren en una variable
se dan en el mismo sentido en
+ + la otra.
- -
Negativa o inversa: indica que los
cambios que ocurren en una variable
se dan en sentido contrario en la otra.
+ -
- +
Nula: indica que no existe relación
entre las variables, es decir, las
variable son independientes.
Al estudiar simultáneamente, los valores de dos variables estadísticas para una
misma población, el conjunto deNecesid
los pares de valores correspondientes a cada
ad Bidimensional.
individuo se denomina Distribución

Analiza
r

Comportamient
o
Tipo de Variable
Dos Escala de
series de Medida de los
Tendencia
datos datos
Tendenc Interacción
ia entre ambas
Central
Dos series de
datos
Escala de
Tipo de
Medida
Variable
Tendencia de 1. Nominal
1. Continuas Números reales los datos

2. Discretas Números enteros 2. Ordinal


1. Lineal
3. Ordinales Orden entre los casos o valores 3. De Razón

4. Nominales Categorías con nomenclaturas 4. De Intervalo


2. No lineal
5. Tipo Datos continuos o discretos
dicotomizadas dicotomizados a partir de
un estadístico
Las combinaciones entre dos o más variables provenientes de un
mismo grupo de sujetos o elementos originan una MEDIDA DE
RELACIÓN O CORRELACIÓN.
Comportamiento

de los Verifican si existe


Valores
relación o asociación
entre grupos o series de
en relación
datos que se presentan
Variación de forma conjunta e
respect inseparable, expresando
o de esta manera si lo que
Tendencia Central
ocurre en una serie de
de las
datos ocurre o no en la
Variables otra
Medidas estadísticas aplicadas a
distribuciones bidimensionales (2 variables)  correlación simple
o
distribuciones multidimensionales (3 o más variables) 
correlación compuesta

Clasificación
Correlación Lineal Simple
Bidimensional
Regresión Lineal Simple
Medidas de
Relación
Correlación Lineal Múltiple
Multidimensional
Regresión Lineal Múltiple
Análisis de una Correlación
Técnica estadística que estudia el grado de dependencia
que puede existir entre dos o más variables.

Análisis de una Correlación


Simple
a) Análisis Visual: Primera impresión del tipo de relación.

Se construye el gráfico conocido como GRÁFICO DE


DISPERSIÓN O DIAGRAMA DE DISPERSIÓN. Los valores
de ambas series indicarán una coordenada representando a
cada sujeto o elemento.

El conjunto de puntos recibe el nombre de NUBE DE


PUNTOS.
PATRONES GENÉRICOS
1. La no asociación: Los puntos se
reparten por todos los cuadrantes o
todos se presentan sobre un mismo
valor del eje Y (constante)

No se aprecia una
tendencia clara
2. La asociación lineal: Los puntos se sitúan sobre una línea
recta, presentando un patrón de dependencia positiva – directa o
negativa – inversa.

Positiva - directa Negativa - inversa


Positiva - directa

Negativa - inversa
3. La asociación no lineal: Los puntos
se organizan bajo una forma curvilínea.
Puede ser monótona (creciente o decreciente)
o seguir una función cuadrática.

RECTA DE MEJOR AJUSTE


Línea recta que puede trazarse lo más centrada posible sobre los
puntos en un diagrama de dispersión y deja aproximadamente el
mismo número de desvíos respecto a la tendencia central por
encima y por debajo de la recta.

Ecuación:
b
 XY a  X  bY
Y  a  b( X ) Y 2
b) Análisis Cuantitativo: Cuantifica el grado de encaje de
la relación a un modelo y complementa la información junto
con el análisis visual.
Coeficiente de Variables
En ambos coeficientes
Correlación cuantitativas
cuando mayor es su valor
más similares son las
Coeficiente Variables no variables.
de Asociación cuantitativas

Coeficiente de
1. Existencia o
Correlación
no de la relación 2. Sentido
3. Grado o fortaleza

A nivel poblacional Coeficiente de A nivel muestral

Parámetro  Rho “ρ” Correlación Estadístico  “r”


Coeficientes de Correlación con SPSS
Pearson: es el coeficiente que se utiliza Procedimiento:
cuando las variables que se interrelacionan son 1. Pulse el botón analizar de la barra de
continuas, han sido medidas en escalas de menú.
intervalos o razón. Se caracteriza por ser lineal 2. Del menú emergente correlaciones
y paramétrica, por lo tanto solo puede ser 3. Seleccione a continuación Bivariadas
utilizado cuando exista una pareja de variables 4. Luego inserte las variables objeto de
correspondiente a una misma muestra ya que lo estudio.
que se hace es comparar la covarianza existente 5. Selecciones el coeficiente deseado
entra ellas. Para su utilización se deben 6. Pulse aceptar.
considerar que se cumplen los siguientes 7. Interprete los resultados obtenidos.
supuestos: cada par de datos es independiente
de los demás, la relación entre las variables es
rectilínea y las variables son continuas.
Fórmula de los Desvíos
( x )( y )
xy  Donde X= (X-X) y Y= (y- y)
x 2 * y 2
El procesador muestra en un cuadro en primer
Fórmula de las puntuaciones Originales lugar el resultado de la correlación (Correlación
Nxy  (x )(y ) de Pearson), luego la probabilidad de
xy  significación para pruebas de hipótesis (Sig.
 
N  x 2  ( x ) 2 N y 2  (  y ) 2  Bilateral) y finalmente el tamaño de la muestra o
de la población (N).
Medidas de Relación para Distribuciones
Bidimensionales
1. Coeficiente de Correlación Producto de los
Momentos de Pearson o Correlación de Pearson (rxy)
Se emplea en una pareja de variables al estudiar la covarianza
existente entre ellas respecto a la tendencia central de la relación.
Las variables deben ser de escala de razón o de intervalos.

Supuestos para su aplicación


1. Continuidad
2. Linealidad
3. Homocedasticidad
4. Normalidad
5. Tamaño
Propiedades del Coeficiente de
Correlación de Pearson
1. Su valor oscilará entre -1 a 1 (incluidos ambos).
-1 ≤ r ≤ 1

2. Su valor no cambiará aún transformando los valores de


una variable en otra escala.

3. Su valor no es afectado por la elección de “X” o de


“Y”.

4. El coeficiente solo mide la fuerza de una relación


lineal.
Fórmulas para calcular el Coeficiente de
Correlación de Pearson

rxy 
 zx  zy a) Considerando los puntajes típicos
n

rxy 
 xy b) Considerando las desviaciones de las
puntuaciones de cada serie con respecto a
nSxSy la media

rxy 
  X  X Y  Y  c) Considerando las

 X Y 2 2 desviaciones cuadráticas
d) Fórmula de las Puntuaciones Originales
N
EJEMPLO DE LA APLICACIÓN

DE 
xy  x y 
LA CORRELACIÓN 
DE PEARSON

ÍndiceN  x Rango
   x   N  y 
rxy
  y
2 2 2 2

en
Sujetos Académico puntualidad X2 Y2 XY
1 62 38 3844 1444 2356
2 51 45 2601 2025 2295
3 51 50 2601 2500 2550
4 50 21 2500 441 1050
5 50 22 2500 484 1100
6 50 29 2500 841 1450
7 62 10 3844 100 620
8 65 7 4225 49 455
9 68 15 4624 225 1020
10 70 12 4900 144 840
 Sumatoria 579 249 34139 8253 13736
n(XY )  (X )(Y )
rxy 
 n ( X 2

)  ( X ) 2 n ( Y 2 )  ( Y ) 2 
10(13.736)  (579)(249)
rxy 
10(34.139)  (579) 10(8.253)  (249) 
2 2

rxy  - 0,61

La correlación - 0,61 es imperfecta negativa


y de grado alto
3. Coeficiente de Correlación Ordinal de Spearman (rs)
Para variables medidas mediante una escala ordinal. Es no paramétrico y
se deriva del coeficiente de correlación de Pearson.
6 d 2
d: Diferencia de los rangos entre las variables
rs  1 
n( n 2  1) n: Números de los pares de medida
Sujetos Índice Rango en
Académico puntualidad X Y d d2
1 62 38 4,5 3 1,5 2,25
2 51 45 6,5 2 4,5 20,25
3 51 50 6,5 1 5,5 30,25
4 50 21 9 6 3 9
5 50 22 9 5 4 16
6 50 29 9 4 5 25
7 62 10 4,5 9 -4,5 20,25
8 65 7 3 10 -7 49
9 68 15 2 7 -5 25
10 70 12 1 8 -7 49
Sumatoria  246
6 d 2 6( 246)
rs  1   1  - 0,52
n( n  1)
2
10(10  1)
2

Resultado de la correlación de Spearman con el


procesador Statgraphics
Correlaciones por Rangos de Spearman
índice acad rango punt
---------------------------------------------------------
índice acad -0,5186
La correlación - 0,52
(10)
0,1197
es imperfecta
rango punt -0,5186 negativa y de grado
(10) medio
0,1197
---------------------------------------------------------
Correlación
(Tamaño muestral)
P-Valor
Coeficientes de Correlación con SPSS

Spearman
1. Pulse el botón analizar de la barra de
menú.
2. Del menú emergente correlaciones
3. Seleccione a continuación Bivariadas
4. Luego inserte las variables objeto de
estudio.
5. Selecciones el coeficiente deseado
6. Pulse aceptar. El procesador muestra en un cuadro en primer
7. Interprete los resultados obtenidos. lugar el resultado de la correlación (Correlación
de Pearson), luego la probabilidad de
significación para pruebas de hipótesis (Sig.
Bilateral) y finalmente el tamaño de la muestra o
de la población (N).
4. Coeficiente de Correlación Biserial Puntual (rbp)
Determinar el grado de relación entre una variable continua (escala de
intervalo o razones) y otra variable de naturaleza dicótoma o
dicotómica (se divide en solo dos categorías o modalidades).
_ _
X p X q
rbp  * p*q
s
Donde:
X p: Media de la variable continua de los que se encuentran en el criterio.
X q: Media de la variable continua de los que no se encuentran en el criterio.
s: Desviación típica de la variable continua.
p: Proporción de unidades estadísticas que se encuentra en el criterio.
q: Proporción de unidades estadísticas que no se encuentra en el criterio.
Coeficientes de Correlación
Biserial Puntual
Se utiliza para determinar la relación de una variable
cuantitativa continua y una de naturaleza cualitativa
dicotómica.
Xp X q
bp  * p*q
st

Donde:
Xp: Corresponde a la media de la variable continua de los que se
encuentran en el criterio.
Xq: Corresponde a la media de la variable continua de los que no
se encuentran en el criterio.
St: desviación típica de la variable continua.
p: proporción de unidades estadísticas que se encuentran en el
criterio.
q: proporción de unidades estadísticas que no se encuentran en el
criterio.
p= fp q= fq
n n
Coeficientes de Correlación con SPSS
Biserial Puntual
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación Explorar
4. Luego inserte las variables objeto de estudio (en dependientes la
variable numérica y en factores la variable cualitativa dicotómica).
5. Selecciones estadísticos
6. Pulse aceptar.
Con este procedimiento obtiene las medias de p y q
Para obtener St (desviación típica de la variable numérica):
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación Descriptivos
4. Luego inserte la variable numérica
5. Pulse opciones
6. Seleccione la opción desviación típica
7. Pulse continuar y luego aceptar.
Para obtener p y q
1. Pulse el botón analizar de la barra de menú. Xp Xq
bp  * p*q
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación frecuencias

st
4. Luego inserte la variable cualitativa dicotómica
5. Pulse aceptar.
6. Sustituya los valores obtenidos en la formula del coeficiente.
Coeficientes de Correlación con SPSS
Phi Se aplica cuando las dos variables son de
naturaleza dicotómica y Se presentan en tablas de 2x
2. Este caso se presenta cuando dos variables son
de tipo nominal dicotómica es decir ambas variables
son de tipo nominal con solo dos categorías que
representan presencia y ausencia, de una
determinada característica
.
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación tablas de contingencias
4. Luego inserte las variables objeto de estudio.
5. Pulse casillas y seleccione frecuencias observadas y
porcentaje total
6. Pulse continuar y luego aceptar.
7. Sustituya los valores obtenidos en la formula del
coeficiente.

a b p
( a * d )  (b * c )
c d  
q p * q * p´ * q
p´ q´
Coeficientes de Correlación con SPSS
Phi
El procesador no muestra directamente el resultado,
se debe hacer una parte con ayuda del computador y
otra parte manual.
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación tablas de contingencias
4. Luego inserte las variables objeto de estudio.
5. Pulse casillas y seleccione frecuencias observadas y
porcentaje total
6. Pulse continuar y luego aceptar.
7. Sustituya los valores obtenidos en la formula del
coeficiente.

a b p ( a * d )  (b * c )
 
c d p * q * p´ * q
q
p´ q´
Medidas de Relación para Distribuciones
Multidimensionales
1. Coeficiente de Correlación Parcial (r12.3)
Determina el verdadero grado de relación entre dos variables
cuando se controla o elimina la influencia de una tercera.
r12  ( r13 * r23 )
r12.3 
(1  r13
2
)(1  r23
2
)

EJEMPLO DE LA APLICACIÓN DE LA CORRELACIÓN PARCIAL

Se desea conocer la correlación existente entre las variables


denominadas resolución de problemas y trabajo de
investigación controlando la variable primer lapso.
BASE DE DATOS

Sujetos Primer Resolución de Trabajo de


Lapso Problemas Investigación
1 10 11 18
2 16 15 18
3 16 17 14
4 18 14 19
5 13 15 16
6 11 13 15
7 10 12 18
8 15 16 15
9 19 19 19
10 15 18 15
Correlaciones
resolución trabajo primer
------------------------------------------------------------
resolución -0,2506 0,7802 Correlación igual – 0,25
(10) (10) (Correlación imperfecta
negativa de grado bajo)
trabajo -0,2506 0,1821
(10) (10)

primer 0,7802 0,1821


(10) (10)
Correlaciones Parciales
------------------------------------------------------------
Correlación igual – 0,64
resolución trabajo primer
controlando una tercera
---------------------------------------------------------------------
variable resolución -0,6385 0,8626
(Correlación imperfecta ( 10) (10)
negativa de grado alto) trabajo -0,6385 0,6237

( 10) (10)
primer 0,8626 0,6237
(10) (10)
Coeficientes de Correlación con SPSS

Parcial
1. Pulse el botón analizar
de la barra de menú.
2. Del menú emergente
correlaciones
3. Seleccione a
continuación parcial
4. Luego inserte las
variables objeto de
estudio.
5. Pulse aceptar.
6. Interprete los resultados
obtenidos comparando
con el resultado del
coeficiente de
correlación de Pearson.
2. Coeficiente de Correlación Múltiple (R1.23)
(Regresión Lineal Múltiple)
Determina la relación existente entre una variable y por lo menos
dos variables independientes tomadas de manera conjunta.

R1.23  R 2 1.23

Es la raíz cuadrada del coeficiente de determinación múltiple que


explica cuanto de la varianza de la variable dependiente es
explicada en forma conjunta por las varianza de las variables
independientes.

r 2
12 r 2
  r12 * r13 * r 23
13
R 2
1.23 
1  r 2 23
EJEMPLO DE LA APLICACIÓN DE LA CORRELACIÓN MÚLTIPLE
Se desea conocer el índice académico probable de un sujeto que ha
obtenido en las variables denominadas resolución de problemas 12
puntos y en trabajo de investigación 14 puntos.
BASE DE DATOS
Sujetos Primer Trabajo de
Lapso Investigación
1 10 18
2 16 18
3 16 14
4 18 19
5 13 16
6 11 15
7 10 18
8 15 15
9 19 19
10 15 15
Análisis de Regresión Lineal Múltiple con el
procesador Statgraphics
Análisis de Regresión Múltiple
-----------------------------------------------------------------------------------------
--
Variable Dependiente: Índice Académico
-----------------------------------------------------------------------------------------
--
Error Estadístico
Parámetro Estimación estándar T P-Valor
-----------------------------------------------------------------------------------------
--
CONSTANTE 51.2283 29.1226 1.75905 0.1220
Primer 0.0639169 0.989472 0.0645969 0.9503
Trabajo 0.344773 1.67603 0.205709 0.8429

R – cuadrado = 0.752687 porcentaje


Error estándar de est. = 9.33711

Ecuación del modelo ajustado


Índice Académico = 51.2283 + 0.0639169*Primer + 0.344773*Trabajo
Ecuación del modelo ajustado
Índice Académico = 51.2283 + 0.0639169*Primer + 0.344773*Trabajo

Índice Académico = 51.2283 + 0.0639169*(12) + 0.344773*(14)

Índice Académico = 56.1190389 puntos

Índice Académico = 56.12 puntos

Empleando el error de estimación múltiple

Xˆ  X   1.23
Xˆ  56.12  9.34
Xˆ 1  65.46
Xˆ 2  46.78
Coeficientes de Correlación con SPSS

Múltiple
1. Pulse el botón analizar de la
barra de menú.
2. Del menú emergente
correlaciones
3. Seleccione a continuación
Bivariadas
4. Luego inserte las variables objeto
de estudio.
5. Pulse aceptar.
6. Sustituya los valores obtenidos
en la fórmula del coeficiente
7. Interprete.

12
2
 13
2
 (12 * 13 * 23 )
1.23 
1  23
2
Regresión
Técnica estadística que busca predecir la variable dependiente en función de la
variable independiente.

Y  a  bX
Donde:
Y: la variable dependiente (la que voy a predecir)
X: la variable independiente (la variable conocida, me dan el dato)
a:=ordenada de origen y b: pendiente de la recta
a y b: son coeficientes que se derivan de los desvíos respecto a la media,
utilizando las siguientes ecuaciones:

( X  X )(Y  Y )
b a  Y  b(X )
( X  X ) 2
Los resultados obtenidos se sustituyen en la ecuación de la recta, se toman
valores arbitrarios de la (X) y se obtienen los pares ordenados (X,Y) que
representaran la recta de mejor ajuste.
2. Regresión y Predicción
(Regresión lineal simple)

Técnica estadística que pronostica o anticipa una variable


(dependiente) en función de la otra (independiente),
partiendo de la ecuación de la recta debido a la tendencia
lineal de los datos.

El valor pronosticado Yˆi solo coincidirá con el valor observado


de Yi si la relación es perfecta, de lo contrario se aproximará a la
media aritmética de dicha variable y no a sus valores, lo que se
conoce como REGRESIÓN
Ecuaciones

Xˆ  axy  bxy * Y Yˆ  axy  bxy * X


Estimación de X en función de Y Estimación de Y en función de X

Donde:
X: Variable independiente o predictora.
Y: Variable dependiente.
a: Ordenada en el origen o valor de la dependiente cuando la variable
independiente es igual a cero.
b: Coeficiente de regresión o pendiente de la recta.
Coeficiente de Determinación (Cd o R2)
Determina el poder de predicción del modelo de regresión e indica la
proporción de la varianza en la variable dependiente explicada por la
variable independiente.

R 2

  
Yˆi  Y
2

R2 = r2
 Yi  Y 
2

Error de estimación
Error cometido al predecir una variable en función de otra
tomando en cuenta la correlación existente entre ellas.

est  s 1  r 2
s: Desviación típica de la variable dependiente
Regresión
Rectas de regresión
Representaciones gráficas del coeficiente de correlación de
Pearson de una variable “X” sobre una variable “Y” y viceversa.
Se trazan dos rectas empleando la ecuación de la recta
considerando el coeficiente de correlación y las desviaciones
típicas de ambas variables. Informan gráficamente sobre:
1. Orientación en relación a los cuadrantes.

2. Signo y sentido de la relación.

3. Fortaleza de la correlación.

Si las rectas coinciden Relación Perfecta

Si las no rectas coinciden Relación Imperfecta

Ángulo entre las rectas Intensidad


sx
X  X  r * (Y  Y )
sy
Y Y r*
sy
sx
X  X 
Regresión
( X  X )(Y  Y )
Y  a  bX b
( X  X ) 2
a  Y  b(X )

Matematica  0,09  2,39( fisica)


Donde:
Y: la variable dependiente (la que voy a predecir)
X: la variable independiente (la variable conocida, me dan el dato)
a:=ordenada de origen y b: pendiente de la recta
a y b: son coeficientes que se derivan de los desvíos respecto a la media,
utilizando las siguientes ecuaciones:

Cada vez que física aumenta 1 punto matemática aumenta 2,39 puntos.
( X  X )(Y  Y ) a  Y  b(X )
b
Ejemplo ( X  X ) 2

A continuación se presentan dos series de calificaciones de un grupo de


estudiantes, en cuanto a los resultados obtenidos de la aplicación del primer
y segundo parcial de un examen de Modulo de Análisis de Datos
Educativos, se desea saber cuanto obtendrá un estudiante en el segundo
parcial si obtuvo 14 puntos en el primero: 64.8
X Y X-X Y-Y (x-x)(y-y) (X-X)² b  0.64
101.2
02 08 -8.6 -4.4 37.84 73.96
a  12.4  0.64(10.6)  5.62
11 10 0.40 -2.4 -0.96 0.16
12 12 1.4 -0.4 -0.56 1.96 Y  a  bX
13 14 2.4 1.6 3.84 5.76
Y  5.62  0.64(14)  14.58
15 18 4.4 5.6 24.64 19.36
Σ 53 Σ 62 Σ 0 Σ 0 Σ 64.8 Σ 101.2 14.58 puntos es la calificación
probable en el segundo
10.6 12.4 parcial de un estudiante que
haya obtenido 14 puntos en el
primero.
Regresión con SPSS
Resolución en la
Computadora:

1.Pulse el botón analizar de la


barra de menú.
2.Del menú emergente regresión
3.Seleccione a continuación
lineal
4.Luego inserte las variables
objeto de estudio y seleccione el
método introducir.
5.Pulse aceptar.
6.Sustituya los valores obtenidos
en la fórmula del coeficiente
7.Interprete

Y  5.61  0.64(14)  14.57


Determine cuál será la puntuación probable en el primer lapso de un alumno
que haya obtenido 15 puntos en trabajo de investigación y cual seria su error
de estimación. ( X  X )(Y  Y ) 13,2
b   0,36
N X Y X-X Y-Y (x-x)(y-y) (X-X)² (y-Y)² ( X  X ) 2 36,4
a  Y  b( X )  14,3  0,36(16,6)  8,32
Y  a  bX  8,32  0,36(15)  13,72
1 18 10 1,4 -4,3 -6,02 1,96 18,49
13,72 puntos es la calificación
2 18 16 1,4 1,7 2,38 1,96 2,89 probable en el primer lapso de un
estudiante que haya obtenido 15
3 14 16 -2,6 1,7 -4,42 6,76 2,89 puntos en trabajo de investigación y
su error de estimación seria de 3,11
4 19 18 2,4 3,7 8,88 5,76 13,69 puntos .

5 16 13 -0,6 -1,3 0,78 0,36 1,69


El error estándar de estimación es el error que cometeríamos
al predecir una variable en función de otra, tomando en
cuenta la correlación existente entre ambas. Mide la
6 14 11 -2,6 -3,3 8,58 6,76 10,89
dispersión de los valores observados alrededor de la recta de
regresión. Una de las fórmulas usadas para calcularlo es:

7 18 10 1,4 -4,3 -6,02 1,96 18,49  est  s y 1  (rxy ) 2


8 15 15 -1,6 0,7 -1,12 2,56 0,49
( y  y ) 2 92,1
Sy    3,20
9 19 19 2,4 4,7 11,28 5,76 22,09 n 1 9

10 ( x  x)( y  y ) 13,2
15 15 -1,6 0,7 -1,12 2,56 0,49 xy    0,23
( x  x ) 2 *  ( y  y ) 2 36,4 * 92,1
Σ 166 143 0 0 13,2 36,4 92,1
Promedio 16,6 14,3
 est  3,20 1  (0,23) 2  3,11
Determine cuál será la puntuación probable en el primer lapso de un alumno
que haya obtenido 15 puntos en trabajo de investigación y cual seria su error
de estimación.
N X Y X-X Y-Y (x-x)(y-y) (X-X)² (y-Y)² Yc (y-yc)²

a+b(x) Otra Fórmula usada para


calcular el error estándar
1 de la estimación es:
18 10 1,4 -4,3 -6,02 1,96 18,49 14,8 23,04
2 ( y  yc) 2 87,31
18 16 1,4 1,7 2,38 1,96 2,89 14,8 1,44  est    3,30
n2 8
3 14 16 -2,6 1,7 -4,42 6,76 2,89 13,36 6,97
13,72 puntos es la calificación
4 19 18 2,4 3,7 8,88 5,76 13,69 15,16 8,07 probable en el primer lapso de
un estudiante que haya
5 16 13 -0,6 -1,3 0,78 0,36 1,69 14,08 1,17 obtenido 15 puntos en trabajo
de investigación y su error de
6 14 11 -2,6 -3,3 8,58 6,76 10,89 13,36 5,57 estimación seria de 3,30
puntos .
7 18 10 1,4 -4,3 -6,02 1,96 18,49 14,8 23,04
8 15 15 -1,6 0,7 -1,12 2,56 0,49 13,72 1,64
9 19 19 2,4 4,7 11,28 5,76 22,09 15,16 14,75
10 15 15 -1,6 0,7 -1,12 2,56 0,49 13,72 1,64
Σ
166 143 0 0 13,2 36,4 92,1 142,96 87,31
Promedio 16,6 14,3
El grado de relación entre
las variables resulta de la
dispersión de los valores
con respecto a su
tendencia central.

La recta de mejor ajuste es aquella


que deja aproximadamente igual
numero de desvíos respecto a la
tendencia central por encima y por
debajo de ella.
La recta de mejor ajuste se obtiene a
partir de la ecuación de la recta: Y=
a+b(x).

En donde a y b se
obtienen a partir de:

b= ∑(XY)
∑(Y2) a= X – b Y
Bibliografía
 Apuntes de Estadística con aplicación de procesadores. Pinto
y Pernalete (2007)

 Estadística Aplicada a la Educación. Pérez (1998)

 Estadística Aplicada a la Investigación Educativa. Chourio


(2011)

 Estadística Descriptiva en Ciencias del comportamiento.


Solanas y otros (2005)

 Manual de estudio de Estadística Aplicada a la Educación.


Parte I. Martínez y Macías (2003)
Ejercicios Propuestos
a.- Elabore el diagrama de Dispersión y señale gráficamente el tipo de correlación: X: Primer lapso Y:
Resolución de Problemas
b.- Para la nube de punto construida en el literal anterior identifique el sexo.

c.- Determine si es cierto que a mayor puntuación en primer lapso existe un alta tendencia a obtener
mayores puntuaciones en resolución de problemas.

d.- Determine si es cierto que a mayor edad se obtiene mayor índice de admisión.
e.- Determine cual será la puntuación probable en primer lapso de un estudiante que haya obtenido 15
puntos en trabajo de investigacion.

f.- será cierto que los estudiantes con menor edad obtienen los primeros lugares en responsabilidad o rango
de puntualidad.
g.- Determine el verdadero grado de relación entre resolución de problemas y el trabajo de investigación
cuando se controla la calificación del primer lapso.
h.- Determine si es cierto que responder correctamente el ítem 5 indica una alta tendencia a obtener
mejores calificaciones en primer lapso.

i.- Sera cierto que las hembras tienden a responder correctamente el items 5.
j.- Cual será el grado de relación existente entre el tipo de plantel y el sexo.
k.- Cuánto del primer lapso es explicado por la resolución de problemas y el trabajo de investigación en
forma conjunta.

l.- Determine si la edad mantiene alguna relación con el índice académico de admisión.
a.- Elabore los diagramas de Dispersión y señale gráficamente el
tipo de correlación: X: Primer lapso Y: Resolución de Problemas

Procedimiento en el Procesador Grafico N° 1. Diagrama de Dispersión o Nube de Puntos para las variables
Primer lapso y Resolución de Problemas.
1.Pulse el botón gráficos de la barra de
menú.
2.Del menú emergente seleccione
Cuadro de Diálogos Antiguos
3.Luego seleccione Dispersión
4.Seleccione a continuación simple
5.Inserte las variables objeto de estudio
en las casillas ejes de categorías X y Y
6.Coloque el título y la fuente
7.Pulse continuar y luego aceptar.
Una vez que aparezca el gráfico usted
lo puede modificar haciendo clic sobre
el, luego clic icono derecho de mouse,
seleccionar objeto gráfico de SPSS,
abrir. Allí podrá modificar el gráfico
empleando las barra de menú y
herramientas.
Interpretación: como se puede apreciar en la grafico N° 1, la
Nota: Se debe pasar tal cual a la hoja relación entre las variables primer lapso y resolución de problemas
de examen y realizar la es imperfecta positiva, los que indica que los estudiantes que
interpretación: obtuvieron mayores calificaciones en primer lapso obtuvieron altas
calificaciones en resolución de problemas y viceversa, los
estudiantes que obtuvieron menores calificaciones en primer lapso
obtuvieron bajas calificaciones en resolución de problemas y
viceversa.
b.- Para la nube de punto construida en el literal anterior
identifique el sexo.

Procedimiento en el Procesador Grafico N° 2. Diagrama de Dispersión o Nube de Puntos para las variables
Primer lapso y Resolución de Problemas identificando el sexo.
1.Pulse el botón gráficos de la barra de
menú.
2.Del menú emergente seleccione
Cuadro de Diálogos Antiguos
3.Luego seleccione Dispersión
4.Seleccione a continuación simple
5.Inserte las variables objeto de estudio
en las casillas ejes de categorías X y Y.
6.En la casilla establecer marca por
se selecciona el sexo.
7.Coloque el título y la fuente
8.Pulse continuar y luego aceptar.
Una vez que aparezca el gráfico usted
lo puede modificar haciendo clic sobre
el, luego clic icono derecho de mouse,
seleccionar objeto gráfico de SPSS,
abrir. Allí podrá modificar el gráfico
empleando las barra de menú y Interpretación: como se puede apreciar en la grafico N° 2, la
herramientas. relación entre las variables primer lapso y resolución de problemas
es imperfecta positiva, los que indica que los estudiantes que
Nota: Se debe pasar tal cual a la hoja obtuvieron mayores calificaciones en primer lapso obtuvieron altas
de examen y realizar la calificaciones en resolución de problemas y viceversa, los
interpretación: estudiantes que obtuvieron menores calificaciones en primer lapso
obtuvieron bajas calificaciones en resolución de problemas y
viceversa.
c.- Determine si es cierto que a mayor puntuación en
primer lapso existe un alta tendencia a obtener mayores
puntuaciones en resolución de problemas.
Dado que las dos variables son cuantitativas continuas, en escala de intervalo y suponiendo que se cumplen los
supuestos, se procede aplicar la correlación de Pearson.

Procedimiento en el Procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente correlaciones
3. Seleccione a continuación Bivariadas
4. Luego inserte las variables objeto de estudio.
5. Selecciones el coeficiente deseado Pearson
6. Pulse aceptar.
7. Interprete los resultados obtenidos.

El procesador muestra en un cuadro en primer lugar el resultado de la correlación (Correlación de Pearson), luego la
probabilidad de significación para pruebas de hipótesis (Sig. Bilateral) y finalmente el tamaño de la muestra o de la
población (N). Nxy  (x )(y )
xy   0,79
 N x 2
 ( x ) 2  Ny 2
 ( y ) 2 
Interpretación: Dado que el coeficiente de Correlación de Pearson para las variables primer lapso y
resolución de problemas dio 0,79 la relación es imperfecta positiva de grado alto, lo que indica que
existe una alta tendencia a que los estudiantes que obtuvieron mayores calificaciones en primer lapso
obtuvieron mayores calificaciones en resolución de problemas y viceversa, los estudiantes que
obtuvieron menores calificaciones en primer lapso obtuvieron menores calificaciones en resolución de
problemas y viceversa, por lo tanto el planteamiento es cierto.
d.- Determine si es cierto que a mayor edad se
obtiene mayor índice de admisión.
Dado que las dos variables son cuantitativas continuas, en escala de razón e intervalo y suponiendo que se
cumplen los supuestos, se procede aplicar la correlación de Pearson.

Procedimiento en el Procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente correlaciones
3. Seleccione a continuación Bivariadas
4. Luego inserte las variables objeto de estudio.
5. Selecciones el coeficiente deseado Pearson
6. Pulse aceptar.
7. Interprete los resultados obtenidos.

El procesador muestra en un cuadro en primer lugar el resultado de la correlación (Correlación de Pearson), luego la
probabilidad de significación para pruebas de hipótesis (Sig. Bilateral) y finalmente el tamaño de la muestra o de la
población (N).
Nxy  (x )(y )
xy   0,10
 N x 2
 ( x ) 2
 Ny 2
 ( y ) 2

Interpretación: Dado que el coeficiente de Correlación de Pearson para las variables edad e índice de
admisión dio -0,10 la relación es imperfecta negativa de grado muy bajo, lo que indica que existe una
muy baja tendencia a que los estudiantes que tienen mayor edad son los que tienen menor índice de
admisión y viceversa, los estudiantes que tienen menor edad son los que tienen mayor índice de
admisión y viceversa, por lo tanto el planteamiento es falso.
e.- Determine cual será la puntuación probable en primer
lapso de un estudiante que haya obtenido 15 puntos en
trabajo de investigación y cual seria su error de estimación.
.
Procedimiento en la Computadora
1. Pulse el botón analizar de la barra de
menú.
2. Del menú emergente regresión
3. Seleccione a continuación lineal
4. Luego inserte las variables objeto de
estudio y seleccione el método
introducir.
5. Pulse aceptar.
6. Sustituya los valores obtenidos en la a
fórmula del coeficiente b

7. Interprete

Y= primer lapso
X= Trabajo de Investigación

Y  a  bX  7,024  0,425(15)  13,40  est  s y 1  (rxy ) 2  2,99


Interpretación: 13,40 puntos es la calificación probable de un estudiante en primer lapso si obtuvo 15
puntos en trabajo de investigación y el error de estimación es de 2,99 puntos. Empleando el error de
estimación tenemos que 13,40 ±2,99 =
Y1=16,39 puntos y Y2=10,41 puntos, de allí que la calificación en primer lapso de un estudiante que
haya obtenido 15 puntos en trabajo de investigación no será menor de 10, 41 puntos ni mayor de 16, 39
puntos.
f.- será cierto que los estudiantes con menor edad obtienen los
primeros lugares en responsabilidad o rango de puntualidad.
Dado que una de las variables es ordinal (rango de puntualidad) el coeficiente a utilizar es el de Spearman

Procedimiento en el Procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente correlaciones
3. Seleccione a continuación Bivariadas
4. Luego inserte las variables objeto de estudio.
5. Selecciones el coeficiente deseado Spearman
6. Pulse aceptar.
7. Interprete los resultados obtenidos.
El procesador muestra en un cuadro en primer lugar el resultado de la correlación (Correlación de Pearson), luego la
probabilidad de significación para pruebas de hipótesis (Sig. Bilateral) y finalmente el tamaño de la muestra o de la
población (N).
6d 2
s  1   0,41
n( n  1)
2

Interpretación: Dado que el coeficiente de Correlación de Spearman para las variables edad rango de
puntualidad dio 0,41 la relación es imperfecta positiva de grado moderado, lo que indica que existe una
moderada tendencia a que los estudiantes que tienen mayor edad son los que tuvieron los mayores
lugares en responsabilidad y viceversa, los estudiantes que tienen menor edad son los que tienen
menores lugares (llagaron de primero) y viceversa, por lo tanto el planteamiento es cierto.
g.- Determine el verdadero grado de relación entre resolución
de problemas y el trabajo de investigación cuando se controla
la calificación del primer lapso.
Dado que el ejercicio presenta 3 variables y aparece la palabra clave controla, el coeficiente a utilizar es el
de correlación parcial .
Procedimiento en el Procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente correlaciones
3. Seleccione a continuación parcial
4. Luego inserte las variables objeto de estudio.
5. Pulse aceptar.
6. Interprete los resultados obtenidos comparando con el
resultado del coeficiente de correlación de Pearson.

12  (13 * 23 )


12.3   0,00
(1   )(1  
2
13
2
23 )

Interpretación: al controlar la calificación del primer la relación entre las variables resolución de
problemas y trabajo de investigación es nula, es decir las variables son independientes, por la tanto, se
puede decir que la calificación del primer lapso ejerce influencia sobre la relación de resolución de
problemas y trabajo de investigación, ya que según Pearson la relación era positiva imperfecta de grado
bajo.
h.- Determine si es cierto que responder correctamente el ítem 5 indica
una alta tendencia a obtener mejores calificaciones en primer lapso.
Dado que el ejercicio presenta 1 variable cualitativa dicotómica (ítems 5 ) y una variable cuantitativa continua
(calificación del primer lapso el coeficiente a utilizar es de Biserial puntual.

Procedimiento en el procesador
El procesador no muestra directamente el resultado, se debe hacer una parte con
ayuda del computador y otra parte manual.
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación Explorar
4. Luego inserte las variables objeto de estudio (en dependientes la variable numérica
y en factores la variable cualitativa dicotómica).
5. Selecciones estadísticos
6. Pulse aceptar.
Con este procedimiento obtiene las medias de p y q
Para obtener St (desviación típica de la variable numérica):
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación Descriptivos
4. Luego inserte la variable numérica
5. Pulse opciones
6. Seleccione la opción desviación típica
7. Pulse continuar y luego aceptar.
Para obtener p y q
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación frecuencias
4. Luego inserte la variable cualitativa dicotómica
5. Pulse aceptar. 13,48  14,04
6. Sustituya los valores obtenidos en la formula del coeficiente.   0,54 * 0,46  0,18 * 0,4984  0,09
*
bp
3 ,06
Interpretación: Dado que el coeficiente de Correlación Biserial Puntual para las variables respuesta dada al items 5 y calificación en
primer lapso dio -0,09 la relación es imperfecta negativa de grado muy bajo, lo que indica que existe una muy baja tendencia a que los
estudiantes que respondieron correctamente con los que obtuvieron menores calificaciones en el primer lapso y viceversa, los
estudiantes que respondieron incorrectamente son los que tienen mejores calificaciones en el primer lapso y viceversa, por lo tanto el
planteamiento es falso.
h.- Determine si es cierto que responder correctamente el ítem 5 indica
una alta tendencia a obtener mejores calificaciones en primer lapso.
Dado que el ejercicio presenta 1 variable cualitativa dicotómica (ítems 5 ) y una variable cuantitativa continua
(calificación del primer lapso el coeficiente a utilizar es de Biserial puntual.
Procedimiento 2 en el procesador
1.- cree una variable llamada X, que sea cuantitativa que va
asumir los valores 0 cuando conteste incorrectamente el
ítems 5 y 1 cuando constaste correctamente el ítems x
2.- Calcule la correlación de Pearson para las variables
calificación de primer lapso y X
3.- Sustituya en la formula e Interprete

Xp Xq
bp  * p * q  0,09
st
Interpretación: Dado que el coeficiente de Correlación
Biserial Puntual para las variables respuesta dada al ítems 5 y
calificación en primer lapso dio -0,09 la relación es imperfecta
negativa de grado muy bajo, lo que indica que existe una muy
baja tendencia a que los estudiantes que respondieron
correctamente con los que obtuvieron menores calificaciones
en el primer lapso y viceversa, los estudiantes que
respondieron incorrectamente son los que tienen mejores
calificaciones en el primer lapso y viceversa, por lo tanto el
planteamiento es falso.
i.- Sera cierto que las hembras tienden a responder correctamente el ítems 5.
Dado que el ejercicio presenta 2 variables cualitativas dicotómicas el coeficiente a utilizar el Phi.

Procedimiento en el procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos A B
3. Seleccione a continuación tablas de contingencias C D
4. Luego inserte las variables objeto de estudio.
5. Pulse casillas y seleccione frecuencias observadas y
porcentaje total
6. En Estadísticos seleccione Phi
7. Pulse continuar y luego aceptar.
8. Sustituya los valores obtenidos en la formula del
coeficiente.

( a * d )  (b * c )
 
p * q * p´ * q Interpretación: Dado que el coeficiente
a b de Correlación Phi o Medida de
p Asociación Phi para las variables sexo y
(15 *10)  (12 *13)
c d   6 / 618,49  0,01 respuesta dada al ítems 5 dio -0,01 la
q 28 * 22 * 27 * 23 relación es imperfecta negativa de grado
muy bajo, lo que indica que existe una
p´ q´ muy baja tendencia a que las hembras
tiendan a contestar correctamente el items
5 por lo tanto el planteamiento es cierto
de que las.
j.- Cual será el grado de relación existente entre el tipo de plantel y el sexo.
. Dado que el ejercicio presenta 2 variables cualitativas dicotómicas el coeficiente a utilizar el Phi.

Procedimiento en el procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente Estadísticos descriptivos
3. Seleccione a continuación tablas de contingencias
4. Luego inserte las variables objeto de estudio.
5. Pulse casillas y seleccione frecuencias observadas y
porcentaje total
6. En Estadísticos seleccione Phi
7. Pulse continuar y luego aceptar.
8. Sustituya los valores obtenidos en la formula del
coeficiente.

a b p ( a * d )  (b * c )
  0,02
c d p*q* p *q ´
q
p´ q´
Interpretación: Dado que el coeficiente de Correlación Phi o Medida de Asociación Phi para las
variables sexo y tipo de plantel dio -0,02 la relación es imperfecta negativa de grado muy bajo, de allí
que el grado de relación existente entre las variables es muy bajo.
k.- Cuánto del primer lapso es explicado por la resolución de problemas y el
trabajo de investigación en forma conjunta.
De acuerdo al tipo de pregunta debe interpretarse el coeficiente de determinación de la correlación múltiple, el
método mas fácil de resolver el planteamiento es el siguiente:

Resolución en la Computadora:
1.Pulse el botón analizar de la barra de menú.
2.Del menú emergente regresión
3.Seleccione a continuación regresión lineal
4.Luego inserte las variables objeto de estudio
(en dependiente coloque primer lapso y en
independientes seleccione resolución de
problemas y trabajo de investigación)
5. y seleccione el método introducir Pulse
aceptar.
6.Sustituya los valores obtenidos en la fórmula
del coeficiente
7.Interprete

Interpretación: la calificación de primer lapso es explicado por la resolución de problemas y trabajo


de investigación en un 63,5%
l.- Determine si la edad mantiene alguna relación con el índice académico de
admisión.
Dado que las dos variables son cuantitativas continuas, en escala de razón e intervalo y suponiendo que se
cumplen los supuestos, se procede aplicar la correlación de Pearson.

Procedimiento en el Procesador
1. Pulse el botón analizar de la barra de menú.
2. Del menú emergente correlaciones
3. Seleccione a continuación Bivariadas
4. Luego inserte las variables objeto de estudio.
5. Selecciones el coeficiente deseado Pearson
6. Pulse aceptar.
7. Interprete los resultados obtenidos.

Nxy  (x )(y )


xy   0,10
 N x 2
 ( x ) 2
 Ny 2
 ( y ) 2

Interpretación: Dado que el coeficiente de Correlación de Pearson para las variables edad e índice de
admisión dio -0,10 la relación es imperfecta negativa de grado muy bajo, lo que indica que existe una
muy baja tendencia a que los estudiantes que tienen mayor edad son los que tienen menor índice de
admisión y viceversa, los estudiantes que tienen menor edad son los que tienen mayor índice de
admisión y viceversa, por lo tanto si existe relación entre las variables.

También podría gustarte