Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Temas Completosss

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 167

TEMA 1: CONCEPTOS GENERALES

1. CONCEPTOS PREVIOS

 Población. Es el conjunto de objetos realmente existentes y posibles que


poseen un conjunto de características observables comunes y sobre los que
versa un determinado estudio o investigación.
 Muestra. Cualquier subconjunto de la población.
 Parámetro. Toda función definida sobre los valores numéricos de
una población.
 Estadístico. Toda función definida sobre los valores numéricos de una
muestra.
 Característica. Propiedad o cualidad de un individuo.
 Modalidad. Cada una de las maneras como se presenta una característica. Por
ejemplo, la característica “Sexo” tiene dos modalidades: hombre o mujer. La
característica “Religión” tiene varias modalidades: cristianismo, budismo,
islamismo, etc.
 Medida. Atribución de números a objetos según ciertas reglas. Estas reglas se
resumen en la siguiente: aceptaremos como válidas entre los números, solo
aquellas relaciones que sean verificables empíricamente entre las modalidades
de los objetos a los que se atribuyen.

2. DEFINICIÓN DE ESTADÍSTICA

Ciencia que recoge, ordena y analiza los datos de una muestra, extraída de
determinada población para, mediante el cálculo de probabilidades, realizar
inferencias acerca de la población.

- Estadística descriptiva. Recoge, ordena y analiza los datos de una muestra.


Describe la muestra.
- Estadística inferencial. Generaliza los datos de la muestra a toda la población
de la que ha sido extraída. Inferencia sobre la población.

Ambas son complementarias, no excluyentes.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862362

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. ESCALAS DE MEDIDA

Una escala de medida es un conjunto de modalidades distintas y de números distintos


que se relacionan biunívocamente. Tenemos distintos tipos de escalas de medida. Al
medir, o sea, al atribuir números a los objetos, solo se aceptan como válidas entre los

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
números aquellas relaciones que son verificables entre las correspondientes
modalidades. Según qué relaciones sean verificables, tendremos distintos tipos de
escalas de medida. Según La Teoría de las Escalas de Medida de Stevens, son cuatro los
posibles niveles de medida:

 Nominal. Relaciones de igualdad o desigualdad. Por ejemplo, color de ojos.


 Ordinal. Relaciones de igualdad y de orden. Por ejemplo, escalas Likert,
preferencias, clase social, etc.
 Intervalo. Relación de igualdad de la diferencia de intervalos. No hay 0 real. Por
ejemplo, coeficiente de inteligencia, temperatura, etc.
 Razón. El 0 existe. Por ejemplo, peso, altura, nº de palabras recordadas.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862362

Con el Plan Turbo, además de eliminar los vídeos también recibes descargas sin publicidad mensuales
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4. DEFINICIÓN DE VARIABLE

Una variable es una característica o fenómeno, de los sujetos o de los objetos, que
puede tomar diferentes valores y que podemos medir. Las distintas categorías que la
variable asume o puede asumir son los “niveles de la variable” o “valores de la
variable”. Una variable debe poseer al menos dos valores.

5. LAS VARIABLES EN LA INVESTIGACIÓN PSICOLÓGICA

Las variables pueden ser clasificadas de diferentes formas en función del criterio que
se asuma. Nos ocuparemos de dos tipos de clasificaciones diferentes:

- Desde el punto de vista estadístico


- Desde el punto de vista metodológico

5.1. Clasificación estadística

Encontramos dentro de esta clasificación las variables cualitativas que son aquellas
que no se pueden contar, corresponden con las nominales (son cualidades). Por
ejemplo, el sexo, el color de ojos. Las variables Cuasicuantitativas se corresponden
con las ordinales. Por ejemplo, las preferencias, clase social, etc. Una variable
cuantitativa discreta es una variable que podemos contar pero no medir, es decir,
entre una unidad y otra no hay valores intermedios, no hay continuidad. Por ejemplo,
el número de hijos. Una variable cuantitativa continua es aquella que puede admitir
todo tipo de subdivisiones, es decir, entre un valor entero y otro de la variable existe
una cantidad infinita de valores posibles, sólo limitados por el instrumento de
medición usado. Por ejemplo, el peso, la estatura. Una variable dicotómica es aquella
que, por naturaleza, sólo puede tomar dos valores posibles. Por ejemplo, verdadero y
falso. Una variable dicotomizada es aquella variable, con más de dos valores, a la que

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862362

Con el Plan Turbo, además de eliminar los vídeos también recibes descargas sin publicidad mensuales
“forzamos” a tener solamente dos. Por ejemplo, clasificar la altura en bajos (menos de
1,70) y altos (más de 1,70). La clasificación estadística nos queda así:

- Variables Cualitativas (nominales).


- Variables Cuasicuantitativas (ordinal)
- Variables Cuantitativas
o Discretas (entre dos valores no hay número intermedio. Por ejemplo, nº
de hijos)
o Continuas (entre dos valores sí hay número intermedio. Por ejemplo,
peso).

5.2. Clasificación metodológica

Una variable independiente es aquella que es manipulada en el intento de detectar si


cambios en ella provocan cambios en la variable que es medida. La variable
dependiente es aquella que medimos. Las variables extrañas o contaminadoras son
aquellas que pueden distorsionar los resultados de la investigación, bien potenciando
una relación que no es real entre la variable independiente y la dependiente; o bien
enmascarando la relación que hay realmente entre ellas. Son variables que no
podemos controlar y que pueden ser confundidas con las variables explicativas.
Controladas vs. Enmascaradas. Una misma variables puede ser considerada a veces en
una investigación como VI y otras como VD dependiendo de su papel en el diseño de la
investigación.

EJERCICIO:

Clasificación estadística y escala de medida de cada una:

Sexo:

Nº de enfermedades:

Género:

Grupo sanguíneo:

Nº hijos por unidad familiar:

Provincia de nacimiento:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862362

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Nº de hijos que tiene una persona:

Calificación (aprobado, suspenso, notable…):

Rendimiento académico (0-10):

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Coeficiente intelectual:

Ingresos mensuales:

Tiempo de reacción:

Escalas tipo Likert:

Soluciones:

1. Cualitativa y nominal.
2. Cuantitativa discreta, razón.

3. Cualitativa y nominal.

4. Cuantitativa discreta, razón.

5. Cualitativa y nominal.
6. Cuantitativa discreta, razón.

7. Cuasicuantitativa y ordinal.

8. Cuantitativa continua, razón.


9. Cuantitativa, intervalo.

10. Cuantitativa continua, razón.


11. Cuasicuantitativa y ordinal.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862362

Con el Plan Turbo, además de eliminar los vídeos también recibes descargas sin publicidad mensuales
TEMA 2: DESCRIPCIÓN DE UNA VARIABLE

1. ORGANIZACIÓN DE DATOS. DISTRIBUCIONES DE FRECUENCIAS

Una clase es un conjunto o agrupación de modalidades con alguna característica en


común. Deben cumplir 3 requisitos:

 Estar bien definidas. Debemos saber qué modalidades pertenecen a cada clase.
 Ser mutuamente excluyentes. Cada modalidad debe pertenecer únicamente a
una clase.
 Ser exhaustivas. Toda modalidad debe pertenecer a una de las clases.

En el momento previo al análisis, los datos suelen encontrarse dispuestos en una


matriz. Tenemos por ejemplo 400 puntuaciones de 400 personas en un test. Es una
cantidad inmanejable para hacer un análisis, así que tenemos que organizarlos en
tablas de frecuencias.

1.1. Distribuciones de frecuencias

En primer lugar, tras organizar las modalidades que tengamos, realizaremos la


columna de la frecuencia absoluta (ni), que es el número de observaciones que hay en
cada clase. Por ejemplo:

El sumatorio de ni nos debe dar el número total de elementos


que componen la muestra.

∑ni = n

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862361

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La Frecuencia absoluta acumulada (Ni). Una vez ordenadas las clases de menor a
mayor, la Ni de una clase es igual a su frecuencia absoluta, más las frecuencias
absolutas de las clases anteriores.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La siguiente frecuencia a calcular es la frecuencia relativa o proporción (fi), que es el
cociente entre la frecuencia absoluta de una clase y el tamaño de la muestra.

ni
fi =
n

∑fi = 1

La frecuencia relativa acumulada (Fi) de una clase


es igual a su frecuencia relativa, más las frecuencias
relativas de las clases anteriores.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862361

Con el Plan Turbo, además de eliminar los vídeos también recibes descargas sin publicidad mensuales
También podemos calcular el Porcentaje (%) que es la proporción o frecuencia relativa
de una clase, multiplicada por 100. ∑Pi = 100. El Porcentaje acumulado (%ac) es igual a
su porcentaje, más los porcentajes de las clases anteriores.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejercicio

Tiempo de reacción de 20 sujetos frente a un estímulo visual:

- 6 sujetos han tardado 530 milisegundos en reaccionar.


- 10 sujetos han tardado 540 milisegundos en reaccionar.
- 3 sujetos han tardado 550 milisegundos en reaccionar.
- 1 sujeto ha tardado 560 milisegundos en reaccionar

¿Cómo se pueden tabular estos datos?

Xi ni Ni fi Fi % %ac
530 6 6 0’3 0’3 30 30
540 10 16 0’5 0’8 50 80
550 3 19 0’15 0’95 15 95
560 1 20 0’05 1 5 100

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3862361

Con el Plan Turbo, además de eliminar los vídeos también recibes descargas sin publicidad mensuales
TEMA 3: ESTADÍSTICOS UNIVARIADOS

1. MEDIDAS REPRESENTATIVAS DE UN CONJUNTO DE DATOS ESTADÍSTICOS

Estas son las diferentes


medidas que vamos a
ver a lo largo de este
punto.

1.1. Medidas de tendencia central

La moda es el valor más frecuente y su símbolo es Mo. Si se trata de datos no


agrupados es el valor que más veces se repite. Si es una variable cuantitativa discreta,
es el valor de la variable al que corresponde la frecuencia más alta. Si es una variable
cuantitativa continua, es el intervalo al que corresponde la máxima frecuencia,
hablaríamos en este caso de intervalo modal. Una distribución de frecuencias puede
contar con una o varias modas. Sus propiedades son:

 Es muy fácil de calcular.


 Puede no ser única.
 Es función de los intervalos elegidos a través de su amplitud, número y límites
de los mismos.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La media aritmética ( ) es el punto en el que se concentra el peso de los datos, el
centro de gravedad de un grupo de datos.

Respecto a la fórmula para datos agrupados, (ni


por Xi) quiere decir que tenemos que multiplicar

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
cada valor de Xi por su ni y luego sumarlos todos y
cada uno de ellos, para terminar dividiéndolos
por la n. Por ejemplo:
∑ ni ∙ Xi
Xi ni ni ∙ Xi Entonces, ahora si =
n
1 2 2
2 1 2
3 4 12 = 38/12 = 3,17

4 3 12
5 2 10

Las propiedades de la media son:

 La suma de las diferencias de todas las puntuaciones respecto de la media es 0.


∑( X - )=0
 Si a los valores de una variable se les suma una constante, la media de las
nuevas puntuaciones será igual a la media original más la nueva constante.
Yi = Xi + K = +K
 Si a los valores de una variable se les multiplica por una constante, la media de
los nuevos valores es igual al producto de la media original por el factor.
Yi = Xi * K = *K

A pesar de las buenas propiedades que ofrece la media, también tiene sus
inconvenientes:

 Es muy sensible a los valores extremos de la variable. Ya que todas las


observaciones intervienen en el cálculo de la media, la aparición de una
observación extrema, hará que la media se desplace en esa dirección. En
consecuencia:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


o No es recomendable usar la media como medida central en las
distribuciones muy asimétricas.
o Depende de la división en intervalos en el caso de variables continuas.
o Si consideramos una variable discreta, por ejemplo, el número de hijos

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
en las familias de Almería, el valor de la media puede no pertenecer al
conjunto de valores de la variable.

1.2. Medidas de tendencia central y posición

La mediana (Md) es el valor que ocupa la posición central una vez ordenados los datos,
de menos a mayor. Es el “centro geográfico” de la distribución de frecuencias.

Xi ni Ni Para calcular hay que seguir unos determinados pasos.


1 2 2
1. Nuestro primer objetivo en esta fórmula es realizar el n/2. En
2 1 3
este caso N= 12, por lo que 12/2= 6. N/2 = 6
3 4 7 2. Buscamos en la columna de Ni dónde podemos encontrar el 6, y
4 3 10 es en el tercer intervalo (subrayado). Quedarnos con esta fila es
5 2 12 muy importante, porque de aquí saldrá todo.
3. Sigamos con Lei, para calcularlo nos iremos a la columna de Xi y buscamos en la
misma fila donde hemos subrayado antes. Tenemos que el número
correspondiente es 3. Para calcular L ei tendremos que restarle siempre 0’5.
Entonces Lei = 3 – 0’5= 2’5. Lei = 2’5
4. Ahora calculemos Ni-1. Es sencillo, tenemos que ir a donde hemos ubicado
anteriormente el número subrayado en la columna de Ni, y escogemos el
período anterior, en este caso, es 3. Ni-1 = 3
5. Nos queda saber de dónde sale el número del denominador, el ni. Pues, en la
columna de ni nos tenemos que fijar en la fila del número subrayado
anteriormente, en este caso es el número 4. ni = 4

Ahora sustituimos todos estos datos obtenidos en la formula y calculamos.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


12
−3
2
Md= 2’5 + [ ] = 2’5 + 0’75 = 3’25
4

Las propiedades de la mediana son las siguientes:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
 La mediana no se ve afectada por puntuaciones extremas.
 El valor de la mediana es función de los intervalos elegidos.
 Cuando una distribución de datos es muy asimétrica, es preferible la mediana
como índice de tendencia central, antes que la media.
 La mediana es un índice de posición, además de un índice de tendencia central.

A modo de resumen debemos saber que según las variables que nos encontremos
podremos calcular ciertos índices de tendencia:

 Variables cualitativas: moda.


 Variables cuasicuantitativas: moda y mediana.
 Variables cuantitativas: moda, mediana y media.

Ejercicio

Xi ni Ni X i * ni ¿Cuál es la Moda, media y mediana?


1 22 22 22
2 26 48 52
3 13 61 39
4 24 85 96
5 15 100 75

Solución:

La moda es el valor más frecuente, y en este caso es 2.

La media la calculamos a través del sumatorio de Xi * ni, que en este caso es: 284. A
continuación, se divide por N que es 100. 284/100= 2’84.
∑ ni ∙ Xi 284
= = = 2’84
n 100
Calculamos ahora la mediana, paso por paso, como antes.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


1. n/2= es en este caso 50.
2. Nuestro n/2 se encuentra en el tercer intervalo de la columna Ni.
3. Para calcular Lei tenemos que fijarnos en la tercera fila, pero en la columna de
Xi. En este caso el número es 3. Procedemos a restar 3 – 0’5= 2’5. Por lo que
Lei = 2’5.
4. Vamos con Ni-1. Nos fijamos en la columna de Ni donde se encontraba nuestra
n/2, y cogemos el intervalo anterior, es decir, el segundo intervalo. Por lo que,
Ni-1 = 48.
5. Nos falta ni. Nos fijamos en la tercera fila pero en la columna de ni y el número
es 13.

Como ya tenemos todos los datos necesarios para realizar la fórmula, la hacemos:

100
−48
2
Md= 2’5 + [ ] = 2’5 + 0’15 = 2’65
13

1.3. Estadísticos de posición

Los cuantiles son puntos en una escala numérica, por encima y por debajo del cuál,
existe un conjunto de observaciones o datos cuya proporción conocemos. Hay
diferentes tipos de cuantiles:

 Cuartiles. Cuantiles que dividen la escala numérica en cuatro partes: Q 1, Q2, Q3.
 Deciles. Cuantiles que dividen la escala numérica en diez partes. D1, D2, D3, D4,
D5, D6, D 7, D8, D9.
 Percentiles. Cuantiles que dividen la escala numérica en cien partes. P1, P2, P3,
P4, P5,….. P97, P98, P99.

Esta imagen nos lo representa bien:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Aquí podemos observar que
la mediana se corresponde
con el Q2, con el D5 y con el
P50.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Md = Q2 = D5 = P50

Además, también nos será útil


saber que:

Q1 = P25

Q3 = P75 Q2 = P50

La forma de interpretar los percentiles es sencilla, si por ejemplo hablamos de que tu


puntuación en un examen se encuentra en el percentil 75, decimos que el 75% de
gente tiene puntuaciones iguales o inferiores a esa, por lo que también querrá decir
que el 25% restante de personas tienen puntuaciones superiores a la tuya. La fórmula
para calcular cualquier percentil es la siguiente:

Podemos ver que es casi idéntica a la fórmula de


la mediana, por lo que la calculamos siguiendo los
mismos pasos que anteriormente. Solo hay una
diferencia, que en lugar de tener que calcular primero n/2, aquí tenemos que calcular
k*n/100; pero los pasos son los mismos.

El rango percentil (RPx) es el porcentaje de casos en una distribución que alcanza


valores iguales o menores que un valor dado X. Cuando nos pidan un rango percentil
tendremos que aplicar la siguiente fórmula:

Aquí puede parecer que nos han


quitado el chollo de hacer una
cuentecita y buscar a partir de ahí,
pero para nada, nos lo han facilitado
incluso. Ahora el primer paso que tenemos que dar es fijarnos en la X, esa X va a
corresponder al número que nos pidan. Es decir, si te piden el Rango Percentil de 7, lo
único que tienes que hacer es buscar el 7 en la columna de Xi y en base a eso

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


seguiremos los pasos de siempre. Por supuesto, en la fórmula, sustituiremos la X por el
número que nos den, en este caso el 7.

Ejercicio:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Xi ni Ni
1 22 22
Calcula P80, RP4, y Q3
2 26 48
3 13 61
4 24 85
5 15 100

Solución:

Primero para calcular el P80 tenemos que encontrar los datos que se nos piden en la
fórmula, empezando por k*n/100. En este caso k = 80, n = 100. Por lo que nos queda:

𝑘∗𝑛 80∗100
= = 80
100 100

Seguimos con Lei, en este caso vemos que 80 se encuentra en el cuarto intervalo de Ni.
Por lo que para encontrar el número con el que haremos Lei tenemos que fijarnos en la
cuarta fila, en la columna de Xi, en este caso es 4.

Lei = 4 – 0’5 = 3’05

Ni-1 es 61, y nuestro ni para esta fórmula es 24.

80−61
P80 = 3’5 + [ ] = 3’5 + 0’79 = 4’29
24

Calculemos ahora RP4:

Lo primero que tenemos que hacer es buscar el 4 (X), en la columna de Xi. Es la cuarta
fila. Así que empecemos a encontrar los datos para la fórmula. Lei en este caso sería 4 –
0’5 = 3’05. Continuamos con ni, en este caso se corresponde con el número 24. Por
último, Ni-1 es 61.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


[(4−3′5) ∗24 ]+61
RP4 = * 100 = 73
100

Terminamos con Q3. Si recordamos Q3 equivalía a P75. Por lo que tenemos que aplicar
la fórmula de los percentiles otra vez. En este caso k*n/100 = 75. L ei en este caso es 4 –

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
0’5 = 3’5. Ni-1 = 61 y, por último, ni = 24.

75−61
P75 = 3’5 + [ ] = 3’5 + 0’58 = 4’08
24

Q3 = P75 = 4’08

1.4. Medidas de variabilidad o dispersión

La información que nos proporcionará la medida de dispersión es,


tomando como referencia un valor de tendencia central (mediana o
media aritmética), cómo de alejados o concentrados alrededor de ese
valor de tendencia central están los datos. Por ejemplo, si yo tengo un
valor de tendencia central, como puede ser la media aritmética, de 5 y
una dispersión muy pequeña, querrá decir que la mayoría de los
valores oscilan entre por ejemplo 4 y 7. Sin embargo, si tengo un valor de dispersión
muy grande, los valores están repartidos a lo largo de todo el continuo de valores de la
variable.

La desviación media (Dm) es la media de las diferencias, en valor absoluto, de los


valores de una variable respecto a su media aritmética.

∑ [Xi - ] Datos ∑ [ ni * |Xi - | ]


Datos Dm(X) = Dm(X) =
originales n agrupados
n

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


La varianza (Sx2) es la media de las diferencias cuadráticas de n puntuaciones con
respecto a su media aritmética. La desviación típica (Sx) es la raíz cuadrada de la
varianza.
∑ [Xi - ]2
Datos
originales
Sx2 =
n
Sx = √ ∑ [X -n i ]2

Datos ∑ ni * [Xi - ]2 ∑ ni * [Xi - ]2


agrupados
2
Sx =
n Sx = √ n

El Índice M.A.D (MAD) es la mediana de las diferencias, en valor absoluto, de un


conjunto de puntuaciones respecto a su mediana. Se llama mediana de las
desviaciones absolutas.

M.A.D. = Md de |Xi – Md|


¿Cómo se calcula M.A.D?

1. Debemos calcular la Mediana (Md) de la tabla de frecuencias que estemos


trabajando.
2. Una vez tengamos la mediana hacemos una columna en nuestra tabla de
frecuencias para calcular Xi – Md
3. Los valores que nos hayan salido en la nueva columna que hemos creado para
restarle a cada valor de Xi la media tenemos que ordenarlos de MENOR a
MAYOR.
4. Haremos entonces la Mediana de esos valores.

Por ejemplo: Supongamos que hemos obtenido en nuestra columna de Xi – Md un


total de 5 valores, los ordenamos de menor a mayor:

|Xi – Md| = 0’35 – 0’65 – 1’35 – 1’65 – 2’35

Hacemos la mediana de forma manual.

|Xi – Md| = 0’35 – 0’65 – 1’35 – 1’65– 2’35

El valor que nos queda en el centro es M.A.D = 1’35.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
¿Qué pasaría si en lugar de 5 valores, tuviéramos 6, o cualquier otro número par?
Haríamos la mediana de forma manual, y tendríamos que hacer la media de los dos
valores que nos quedarían sin tachar. Por ejemplo:

|Xi – Md| = 0’35 – 0’65 – 1’35 – 1’55 – 1’65 – 2’35

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
= (1’35 + 1’55) /2 = 1’45

En este segundo ejemplo, M.A.D = 1’45

Los diferentes rangos que presentamos a continuación están basados en los índices de
posición y son útiles en aquellos casos en los que no se puede utilizar la media como
valor de tendencia central, es decir, cuando utilicemos la mediana como valor de
tendencia central. Calcularemos los rangos siempre que nos den una variable ordinal.

El rango establece la diferencia entre el valor más alto y el valor más pequeño. Es el
menos aconsejables de todas las medidas de variabilidad o dispersión.

Rango = Valor máximo – Valor mínimo

El rango intercuartil o intercuartílico es la diferencia entre el cuartil 3 y cuartil 1. O lo


que es lo mismo, la diferencia entre el percentil 75 y percentil 25.

R1Q = Q3 – Q1 R1Q = P75 – P25

El rango semi-intercuartil o semi-intercuartílico es la diferencia entre Q3 y Q1, entre


dos.

Amp = Q3 – Q1 Amp = P75 – P25


2 2

Pongamos un ejemplo a continuación para que quede claro como calcular algunos de
las medidas que hemos visto

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


Xi ni Ni A partir de aquí debemos saber que n= 100, = 2’84 y
1 22 22 Md= 2’65. Calcula la desviación típica (Sx) y la varianza
2 26 48 (Sx2)
3 13 61

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4 24 85
5 15 100

Lo primero que tenemos que hacer es crear las columnas en nuestra tabla que sean
necesarias para calcular la desviación típica y la varianza.

Xi ni Ni X- (X- )2 | ni *( X - )2 |
1 22 22 -1’84 3’3856 74’4832
2 26 48 -0’84 0’7056 18’3456
3 13 61 0’16 0’02556 0’33228
4 24 85 1’16 1’3456 32’2944
5 15 100 2’16 4’6656 69’984
10’128 195, 44

Ahora calculemos la varianza.

∑ ni * [Xi - ]2 195’44
2
Sx = = = 1’9544
n 100

Seguimos con la desviación típica:

∑ ni * [Xi - ]2
Sx= √ n = √ 195’44
100
= 1’398

Vemos que la desviación típica ha salido un valor muy alto puesto que nos movemos
en un intervalo del 1 al 5 (Xi), sin embargo, si nuestro intervalo fuera de 0 a 50, esta
desviación típica sería muy pequeña, pero en este caso no.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


1.5. Medidas de forma

El estudio de la forma vendrá dado por dos parámetros: simetría o asimetría, y


curtosis. Ambos permiten complementar la descripción de esa variable.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1.5.1. Índices de sesgo: simetría o asimetría

A la hora de comparar la forma, compararemos la curva que surge de representar


nuestros datos con una distribución normal, simétrica (la del medio). Cuando nuestra
curva es asimétrica positiva (la de la derecha) quiere decir que habrá muchos más
valores bajos que valores altos de la variable. Sin embargo, si nuestra curva es
asimétrica negativa (la de la izquierda), significa que habrá muchos más valores altos
que valores bajos de la variable.

Índice de sesgo basado en los tres cuartiles

Se calcula a partir del valor de los 3 cuartiles, como su propio nombre indica. Se utiliza
para datos cuantitativos y cuasicuantitativos. Si la variable es ordinal, intervalo o razón
podemos utilizar esta fórmula. Pero si la variable es ordinal SOLO podremos utilizar
esta fórmula, no podremos utilizar el coeficiente que veremos a continuación.
( Q3 – Q 2 ) – ( Q 2 – Q 1 ) ( P75 – P50 ) – ( P50 – P25 )
As = =
( Q3 – Q 2 ) + ( Q2 – Q 1 ) ( P75 – P50 ) + ( P50 – P25 )

Si As > 0 Distribución Asimétrica positiva


Si As = 0 Distribución Simétrica
Si As < 0 Distribución Asimétrica negativa

Coeficiente γ1 (gamma) de Fisher

Se utiliza para variables cuantitativas.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


Sx3 = Desviación
3
Datos [ ∑ ( Xi - ) ]/n típica al cubo
originales
γ1 =
Sx3

Datos [ ∑ [ ( Xi - )3 * ni] ] / n
γ1 =
Agrupados
Sx3

Si γ1 > 0 Distribución Asimétrica positiva

Si γ1 = 0 Distribución Simétrica

Si γ1 < 0 Distribución Asimétrica negativa

1.5.2. Índices de apuntamiento o curtosis

La distribución normal es mesocúrtica. Si nuestra curva sale platicúrtica (izquierda)


significaría que habrá un índice de dispersión muy alto porque los datos están
distribuidos con frecuencias parecidas a lo largo de los valores de toda la variable. Por
otro lado, si nuestra curva sale leptocúrtica (derecha) el índice de dispersión será muy
bajo puesto que los datos están concentrados alrededor de ese valor de tendencia
central escogido.
Sx4 = Desviación
Coeficiente γ2 (gamma) de Fisher típica a la cuarta

Se utiliza para informar sobre la curtosis o apuntamiento de una distribución de


frecuencias en el caso en el que la variable sea cuantitativa (intervalo o razón).

Datos [ ∑ ( Xi - )4 ] / n
originales γ2 = -3
Sx4

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
[ ∑ [ ( Xi - )4 * ni] ]/ n
Datos γ2 = -3
Agrupados Sx4

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Si γ2 > 0 Distribución leptocúrtica

Si γ2 = 0 Distribución mesocúrtica

Si γ2 < 0 Distribución platicúrtica

Coeficiente K de Kelley

Se utiliza para informar sobre la curtosis o apuntamiento de una distribución de


frecuencias en el caso en el que la variable sea al menos ordinal. Pero si la variable es
ordinal SOLO podremos utilizar esta fórmula.

( Q3 – Q1 ) / 2
( P75 – P25 ) / 2
K= - 0’263 = - 0’263
P90 – P10 P90 – P10

Si K > 0 Distribución leptocúrtica


Si K = 0 Distribución mesocúrtica
Si K < 0 Distribución platicúrtica
Ejercicio

Calcula los índices de simetría y curtosis adecuados.

Xi ni Ni ni * X i Sabiendo que = 2’84, Md= 2’65 y n=100


1 22 22 22
2 26 48 52
3 13 61 39
4 24 85 96
5 15 100 75

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


1º haremos los cálculos necesarios en nuestra tabla para calcular γ1 y γ2

Xi ni Ni ni * X i Xi - (Xi - )2 (Xi - )3 (Xi - )4


1 22 22 22 -1’84 3’3856 -6’2295 11’4623

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2 26 48 52 -0’84 0’7056 -0’5927 0’4979
3 13 61 39 0’16 0’0256 0’0041 0’0007
4 24 85 96 1’16 1’3456 1’5609 1’8106
5 15 100 75 2’16 4’6656 10’0777 21’7678

ni * (Xi - )2 ni * (Xi - )3 ni * (Xi - )4


74’4832 -137’049 252’1706
18’3456 -15’4102 12’9454
0’3328 0’0533 0’0091
32’2944 37’4616 43’4544
69’984 151’1655 326’517

195’44 36’2212 635’0965

2º Recordemos que para los coeficientes de Fisher necesitamos conocer la desviación


típica. Hagamos los cálculos:

Sx =
√ ∑ ni * [Xi - ]2 = √ 195’44
100
= 1’398
n

3º Ahora vayamos sustituyendo en nuestras fórmulas:

[ ∑ [ ( Xi - )3 * ni] ] / 36’2212 / 100 0’3622


γ1 = = = 2’7323 = 0’1326
Sx3 (1’398)3
n n
Se trata de una distribución asimétrica positiva, es decir, hay más valores bajos que
valores altos de la variable.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


[ ∑ [ ( Xi - )4 * ni] ]/ n 635’0965 / 100 6’351
γ2 = -3= -3 =
3’8197
-3 = -1’337
Sx4 (1’398)4

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
n
Se trata de una distribución platicúrtica, es decir, hay un índice de dispersión muy alto
porque los datos están distribuidos con frecuencias parecidas a lo largo de los valores
de toda la variable.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3882628

Elimina la publicidad de este documento con 1 coin


TEMA 4: TRANSFORMACIÓN DE PUNTUACIONES. Puntuaciones
típicas y escalas derivadas.

1. PUNTUACIONES TÍPICAS Y ESCALAS DERIVADAS

Una herramienta muy utilizada es la transformación de los datos de investigación, bien


porque el formato de los mismos no permite la realización de los análisis que se han de
desarrollar, bien para poder comparar los resultados de distintos grupos o,
sencillamente, hacer más fácil la comprensión del dato.

Una puntuación directa es aquella que atribuye directamente la herramienta de


medida que utilizamos a cada uno de los sujetos a los que medimos y, por sí sola, no
resulta nada informativa. Su símbolo es Xi (la X es mayúscula).

La puntuación diferencial correspondiente a la puntuación directa, representa la


posición relativa del sujeto al que corresponde, es decir, indica cuántas unidades está
situado por encima o por debajo de la media aritmética del grupo. Es la puntuación
directa menos la media aritmética del grupo, y su símbolo es xi (la x es minúscula).

La puntuación típica compara la distancia de cada dato a la media, con la dispersión


del grupo; esto permite establecer si dicha distancia es importante en el conjunto de
datos. Es la puntuación diferencial dividida entre la desviación típica del grupo y su
símbolo es Zi. Sus valores van desde -3 a +3.

Las puntuaciones T son aquellas conseguidas mediante una transformación lineal de


las puntuaciones típicas y su símbolo es T.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1.1. Ventajas de las puntuaciones típicas

 Son independientes de la unidad de medida utilizada en la distribución.


 Las Zs suelen ser utilizadas para acotar las puntuaciones dentro de la
distribución.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
 La puntuación típica indica, con el signo, el sentido de la distancia.
 La media de las puntuaciones típicas de una distribución es siempre 0. El valor
de la varianza y el de la desviación típica en las puntuaciones típicas es siempre
1.
 Una vez elevados al cuadrado cada una de las puntuaciones típicas y
sumándolas, el resultado es el tamaño de la muestra. ( ∑ Zi2 = N ).

Una vez que transformamos las puntuaciones directas en puntuaciones típicas


podemos establecer esta curva, que está construida a partir de puntuaciones
tipificadas. Es decir, esto es una distribución normal tipificada. El µ del centro es el
valor de la media poblacional y de la distribución. A la izquierda, en µ-σ, se encuentra
el valor -1, y a la derecha, µ+σ es el valor +1. ¿Por qué equivale σ a 1? Recordemos que
la desviación típica en puntuaciones típicas equivale siempre a 1, y σ es el símbolo de
la desviación típica. La mayoría de la gente, concretamente el 68% de la población se

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


va a encontrar en valores comprendidos entre -1 y +1, eso significa lo que abarca la
primera flecha, es decir, la mayoría de la gente se mueve entorno a una desviación
típica arriba o abajo. La segunda flecha, quiere decir que el 95% de la población se
encontraría dos desviaciones típicas por arriba o por abajo. Y, por último, la tercera

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
flecha implica que el 97’7 % de la población se encuentra 3 desviaciones típicas por
arriba o por abajo, es decir, se mueven en torno a los valores -3 y +3. La curva NUNCA
llegará a cortar el eje, esto quiere decir que hay muy muy pocas personas que se
encuentren en los extremos.

Ejercicio

Se han extraído al azar las notas de 10 alumnos, de entre un grupo de 100. Dichas
calificaciones estaban medidas en una escala de 0 a 30. Vamos a analizar estas notas
calculando su media y desviación típica, tanto en puntuaciones directas como en
puntuaciones diferenciales.

Nos dan esta tabla:

PUNTUACIONES
DIRECTAS
Xi
Con esto podemos hacer perfectamente la media de

12 momento. Pero ¡OJO! La fórmula de la media que


12 debemos aplicar es la de datos originales, no la de
13 agrupados. A pesar de que lo veamos en tabla, estos
15
datos no están agrupados, puesto que vemos que se
15
repiten.
15
16 ∑ Xi 150
Entonces = = = 15
17
N 10
17
18
A continuación, aunque podríamos sacar las puntuaciones
150
diferenciales ya, lo que haremos será la columna para
realizar la desviación típica.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


PUNTUACIONES DIRECTAS
Ahora realicemos la varianza para posteriormente
Xi (Xi - )2
calcular nuestra desviación típica.
12 9
∑ (Xi- )2 40
12 9 Sx2 = = =4
N 10
13 4

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora la desviación típica
15 0
15 0
Sx = √4 = 2
15 0
16 1
17 4
17 4
18 9
150 40

Ahora vayamos con la parte de las puntuaciones diferenciales. Recordemos que la


puntuación diferencial se saca restándole a Xi la media aritmética (Xi - ).

PUNTUACIONES
DIFERENCIALES

Xi
-3 Hagamos la media.
-3 ∑ xi ∑ (Xi - ) 0
-2 = = = =0
N N 10
0
0
0
1
2
2
3
0

Hagamos la tabla completa para hacer la varianza y la desviación típica.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


PUNTUACIONES DIFERENCIALES

xi (xi - )2
La varianza sería:
-3 9
∑ (xi- )2 40
-3 9 Sx2 = N = 10 = 4
-2 4
0 0
La desviación típica por lo tanto:
0 0
Sx = √4 = 2
0 0
1 1
2 4
2 4
3 9
0 40

Estos son los gráficos en los que saldrían. El eje X de ambas gráficas se corresponde
con las puntuaciones directas (izquierda) y las puntuaciones diferenciales (derecha).
Como podemos observar, cambian los índices de tendencia central (la media en
puntuaciones diferenciales será siempre 0 porque ∑ Xi = 0, pero el índice de dispersión
sigue siendo el mismo, las dos distribuciones son idénticas. La diferencia entre ambas
gráficas es que en la parte de las puntuaciones directas la media estaba en 15, y en
puntuaciones diferenciales está en 0, pero la forma del gráfico es idéntica porque los
índices de dispersión son los mismos. Son dos variables equivalentes.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1.2. Escalas derivadas

Si se realiza una transformación lineal en los datos iniciales, es decir, se multiplican los
datos por un número y se les suma otro, los estadísticos estudiados hasta ahora
pueden cambiar su valor.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Las medidas de posición se ven modificadas en su valor por ambos cambios.
- Las medidas de dispersión sólo se ven afectadas por el cambio multiplicativo.

MEDIA Y VARIANZA DE LOS DATOS TRANSFORMADOS


Transformación Yi = aXi + b
Media =a +b
Varianza Sy2 = a2Sx2

Esta transformación a una escala derivada suele hacerse cuando no interesa trabajar
con puntuaciones negativas.

Una de las escalas derivadas más conocidas es aquella que tiene como media 50 (b) y
como desviación típica 10 (a) y se conoce como Escala T o Puntuaciones T.

T = aZi + b

Ejercicio

Dadas las puntuaciones 3, 3, 3, 4, 5, 6, 6, 9, 10, 10; calcular otras puntuaciones a partir


de ellas que tengan media 5 y desviación típica 2.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


Xi El primer paso es calcular las puntuaciones diferenciales, para a raíz
3
de ellas poder obtener las puntuaciones T. Recordemos las fórmulas:
3
3
4
5

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
6
6
9
10
10 Para hacer las puntuaciones diferenciales (xi) necesitamos primero
59 conocer la media de Xi
Xi xi = (Xi - )
∑ Xi 59 Puntuaciones
= N = 10 = 5’9 diferenciales
3 -2’9
3 -2’9
3 -2’9
4 -1’9
5 -0’9
6 0’1
6 0’1
9 3’1
10 4’1
10 4’1
59
Ahora necesitaremos conocer la desviación típica para completar la
fórmula para obtener las puntuaciones T. Pero antes realizaremos la columna
necesaria para conocer nuestra DT.

Xi xi = (Xi - ) (Xi - )2 ∑ ( Xi - )2
Puntuaciones
diferenciales
Sx = √ N
= √ 72’9
10
3 -2’9 8’41 = √7′29 = 2’7
3 -2’9 8’41
3 -2’9 8’41
4 -1’9 3’61
5 -0’9 0’81
6 0’1 0’01
6 0’1 0’01
9 3’1 9’61
10 4’1 16’81
10 4’1 16’81
59 72’9

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


Ahora que tenemos los datos para hacer la fórmula de las puntuaciones T ( xi ) .
Sx
Rellenamos la fórmula y hacemos la columna de estas puntuaciones T. Para hacer la
columna lo único que tenemos que hacer es dividir cada columna de las puntuaciones
diferenciales (Xi - ) por la desviación típica calculada anteriormente (2’7)

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Xi xi = (Xi - ) (Xi - )2 Zi
Puntuaciones Puntuaciones
diferenciales típicas
3 -2’9 8’41 -1’0741
3 -2’9 8’41 -1’0741
3 -2’9 8’41 -1’0741 Una vez que tenemos
4 -1’9 3’61 -0’7037
las puntuaciones
5 -0’9 0’81 -0’3333
6 0’1 0’01 0’0370 típicas podemos
6 0’1 0’01 0’0370
obtener nuestra
9 3’1 9’61 1’1481
10 4’1 16’81 1’5185 escala derivada.
10 4’1 16’81 1’5185
59 72’9

Para obtener las escalas derivadas recordemos que la fórmula era bien sencilla:

D = aZi + b Sabemos que a, que es la desviación típica,


equivale a 2. Por otro lado, b, que es la media,
equivale a 5. D = aZi + b = 2Zi + 5

Ahora se trata solo de sustituir en la fórmula cada puntuación de Z i para conseguir


nuestra columna.

Xi xi = (Xi - ) (Xi - )2 Zi D
Puntuaciones Puntuaciones
diferenciales típicas
3 -2’9 8’41 -1’0741 2’8518
3 -2’9 8’41 -1’0741 2’8518
3 -2’9 8’41 -1’0741 2’8518
4 -1’9 3’61 -0’7037 3’5926
5 -0’9 0’81 -0’3333 4’3334
6 0’1 0’01 0’0370 5’0740
6 0’1 0’01 0’0370 5’0740
9 3’1 9’61 1’1481 7’2962
10 4’1 16’81 1’5185 8’0370
10 4’1 16’81 1’5185 8’0370

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


PROBLEMA 1

Para conseguir una beca los aspirantes deben superar, entre otras, una prueba de
nivel de inglés. La media obtenida en la prueba fue 8’7 y la desviación típica 2’3. Por
problemas técnicos en la realización del examen se toma la decisión de sumar 2
puntos a las calificaciones de dicho grupo. Tras aplicar dicha transformación, ¿cuál es
la media y la varianza en la prueba?

Necesitamos transformar la variable, crear una variable nueva (Y) a la que sumemos
esos dos puntos, por lo que tendríamos que hacer algo así Y= X + 2. Pero, aquí la
pregunta es sobre la media y la varianza de nuestra variable transformada.

- Recordemos que los índices de tendencia central (como la media) se ven


afectados por los cambios multiplicativos y sumativos ( = a + b). En este caso
solo tenemos un cambio sumativo así que = + 2 = 10’7, es decir, = 10’7.
- Ahora vamos con la varianza. Los índices de dispersión (varianza) solo se ven
afectados por los cambios multiplicativos (Sy2 = a2Sx2). En este ejercicio el único
cambio que hay es sumativo, no hay ninguno multiplicativo, por lo que la
varianza quedaría igual que en la anterior variable. En este caso, nos han dado
la desviación típica, la cual tenemos que elevar a dos para conocer la varianza
(Sx2). Sx2= (2’3)2 = 5’29. Sx2 = 5’29.

PROBLEMA 2

La dirección DGT está interesada en estudiar la educación vial en los jóvenes. Para
ello selecciona una muestra aleatoria de 4 sujetos que acaban de obtener el carnet
de conducir (grupo 1) y otros 4 que lo tienen hace cinco años (grupo 2) y registra el
nº de veces que han infringido la ley en el último año.

Grupo 1: 1 2 4 1 1 =2 S12 = 1’5


Grupo 2: 2 7 7 8 2 =6 S22 = 5’5

1. Obtenga las puntuaciones T para los sujetos del grupo 1.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
En primer lugar debemos identificar las puntuaciones directas de las que partimos, en
este caso son las el grupo 1:

1, 2, 4, 1

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora tocaría calcular las diferenciales, para lo que tenemos que restarle a cada
puntuación directa la media (Xi - ). Recordemos que la media para el primer grupo es
2. Nos quedarían las siguientes puntuaciones diferenciales (xi)

-1, 0, 2, -1

Seguimos con las puntuaciones típicas (Zi). Para calcularlas lo único que necesitamos
𝑥𝑖
son las puntuaciones diferenciales y conocer la desviación típica ( ). Tenemos la
𝑆𝑥
varianza, que es 1’5, pues para calcular la desviación típica lo único que tenemos que

hacer es la raíz cuadrada de 1’5. Sx= √1′5 = 1’22 . Solo nos queda dividir cada
puntuación diferencial por la desviación típica.

-0’82, 0, 1’64, -0’82

Para este paso siguiente debemos tener MUY CLARO que cuando nos hablen de escala
T SIEMPRE, SIEMPRE, la desviación típica (a) será 10 y la media (b) 50. Por lo que:
T= a* Zi +b T= 10 * Zi +50

Ahora para conocer las puntuaciones T solo debemos sustituir las puntuaciones típicas
anteriores en Zi y calcular todas las puntuaciones:

41’8, 50, 66’4, 41’8

2. Rosa, del grupo 1, obtiene una puntuación diferencial de -2, ¿cuál es su puntuación
típica?

Solo debemos la puntuación de rosa en la fórmula para obtener las puntuaciones


típicas:
xi -2
Zi = = = -1’64
Sx 1’22
3. Si transformamos la variable X en la variable Y = 2X + 3,

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


Es importante que sepamos que en este apartado nos habla de la variable X, no de
grupo 1 o de grupo 2, por lo que lo que nos pidan a partir de ahora deberemos
calcularlo operando tanto con los datos del grupo 1, como con los datos del grupo 2.
Dejemos algunos datos hechos. Por ejemplo para la variable X, la N=8 puesto que

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ahora tenemos en total 8 puntuaciones de 8 sujetos.

- ¿Cuál es la media y la varianza de Y?

Para conocer la media de Y, la fórmula es = a* + b. En el enunciado de este


ejercicio 3 ya nos dice que a= 2 y b= 3 por lo que nuestra fórmula quedaría de
momento así: = 2* + 3. Solos nos queda conocer la media de X. Como hemos dicho
anteriormente, jugamos con 8 puntuaciones ahora, así que hagamos de nuevo la
media:
1+2+4+1+2+7+7+8
= =4
8

Ahora que tenemos todos los datos solo nos queda sustituir en la fórmula de la media
de nuestra nueva variable Y:

= 2* 4 + 3 = 11. La media de Y es 11

Ahora vamos con la varianza. Para ello mejor elaboremos una tabla para que quede
más claro. Recordemos que para conocer la varianza de nuestra nueva variable la
fórmula es:
∑ (Xi - )2 La fórmula es la de
Sx2 = datos originales
n

Ahora sí, la tabla:

Puntuaciones Xi - (Xi - )2

1 -3 9
2 -2 4
4 0 0
1 -3 9
2 -2 4
7 3 9
7 3 9

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


8 4 16
60

Ahora podemos calcular la varianza:


60

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Sx2 = = 7’5
8
Ahora recuperemos la fórmula para conocer la varianza de una nueva variable Y y
sustituyamos con todo lo que sabemos:
Sy2 = a2Sx2 Sy2 = 22 * 7’5 = 30. Sy2 = 30. La varianza de Y es 30.

- Si un sujeto obtiene una puntuación típica de 1 en X, ¿cuál será su puntuación


directa en Y?

Aquí lo único que tenemos que hacer es sustituir en fórmulas y despejar. Empecemos.
Tenemos que un sujeto obtiene una puntuación típica (Zi) es 1 y tenemos que ir hacia
atrás hasta llegar a las puntuaciones directas. Sustituimos en la fórmula para obtener
las puntuaciones típicas:

Zi = Xi -
Sx

Sabemos que Zi es 1; que es 4; y Sx es √7′5 = 2’74.


Xi - 4
1= 2’74

2’74 = Xi – 4

2’74 + 4 = Xi

6’74 = Xi

Ahora solo sustituimos en la fórmula de Y= 2X + 3

Y= 2 * 6’74 + 3 Y= 16’48

4. ¿Qué puntuación diferencial le corresponde a un sujeto del grupo 2 que obtuvo


una puntuación T de 65?

Ojito porque nos hablan del GRUPO 2, por lo que ahora deberemos usar la media,
varianza y desviación típica del GRUPO 2.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Elimina la publicidad de este documento con 1 coin


Igual que antes, deberemos ir sustituyendo en fórmulas y despejando. Empezando por
las puntuaciones T. RECORDEMOS que al ser puntuación T, la a= 10 y la b=50. Ahora sí,
sustituyamos en la fórmula T= a*Zi + b

65 = 10*Zi + 50

65-50 = 10*Zi

15 = 10*Zi

15/10 = Zi Zi = 1’5

Ahora sustituyamos y despejamos en la fórmula de las puntuaciones diferenciales.


Para ello debemos conocer la desviación típica del grupo dos, para lo que tenemos que

hacer √5′5 = 2’35. Sx= 2’35.

ZI = xi / Sx

1’5 = xi / 2’35

1’5 * 2’35 = xi

3’53 = xi. 3’53 es la puntuación diferencial del sujeto del grupo dos que ha
obtenido una puntuación T de 65.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3924248

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TEMA 5: CORRELACIONES

1. INTRODUCCIÓN

Hasta ahora nos hemos centrado en medidas de tendencia central, variabilidad, forma;
es decir, en describir una única variable. No obstante, en la práctica es común
examinar dos o más variables conjuntamente (p.ej: relación entre inteligencia y
rendimiento, etc.). En este tema nos centraremos en estudiar la relación entre dos
variables (a partir de n observaciones apareadas) y calcularemos índices que nos darán
el grado de relación/asociación lineal entre ambas variables.

2. CONCEPTO

El análisis de correlación ayuda a establecer el grado de relación entre dos variables, X


e Y. La cuantía o magnitud de la relación entre dos variables se puede establecer
calculando un índice de correlación, de forma que será alta o baja, fuerte, débil,
moderada, si es grande, si es pequeña… según el valor numérico del estadístico
calculado. La cuantía o magnitud nos dirá la fuerza con la que dos variables están
relacionadas o no.

El sentido de la relación lo indica el signo que acompaña al valor del estadístico, de


forma que una relación puede ser positiva si al aumentar una de las variables aumenta
la otra y, negativa, si al aumentar una de las variables disminuye la otra.

El tipo de relación entre las dos variables consideradas puede ser lineal o no lineal. Si
nosotros a partir del resultado que obtenemos en el resultado del cálculo del
estadístico sale que no hay relación entre las variables tendremos que agregar la
coletilla de que “no hay relación lineal”, al igual que si hubiera diríamos que “hay
relación de tipo lineal”.

Si las dos variables X e Y son cuantitativas, se puede calcular la Covarianza, el


Coeficiente de Correlación de Pearson o la Razón de correlación entre ambas.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Representaciones gráficas de una relación

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Aquí tenemos 3 ejemplos de 3 situaciones que se pueden dar cuando estudiamos las
relaciones entre dos variables. Representamos ambas variables, una en el eje X y otra
en el eje Y. Cada punto será un par de puntuaciones, es decir, el valor que el sujeto
obtiene en la variable X y el valor que obtiene en la variable Y, normalmente se
representan ambos entre paréntesis y separados por una coma, primero el valor
obtenido en X y luego el valor obtenido en Y. Por ejemplo, supongamos que tenemos
un valor en la variable X de 3, y un valor de 5 en la variable Y, pues lo representaríamos
así: (3, 5).

Fijémonos en como se distribuye la nube de puntos cuando estudiamos la inteligencia


y su relación con el rendimiento. La primera gráfica de la izquierda es lo que llamamos
relación lineal positiva porque, una relación lineal perfecta sería una línea que iría
hacia arriba, y esa nube de puntos tiene esa tendencia lineal y ascendente, y quiere
decir que una puntuación más alta en la variable X está asociada a una puntuación más
alta en la variable Y, es una relación directamente proporcional.

En la gráfica de en medio (sin relación) tenemos una nube de puntos que representa
que hay independencia entre las variables o que no hay relación.

En la tercera gráfica tenemos una relación lineal negativa, es decir, tenemos valores
altos en la variable X que están asociados a valores bajos en Y, pero sigue igualmente

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
una tendencia lineal. En este caso sería una relación inversamente proporcional,
cuando una variable sube, la otra baja, y viceversa.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Aquí podemos ver más claro la diferencia de una relación lineal y una no lineal.
Aunque nosotros nos centraremos en las relaciones lineales.

Aquí vemos que todas las gráficas son relaciones lineales positivas (ascendentes hacia
la derecha). Para interpretar estas gráficas nos servimos de los valores numéricos, es
decir, interpretamos la magnitud. Para valores cercanos a 1 (entre 0’9 y 1) nos van a
dar gráficos como la primera gráfica (relación lineal perfecta o casi perfecta). Valores
comprendidos entre 0’4 o ‘8, nos darán las de en medio (fuerte o moderada). Y serán
débiles cuando los valores oscilen entre 0’2 o 0’4.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Ahora necesitamos un índice que nos informe tanto del grado en que X e Y están
relacionadas, como de si la relación es positiva o negativa.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Medidas de asociación

Si la relación lineal es positiva, cuando las puntuaciones


diferenciales de X son positivas, las puntuaciones
diferenciales de Y también suelen serlo.

Si la relación lineal es negativa, cuando las


puntuaciones diferenciales de X son positivas, las
puntuaciones diferenciales de Y suelen ser negativas.

Covarianza

Vamos a calcular este índice cuando tengamos dos variables cuantitativas. La


Covarianza vamos a calcularla a partir de las dos varianzas de las variables originales.
∑ [ (Xi - ) * (Yi - ) ]
Sxy = N

En el caso 1 del apartado anterior, el primer gráfico, la Covarianza será un valor


positivo. En el caso 2 del apartado anterior, el segundo gráfico, la Covarianza será un
valor negativo. Por tanto, la Covarianza nos da información sobre si la relación entre X
e Y es positiva o negativa.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
La Covarianza indica el grado de variación conjunta de dos variables. Indica la cuantía y
el sentido de la covariación. En cuanto a la cuantía o magnitud, será muy complicado
interpretarlo, porque la covarianza no está acotada, no tiene ni un mínimo ni un
máximo. Por esto, más que nada nos centraremos en el sentido. Tiene como unidad de
medida el producto de las unidades de las dos variables. Esto último, unido al hecho de
que no está acotada superiormente, hacen difícil su interpretación. Otra fórmula de
cálculo es esta:
∑ (Xi * Yi )
Sxy = -( * )
N

Para solucionar estos problemas contaremos con el siguiente índice.

Ejercicio Covarianza

Xi Yi Xi2 Yi2 Xi * Yi
25 20 625 400 500
Con estos datos calculemos la
20 19 400 361 380
Covarianza.
35 40 1225 1600 1400
40 35 1600 1225 1400
35 41 1225 1681 1435
Podemos empezar con la media de
30 37 900 1369 1110
X:
25 20 625 400 500
40 50 1600 2500 2000 495
= = 33
15
11 15 121 225 165
25 21 625 441 525 Sigamos con la media de Y:
9 12 81 144 108 501
= = 33’4
15
50 50 2500 2500 2500
80 74 6400 5476 5920
50 45 2500 2025 2250
20 22 400 400 440
495 501 20827 20831 20633

Con los datos que tenemos ya podemos calcular la Covarianza:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
∑ (Xi * Yi ) 20633
Sxy = -( * ) Sxy = - 33 * 33’4
N 15

Sxy = 1375’53 – 1102’2 = 273’33

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Como tiene signo positivo (+273’33) sabemos que es una relación lineal positiva, si la
variable X aumenta, la variable Y también, y viceversa. Pero, ahora, en cuanto a la
magnitud no podemos decir mucho, no podemos interpretarla.

Coeficiente de correlación producto-momento de Pearson

El Coeficiente de Correlación de Pearson parte de la Covarianza. También se utiliza


para variables cuantitativas. Tiene varias fórmulas para calcularse:

Sxy ∑ (Zx * Zy )
rxy = rxy =
Sx *Sy N

[ N * ∑ ( Xi * Yi ) ] – [ ∑Xi * ∑Yi ]
rxy =

√ [ N * ∑ ( Xi2) ] – ( ∑Xi )2 * √[ N * ∑ (Yi2) ] – (∑Yi)2

Nos indica la cuantía y el sentido de la relación ente dos variables. Está acotado,
oscilando entre -1 y +1. No posee unidad de medida, por lo que se puede aplicar a
variables con diferentes unidades de medida, es decir, podemos relacionar inteligencia
con estatura o la puntuación de un test de asertividad con la fuerza con la que una
persona golpea un martillo. Solo nos indica si existe relación/asociación de tipo LINEAL
entre las variables.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Como hemos dicho antes, el coeficiente de correlación de Pearson está acotado entre
-1 < rxy < +1. Es decir, no puede valer menos de -1 ni más de +1.

• El Coeficiente de Correlación de Pearson de -1 indica una relación lineal


negativa perfecta.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
• El Coeficiente de Correlación de Pearson de +1 indica una relación lineal
positiva perfecta.
• El Coeficiente de Correlación de Pearson de 0 indica ausencia o independencia
de relación lineal.
• Un valor cercano a 0 del coeficiente no implica que no haya algún tipo de
relación no lineal, porque Pearson SÓLO mide relación lineal.

rxy = +1 Relación lineal positiva perfecta entre las dos variables


rxy = -1 Relación lineal negativa perfecta entre las dos variables.
rxy = 0 No existe relación lineal entre las dos variables.
Relación positiva
+0’90 < rxy < +1 Relación positiva muy alta
+0’70 < rxy ≤ +0’90 Relación positiva alta
+0’40 < rxy ≤ +0’70 Relación positiva moderada o media
+0’20 < rxy ≤ +0’40 Relación positiva baja
0 < rxy ≤ +0’20 Relación positiva muy baja
Relación negativa
-1 < rxy < -0’90 Relación negativa muy alta
-0’90 < rxy ≤ -0’70 Relación negativa alta
-0’70 < rxy ≤ -0’40 Relación negativa moderada o media
-0’40 < rxy ≤ -0’20 Relación negativa baja
0’20 < rxy ≤ 0 Relación negativa muy baja

El Coeficiente de Correlación de Pearson (en valor absoluto, es decir, el número,


ignorando el signo) no varía cuando se transforman linealmente las variables. Por
ejemplo, la Correlación de Pearson entre la temperatura (en grados Celsius) y el nivel

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
de depresión es la misma que la correlación entre la temperatura (medida en grados
Fahrenheit) y el nivel de depresión. El Coeficiente de Correlación de Pearson es el
mismo entre las puntuaciones directas de X e Y, o entre las puntuaciones diferenciales
de X e Y, o entre las puntuaciones típicas de X e Y. (Las puntuaciones diferenciales y las

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
puntuaciones típicas son transformaciones lineales de las puntuaciones directas).

Para la interpretación de este coeficiente debemos tener en cuenta qué es lo que


estamos midiendo para poder interpretar cómo de grande es la relación entre las
variables bajo estudio.

Es muy importante efectuar el diagrama de dispersión.


Por ejemplo, en el caso de la izquierda, está claro que
no hay relación entre la inteligencia y rendimiento. Sin
embargo, si calculamos el Coeficiente de Correlación de
Pearson nos dará un valor muy elevado, causado por la
puntuación atípica en la esquina superior derecha.

La CORRELACIÓN NO IMPLICA CAUSACIÓN. El hecho de que dos variables estén


altamente correlacionadas no implica que X cause Y, ni que Y sea causa de X,
simplemente que existe una relación entre ambas. Si yo llego a la conclusión de que la
edad esta relacionada con la aptitud verbal, no quiere decir que la edad cause que
haya una mayor aptitud verbal; sino que hay una asociación entre ambas variables.

El coeficiente de Correlación de Pearson puede verse afectado por la influencia de


terceras variables. Por ejemplo, si vamos a un colegio y medimos la estatura y pasamos
una prueba de habilidad numérica, el resultado
será que los más altos también tienen más
habilidad verbal…claro, que eso puede ser
debido simplemente a que en el colegio los
niños más altos serán mayores en edad que los
más bajos. Si se parcializa esta “tercera”
variable (mediante “correlación parcial” que
elimina el efecto de una 3ª variable),

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
difícilmente habrá una relación de importancia entre estatura y habilidad numérica.
Hay muchos casos en que es la tercera variable la causante de una alta relación entre X
e Y (y ello muchas veces es difícil de identificar).

El valor del coeficiente de Pearson depende en parte de la variabilidad del grupo. Si


efectuamos el Coeficiente de Correlación de Pearson entre inteligencia y rendimiento
con todos los sujetos, el valor del coeficiente de
Pearson será bastante elevado. Sin embargo, si
empleamos únicamente los individuos con CI bajo
(o CI alto) y calculamos la correlación con
Rendimiento, el valor del coeficiente de Pearson
será claramente menor. Un grupo heterogéneo
(aquel que tiene un índice de dispersión mayor)
daría pues un mayor grado de relación entre
variables que un grupo homogéneo (aquel que tiene un índice de dispersión menor).

En resumen, existen algunos factores que pueden influir en el Coeficiente de


Correlación de Pearson y que pueden hacer que el resultado al que lleguemos sea
erróneo, a saber:

La dispersión o variabilidad de los valores. Si existe un solo dato que esté alejado del
resto, este valor hará que el coeficiente aumente mucho su valor. Cuando esto ocurre
lo que se suele hacer es eliminar las puntuaciones correspondientes a ese sujeto.

X 1 3 5 7

Y 2 4 6 800

La fiabilidad de las medidas. Si se utilizan para recoger los datos unos instrumentos
que no son fiables, los resultados a partir de esos datos tampoco lo son.

El influjo de una tercera variable. Por ejemplo, la relación entre peso y amplitud de
vocabulario en un grupo de niños de 5 a 8 años es muy alta pero es falsa, puesto que
hay una tercera variable (al menos) que es la edad que está influyendo.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejercicio

Xi Yi Xi2 Yi2 Xi * Yi
25 20 625 400 500
20 19 400 361 380

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
35 40 1225 1600 1400 Calcula el Coeficiente de Correlación
40 35 1600 1225 1400 de Pearson.
35 41 1225 1681 1435
30 37 900 1369 1110
25 20 625 400 500
40 50 1600 2500 2000
11 15 121 225 165
25 21 625 441 525
9 12 81 144 108
50 50 2500 2500 2500
80 74 6400 5476 5920
50 45 2500 2025 2250
20 22 400 400 440
495 501 20827 20831 20633

Cogeremos la fórmula larga para calcularlo:

[ N * ∑ ( Xi * Yi ) ] – [ ∑Xi * ∑Yi ]
rxy =

√ [ N * ∑ ( Xi2) ] – ( ∑Xi )2 * √[ N * ∑ (Yi2) ] – (∑Yi)2

[ 15 * 20633 – [ 495 * 501 ]


rxy =
√[ 15 * 20827 ] – ( 495 )2 * √ [ 15 * 20831 ] – (501)2

309495 - 247995
rxy =
√312405 - 245025 * √ 312465 – 251001

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
61500 61500

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
rxy = = = 0’95
√ 67380 * √ 61464 259’56 * 247’92

Al ser positivo quiere decir que hay una relación lineal positiva. Respecto a la
magnitud, se encuentra entre 0’9 y 1, por lo que es una correlación lineal positiva muy
alta entre las variables X e Y.

Correlación parcial

Ya vimos antes que efectuar la correlación de Pearson entre la estatura y la habilidad


numérica en un grupo de niños podía estar influida por la edad (es decir, al aumentar
la edad aumenta la estatura y aumenta la habilidad numérica). ¿Cómo controlamos el
efecto de la edad en tal caso?

Primera posibilidad (eliminación empírica):

Se trataría de formar subgrupos de edad, en los que en cada uno de ellos la edad fuera
similar y calcular el coeficiente de Pearson para cada subgrupo. Esto es correcto, pero
quizás ahora cada uno de estos coeficientes se calcule con pocos individuos, lo que
puede restar cierta estabilidad.

Segunda posibilidad (eliminación estadística)

Se trataría de utilizar los datos del grupo completo y eliminar la influencia de la tercera
variable de manera estadística.

rxy – ( rxz * ryz )


rxy.z=
√1 – rxz2 * √1 – rxz2

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Evidentemente, el valor de este índice estará entre -1 y +1, y la interpretación es
análoga al coeficiente de correlación de Pearson.

Aquí tenemos un ejemplo:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejercicio

X Y
1 6
De la siguiente tabla, calcular e interpretar el Coeficiente
3 8
de Correlación de Pearson y la Covarianza.
4 10
5 3
7 10
9 7
10 8
5 3
4 7
5 9

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Vamos a hacerlo de forma organizada, es decir, a mi forma

Empecemos colocando las fórmulas por aquí para ver qué nos hará falta calcular para
completar las fórmulas:
∑ [ (Xi - ) * (Yi - ) ]
La covarianza es Sxy =
N

Pearson:
[ N * ∑ ( Xi * Yi ) ] – [ ∑Xi * ∑Yi ]
rxy =

√ [ N * ∑ ( Xi2) ] – ( ∑Xi )2 * √[ N * ∑ (Yi2) ] – (∑Yi)2

Hemos cogido esa de Pearson pero se puede coger cualquiera.

Vale ahora hagamos una lista de las columnas que necesitaremos calcular para realizar
las dos columnas para después simplemente sustituir y operar:

• Columna de Xi
• Columna de Yi
• Columna de Xi2
• Columna de Yi2
• Columna de Xi * Yi
• Columna de Xi -
• Columna de Yi -

Antes de hacer las columnas debemos saber que N=10 (hay 10 datos). Hagamos la
media de las dos variables:

53 71
= = 5’3 = = 7’1
10 10

El 53 lo sacamos del sumatorio de Xi, al igual que el 71 de Yi

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
X Y Xi2 Yi2 Xi * Yi Xi - Yi - ( Xi - ) – ( Yi - )
1 6 1 36 6 -4’3 -1’1 4’73
3 8 9 64 24 -2’3 0’9 -2’07
4 10 16 100 40 -1’3 2’9 -3’77

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
5 3 25 9 15 -0’3 -4’1 1’23
7 10 49 100 70 1’7 2’9 4’93
9 7 81 49 63 3’7 -0’1 -0’37
10 8 100 64 80 4’7 0’9 4’23
5 3 25 9 15 -0’3 -4’1 1’23
4 7 16 49 28 -1’3 -0’1 0’13
5 9 25 81 45 -0’3 1’9 -0’57
53 71 347 561 386 0 0 9’7

Empecemos sustituyendo directamente en la covarianza:


9’7
Sxy = = 0’97
10

Seguimos con el coeficiente de correlación de Pearson:

[ 10 * 386 ] – [53 * 71 ]
rxy =
√ [ 10 * 347 ] – ( 53 )2 * √ [ 10 * 561 ] – (71)2

3860 – 3763 97 97
rxy = = =
√ 3470 – 2809 * √ 5610 – 5041 √ 661 *√569 25’71 * 23’85

97
= 0’16
613’18

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
OTROS COEFICIENTES DE CORRELACIÓN
Estos coeficientes se utilizan cuando las variables no sean cuantitativas, ambas o al
menos una de ellas no lo sea.
Aquí podemos ver un ligero avance de lo que iremos viendo a lo largo de este tema:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Coeficiente Q de Yule (Q)
Se aplica cuando tenemos dos variables nominales, pero cada una de ellas solo puede
tener dos categorías. Por ejemplo:

La fórmula es la siguiente:

[ ( A1 B1 ) * (A2 B2 ) ] – [ ( A1 B2 ) * ( A2 B1 ) ]
Q=
[ ( A1 B1 ) * (A2 B2 ) ] + [ ( A1 B2 ) * ( A2 B1 ) ]

Está acotada entre -1 y +1. -1 ≤ Q ≤ +1

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Si Q es positivo, esto indica que hay una relación positiva entre A1 B1 y entre A2 B2; y
relación negativa entre A1 B2 y entre A2 B1.
Si Q es negativo, indica relación negativa entre A1 B1 y entre A2 B2; y relación positiva
entre A1 B2 y entre A2 B1.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Coeficiente de contingencia (C)
Se utiliza para variables nominales. Nos indica la intensidad de la relación entre dos
variables

χ²
C= √ N + χ²

Para poder calcular C, debemos calcular primero el coeficiente de Chi-Cuadrado

El coeficiente Chi-cuadrado se aplica a dos variables nominales con dos o más


categorías cada una de ellas. Es decir, podemos estudiar si hay relación entre una
variable que tenga 3 niveles y otra que tenga 5.

0 ≤ C ≤ +1

Este coeficiente está acotado entre 0 y +1.

ORDENACIÓN POR RANGOS DE VARIABLES CONTINUAS


En cuanto a variables ordinales o Cuasicuantitativas podemos trabajar de dos maneras.
Podemos calcular medidas de asociación para variables ordinales o podemos trabajar
con dos variables cuantitativas pero nos interese ordenarlas por rangos.
Si partimos de una variable cuantitativa por ejemplo:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
X Y Cuando estemos pasando una variable cuantitativa a una ordinal siempre
8 9 el valor más alto de la variable ocupará el rango 1 y el valor más pequeño
9 8 el último que haya, n.
7 4
5 7

Veamos como se transforma en rangos con el cuadro de arriba, en concreto con X. En


primer lugar tenemos que ordenar los números de mayor a menor, en este caso sería:
9-8-7-5. Una vez hayamos hecho esto, asignaremos el número “1” al número mayor de
todos, que sería el 9; el “2” al siguiente más grande, que sería en 8, y así
sucesivamente. Después crearíamos una tabla con los números nuevos asignados, tal
que así:
Rangos Rangos
X Y
X Y
8 9
2 1
9 8
1 2
7 4
3 4
5 7
4 3

Veamos ahora uno un poco más complicado:

MEMORIA
Siguiendo la lógica explicada anteriormente al 8 le correspondería el
(X)
número “1”, pero al haber dos ochos hay que hacer un pequeño
3
tejemaneje. ¿Cuál es ese chanchullo? El siguiente:
5
8 Cuando ya hemos ordenado los números de mayor a menor y nos

8 encontramos que tenemos un empate entonces tendremos que tener

2 en cuenta la posición que tienen, el que primero esté se llevará el


primer número, y el siguiente el número 2. Es decir, el primer 8 que nos
encontramos (tercera fila) se llevaría el número “1”, y el segundo 8 (cuarta fila) se
llevaría el número “2”. ¿Qué tenemos que hacer ahora con los dos 8, que ahora sus
valores son 1 y 2 respectivamente? Pues empezamos sumando sus valores actuales

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
(1+2=3) y a continuación hacemos su media (3/2 = 1’5). 1’5 sería el valor que
correspondería a esos dos ochos, es decir se nos quedaría esta tabla.

MEMORIA MEMORIA

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
(X) (X) No hay número “2” como tal
3 4 porque realmente es el segundo 8
quien se lleva la segunda posición,
5 3 es decir, no podemos repartir 5
1’5 posiciones entre 4 números
8
distintos (distintos porque se
8 1’5 repiten dos 8, ya sabemos que en
5 total hay 5)
2

¿Qué pasa entonces si hay triple empate? Pues el mismo mecanismo:

INTELIGENCIA La segunda posición sería del 6 (porque la primera es del 9, ya que es

(Y) el número mayor), pero como nos encontramos tres 6 seguidos, el 2

4 se lo lleva el de la segunda fila, el 3 el de la tercera fila, y el 4 el de la

6 cuarta fila. Por lo que: 2+3+4= 9. Y la media entre estos tres es:

6 9/3= 3. Pues le corresponde el número 3 a todos los 6. Quedaría una

6 tabla como la siguiente:

INTELIGENCIA INTELIGENCIA
(Y) (Y)
4 5
6 3
6 3
6 3
9 1

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Coeficiente de correlación de Spearman (rs)
Se utiliza con variables ordinales. Es una adaptación del coeficiente de Pearson, pero
para variables ordinales. Mide el grado de correspondencia entre los órdenes de las
dos variables
Es la diferencia de cada fila de rangos
y posteriormente elevada a 2.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Oscila
Oscilaentre entre
6 * ∑ d12
rs = 1 – -1-1≤ ≤rs r≤s ≤+1+1
N * (N2 – 1)

Si la correlación es positiva, los valores altos de X tienden a aparearse con valores altos
de Y, y los valores bajos de X tienden a aparearse con valores bajos de Y.

Si la correlación es negativa, los valores altos de X tienden a aparearse con valores


bajos de Y, y los valores bajos de X tienden a aparearse con valores altos de Y.

Coeficiente de Correlación de Kendall (tk)

Oscila entre
P = Número de no-inversiones
P- Q -1 ≤ tk ≤ +1
tk = Q = Número de inversiones
N * (N – 1)
2

Hablamos de dos variables ordenadas por rangos o dos variables ordinales por
naturaleza. Se eligen dos sujetos A y B. Si A es superior a B en X e inferior en Y o
viceversa, se da una inversión (I). Si A es superior a B en X e Y, o inferior en ambas, se
da una no-inversión (NI).

Mide el grado de correspondencia entre los órdenes de las dos variables.

Si la correlación es positiva, los valores altos de X tienden a aparearse con valores altos
de Y, y los valores bajos de X tienden a aparearse con valores bajos de Y.

Si la correlación es negativa, los valores altos de X tienden a aparearse con valores


bajos de Y, y los valores bajos de X tienden a aparearse con valores altos de Y.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
COEFICIENTES DE CORRELACIÓN PARA VARIABLES DICOTÓMICAS Y DICOTOMIZADAS

A continuación, veremos los casos en los que tenemos variables dicotómicas o


dicotomizadas, o combinemos una dicotómica y una continua; o una dicotomizada y
una continua.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Conceptos previos

Una variable es dicotómica cuando por propia naturaleza sólo puede manifestarse
según dos modalidades (Sexo: mujer-hombre; lanzar moneda: cara-cruz).

Una variable está dicotomizada cuando pudiendo manifestarse según tres o más
modalidades, sólo se le permite manifestarse según dos (Altura: bajo-alto; rendimiento
escolar: aprobado-suspenso).

Coeficiente de Correlación Biserial-Puntual (rbp)

Se utiliza siempre cuando una variable es continua y la otra variable es dicotómica. Por
ejemplo, una variable dicotómica como por ejemplo acertar o fallar un ítem y una
variable continua que es la nota final que el sujeto saca en el test. Mide la fuerza de la
asociación entre las dos variables.

Vamos a establecer dos categorías en la variable dicotómica, la categoría p y la q.


Generalmente, la categoría p es la que vamos a estudiar, y la que complementa a esta
variable sería la q. En el ejemplo puesto anteriormente la p serían los aciertos y los
fallos serían la q. Y la nota pues sería la variable continua.

Si la correlación es positiva, los sujetos de la categoría p tienden a tener puntuaciones


altas en X y los sujetos de la categoría q tienden a tener puntuaciones bajas en X.

Si la correlación es negativa, los sujetos de la categoría p tienden a tener puntuaciones


bajas en X y los sujetos de la categoría q tienden a tener puntuaciones altas en X.

Oscila entre
-1 ≤ rbp ≤ +1
p - 𝑝 p - q
rbp = *√ rbp = * √𝑝 ∗ 𝑞
Sx 𝑞 Sx

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Los valores 1 y 0 son los
correspondientes a la vble
X = Variable continua p = proporción de sujetos con 1 en Y dicotomizada, por ejemplo:
acertar ítem=1; fallar ítem=0
Y = Variable dicotómica q = proporción de sujetos con 0 en X

p = Media aritmética en la variable X de las personas cuya puntuación en Y es p.

q = Media aritmética en la variable X de las personas cuya puntuación en Y es q.

= Media aritmética de la variable X.

Coeficiente de Correlación Phi (ϕ)

Se utiliza cuando las dos variables son dicotómicas


(c * b) – (a * d)
ϕ=
√(𝑎 + 𝑏) ∗ (𝑐 + 𝑑 ) ∗ (𝑎 + 𝑐 ) ∗ (𝑏 + 𝑑)

Los valores a, b, c y d se obtienen de la siguiente tabla:

Son todo sumas aunque no se vea muy bien.

Si la correlación es positiva, indica que los sujetos de la categoría 1 en X tienden a la


categoría 1 en Y y los sujetos de la categoría 0 en X tienden a la categoría 0 en Y.

Si la correlación es negativa, indica que los sujetos de la categoría 1 en X tienden a la


categoría 0 en Y y los sujetos de la categoría 0 en X tienden a la categoría 1 en Y.

Coeficiente de Correlación Biserial (rb)

Se utiliza cuando hay una variable continua y una variable dicotomizada, o cuando
ambas son dicotomizadas. La variable Y será la dicotomizada.

p - 𝑝 p - q 𝑝∗𝑞
rb = * rb = * 𝑦
Sx 𝑦 Sx

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
X= Variable continua p= proporción de sujetos con 1 en Y

Y= Variable dicotomizada q= proporción de sujetos con 0 en Y

p = Media aritmética en la variable X de las personas cuya puntuación en Y es p.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
q = Media aritmética en la variable X de las personas cuya puntuación en Y es q.

= Media aritmética de la variable X.

Si la correlación es positiva, los sujetos de la categoría p tienden a tener puntuaciones


altas en X y los sujetos de la categoría q tienden a tener puntuaciones bajas en X.

Si la correlación es negativa, los sujetos de la categoría p tienden a tener puntuaciones


bajas en X y los sujetos de la categoría q tienden a tener puntuaciones altas en X.

Coeficiente de Correlación tetracórica (rt)

Se utiliza cuando ambas variables están dicotomizadas.

Oscila entre
180o -1 ≤ rt ≤ +1
rt = cos
𝑏∗𝑐
1+√
𝑎∗𝑑

𝑐∗𝑏
Hay que calcular la proporción entonces:
𝑎∗𝑑

𝑐∗𝑏
- Si > 1 buscamos en la tabla de la correlación tetracórica el intervalo donde
𝑎∗𝑑
se halla ese valor. La puntuación de rt que le corresponda será el valor del
coeficiente de correlación tetracórica.
𝑐∗𝑏 𝑎∗𝑑
- Si < 1 hay que calcular y buscar el resultado en la tabla de la
𝑎∗𝑑 𝑐∗𝑏
correlación tetracórica. La puntuación de rt que le corresponda, se toma como
negativa y ese será el valor del coeficiente de correlación tetracórica.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Ejercicio

RELIGIÓN

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Católico Protestante
SEXO Mujer 18 20 38
Varón 40 25 65
58 45 N= 103

Con estos datos calculemos el coeficiente de Correlación Phi (ϕ)

Para hacer este coeficiente de correlación teníamos que tener en cuenta este modelo:

Ahora simplemente en el cuadro de arriba


tenemos que identificar qué casilla es 1, 0, a,
b, c y d. Lo pondremos entre paréntesis para
que se entienda mejor:

RELIGIÓN
(Variable X)
SEXO Católico (0) Protestante (1)
(Variable Y) Mujer (1) 18 (a) 20 (b) 38 (a+b)
Varón (0) 40 (c) 25 (d) 65 (c+d)
58 (a+c) 45 (b+d) N= 103
(a+b+c+d)

Ahora que ya sabemos qué número es a, b, c y d y a qué categoría corresponde 0 y 1


en cada variable solo nos queda calcular la fórmula e interpretar el resultado.
(c * b) – (a * d) (40 *20 ) – (18 * 25)
ϕ= =
√(𝑎 + 𝑏) ∗ (𝑐 + 𝑑 ) ∗ (𝑎 + 𝑐 ) ∗ (𝑏 + 𝑑) √(38) ∗ (65) ∗ (58) ∗ (45)

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
800 - 450 350
ϕ= = = 0’14
√6446700) 2539’04

Como la correlación es positiva, esto nos indica que los sujetos de la categoría 1 en X

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
(protestantes) tienden a la categoría 1 en Y (Mujer); y los sujetos de la categoría 0 en X
(católicos) tienden a la categoría 0 en Y (Varones). Es decir, que los protestantes
tienden a ser mujeres y los católicos tienden a ser hombres.

Ejercicio

Calcula el coeficiente de Correlación de Spearman

X Y
8 9
Lo que haremos en primer lugar son los rangos, recordemos que este
9 8
coeficiente se hace con rangos. De hecho… si nos fijamos bien, esta
7 4
tabla ya la hicimos anteriormente, así que la voy a poner, puesto que ya
5 7 he explicado como se hacía y no tiene más misterio como para
demorarnos más:

Rangos Rangos
X Y
X Y
8 9
2 1
9 8
1 2
7 4
3 4
5 7
4 3

Ahora pongamos la fórmula aquí para saber qué datos necesitamos más

6 * ∑ d12
rs = 1 –
N * (N2 – 1)

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
De momento sabemos que N=4. ¿Por qué es igual a 4 y no 8 si en total tenemos 8
puntuaciones entre las variables X e Y? Porque estamos hablando de la misma muestra
de sujetos que tienen dos puntuaciones, una en la variable X y otra en Y. Es decir, no
son dos grupos diferentes de sujetos, son el mismo grupo de sujetos puntuando en dos
variables.

Ahora crearemos una columna para hacer d12, bueno en realidad dos para ver con más
detalle cómo se hace. Lo único que tenemos que hacer para obtener d12 es: primero
realizar la diferencia entre cada valor de X e Y, y posteriormente elevarla al cuadrado.
Por último, realizaríamos el sumatorio de esas diferencias porque es lo que se nos pide
finalmente en la fórmula (∑ d12)

RANGOS RANGOS d1 d12


X Y (diferencia
entre Xi – Yi)
2 1 1 1
1 2 -1 1
3 4 -1 1
4 3 1 1
4

Ahora lo tenemos todo listo para calcular nuestra fórmula e interpretar el resultado.

6 * ∑ d12 6*4 24
rs = 1 – = 1- = 1-
N * (N2 – 1) 4* (42 – 1) 4 * 15

24
rs = 1 – = 1- 0’4 = 0’6
60

Como la correlación es positiva, significa que los valores altos de X tienden a aparearse
con valores altos de Y, y los valores bajos de X tienden a aparearse con valores bajos
de Y.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3975173

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TEMA 7: REGRESIÓN LINEAL

Cuando hablamos de análisis de regresión es un análisis que incluye dos variables con
las que trabajaremos y nos permitirán pronosticar o predecir puntuaciones de una de
ellas, a partir de las puntuaciones de la otra. Hay regresión lineal y no lineal, al igual
que las correlaciones; pero solo veremos las de tipo lineal simple.

Si hablamos de regresión lineal lo primero que debemos plantearnos es qué es la


ecuación de la recta en el plano. La ecuación de la recta en el plano es de la forma:

Y = A +BX.

Las constantes A y B son propias de cada recta. Al variar A y/o B, varía la recta; y al
variar la recta, varían A y/o B. La constante A es llamada ordenada en el origen,
representa el valor de Y (ordenada) cuando X=0 (es decir, cuando en el eje de abscisas
nos encontramos en el origen). Es el lugar donde la recta corta el eje Y. La constante B
es llamada pendiente de la recta y representa la inclinación mayor o menor de la
misma.

Diferentes formas de la ecuación. Representación gráfica.

Algunas ecuaciones de rectas y sus correspondientes representaciones gráficas.

Vemos que A=2, por lo


que el punto donde
corta el eje Y cuando
X=0 es en 2. Por otro
lado, B=3, por lo que es
positiva.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
En esta ecuación A=1, por
lo que el punto donde
corta el eje Y cuando X=0

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
es en 1. La B=2 por lo que
la pendiente es positiva.
Vemos que la pendiente
con respecto a la anterior
gráfica es menos inclinada

En esta ecuación, A=1, por


lo que al igual que la
anterior corta en Y=1
cuando X=0. Pero, a
diferencia de la otra, la B= -
2, por lo que la pendiente es
negativa.

Aquí Y=X, por lo que la


pendiente es 1 (1*X=X), así
que es positiva la
pendiente. En esta
ecuación cada valor de X se
corresponde con el mismo
valor pronosticado para la
variable Y.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Aquí tendríamos el mismo caso que
el anterior pero con pendiente
negativa.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Concepto de Regresión

Regresión equivale a predicción o pronostico. La palabra regresión se debe a Galton.


Estudiando la relación entre las características de los padres y las de sus hijos observó
que a padres altos correspondían hijos altos, pero que, en general, se acercaban más a
su media que los padres a la suya. Igualmente, a padres bajos correspondían hijos
bajos, pero que, en general, se acercaban a su media más que los padres a la suya. Es
decir, parecía darse cierta regresión hacia la media. Según este modo de pensar, los
hijos serían más iguales, más homogéneos entre sí que lo eran sus padres. Pasamos
por alto la discusión de esta interpretación y nos limitamos a constatar que el término
regresión fue introducido con ocasiones de estos estudios de Galton sobre la herencia
y que hoy para nosotros equivale a predicción, pronóstico, estimación. Es decir,
ecuación de regresión equivaldrá a ecuación de predicción, de pronóstico, de
estimación.

Concepto y procedimiento de mínimos cuadrados

Intentamos determinar una función matemática (una ecuación) que nos permita
pronosticar la puntuación de cada persona en una variable Y (variable criterio),
conocida su puntuación en otra variable X (variable predictora). Entre todas las
funciones elegimos una muy sencilla: la función lineal, la ecuación de la línea recta
Y’= A + B * X

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Deseamos construir una línea recta tal que haga mínimo el error cometido en los
pronósticos. Esta minimización del error se entiende de la siguiente forma:

(Y1– Y’1)2 + (Y2 – Y’2)2 + (Y3 – Y’3)2 + … + (Yn – Y’n)2 = mínima

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Y= Puntuación obtenida.

Y’= Puntuación pronosticada.

En general: ∑ (Yi – Y’i)2 = mínima (el sumatorio de estos errores residuales


será el más pequeño posible, mínimo)

En esto consiste la creación de las rectas de regresión según el criterio de mínimos


cuadrados.

Veámoslo con un ejemplo: imaginad que medimos una variable X, que es la asistencia
a la asignatura de Análisis de datos; y medimos una variable Y que es la nota que saque
cada alumno en la asignatura. Pensamos que podemos utilizar la asistencia (variable X)
como predictora de la nota en la asignatura (variable Y). ¿Qué pasará? Pues que si
medimos este año las dos variables y establecemos una recta de regresión, no hará
falta que los alumnos del año siguiente hagan examen, porque podemos pronosticar la
nota que sacarán con la asistencia. Esto es lo que nos viene a decir la regresión, visto
así es muy absurdo, pero realmente es un análisis muy útil en investigación. Es lógico
que haya diferencias entre la puntuación que pronostiquemos y la puntuación real que
se va a dar, porque siempre va a haber errores de medición o de cualquier tipo. Ese
factor de error lo vamos a llamar residual, es decir es la diferencia entre la puntuación
pronosticada y la real ( (Yi – Y’i)2 ).

Regresión de Y a partir de X

Mediante estas ecuaciones intentamos pronosticar Y a partir de X. En puntuaciones


directas, partimos de la fórmula de la ecuación de la línea recta: Y’= A + B * X.
Debemos calcular los valores de A y B para que ∑ (Yi – Y’i)2 sea mínima. Para ello,
utilizamos las siguientes fórmulas:

[ n * ∑ (X * Y) ] – [ (∑ X ) * (∑ Y ) ]
B=
[ n * ( ∑ X2) ] – (∑ X )2

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
A= –B*

Ejemplo:

X Y X*Y X2 Y2 n=6
4 7 28 16 49
9 14 126 81 196
16 13 208 256 169
23 11 253 529 121
31 10 310 961 100
37 5 185 1369 25
∑ 120 60 1110 3212 660

Queremos calcular Y’, (Y – Y’) y (Y – Y’)2.

Para empezar debemos traer la fórmula para calcular Y’, y es: Y’= A + B * X

Como necesitamos saber A y B, tendremos que calcular las fórmulas de ambas,


empezando por B:

[ n * ∑ (X * Y) ] – [ (∑ X ) * (∑ Y ) ]
B=
[ n * ( ∑ X2) ] – (∑ X )2

Como disponemos de todos los datos necesarios solo nos queda sustituir:

[ 6 * 1110 ] – [ 120 * 60 ] 6660 – 7200 -540


B= = = = -0’11
[ 6 * 3212 ] – (120 )2 19272 – 14400 4872

Ahora tocaría sacar A, cuya fórmula es: A= –B*

Tenemos que conocer la media de X y de Y.

=
120 = 20 =
60 = 10
6 6

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora sí, sustituyamos en la fórmula:

A= –B* A = 10 – [ (-0’11) * 20 ] A = 10 – (-2’2) A = 12’2

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ya que sabemos qué es A (12’2) y qué es B (-0’11) podemos calcular la fórmula de Y’.

Y’= 12’2 + (-0’11) * X

La X va a equivaler a cada Xi de cada fila que calculemos; es decir, en este caso para el
primer valor tendríamos que sustituir la X por 4, en el segundo por 9, en el tercero por
16, y así sucesivamente.

Ahora podemos seguir construyendo nuestra tabla:

X Y X*Y X2 Y2 Y’ (Y – Y’) (Y – Y’)2


4 7 28 16 49 11’76 -4’76 22’6576
9 14 126 81 196 11’21 2’79 7’7841
16 13 208 256 169 10’44 2’56 6’5536
23 11 253 529 121 9’67 1’33 1’7689
31 10 310 961 100 8’79 1’21 1’4641
37 5 185 1369 25 8’13 -3’13 9’7969
∑ 120 60 1110 3212 660 60 0 50’0252

Lo que nos han pedido aquí es la recta de regresión (Y’). Pero si nos piden que
pronostiquemos la puntuación de un sujeto que ha sacado una puntuación de 5 en la
variable X, tendremos que enunciar la recta (Y’) y después sustituir en X por 5.

Podríamos calcular también la varianza error (S2e). Para calcularla necesitamos en el


numerador el sumatorio de los residuos al cuadrado (Y – Y’)2 y en el denominador
tendremos el tamaño de la muestra (n). En este caso S2e = 8’337533. Este dato nos dirá
si nuestros errores son pequeños o grandes.
∑ (Y – Y’)2
S2 e= n

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
También podemos calcular el coeficiente de determinación (r2xy) es el coeficiente de
correlación de Pearson elevado al cuadrado. En este caso nos saldría 0’17. Este dato
nos da información sobre el porcentaje de la variabilidad de una variable que está
explicado por la otra. Normalmente se expresa en tanto % (17%) y se interpreta como:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
un 17% de la variabilidad de la variable X está explicado por la variable Y.

Ejercicio

Dadas las variables “comprensión lectora” y “vocabulario” (cuyos valores aparecen en


la siguiente tabla), predecir las puntuaciones para la variable “Vocabulario” en función
de la puntuación en “Comprensión lectora”. Calcular, también, la varianza de la
regresión y el coeficiente de determinación. ¿Qué puntuación en vocabulario tendrá
un sujeto que ha obtenido una puntuación de 20 en comprensión lectora?

Comprensión lectora Vocabulario (Y)


(X)
12 14
4 7
6 9
N=6
8 10
10 6
5 1

Empecemos añadiendo a la tabla los datos que vamos a necesitar saber para calcular:
B, A y por lo tanto la recta de regresión; y el coeficiente de Pearson.

(X) (Y) X*Y X2 Y2


12 14 168 144 196
4 7 28 16 49
6 9 54 36 81
8 10 80 64 100
10 6 60 100 36
5 1 5 25 1
45 47 395 385 463

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Con estos datos ya podemos empezar a calcular B:

[ n * ∑ (X * Y) ] – [ (∑ X ) * (∑ Y ) ]
B=
[ n * ( ∑ X2) ] – (∑ X )2

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
[ 6 * 395 ] – [ 45 * 47 ] 2370 – 2115 255
B= = = = 0’89
[ 6 * 385 ] – (45)2 2310 – 2025 285

Ahora tocaría sacar A: A= –B*

Tenemos que conocer la media de X y de Y.


45 47 = 7’83
= = 7’5 =
6 6
Ahora sí, sustituyamos en la fórmula:

A= –B* A = 7’83 – [ 0’89 * 7’5 ] A = 7’83 – 6’675 A = 1’155

Ahora podemos sacar la recta de regresión:

Y’= A + B * X Y’= 1’155 + 0’89 * X

Ya podríamos contestar a la pregunta de: ¿Qué puntuación en vocabulario tendrá un


sujeto que ha obtenido una puntuación de 20 en comprensión lectora?

Y’= 1’155 + 0’89 * 20 Y’= 18’95

(Este es el resultado que me sale a mí después de hacerlo 20 veces, pero la


profesora dijo que salía 19’05, comprobadlo por si acaso)

Calculemos ahora el coeficiente de Pearson para sacar posteriormente el coeficiente


de determinación (r2xy).

[ N * ∑ ( Xi * Yi ) ] – [ ∑Xi * ∑Yi ]
rxy =

√ [ N * ∑ ( Xi2) ] – ( ∑Xi )2 * √ [ N * ∑ (Yi2) ] – (∑Yi)2

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
[ 6 * 395 ] – [ 45 * 47 ]
rxy =

√ [ 6 * 385 ] – (45)2 * √ [ 6 * 463 ] – (47)2

2370 - 2115 255


rxy = =
√ 2310 - 2025 * √ 2778 - 2209 √ 285 * √ 569

255 255
rxy = = = 0’63
16’88 * 23’85 402’59
Ahora para obtener el coeficiente de determinación tenemos que elevarlo al cuadrado:

r2xy = 0’4

Ahora hagamos las columnas de las tablas que nos quedan para poder hacer la
varianza error de la regresión.

(X) (Y) X*Y X2 Y2 Y’ (Y-Y’) (Y-Y’)2


12 14 168 144 196 13’615 0’385 0’1482
4 7 28 16 49 7’385 -0’385 0’1482
6 9 54 36 81 9’165 -0’165 0’0272
8 10 80 64 100 10’055 -0’055 0’0030
10 6 60 100 36 6’495 -0’495 0’2450
5 1 5 25 1 2’045 -1’045 1’0920
45 47 395 385 463 1’6636

Recordemos que para obtener la varianza error de la regresión necesitamos dividir el


sumatorio de los residuales al cuadrado, entre n:
∑ (Y – Y’)2 1’6636
S 2e = n = 6 = 0’28

(Este es el resultado que me sale a mí después de hacerlo 20 veces, pero la


profesora dijo que salía 24’91, comprobadlo por si acaso)

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-3998929

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
TEMA 8: ORGANIZACIÓN Y DESCRIPCIÓN DE DATOS CON MÁS DE UNA VARIABLE

Cuando queremos describir conjuntamente dos variables estadísticas, el primer paso


será (igual que en el caso de la estadística univariada), representar los datos en una
tabla de frecuencias. Ahora, a cada caso le corresponde no un valor sino dos o incluso
tres (uno para cada una de las variables). Así, en el caso de que intentemos relacionar
el peso y la estatura de las personas, a cada persona le asociamos un par de valores
(peso, estatura). Los pares de valores así formados constituyen la distribución
bidimensional. La tabla de frecuencias consiste en una tabla de doble entrada (una
variable en filas y otra variable en columnas) en la que se recogen tanto las frecuencias
de cada una de las variables por separado como los pares de puntuaciones que cada
caso obtiene en ambas variables (frecuencia conjunta). El estudio conjunto de dos
variables nos permite analizar las relaciones entre ellas. Podemos tener cualquier
combinación de variables cuantitativas/cualitativas.

Organización y representación de los datos con más de una variable

Los datos se organizan en tablas de contingencia. Para representar, por ejemplo, dos
variables cualitativas, la variable Xi (con I categorías) y la variable Yj (con J categorías)
se construirá una tabla de doble entrada con I filas y J columnas. Dentro de cada casilla
de la tabla se encontrarán las frecuencias conjuntas de las dos variables (n ij).

j=1 j=2 ……………….. J n


i=1 n11 n12 ……………….. n1j n1
i=2 n21 n22 ……………….. n2j n2
i=3 n31 n32 ……………….. n3j n3
……………….. ……………….. ……………….. ……………….. ………………..
I nI1 nI2 ……………….. nIJ nI
nJ n1 n2 nJ N

Normalmente la variable X va en filas y la Y en columnas. En n11 se recogerá la


frecuencia absoluta (el número de sujetos) que cumplen la condición valor 1 en la
variable X y valor 1 en la variable Y; y así sucesivamente. La columna y fila de n, la

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
última columna y la última fila es la descripción de cada variable por separado, se
llaman marginales.

Ejemplo

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Tenemos dos variables:

- La variable Xi: Género con I=2 categorías.


- La variable Yi: Tabaquismo con J=3 categorías

Donde:

- N= 150 sujetos (100 varones y 50 mujeres).


- 60 fumadores, 60 no fumadores y 30 exfumadores.
- Con 50 varones no fumadores n12.
- Frente a 10 mujeres no fumadores n22.

Donde

- N es el total de sujetos de la muestra.


- Las casillas de la tabla contienen la distribución de frecuencias conjuntas (n ij).
- Los laterales derecho e inferior de la tabla contienen la distribución de
frecuencias marginales (ni y nj).

Las distribuciones de frecuencias conjuntas también pueden expresarse en términos


relativos

pij = nij/n

¿Cómo hemos obtenido estos valores? Dividiendo la categoría nij/n, que n=150. Si yo
divido n13/n que en este caso sería como dividir 20 (porque corresponde a la casilla

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


exfumador y varón) entre 150 y colocaríamos en nuestra nueva tabla de frecuencias el
resultado que sale, que es 0’13.

Además de las frecuencias absolutas y relativas, también aparece el concepto de


distribución condicional

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Distribución de tabaquismo dado que se es varón n/i=1

Distribución de género dado que se es fumador n/j=1

Las distribuciones de frecuencias condicionales también pueden expresarse en


términos de frecuencias relativas, por ejemplo:

Distribución de Y condicionada a X

30/100= 0’30 de los varones, un 30% fuma

De los varones un 30% fuma, un 50% no fuma y un 20% es exfumador.

Aquí nos tenemos que preguntar es de todos los varones cuantos son fumadores, o de
todas las mujeres cuantas son no fumadoras. El 100% lo consideramos cada una de las
categorías de la variable género.

Tenemos que tomar esta tabla siempre como modelo para obtener las casillas que
queramos. Por ejemplo, para conseguir el 0’3 ese tenemos que dividir 30 de la casilla
varón y fumador entre el 100 de la casilla ni. Y para conseguir el 0’6 que tenemos en la
casilla de la tabla nueva de mujer fumadora tenemos que dividir el 30 de la tabla vieja
entre 50 de ni.

Distribución de X condicionada a Y

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
30/60=0’50 De los fumadores, un 50% son varones

De los no fumadores, el 83% son varones y el 17% son mujeres.

De los exfumadores, el 67% son varones y el 33% son mujeres.

Para conseguir esta tabla es igual que en la anterior. La n en la que nos tenemos que
fijar es en la fila de Pj.

Cuando estamos presentando dos variables de forma conjunta podemos hacerlo


mediante las tablas que acabamos de ver o podemos utilizar gráficos.

La representación gráfica de dos variables cualitativas puede verse en las siguientes


gráficas. Para dos variables cualitativas la representación gráfica podría ser un
diagrama de barras.

En la primera tenemos el género en el eje x y la condición de tabaquismo en Y. En la


segunda variable la condición de tabaquismo en el eje X y el género en Y.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


En el caso de una variable cualitativa y otra cuantitativa: se describe la variable
cuantitativa condicionada a las categorías de la cualitativa. Relacionamos la nota media
de un grupo de alumnos en una asignatura con su nivel de ansiedad ante los
exámenes.

El gráfico es más simple, porque la cualitativa siempre irá en el eje X y la cuantitativa


va en el eje Y.

Descripción conjunta de tres variables

Esta es la representación gráfica

Si dos son cualitativas la tercera tiene que ser cuantitativa. Una de las variables
cualitativas irá en el eje X, la otra será en series, es decir, con líneas distintas.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejercicio
Estamos interesados en averiguar si la motivación guarda relación con el rendimiento
académico. Para ello, se selecciona una muestra de 15 alumnos y se les evalúa en las
variables MOTIVACIÓN (A= alta; M= media y B=baja), CALIFICACIÓN (AP=aprobado;

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
SS=suspenso) y FALTAS a clase durante el curso. Los resultados obtenidos han sido los
siguientes.

Sujeto Motivación Calificación Faltas


1 A AP 2
2 B SS 7
3 M AP 1
4 A AP 2
5 A SS 3
6 B AP 3
7 M AP 2
8 A AP 1
9 A AP 0
10 M SS 5
11 M SS 4
12 A AP 2
13 A AP 3
14 B SS 6
15 B SS 5

1. Elaborar la distribución de frecuencias absolutas y relativas para las variables


“motivación” y “calificación”.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Elaborar la distribución de frecuencias conjuntas y la representación gráfica para las
variables “motivación” y “calificación”.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
3. Elaborar la distribución de frecuencias conjuntas y las distribuciones de frecuencias
condicionales en términos relativos para las variables “motivación” y “calificación”.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
4. Responder a las siguientes preguntas:
- ¿Qué porcentaje de alumnos aprueba y tiene motivación alta?
En esta pregunta debemos fijarnos en la tabla %total ya que no nos pide ninguna
“condición”. Sería el 40%.
- De los que aprueban, ¿qué porcentaje tiene motivación baja?
Aquí si nos piden una condición y es que estén aprobados, así que nos fijamos en
%calificación, porque lo importante es que estén aprobados. Sería el 11’1%.
- De los alumnos con motivación alta, ¿qué porcentaje suspende?
Aquí nos piden la condición de que tengan motivación alta, así que miramos en
%Motivación. Sería el 14’3%.
5. Describir la relación entre las variables “motivación” y “faltas” y elaborar la
representación gráfica de ambas.
Aquí no sé por qué quiere las medias, a modo “resumen”.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Pero básicamente se calculan dividiendo el número totales de faltas en cada categoría
de motivación entre el número de personas totales de cada categoría de motivación.
Por ejemplo, para la categoría de motivación alta ha habido en total 13 faltas (entre
aprobados y suspensos), pues debemos dividirlo entre el total de personas que tienen
motivación alta que son 7 personas. (13/7= 1’86).
6. Representar en una sola gráfica las tres variables.

Pongo la corrección de la profesora porque no entiendo como lo ha hecho.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4028871

1 descarga sin publicidad = 1 coin


TEMA 10: INTRODUCCIÓN A LA PROBABILIDAD

Aquí empieza la estadística inferencial y nos permite extrapolar a la población lo que


observamos en la muestra.

INTRODUCCIÓN

En primer lugar vamos a ver primero unas definiciones. Un experimento es toda


intervención controlada y planificada de un investigador sobre unos objetos. Un
experimento predecible es aquel que si se realiza repetidamente en unas condiciones
aproximadamente idénticas, conducirá a los mismos resultados una y otra vez (ej:
ebullición del agua. Siempre hervirá a los 100 grados centígrados). Un experimento
aleatorio es cuyo resultado no puede ser pronosticado con exactitud, porque aunque
mantengamos las mismas condiciones, conducirá a resultados distintos en cada
ocasión, ya que intervienen una serie de factores llamados aleatorios que son
impredecibles (ej: lanzar una moneda). El Espacio Muestral (E) es el conjunto de todos
los posibles resultados de un experimento aleatorio. El punto muestral es cada uno de
los posibles resultados de un experimento aleatorio (Por ejemplo en el lanzamiento de
moneda hay dos puntos muestrales: cara o cruz). Hay varios tipos de Espacio muestral:

• Discreto finito: tiene un número limitado o finito de puntos muestrales (lanzar


un dado).
• Discreto infinito (o infinito contable): tiene un número infinito numerable de
puntos muestrales (lanzar un dado hasta que salga cuatro).
• Continuo (o infinito no contable): tiene infinitos puntos muestrales no
numerables (lanzar una piedra a un estanque).

Los espacios muestrales son conjuntos de sucesos elementales y estos, a veces, pero
no siempre, son números. Al representar los sucesos elementales por números se
crean lo que se denominan variables aleatorias. Una variable aleatoria es una función
que asocia un número real, y sólo uno, a cada suceso elemental del espacio muestral
de un experimento aleatorio. Las variables aleatorias se representan con letras

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
mayúsculas. Para referirnos a un valor concreto de la variable, utilizaremos la letra
minúscula y un subíndice que designe a ese valor concreto.

TEORÍA DE SUCESOS.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Un suceso es cualquier subconjunto del espacio muestral (E). Podemos clasificar los
sucesos siguiente dos criterios. El primero es según el número de elementos del
espacio muestral:

• Suceso elemental o simple. Contiene un solo elementos.


• Suceso compuesto. Consta de 2 o más elementos.
• Suceso cierto o seguro. Consta de todos los elementos.
• Suceso imposible. No consta de ningún elemento de E (Ø)

En segundo lugar, tenemos la clasificación atendiendo a las operaciones de los


conjuntos:

• Suceso contrario.
• Unión de sucesos.
• Intersección de sujetos.
• Diferencia de sucesos.
• Sucesos incompatibles o mutuamente excluyentes.
• Sucesos equiprobables. Todos los elementos tienen la misma probabilidad de
ocurrencia.

INTRODUCCIÓN A LA TEORÍA DE LA PROBABILIDAD.

Tenemos dos enfoques. El primero es el enfoque interpretativo que tiene dos


variantes:

• Objetivo:
o Clásico o “a priori”:
▪ Equiprobabilidad.
▪ Conocimiento del Espacio Muestral
o Frecuentista o “a posteriori”: Frecuencia relativa.
• Subjetivo o Bayesiano:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Y el enfoque axiomático:

• La probabilidad del suceso cierto o seguro es 1.


• La probabilidad de cualquier otro suceso es ≥ 0.
• Si dos sucesos son mutuamente excluyentes, la probabilidad de la unión es

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
igual a la suma de probabilidades.

LA PROFESORA NO HA EXPLICADO MÁS DE ESTO.

MODELOS PROBABILÍSTICOS DISCRETOS.

La variable aleatoria discreta es aquella que adopta valores tales que se pueden
encontrar 2 consecutivos entre los cuáles no hay valores asumibles por la variable. Por
ejemplo, el número de ratas que salen de un laberinto por la parte izquierda. Las
distribuciones discretas de probabilidad son:

• Distribución de Bernoulli.
• Distribución Binominal.
• Distribución de Pascal (Binomial negativa).
• Distribución de Poisson.
• Distribución Geométrica.
• Distribución Hipergeométrica.
• Distribución Multinomial.

Hay conceptos fundamentales:

• Función de Probabilidad. Es la función que asocia, a cada valor de la variable


aleatoria la probabilidad de que adopte ese valor. f(xI) = P (X = xI)
• Función de distribución. Es la función que asociada a cada valor de la variable
aleatoria la probabilidad de que adopte, como mucho, ese valor. F(xI) = P(X≤ xI)

Estas funciones nos permitirán llevar a cabo nuestras afirmaciones. Las funciones
anteriores son equivalentes a frecuencia relativa (la primera) y frecuencia relativa
acumulada (la segunda), pero aquí, se refiere a probabilidades, y no al cociente entre
cada frecuencia absoluta y el tamaño de la muestra.

MODELOS PROBABILÍSTICOS CONTINUOS.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Una variable aleatoria continua es aquella que puede tomar un número infinito no
contable de valores. Puede asumir cualquier valor correspondiente a un número real.
Hay 4 distribuciones continuas de probabilidad:

• Distribución Normal.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
• Distribución Chi-Cuadrado de Pearson.
• Distribución “t” de Student.
• Distribución F de Snedecor.

Tenemos otras dos funciones:

• Función de Densidad de Probabilidad (en torno a un valor). Es


la función que asocia valores de la variable con ordenadas o
alturas de la curva en cada punto.
• Función de Distribución. Es la función que asocia, a cada valor de la variable
aleatoria, la probabilidad de que ésta adopte como mucho,
ese valor.

F(xi) = P(X ≤ xi)

En la práctica, el trabajo con variables aleatorias continuas, en Psicología, consiste en


hallar probabilidad que se reducen, casi siempre, a uno de los 3 casos siguientes:

P(X ≤ xi ) = F(xi) P(X ≤ xi ) = 1 - P(X ≤ xi ) = P(xj ≤ X ≤ xi )


1- F(xi)hace referencia a la variable en general y la minúscula
Recordemos que la X mayúscula
con el subíndice a los valores de esa variable.

El primer caso es el que utilizaremos cuando necesitamos saber la probabilidad de que


la variable tome como máximo un valor. El segundo es la probabilidad de que la
variable sea mayor o igual que un valor. El tercero es la probabilidad de que la variable
se encuentre en un intervalo de valores.

La casi totalidad de casos prácticos en psicología se refieren a variables aleatorias


cuyas funcione se ajustan a ciertos modelos teóricos. Conocer esos modelos y saber

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
utilizarlos suele ser suficiente para resolver la práctica totalidad de los problemas
reales. Para estos casos nosotros recurriremos a las tablas de las distribuciones.

Distribución normal

A la hora de operar con la distribución normal nos pueden dar la variable en


puntuación directa, que tendremos que convertirla en típica, y una vez convertida
podremos buscar en la tabla. O directamente nos pueden dar la puntación típica.

Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media
10 y varianza 4. Transformarla en una normal tipificada. X: N (10,4).

Para transformarla en una normal tipificada, transformamos la puntuación directa en


puntuación típica.

𝑋− µ 𝑋− 10
Zx = En el ejemplo, la nueva variable sería: Zx =
𝜎 2

Es dos porque teníamos que hacer


la raíz cuadrada de 4 para conseguir la
desviación típica.

Esta nueva variable se distribuye como una normal tipificada, permitiéndonos, por
tanto, conocer la probabilidad acumulada en cada valor. Zx: N (0,1).

La tabla que tendremos que consultar para este tipo de ejercicios es la de distribución
normal. En la primera columna de la tabla (z) nos aparece el número entero y el primer
decimal de la puntuación típica. En la primera fila nos aparece el segundo decimal.
Todo lo que hay dentro de la tabla son las probabilidades asociadas a esos valores. Es
decir, si cogemos el -0’00 dentro de la tabla vemos que tiene una probabilidad de 0’5,
eso es que la probabilidad de que la variable tome como máximo ese valor es de 0’5.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Cómo se utiliza la tabla de la distribución normal? La tabla de la distribución normal se
puede utilizar de dos formas:

1. Podemos partir de una puntuación directa (hay que transformarla en


puntuación típica).

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. Podemos partir de un porcentaje (hay que transformarlo en proporción).

En el primer caso, una vez hallada la puntuación típica, se busca el entero de dicha
puntuación en la columna de la izquierda, y en la primera fila se buscan las dos cifras
decimales (esto implica que las puntuaciones típicas que vayamos a utilizar deben
redondearse a dos decimales). El valor que coincida con la intersección de fila y
columna será la proporción de valores iguales o menores que el valor que estamos
utilizando, o lo que es lo mismo, la proporción de observaciones (porcentaje si lo
multiplicamos por 100) iguales o menores que el valor usado. Por ejemplo, para la
puntuación 0’94 la probabilidad es de 0’8264, es la probabilidad de que la variable
tome como máximo ese valor.

En el segundo caso, buscamos dentro de la tabla la proporción que más se aproxime a


la nuestra, la fila en donde esté dicha proporción es el entero de la puntuación típica y
la columna nos da los dos decimales de la puntuación típica. Esta puntuación típica es
la que deja por debajo la proporción de observaciones de la que hemos partido.

La columna de la izquierda nos indica el valor cuya probabilidad acumulada queremos


conocer. La primera fila nos indica el segundo decimal del valor que estamos
consultando.

Ejercicio:

Queremos conocer:

• La probabilidad acumulada en el valor 2’75.


• La probabilidad acumulada en el valor 0’67.
• La probabilidad acumulada en el valor 1’35.
• La probabilidad acumulada en el valor 2’19.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Para el primero lo que tenemos que hacer es buscar en la columna de Z el valor 2’7, y
una vez localizado tendríamos que situarnos en la columna de 5 como segundo
decimal.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Vemos que sale 0’997, así que sería una probabilidad de 0’997 de que la variable tome
como máximo el valor de 2’75.

Y así con todos. Así que pondremos la solución directamente.

La probabilidad acumulada en el valor 0’67: una probabilidad de 0’6486 de que la


variable tome como máximo el valor de 0’67.

La probabilidad acumulada en el valor 1’35: una probabilidad de 0’9115 de que la


variable tome como máximo el valor de 1’35.

La probabilidad acumulada en el valor 2’19: una probabilidad de 0’9857 de que la


variable tome como máximo el valor de 2’19.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Si nos preguntan: ¿qué valor de la variable es aquel que deja por debajo una
probabilidad del 60% o 0’6?

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Nos vamos dentro y buscamos dentro el 0’6 o el valor que más se aproxime. En este
caso es el valor 0’26 quien deja por debajo una probabilidad del 60%.

Ejemplo: El salario medio de los empleados de una empresa se distribuye según una
distribución normal, con media 30.000 euros y desviación típica 6.000 euros. Calcular
el porcentaje de empleados con un sueldo inferior a 42.000 euros.

Lo primero que haremos será transformar esa distribución en un normal tipificada,


para ello se transforma la puntuación X en típica Zx, con la fórmula: X menos su media
y dividida por la desviación típica, es decir:

𝑋− µ
Zx =
𝜎

𝑋− 30000
En el ejemplo, la nueva variable sería Zx =
6000

Esta nueva variable se distribuye como una normal tipificada. La variable Zx que
corresponde a una variable X de valor 42.000 es:

42000− 30000
Zx = =2
6000

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Ya podremos consultar en la tabla la probabilidad acumulada para el valor 2 (2,00 en la
tabla) equivalente a la probabilidad de sueldos inferiores a 42.000 euros. Esta
probabilidad es de 0’9772. Por lo tanto, el porcentaje de empleados con salarios
inferiores a 42.000 euros es del 97’72%.

Distribución “t” de Student, Chi-cuadrado o F de Snedecor.

En las 3 encontramos algo novedoso que son los grados de libertad (g.l.), que son el
número de datos que podemos escoger libremente.

Ejemplo: Si me piden que proporcione un conjunto de 4 elementos -> los escojo


libremente.

Si me piden 3 números que sumen 40 -> escojo libremente los 2 primeros, pero el
tercero no, ya que me viene impuesto por el resultado, por lo que tengo 2 grados de
libertad (n-1)

Distribución “Chi-cuadrado” (χ2) de Pearson

Para calcular los valores y probabilidades de esta distribución, hay que utilizar la tala
de la distribución “Chi-cuadrado”. La tabla de la distribución chi-cuadrado se puede
utilizar, como la de la normal, de dos formas.

1. Podemos partir de una puntuación chi-cuadrado.

2. Podemos partir de un porcentaje.

En el primer caos, debemos buscar la puntuación Chi-cuadrado más cercana a la


nuestra, dentro de la tabla de la distribución, en la fila correspondiente a los grados de
libertad que hayamos calculado. La columna en la que se encuentre el valor nos dará el
percentil (porcentaje o %) de observaciones iguales o menores que la puntuación Chi-
cuadrado que tenemos.

En el segundo caso, buscamos el porcentaje que tengamos, o el más cercano a él, en


las columnas de percentiles. La intersección de la columna de percentiles con la fila
correspondiente a los grados de libertad que hayamos calculado nos dará la
puntuación Chi-cuadrado que corresponde al porcentaje de partida. La interpretación
que se le puede dar a la puntuación Chi-cuadrado encontrada es la siguiente:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ésa es la puntuación Chi-cuadrado que deja por debajo del porcentaje de
observaciones del que hemos partido.

A la izquierda de esta tabla, en la primera columna (g.l) tenemos los grados de libertad
y en la primera fila tenemos los percentiles. Es decir, en este caso lo que hay dentro de

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
la tabla son las puntuaciones de la variable. Vamos a localizar la puntuación y subiendo
hacia arriba veremos el percentil o porcentaje de observaciones que deja por debajo-
Normalmente nos darán los g.l o podremos calcularlo, y nos pueden dar la puntuación
o el percentil. Si nos dan percentil y g.l, lo que tendremos que hacer es buscar
utilizando la columna g.l y los percentiles de la primera fila. Si lo que nos dan es la
puntuación y los grados de libertad, pues en la fila que nos haya tocado de g.l,
haciéndolo coincidir con la puntuación que nos den, tendremos que subir hacia arriba
para conocer el percentil que buscamos.

Distribución “t” de Student

Para calcular los valores y probabilidades de esta distribución, hay que utilizar la tabla
de la distribución t.

En la primera columna de la tabla tenemos los grados de libertad, y en la primera fila


tenemos los percentiles. La única diferencia estriba en que la distribución t de Student
es una distribución simétrica, por lo que los percentiles inferiores al percentil 50 darán
la misma puntuación que los superiores pero con signo negativo.

1. Si partimos de una puntuación t, la buscamos dentro de la tabla en la fila


correspondiente a los grados de libertad que tengamos. La columna en la que
se encuentre la puntuación, nos da el percentil (porcentaje o %) de
observaciones que son iguales o menos que dicha puntuación (porcentaje de
observaciones que quedan por debajo de la puntuación).

2. Si partimos de un porcentaje, buscamos el percentil que más se aproxime a


él. La intersección de la columna de percentiles con la fila correspondiente a los
grados de libertad que tengamos, nos dará la puntuación t que corresponde al
porcentaje de partida. Esta puntuación es la que deja por debajo el porcentaje
de observaciones que tenemos.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Distribución F de Snedecor

Para calcular los valores y probabilidades de esta distribución, hay que utilizar las
tablas de la distribución F. La tabla de la distribución F es distinta de las anteriores,
dado que presenta una serie de características que la diferencia de las demás. Los

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
grados de libertad 1 son los del numerador aparecen en la primera fila y los grados de
libertad 2 que son los del denominador aparecen en la primera columna. Entonces si a
mi me dicen que la variable se distribuye con grados de libertad 9 y 14 lo que haremos
será localizar el 9 en la primera fila y el 14 en la primera columna y la intersección de
ambos es la puntuación que podemos estar buscando, pero si no es pues pasamos a la
siguiente tabla, y así sucesivamente hasta que encontremos la puntuación buscada.

1. En vez de una sola tabla, tenemos tantas como percentiles. Cada una de
estas tablas se corresponde con una columna de las distribuciones de chi-cuadrado o t-
Ello es debido a que en la distribución F tenemos dos valores de grados de libertad.

2. Debido a lo anterior, aunque a la hora de buscar en las tablas tenemos las


mismas opciones que en las dos distribuciones anteriores, la manera de hacerlo es
distinta.

Si partimos de una puntuación F, deberemos buscar en cada una de las tablas el valor
que se encuentre en la intersección de los dos valores de grados de libertad que
tengamos. Esto hay que hacerlo para cada una de las tablas hasta que encontremos
nuestro valor o el más cercano a él. El percentil que corresponda a esa tabla es el
porcentaje o % de observaciones iguales o menores que nuestra puntuación.

Si partimos de un porcentaje, debemos utilizar la tabla del percentil que se


corresponda con ese porcentaje, en esa tabla deberemos buscar la intersección que
correspondan a los dos valores de grados de libertad que tengamos. El valor que
aparezca en esa intersección es la puntuación F que buscamos.

En percentiles inferiores al 75 lo que haremos será una transformación invirtiendo los


grados de libertad y dividiendo 1 entre el valor que nos den en la tabla. Esto lo
veremos más adelante.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Ejercicios

Distribución normal

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1. El salario medio de los empleados de una empresa se distribuye según una
distribución normal, con media 30.000 euros y desviación típica 6.000 euros. Calcular
el porcentaje de empleados con un sueldo inferior a 42.000 euros. (Este esta hecho
un poco más arriba pero la profesora no lo explicó en clase).

Aquí lo único que tenemos que hacer es tipificar las puntuaciones:

𝑋− µ 42000− 30000
Zx = = = 2
𝜎 6000

Lo único que hemos hecho ha sido sustituir cada dato en su respectiva casilla. La media

(µ) es 30.000; la desviación típica (𝜎) es 6.000 y por último la X es el valor de la


variable que nos dan, que en este caso es 42.000.

El número resultante ha sido dos, así que vamos a la tabla y buscamos en la primera
columna “2,0” y en la primera fila el segundo decimal “0”. La intersección de ambas es
la probabilidad que se nos está preguntando.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Por lo tanto, hay un porcentaje de 97’72% (0’9772 en la tabla, pero multiplicado por
100 para pasarlo a porcentaje) de empleados que perciben un sueldo inferior a 42.000
euros.

2. A un examen de oposición se han presentado 2.000 aspirantes. La nota media ha


sido un 5’5, con una varianza de 1’5.

a) Tan sólo hay 100 plazas. Usted ha obtenido un 7’7. ¿Sería oportuno ir
organizando una fiesta para celebrar su éxito?

Primero tenemos que ver con ese 7’7 que hemos sacado en qué nivel porcentual nos
hemos situado. Para ello, vamos a empezar calculando el valor de la normal tipificada
equivalente:

𝑋− µ 7,7− 5,5 7,7− 5,5


Zx = = = = 1’80
𝜎 √1,5 1,22

A este valor de Zx si buscamos en la tabla (en la primera columna buscamos 1’8 y en la


primera fila 0, y buscamos la intersección de ambos) vemos que tiene una probabilidad

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
acumulada de 0’9641, que viene a ser 96’41%. Esto quiere decir que por encima de
nosotros tan solo está el 3’59% (hemos restado 100% - 96’41%) de los aspirantes.

Pero ¿cómo sabemos ahora si hemos quedado dentro de esas 100 plazas?, esto es lo
mismo que preguntarnos si estamos entre los 100 primeros o si hay como máximo 99

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
personas por encima de nosotros. Para saberlo hacemos una simple regla de 3.

Si se han presentado 2.000 aspirantes y esto es el 100%, ¿cuánto es el 3’59%?

2.000 – 100%
X – 3’59%

X= 71’80. Esto quiere decir que solo hay 72 personas (redondeando vaya) por encima
de mí, es decir, estoy dentro de los 100 primeros y por lo tanto hay suficientes
probabilidades como para celebrar esa fiesta.

b) Va a haber una 2ª oportunidad para el 20% de las notas más altas que no se
hayan clasificado. ¿A partir de que nota se podrá participar en esta
“repesca”?

Hay que estar atentos a lo que nos piden. Dice el “20%” de notas más altas, así que
tenemos que buscar el 80% de la probabilidad, ya que por arriba nos quedaría el 20%
restante. Cuando buscamos porcentajes superiores lo que hacemos es 100-ese
porcentaje y el resultado es lo que vamos a tener en la tabla.

Dicho esto buscamos dentro la tabla el valor 0’80 o el más cercano.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
En este caso el más cercano es 0’7995, ya que solo se queda a 0’0005 de 0’8; el otro se
pasa por 0’023 puntos. Una vez que lo hayamos encontramos vemos que la
puntuación típica que corresponde a este porcentaje es 0’84. Por tanto, el valor de Zx
corresponde a 0’84 (aproximadamente). Ahora lo único que tenemos que hacer es una

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
ecuación.

𝑋− µ
Zx =
𝜎

𝑋− 5,5
0’84 =
√1,5

0’84 * 1’22 = X – 5’5

1’0248= X – 5’5

1’0248 + 5’5 = X X= 6’5248.

Por lo tanto 6’52 (redondeando) es la nota a partir de la cual se podrá acudir a la


repesca. La nota que deja por debajo el 80% de las puntuaciones, y por tanto, deja por
encima el 20% de las puntuaciones.

Distribución chi-cuadrado

1. ¿Qué porcentaje de observaciones dejará por debajo la puntuación χ2 = 11’65 en


una muestra de 20 sujetos?

En este ejemplo debemos buscar, dentro de la tabla, el valor que más se aproxime a la
puntuación que tenemos (11’65), fijándonos tan solo en la fila correspondiente a los
grados de libertad que nos vienen dados por la muestra y recordamos para obtenerlos
es n-1 (g.l.= n-1 → 20-1=19). La fila de los grados de libertad en la que nos tenemos
que fijar es la de g.l.=19.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
El valor más cercano que encontramos en esa fila es 11’651, y la columna en la que se
encuentra ese valor, es la que corresponde al percentil 10, por lo que podemos
concluir que la puntuación Chi-Cuadrado (11’65) deja por debajo el 10% de las
observaciones.

2. Calcula la puntuación χ2 que deja por debajo el 95% de las observaciones, para
una muestra de 11 sujetos.

Este ejercicio es como el anterior pero a la inversa, aquí nos dan los grados de libertad
y el percentil que tenemos que mirar. Los grados de libertad son: 11-1= 10 g.l. Por lo
que miramos en la fila de g.l. 10 y la columna del 95, observamos que la puntuación
que nos sale es 18’307. Por lo tanto:

Χ2(9,95. 10) = 18’307 es la puntuación que deja por debajo al 95% de


observaciones.

Donde 0’95 es la proporción de observaciones que quedan por debajo (95% el


porcentaje) y 10 son los grados de libertad.

3. Tenemos una variable aleatoria que se distribuye según Chi-cuadrado χ2 con 7 g.l.
a. ¿Qué valor deja por debajo una probabilidad de 0’9?

Aquí nos lo están regalando vaya. Te dicen que los grados de libertad son 7, ya
tenemos la primera columna resuelta. Por otro lado, nos dice que busquemos un valor
que deje por debajo una probabilidad de 0’9, o lo que es lo mismo, que deje el 90% por

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
debajo; esto es el percentil 90. Pues simplemente tenemos que localizar el valor de la
intersección entre los g.l. 7 y el percentil 90.

El valor resultante es 12’017.

b. ¿Qué valor deja por encima una probabilidad de 0’05?

Recordemos que siempre que nos pidan un valor “que deje por encima” tenemos que
restar 1- el valor (en probabilidad) de lo que nos pidan. Que un número deje por
encima el 0’05 quiere decir que deja por debajo el complementario, es decir, 0’95
(Recuerda que los complementarios suman 1). En esta pregunta nos está pidiendo Χ2 7.
0’95

P (X > ¿?) = 0’05 → P(X < ¿?) = 0’95 → Χ2 7, 0’95

Así que nos vamos a la fila en la que g.l. es 7 y a la columna de probabilidad de 0’95 y
obtenemos:

Χ27. 0’95 = 14’067

El valor 12’067 deja por encima de sí una probabilidad de 0’05.

c. ¿Cuál es la probabilidad de que X tome valores menores que 16?

Aquí nos están preguntando P (x < 16), es decir, el número 16 habrá que buscarlo
dentro de la tabla (o un valor aproximado) pero si que hay que quedarse en la fila de
los 7 g.l.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
El valor más próximo a 16 es 16’013 que deja por debajo de sí una probabilidad de
0’975.

d. ¿Cuál es la probabilidad de que X tome valores mayores que 3?

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Aquí nos preguntan P (X > 3), es decir, por complementario 1 – P(X < 3). El número 3
habrá que buscarlo dentro de la tabla (o un valor aproximado) pero hay que quedarse
en la fila de los 7 g.l.

En este caso el valor que encontramos más cercano a 3 es 2’833, que deja por debajo
de sí una probabilidad de 0’1.

Distribución t de Student

1. ¿Qué porcentaje de observaciones dejará por debajo la puntuación t= 0’86 en


una muestra de 20 sujetos?

Aquí nos pide básicamente que busquemos dentro de la tabla la puntuación de 0’86,
pero nos da los g.l. que son 20-1= 19 g.l. Así que dentro de la fila de 19 g.l. es donde
tenemos que buscar el valor 0’86 o el que más se aproxime. Lo encontramos en el
percentil 80, así que deja un 80% de observaciones por debajo.

2. Calcular la puntuación t que deja por debajo el 95% de las observaciones, para
una muestra de 11 sujetos.

Aquí nos habla de que tenemos que fijarnos en el percentil 95 y nos indica que los
grados de libertad son: 11-1= 10 g.l. Localizamos en la tabla el valor de esta
intersección y es 1’812.

3. Tenemos una variable aleatoria X que se distribuye según t de Student con 14 g.l
a. ¿Qué valor deja por debajo una probabilidad de 0’9?

Aquí nos indica que tenemos que fijarnos en el percentil 90 y en la fila de 14 g.l.
Buscamos el valor de esta intersección y resulta ser 1’345.

b. ¿Qué valor deja por debajo una probabilidad de 0’05?

En esta pregunta nos está pidiendo t14. 0’05 pero en la tabla la probabilidad más
pequeña que tenemos es 0’55, así que tenemos que jugar con la idea de la simetría.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Los números negativos dejan por debajo de sí probabilidades menores de 0’5 y los
positivos mayores de 0’5. Así que el número t14. 0’05 es un número negativo. Como la
distribución t de Student es simétrica, el número negativo que deja por debajo 0’05
tiene su simétrico positivo que deja por encima 0’05. Que deje por encima 0’05 quiere

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
decir que por debajo deja el 0’95.

Pero recuerda que buscamos el número negativo, así que:

t14. 0’05 = -1’761

El valor -1’761 deja por debajo de sí una probabilidad de 0’05.

c. ¿Cuál es la probabilidad de que X tome valores menores que 2?

Aquí nos están preguntando P (x < 2), es decir, el número 2 habrá que buscarlo dentro
de la tabla (o un valor aproximado) pero si que hay que quedarse en la fila de los 14 g.l.
El resultado es:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
El valor más próximo a 2 es 2’145, que deja por debajo de sí una probabilidad de 0’975.
Así que el número 2 dejará un poco menos de 0’975 por debajo al ser más pequeño
que el 2’145 de la tabla.

P (x < 2) = 0’975

d. ¿Cuál es la probabilidad de que X tome valores menores que -0’67?

Aquí nos están preguntando P (x < -0’67). En la tabla no aparecen números negativos,
así que vamos a tener que trabajar por simetría.

P (X< -0’67) = P (X > 0’67)= 1 – P (X < 0’67) = 1-0’75= 0’25

El número 0’67 lo hemos buscado dentro de la tabla (o un valor aproximado) pero


recuerda que nos hemos quedado en la fila de los 14 g.l. Buscamos el número más

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
aproximado y vemos que está en la columna del percentil 75 (de aquí sale el 0’75 de la
fórmula de arriba y es este percentil pasado a probabilidad: 0’75).

F de Snedecor

1. ¿Qué porcentaje de observaciones dejará por debajo la puntuación F= 2’05 en


dos muestras con 11 y 16 sujetos respectivamente?

Ya nos está diciendo que serían (11-1=10) 10 g.l. y (16-1=15) y 15 g.l. Vamos a buscar
con 10 y 15 grados de libertad. Tenemos que ir tabla por tabla mirando el 10 en la
primera fila y el 15 en la primera columna y donde converja, esperar a ver si es esa
puntuación o no. El valor más cercano que encontramos es 2’06, y al encontrarse en la
tabla del percentil 90, concluiremos que la puntuación F=2’05, deja por debajo el 90%
de las observaciones.

2. Calcular la puntuación F que deja por debajo el 95% de las observaciones, para
dos muestras de 16 y 18 sujetos, respectivamente.

Aquí ya nos está dando el percentil y los grados de libertad. El percentil es el de la


tabla 95 y los grados de libertad son 15 y 17. Así que directamente vamos a la tabla y a
las filas y columnas correspondientes. El resultado es 2’31.

3. Tenemos una variable aleatoria X que se distribuye según F de Snedecor con 10 y


13 g.l
a. ¿Qué valor deja por debajo una probabilidad de 0’9?

Tenemos que irnos a la tabla del percentil 90 y buscar en la primera fila los grados de
libertad 10 y en la primera columna el grado de libertad 13. El resultado que tenemos
es el valor 2’14.

b. ¿Qué valor deja por encima una probabilidad de 0’01?

Que un número deje por encima el 0’01 quiere decir que deja por abajo el
complementario, es decir 0’99 (recuerda que los complementarios suman 1). En esta
pregunta nos está pidiendo F10, 13; 0’99

P (X > ¿?) = 0’01 → P (X < ¿?) = 0’99 → F10, 13; 0’99

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Así que nos vamos a la hoja que pone Percentil 99 y cruzamos la columna 10 y la fila
13.

F10, 13; 0’99 = 4’1

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
En una distribución F con 10 y 13 g.l., el valor 4’1 deja por encima de sí una
probabilidad de 0’01.

c. ¿Cuál es la probabilidad de que X tome valores menores que 5?

Aquí nos están preguntando P (X < 5), es decir, el número 5 habrá que buscarlo dentro
de las tablas (o un valor aproximado) pero si que hay que quedarse en la columna 10 y
en la fila de los 13 de todas las tablas. Se encuentra en la tabla del percentil 99’5. Esto
quiere decir que deja por debajo de sí una probabilidad de 0’995, así que el número 5
dejará algo más de 0’995 por debajo al ser más grande que el 4’82 de la tabla.

d. Calcular el percentil 2’5 para una variable que se distribuye según F con 7
y 9 g.l.

Aquí nos están preguntando por una F7,9;0’025. El problema surge con que la
probabilidad más pequeña que me da la tabla es 0’9 y en el ejercicio me piden 0’025.
Como no es simétrica no podemos trabajar con complementario como podíamos hacer
con las otras, pero tenemos la propiedad recíproca que nos puede ayudar:

1 1 1
Fn1. n2; P = → F7. 9; 0’025 = F7. 9; 1 - 0’025 = F7. 9; 0’975
Fn1. n2; P
Y ahora sí que podemos calcular F7. 9; 0’975 mirando en tablas, que es el valor 4’197, así que:
0.207 es el resultado

1 1 Este se supone que está mal porque se tienen que


F7. 9; 0’025 = = = 0’2383
F7. 9; 0’975 4’197 invertir el 9 y 7

En una distribución F con 7 y 9 g.l., el valor 0’2382 deja por encima de sí una
probabilidad de 0’025.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
DISTRIBUCIÓN NORMAL. P(Z < z) DISTRIBUCIÓN NORMAL. P(Z < z)

z 0 1 2 3 4 5 6 7 8 9 z 0 1 2 3 4 5 6 7 8 9

-3,5 ,0002 ,0002 ,0002 ,0002 ,0002 ,0002 ,0002 ,0002 ,0002 ,0002 0,0 ,5000 ,5040 ,5080 ,5120 ,5160 ,5199 ,5239 ,5279 ,5319 ,5359
-3,4 ,0003 ,0003 ,0003 ,0003 ,0003 ,0003 ,0003 ,0003 ,0003 ,0002 0,1 ,5398 ,5438 ,5478 ,5517 ,5557 ,5596 ,5636 ,5675 ,5714 ,5753
-3,3 ,0005 ,0005 ,0005 ,0004 ,0004 ,0004 ,0004 ,0004 ,0004 ,0003 0,2 ,5793 ,5832 ,5871 ,5910 ,5948 ,5987 ,6026 ,6064 ,6103 ,6141
-3,2 ,0007 ,0007 ,0006 ,0006 ,0006 ,0006 ,0006 ,0005 ,0005 ,0005 0,3 ,6179 ,6217 ,6255 ,6293 ,6331 ,6368 ,6406 ,6443 ,6480 ,6517
-3,1 ,0010 ,0009 ,0009 ,0009 ,0008 ,0008 ,0008 ,0008 ,0007 ,0007 0,4 ,6554 ,6591 ,6628 ,6664 ,6700 ,6736 ,6772 ,6808 ,6844 ,6879
-3,0 ,0013 ,0013 ,0013 ,0012 ,0012 ,0011 ,0011 ,0011 ,0010 ,0010 0,5 ,6915 ,6950 ,6985 ,7019 ,7054 ,7088 ,7123 ,7157 ,7190 ,7224
-2,9 ,0019 ,0018 ,0018 ,0017 ,0016 ,0016 ,0015 ,0015 ,0014 ,0014 0,6 ,7257 ,7291 ,7324 ,7357 ,7389 ,7422 ,7454 ,7486 ,7517 ,7549
-2,8 ,0026 ,0025 ,0024 ,0023 ,0023 ,0022 ,0021 ,0021 ,0020 ,0019 0,7 ,7580 ,7611 ,7642 ,7673 ,7704 ,7734 ,7764 ,7794 ,7823 ,7852
-2,7 ,0035 ,0034 ,0033 ,0032 ,0031 ,0030 ,0029 ,0028 ,0027 ,0026 0,8 ,7881 ,7910 ,7939 ,7967 ,7995 ,8023 ,8051 ,8078 ,8106 ,8133
-2,6 ,0047 ,0045 ,0044 ,0043 ,0041 ,0040 ,0039 ,0038 ,0037 ,0036 0,9 ,8159 ,8186 ,8212 ,8238 ,8264 ,8289 ,8315 ,8340 ,8365 ,8389
-2,5 ,0062 ,0060 ,0059 ,0057 ,0055 ,0054 ,0052 ,0051 ,0049 ,0048 1,0 ,8413 ,8438 ,8461 ,8485 ,8508 ,8531 ,8554 ,8577 ,8599 ,8621
-2,4 ,0082 ,0080 ,0078 ,0075 ,0073 ,0071 ,0069 ,0068 ,0066 ,0064 1,1 ,8643 ,8665 ,8686 ,8708 ,8729 ,8749 ,8770 ,8790 ,8810 ,8830
-2,3 ,0107 ,0104 ,0102 ,0099 ,0096 ,0094 ,0091 ,0089 ,0087 ,0084 1,2 ,8849 ,8869 ,8888 ,8907 ,8925 ,8944 ,8962 ,8980 ,8997 ,9015
-2,2 ,0139 ,0136 ,0132 ,0129 ,0125 ,0122 ,0119 ,0116 ,0113 ,0110 1,3 ,9032 ,9049 ,9066 ,9082 ,9099 ,9115 ,9131 ,9147 ,9162 ,9177
-2,1 ,0179 ,0174 ,0170 ,0166 ,0162 ,0158 ,0154 ,0150 ,0146 ,0143 1,4 ,9192 ,9207 ,9222 ,9236 ,9251 ,9265 ,9279 ,9292 ,9306 ,9319
-2,0 ,0228 ,0222 ,0217 ,0212 ,0207 ,0202 ,0197 ,0192 ,0188 ,0183 1,5 ,9332 ,9345 ,9357 ,9370 ,9382 ,9394 ,9406 ,9418 ,9429 ,9441
-1,9 ,0287 ,0281 ,0274 ,0268 ,0262 ,0256 ,0250 ,0244 ,0239 ,0233 1,6 ,9452 ,9463 ,9474 ,9484 ,9495 ,9505 ,9515 ,9525 ,9535 ,9545
-1,8 ,0359 ,0351 ,0344 ,0336 ,0329 ,0322 ,0314 ,0307 ,0301 ,0294 1,7 ,9554 ,9564 ,9573 ,9582 ,9591 ,9599 ,9608 ,9616 ,9625 ,9633
-1,7 ,0446 ,0436 ,0427 ,0418 ,0409 ,0401 ,0392 ,0384 ,0375 ,0367 1,8 ,9641 ,9649 ,9656 ,9664 ,9671 ,9678 ,9686 ,9693 ,9699 ,9706
-1,6 ,0548 ,0537 ,0526 ,0516 ,0505 ,0495 ,0485 ,0475 ,0465 ,0455 1,9 ,9713 ,9719 ,9726 ,9732 ,9738 ,9744 ,9750 ,9756 ,9761 ,9767
-1,5 ,0668 ,0655 ,0643 ,0630 ,0618 ,0606 ,0594 ,0582 ,0571 ,0559 2,0 ,9772 ,9778 ,9783 ,9788 ,9793 ,9798 ,9803 ,9808 ,9812 ,9817
-1,4 ,0808 ,0793 ,0778 ,0764 ,0749 ,0735 ,0721 ,0708 ,0694 ,0681 2,1 ,9821 ,9826 ,9830 ,9834 ,9838 ,9842 ,9846 ,9850 ,9854 ,9857
-1,3 ,0968 ,0951 ,0934 ,0918 ,0901 ,0885 ,0869 ,0853 ,0838 ,0823 2,2 ,9861 ,9864 ,9868 ,9871 ,9875 ,9878 ,9881 ,9884 ,9887 ,9890
-1,2 ,1151 ,1131 ,1112 ,1093 ,1075 ,1056 ,1038 ,1020 ,1003 ,0985 2,3 ,9893 ,9896 ,9898 ,9901 ,9904 ,9906 ,9909 ,9911 ,9913 ,9916
-1,1 ,1357 ,1335 ,1314 ,1292 ,1271 ,1251 ,1230 ,1210 ,1190 ,1170 2,4 ,9918 ,9920 ,9922 ,9925 ,9927 ,9929 ,9931 ,9932 ,9934 ,9936
-1,0 ,1587 ,1562 ,1539 ,1515 ,1492 ,1469 ,1446 ,1423 ,1401 ,1379 2,5 ,9938 ,9940 ,9941 ,9943 ,9945 ,9946 ,9948 ,9949 ,9951 ,9952
-0,9 ,1841 ,1814 ,1788 ,1762 ,1736 ,1711 ,1685 ,1660 ,1635 ,1611 2,6 ,9953 ,9955 ,9956 ,9957 ,9959 ,9960 ,9961 ,9962 ,9963 ,9964
-0,8 ,2119 ,2090 ,2061 ,2033 ,2005 ,1977 ,1949 ,1922 ,1894 ,1867 2,7 ,9965 ,9966 ,9967 ,9968 ,9969 ,9970 ,9971 ,9972 ,9973 ,9974
-0,7 ,2420 ,2389 ,2358 ,2327 ,2296 ,2266 ,2236 ,2206 ,2177 ,2148 2,8 ,9974 ,9975 ,9976 ,9977 ,9977 ,9978 ,9979 ,9979 ,9980 ,9981
-0,6 ,2743 ,2709 ,2676 ,2643 ,2611 ,2578 ,2546 ,2514 ,2483 ,2451 2,9 ,9981 ,9982 ,9982 ,9983 ,9984 ,9984 ,9985 ,9985 ,9986 ,9986
-0,5 ,3085 ,3050 ,3015 ,2981 ,2946 ,2912 ,2877 ,2843 ,2810 ,2776 3,0 ,9987 ,9987 ,9987 ,9988 ,9988 ,9989 ,9989 ,9989 ,9990 ,9990
-0,4 ,3446 ,3409 ,3372 ,3336 ,3300 ,3264 ,3228 ,3192 ,3156 ,3121 3,1 ,9990 ,9991 ,9991 ,9991 ,9992 ,9992 ,9992 ,9992 ,9993 ,9993
-0,3 ,3821 ,3783 ,3745 ,3707 ,3669 ,3632 ,3594 ,3557 ,3520 ,3483 3,2 ,9993 ,9993 ,9994 ,9994 ,9994 ,9994 ,9994 ,9995 ,9995 ,9995
-0,2 ,4207 ,4168 ,4129 ,4090 ,4052 ,4013 ,3974 ,3936 ,3897 ,3859 3,3 ,9995 ,9995 ,9995 ,9996 ,9996 ,9996 ,9996 ,9996 ,9996 ,9997
-0,1 ,4602 ,4562 ,4522 ,4483 ,4443 ,4404 ,4364 ,4325 ,4286 ,4247 3,4 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9997 ,9998
-0,0 ,5000 ,4960 ,4920 ,4880 ,4840 ,4801 ,4761 ,4721 ,4681 ,4641 3,5 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998 ,9998

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTILES DE DISTRIBUCIONES CHI-CUADRADO (*)

g.l. 1 2 5 10 20 30 50 70 90 95 97,5 98 99 99,9


1 0,0002 0,0006 0,0039 0,0158 0,0642 0,148 0,455 1,074 2,706 3,841 5,024 5,412 6,635 10,828
2 0,0201 0,0404 0,103 0,211 0,446 0,713 1,386 2,408 4,605 5,991 7,378 7,824 9,210 13,816
3 0,115 0,185 0,352 0,584 1,005 1,424 2,366 3,665 6,251 7,815 9,348 9,837 11,345 16,266
4 0,297 0,429 0,711 1,064 1,649 2,195 3,357 4,878 7,779 9,488 11,143 11,668 13,277 18,467
5 0,554 0,752 1,145 1,610 2,343 3,000 4,351 6,064 9,236 11,070 12,833 13,388 15,086 20,515

6 0,872 1,134 1,635 2,204 3,070 3,828 5,348 7,231 10,645 12,592 14,449 15,033 16,812 22,458
7 1,239 1,564 2,167 2,833 3,822 4,671 6,346 8,383 12,017 14,067 16,013 16,622 18,475 24,322
8 1,646 2,032 2,733 3,490 4,594 5,527 7,344 9,524 13,362 15,507 17,535 18,168 20,090 26,124
9 2,088 2,532 3,325 4,168 5,380 6,393 8,343 10,656 14,684 16,919 19,023 19,679 21,666 27,877
10 2,558 3,059 3,940 4,865 6,179 7,267 9,342 11,781 15,987 18,307 20,483 21,161 23,209 29,588

11 3,053 3,609 4,575 5,578 6,989 8,148 10,341 12,899 17,275 19,675 21,920 22,618 24,725 31,264
12 3,571 4,178 5,226 6,304 7,807 9,034 11,340 14,011 18,549 21,026 23,337 24,054 26,217 32,909
13 4,107 4,765 5,892 7,042 8,634 9,926 12,340 15,119 19,812 22,362 24,736 25,472 27,688 34,528
14 4,660 5,368 6,571 7,790 9,467 10,821 13,339 16,222 21,064 23,685 26,119 26,873 29,141 36,123
15 5,229 5,985 7,261 8,547 10,307 11,721 14,339 17,322 22,307 24,996 27,488 28,259 30,578 37,697

16 5,812 6,614 7,962 9,312 11,152 12,624 15,338 18,418 23,542 26,296 28,845 29,633 32,000 39,252
17 6,408 7,255 8,672 10,085 12,002 13,531 16,338 19,511 24,769 27,587 30,191 30,995 33,409 40,790
18 7,015 7,906 9,390 10,865 12,857 14,440 17,338 20,601 25,989 28,869 31,526 32,346 34,805 42,312
19 7,633 8,567 10,117 11,651 13,716 15,352 18,338 21,689 27,204 30,144 32,852 33,687 36,191 43,820
20 8,260 9,237 10,851 12,443 14,578 16,266 19,337 22,775 28,412 31,410 34,170 35,020 37,566 45,315

21 8,897 9,915 11,591 13,240 15,445 17,182 20,337 23,858 29,615 32,671 35,479 36,343 38,932 46,797
22 9,542 10,600 12,338 14,041 16,314 18,101 21,337 24,939 30,813 33,924 36,781 37,659 40,289 48,268
23 10,196 11,293 13,091 14,848 17,187 19,021 22,337 26,018 32,007 35,172 38,076 38,968 41,638 49,728
24 10,856 11,992 13,848 15,659 18,062 19,943 23,337 27,096 33,196 36,415 39,364 40,270 42,980 51,179
25 11,524 12,697 14,611 16,473 18,940 20,867 24,337 28,172 34,382 37,652 40,646 41,566 44,314 52,620

26 12,198 13,409 15,379 17,292 19,820 21,792 25,336 29,246 35,563 38,885 41,923 42,856 45,642 54,052
27 12,879 14,125 16,151 18,114 20,703 22,719 26,336 30,319 36,741 40,113 43,195 44,140 46,963 55,476
28 13,565 14,847 16,928 18,939 21,588 23,647 27,336 31,391 37,916 41,337 44,461 45,419 48,278 56,892
29 14,256 15,574 17,708 19,768 22,475 24,577 28,336 32,461 39,087 42,557 45,722 46,693 49,588 58,301
30 14,953 16,306 18,493 20,599 23,364 25,508 29,336 33,530 40,256 43,773 46,979 47,962 50,892 59,703

(*) Si c tiene más de 30 g.l., entonces sigue la distribución normal, con el estadístico de contraste:
2

z obs = 2 × c obs
2
- ( 2 × gl ) - 1

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
PERCENTILES DE DISTRIBUCIONES t (*)

g.l. 55 60 65 70 75 80 85 90 95 97,5 99 99,5 99,95


1 0,158 0,325 0,510 0,727 1,000 1,376 1,963 3,078 6,314 12,706 31,821 63,657 636,619
2 0,142 0,289 0,445 0,617 0,816 1,061 1,386 1,886 2,920 4,303 6,965 9,925 31,599
3 0,137 0,277 0,424 0,584 0,765 0,978 1,250 1,638 2,353 3,182 4,541 5,841 12,924
4 0,134 0,271 0,414 0,569 0,741 0,941 1,190 1,533 2,132 2,776 3,747 4,604 8,610
5 0,132 0,267 0,408 0,559 0,727 0,920 1,156 1,476 2,015 2,571 3,365 4,032 6,869

6 0,131 0,265 0,404 0,553 0,718 0,906 1,134 1,440 1,943 2,447 3,143 3,707 5,959
7 0,130 0,263 0,402 0,549 0,711 0,896 1,119 1,415 1,895 2,365 2,998 3,499 5,408
8 0,130 0,262 0,399 0,546 0,706 0,889 1,108 1,397 1,860 2,306 2,896 3,355 5,041
9 0,129 0,261 0,398 0,543 0,703 0,883 1,100 1,383 1,833 2,262 2,821 3,250 4,781
10 0,129 0,260 0,397 0,542 0,700 0,879 1,093 1,372 1,812 2,228 2,764 3,169 4,587

11 0,129 0,260 0,396 0,540 0,697 0,876 1,088 1,363 1,796 2,201 2,718 3,106 4,437
12 0,128 0,259 0,395 0,539 0,695 0,873 1,083 1,356 1,782 2,179 2,681 3,055 4,318
13 0,128 0,259 0,394 0,538 0,694 0,870 1,079 1,350 1,771 2,160 2,650 3,012 4,221
14 0,128 0,258 0,393 0,537 0,692 0,868 1,076 1,345 1,761 2,145 2,624 2,977 4,140
15 0,128 0,258 0,393 0,536 0,691 0,866 1,074 1,341 1,753 2,131 2,602 2,947 4,073

16 0,128 0,258 0,392 0,535 0,690 0,865 1,071 1,337 1,746 2,120 2,583 2,921 4,015
17 0,128 0,257 0,392 0,534 0,689 0,863 1,069 1,333 1,740 2,110 2,567 2,898 3,965
18 0,127 0,257 0,392 0,534 0,688 0,862 1,067 1,330 1,734 2,101 2,552 2,878 3,922
19 0,127 0,257 0,391 0,533 0,688 0,861 1,066 1,328 1,729 2,093 2,539 2,861 3,883
20 0,127 0,257 0,391 0,533 0,687 0,860 1,064 1,325 1,725 2,086 2,528 2,845 3,850

21 0,127 0,257 0,391 0,532 0,686 0,859 1,063 1,323 1,721 2,080 2,518 2,831 3,819
22 0,127 0,256 0,390 0,532 0,686 0,858 1,061 1,321 1,717 2,074 2,508 2,819 3,792
23 0,127 0,256 0,390 0,532 0,685 0,858 1,060 1,319 1,714 2,069 2,500 2,807 3,768
24 0,127 0,256 0,390 0,531 0,685 0,857 1,059 1,318 1,711 2,064 2,492 2,797 3,745
25 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,316 1,708 2,060 2,485 2,787 3,725
26 0,127 0,256 0,390 0,531 0,684 0,856 1,058 1,315 1,706 2,056 2,479 2,779 3,707
27 0,127 0,256 0,389 0,531 0,684 0,855 1,057 1,314 1,703 2,052 2,473 2,771 3,690
28 0,127 0,256 0,389 0,530 0,683 0,855 1,056 1,313 1,701 2,048 2,467 2,763 3,674
29 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,311 1,699 2,045 2,462 2,756 3,659
30 0,127 0,256 0,389 0,530 0,683 0,854 1,055 1,310 1,697 2,042 2,457 2,750 3,646

40 0,126 0,255 0,388 0,529 0,681 0,851 1,050 1,303 1,684 2,021 2,423 2,704 3,551
60 0,126 0,254 0,387 0,527 0,679 0,848 1,045 1,296 1,671 2,000 2,390 2,660 3,460
120 0,126 0,254 0,386 0,526 0,677 0,845 1,041 1,289 1,658 1,980 2,358 2,617 3,373
∞ 0,126 0,253 0,385 0,525 0,675 0,842 1,037 1,282 1,646 1,962 2,330 2,581 3,300

(*) Los percentiles inferiores se relacionan con los superiores aquí tabulados mediante la ecuación ptn = - 1-ptn. Es así como el
percentil 1 de la distribución t con 10 g.l. es igual al número negativo correspondiente al percentil 99 de esta misma distribución,
es decir, 1 t10 = -2,764.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTIL 75 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 5,83 7,50 8,20 8,58 8,82 8,98 9,10 9,19 9,26 9,32 9,41 9,49 9,58 9,63 9,67 9,71 9,76 9,80 9,85
2 2,57 3,00 3,15 3,23 3,28 3,31 3,34 3,35 3,37 3,38 3,39 3,41 3,43 3,43 3,44 3,45 3,46 3,47 3,48
3 2,02 2,28 2,36 2,39 2,41 2,42 2,43 2,44 2,44 2,44 2,45 2,46 2,46 2,46 2,47 2,47 2,47 2,47 2,47
4 1,81 2,00 2,05 2,06 2,07 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08 2,08

5 1,69 1,85 1,88 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,89 1,88 1,88 1,88 1,88 1,87 1,87 1,87
6 1,62 1,76 1,78 1,79 1,79 1,78 1,78 1,78 1,77 1,77 1,77 1,76 1,76 1,75 1,75 1,75 1,74 1,74 1,74
7 1,57 1,70 1,72 1,72 1,71 1,71 1,70 1,70 1,69 1,69 1,68 1,68 1,67 1,67 1,66 1,66 1,65 1,65 1,65
8 1,54 1,66 1,67 1,66 1,66 1,65 1,64 1,64 1,63 1,63 1,62 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,58
9 1,51 1,62 1,63 1,63 1,62 1,61 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,54 1,53 1,53

10 1,49 1,60 1,60 1,59 1,59 1,58 1,57 1,56 1,56 1,55 1,54 1,53 1,52 1,52 1,51 1,51 1,50 1,49 1,48
11 1,47 1,58 1,58 1,57 1,56 1,55 1,54 1,53 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,47 1,46 1,45
12 1,46 1,56 1,56 1,55 1,54 1,53 1,52 1,51 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,45 1,44 1,43 1,42
13 1,45 1,55 1,55 1,53 1,52 1,51 1,50 1,49 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,42 1,41 1,40
14 1,44 1,53 1,53 1,52 1,51 1,50 1,49 1,48 1,47 1,46 1,45 1,44 1,43 1,42 1,41 1,41 1,40 1,39 1,38

15 1,43 1,52 1,52 1,51 1,49 1,48 1,47 1,46 1,46 1,45 1,44 1,43 1,41 1,41 1,40 1,39 1,38 1,37 1,36
16 1,42 1,51 1,51 1,50 1,48 1,47 1,46 1,45 1,44 1,44 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1,34
17 1,42 1,51 1,50 1,49 1,47 1,46 1,45 1,44 1,43 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33
18 1,41 1,50 1,49 1,48 1,46 1,45 1,44 1,43 1,42 1,42 1,40 1,39 1,38 1,37 1,36 1,35 1,34 1,33 1,32
19 1,41 1,49 1,49 1,47 1,46 1,44 1,43 1,42 1,41 1,41 1,40 1,38 1,37 1,36 1,35 1,34 1,33 1,32 1,30

20 1,40 1,49 1,48 1,47 1,45 1,44 1,43 1,42 1,41 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,32 1,31 1,29
21 1,40 1,48 1,48 1,46 1,44 1,43 1,42 1,41 1,40 1,39 1,38 1,37 1,35 1,34 1,33 1,32 1,31 1,30 1,28
22 1,40 1,48 1,47 1,45 1,44 1,42 1,41 1,40 1,39 1,39 1,37 1,36 1,34 1,33 1,32 1,31 1,30 1,29 1,28
23 1,39 1,47 1,47 1,45 1,43 1,42 1,41 1,40 1,39 1,38 1,37 1,35 1,34 1,33 1,32 1,31 1,30 1,28 1,27
24 1,39 1,47 1,46 1,44 1,43 1,41 1,40 1,39 1,38 1,38 1,36 1,35 1,33 1,32 1,31 1,30 1,29 1,28 1,26

25 1,39 1,47 1,46 1,44 1,42 1,41 1,40 1,39 1,38 1,37 1,36 1,34 1,33 1,32 1,31 1,29 1,28 1,27 1,25
26 1,38 1,46 1,45 1,44 1,42 1,41 1,39 1,38 1,37 1,37 1,35 1,34 1,32 1,31 1,30 1,29 1,28 1,26 1,25
27 1,38 1,46 1,45 1,43 1,42 1,40 1,39 1,38 1,37 1,36 1,35 1,33 1,32 1,31 1,30 1,28 1,27 1,26 1,24
28 1,38 1,46 1,45 1,43 1,41 1,40 1,39 1,38 1,37 1,36 1,34 1,33 1,31 1,30 1,29 1,28 1,27 1,25 1,24
29 1,38 1,45 1,45 1,43 1,41 1,40 1,38 1,37 1,36 1,35 1,34 1,32 1,31 1,30 1,29 1,27 1,26 1,25 1,23

30 1,38 1,45 1,44 1,42 1,41 1,39 1,38 1,37 1,36 1,35 1,34 1,32 1,30 1,29 1,28 1,27 1,26 1,24 1,23
40 1,36 1,44 1,42 1,40 1,39 1,37 1,36 1,35 1,34 1,33 1,31 1,30 1,28 1,26 1,25 1,24 1,22 1,21 1,19
60 1,35 1,42 1,41 1,38 1,37 1,35 1,33 1,32 1,31 1,30 1,29 1,27 1,25 1,24 1,22 1,21 1,19 1,17 1,15
120 1,34 1,40 1,39 1,37 1,35 1,33 1,31 1,30 1,29 1,28 1,26 1,24 1,22 1,21 1,19 1,18 1,16 1,13 1,10
∞ 1,32 1,39 1,37 1,35 1,33 1,31 1,29 1,28 1,27 1,25 1,24 1,22 1,19 1,18 1,16 1,14 1,12 1,08 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTIL 90 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 39,86 49,50 53,59 55,83 57,24 58,20 58,91 59,44 59,86 60,19 60,71 61,22 61,74 62,00 62,26 62,53 62,79 63,06 63,33
2 8,53 9,00 9,16 9,24 9,29 9,33 9,35 9,37 9,38 9,39 9,41 9,42 9,44 9,45 9,46 9,47 9,47 9,48 9,49
3 5,54 5,46 5,39 5,34 5,31 5,28 5,27 5,25 5,24 5,23 5,22 5,20 5,18 5,18 5,17 5,16 5,15 5,14 5,13
4 4,54 4,32 4,19 4,11 4,05 4,01 3,98 3,95 3,94 3,92 3,90 3,87 3,84 3,83 3,82 3,80 3,79 3,78 3,76

5 4,06 3,78 3,62 3,52 3,45 3,40 3,37 3,34 3,32 3,30 3,27 3,24 3,21 3,19 3,17 3,16 3,14 3,12 3,11
6 3,78 3,46 3,29 3,18 3,11 3,05 3,01 2,98 2,96 2,94 2,90 2,87 2,84 2,82 2,80 2,78 2,76 2,74 2,72
7 3,59 3,26 3,07 2,96 2,88 2,83 2,78 2,75 2,72 2,70 2,67 2,63 2,59 2,58 2,56 2,54 2,51 2,49 2,47
8 3,46 3,11 2,92 2,81 2,73 2,67 2,62 2,59 2,56 2,54 2,50 2,46 2,42 2,40 2,38 2,36 2,34 2,32 2,29
9 3,36 3,01 2,81 2,69 2,61 2,55 2,51 2,47 2,44 2,42 2,38 2,34 2,30 2,28 2,25 2,23 2,21 2,18 2,16

10 3,29 2,92 2,73 2,61 2,52 2,46 2,41 2,38 2,35 2,32 2,28 2,24 2,20 2,18 2,16 2,13 2,11 2,08 2,06
11 3,23 2,86 2,66 2,54 2,45 2,39 2,34 2,30 2,27 2,25 2,21 2,17 2,12 2,10 2,08 2,05 2,03 2,00 1,97
12 3,18 2,81 2,61 2,48 2,39 2,33 2,28 2,24 2,21 2,19 2,15 2,10 2,06 2,04 2,01 1,99 1,96 1,93 1,90
13 3,14 2,76 2,56 2,43 2,35 2,28 2,23 2,20 2,16 2,14 2,10 2,05 2,01 1,98 1,96 1,93 1,90 1,88 1,85
14 3,10 2,73 2,52 2,39 2,31 2,24 2,19 2,15 2,12 2,10 2,05 2,01 1,96 1,94 1,91 1,89 1,86 1,83 1,80

15 3,07 2,70 2,49 2,36 2,27 2,21 2,16 2,12 2,09 2,06 2,02 1,97 1,92 1,90 1,87 1,85 1,82 1,79 1,76
16 3,05 2,67 2,46 2,33 2,24 2,18 2,13 2,09 2,06 2,03 1,99 1,94 1,89 1,87 1,84 1,81 1,78 1,75 1,72
17 3,03 2,64 2,44 2,31 2,22 2,15 2,10 2,06 2,03 2,00 1,96 1,91 1,86 1,84 1,81 1,78 1,75 1,72 1,69
18 3,01 2,62 2,42 2,29 2,20 2,13 2,08 2,04 2,00 1,98 1,93 1,89 1,84 1,81 1,78 1,75 1,72 1,69 1,66
19 2,99 2,61 2,40 2,27 2,18 2,11 2,06 2,02 1,98 1,96 1,91 1,86 1,81 1,79 1,76 1,73 1,70 1,67 1,63

20 2,97 2,59 2,38 2,25 2,16 2,09 2,04 2,00 1,96 1,94 1,89 1,84 1,79 1,77 1,74 1,71 1,68 1,64 1,61
21 2,96 2,57 2,36 2,23 2,14 2,08 2,02 1,98 1,95 1,92 1,87 1,83 1,78 1,75 1,72 1,69 1,66 1,62 1,59
22 2,95 2,56 2,35 2,22 2,13 2,06 2,01 1,97 1,93 1,90 1,86 1,81 1,76 1,73 1,70 1,67 1,64 1,60 1,57
23 2,94 2,55 2,34 2,21 2,11 2,05 1,99 1,95 1,92 1,89 1,84 1,80 1,74 1,72 1,69 1,66 1,62 1,59 1,55
24 2,93 2,54 2,33 2,19 2,10 2,04 1,98 1,94 1,91 1,88 1,83 1,78 1,73 1,70 1,67 1,64 1,61 1,57 1,53

25 2,92 2,53 2,32 2,18 2,09 2,02 1,97 1,93 1,89 1,87 1,82 1,77 1,72 1,69 1,66 1,63 1,59 1,56 1,52
26 2,91 2,52 2,31 2,17 2,08 2,01 1,96 1,92 1,88 1,86 1,81 1,76 1,71 1,68 1,65 1,61 1,58 1,54 1,50
27 2,90 2,51 2,30 2,17 2,07 2,00 1,95 1,91 1,87 1,85 1,80 1,75 1,70 1,67 1,64 1,60 1,57 1,53 1,49
28 2,89 2,50 2,29 2,16 2,06 2,00 1,94 1,90 1,87 1,84 1,79 1,74 1,69 1,66 1,63 1,59 1,56 1,52 1,48
29 2,89 2,50 2,28 2,15 2,06 1,99 1,93 1,89 1,86 1,83 1,78 1,73 1,68 1,65 1,62 1,58 1,55 1,51 1,47

30 2,88 2,49 2,28 2,14 2,05 1,98 1,93 1,88 1,85 1,82 1,77 1,72 1,67 1,64 1,61 1,57 1,54 1,50 1,46
40 2,84 2,44 2,23 2,09 2,00 1,93 1,87 1,83 1,79 1,76 1,71 1,66 1,61 1,57 1,54 1,51 1,47 1,42 1,38
60 2,79 2,39 2,18 2,04 1,95 1,87 1,82 1,77 1,74 1,71 1,66 1,60 1,54 1,51 1,48 1,44 1,40 1,35 1,29
120 2,75 2,35 2,13 1,99 1,90 1,82 1,77 1,72 1,68 1,65 1,60 1,55 1,48 1,45 1,41 1,37 1,32 1,26 1,19
∞ 2,71 2,30 2,08 1,94 1,85 1,77 1,72 1,67 1,63 1,60 1,55 1,49 1,42 1,38 1,34 1,30 1,24 1,17 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTIL 95 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 161,4 199,5 215,7 224,6 230,2 234,0 236,8 238,9 240,5 241,9 243,9 245,9 248,0 249,1 250,1 251,1 252,2 253,3 254,3
2 18,51 19,00 19,16 19,25 19,30 19,33 19,35 19,37 19,38 19,40 19,41 19,43 19,45 19,45 19,46 19,47 19,48 19,49 19,50
3 10,13 9,55 9,28 9,12 9,01 8,94 8,89 8,85 8,81 8,79 8,74 8,70 8,66 8,64 8,62 8,59 8,57 8,55 8,53
4 7,71 6,94 6,59 6,39 6,26 6,16 6,09 6,04 6,00 5,96 5,91 5,86 5,80 5,77 5,75 5,72 5,69 5,66 5,63

5 6,61 5,79 5,41 5,19 5,05 4,95 4,88 4,82 4,77 4,74 4,68 4,62 4,56 4,53 4,50 4,46 4,43 4,40 4,37
6 5,99 5,14 4,76 4,53 4,39 4,28 4,21 4,15 4,10 4,06 4,00 3,94 3,87 3,84 3,81 3,77 3,74 3,70 3,67
7 5,59 4,74 4,35 4,12 3,97 3,87 3,79 3,73 3,68 3,64 3,57 3,51 3,44 3,41 3,38 3,34 3,30 3,27 3,23
8 5,32 4,46 4,07 3,84 3,69 3,58 3,50 3,44 3,39 3,35 3,28 3,22 3,15 3,12 3,08 3,04 3,01 2,97 2,93
9 5,12 4,26 3,86 3,63 3,48 3,37 3,29 3,23 3,18 3,14 3,07 3,01 2,94 2,90 2,86 2,83 2,79 2,75 2,71

10 4,96 4,10 3,71 3,48 3,33 3,22 3,14 3,07 3,02 2,98 2,91 2,85 2,77 2,74 2,70 2,66 2,62 2,58 2,54
11 4,84 3,98 3,59 3,36 3,20 3,09 3,01 2,95 2,90 2,85 2,79 2,72 2,65 2,61 2,57 2,53 2,49 2,45 2,40
12 4,75 3,89 3,49 3,26 3,11 3,00 2,91 2,85 2,80 2,75 2,69 2,62 2,54 2,51 2,47 2,43 2,38 2,34 2,30
13 4,67 3,81 3,41 3,18 3,03 2,92 2,83 2,77 2,71 2,67 2,60 2,53 2,46 2,42 2,38 2,34 2,30 2,25 2,21
14 4,60 3,74 3,34 3,11 2,96 2,85 2,76 2,70 2,65 2,60 2,53 2,46 2,39 2,35 2,31 2,27 2,22 2,18 2,13

15 4,54 3,68 3,29 3,06 2,90 2,79 2,71 2,64 2,59 2,54 2,48 2,40 2,33 2,29 2,25 2,20 2,16 2,11 2,07
16 4,49 3,63 3,24 3,01 2,85 2,74 2,66 2,59 2,54 2,49 2,42 2,35 2,28 2,24 2,19 2,15 2,11 2,06 2,01
17 4,45 3,59 3,20 2,96 2,81 2,70 2,61 2,55 2,49 2,45 2,38 2,31 2,23 2,19 2,15 2,10 2,06 2,01 1,96
18 4,41 3,55 3,16 2,93 2,77 2,66 2,58 2,51 2,46 2,41 2,34 2,27 2,19 2,15 2,11 2,06 2,02 1,97 1,92
19 4,38 3,52 3,13 2,90 2,74 2,63 2,54 2,48 2,42 2,38 2,31 2,23 2,16 2,11 2,07 2,03 1,98 1,93 1,88

20 4,35 3,49 3,10 2,87 2,71 2,60 2,51 2,45 2,39 2,35 2,28 2,20 2,12 2,08 2,04 1,99 1,95 1,90 1,84
21 4,32 3,47 3,07 2,84 2,68 2,57 2,49 2,42 2,37 2,32 2,25 2,18 2,10 2,05 2,01 1,96 1,92 1,87 1,81
22 4,30 3,44 3,05 2,82 2,66 2,55 2,46 2,40 2,34 2,30 2,23 2,15 2,07 2,03 1,98 1,94 1,89 1,84 1,78
23 4,28 3,42 3,03 2,80 2,64 2,53 2,44 2,37 2,32 2,27 2,20 2,13 2,05 2,01 1,96 1,91 1,86 1,81 1,76
24 4,26 3,40 3,01 2,78 2,62 2,51 2,42 2,36 2,30 2,25 2,18 2,11 2,03 1,98 1,94 1,89 1,84 1,79 1,73

25 4,24 3,39 2,99 2,76 2,60 2,49 2,40 2,34 2,28 2,24 2,16 2,09 2,01 1,96 1,92 1,87 1,82 1,77 1,71
26 4,23 3,37 2,98 2,74 2,59 2,47 2,39 2,32 2,27 2,22 2,15 2,07 1,99 1,95 1,90 1,85 1,80 1,75 1,69
27 4,21 3,35 2,96 2,73 2,57 2,46 2,37 2,31 2,25 2,20 2,13 2,06 1,97 1,93 1,88 1,84 1,79 1,73 1,67
28 4,20 3,34 2,95 2,71 2,56 2,45 2,36 2,29 2,24 2,19 2,12 2,04 1,96 1,91 1,87 1,82 1,77 1,71 1,65
29 4,18 3,33 2,93 2,70 2,55 2,43 2,35 2,28 2,22 2,18 2,10 2,03 1,94 1,90 1,85 1,81 1,75 1,70 1,64

30 4,17 3,32 2,92 2,69 2,53 2,42 2,33 2,27 2,21 2,16 2,09 2,01 1,93 1,89 1,84 1,79 1,74 1,68 1,62
40 4,08 3,23 2,84 2,61 2,45 2,34 2,25 2,18 2,12 2,08 2,00 1,92 1,84 1,79 1,74 1,69 1,64 1,58 1,51
60 4,00 3,15 2,76 2,53 2,37 2,25 2,17 2,10 2,04 1,99 1,92 1,84 1,75 1,70 1,65 1,59 1,53 1,47 1,39
120 3,92 3,07 2,68 2,45 2,29 2,18 2,09 2,02 1,96 1,91 1,83 1,75 1,66 1,61 1,55 1,50 1,43 1,35 1,25
∞ 3,84 3,00 2,60 2,37 2,21 2,10 2,01 1,94 1,88 1,83 1,75 1,67 1,57 1,52 1,46 1,39 1,32 1,22 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
PERCENTIL 97,5 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 647,8 799,5 864,2 899,6 921,8 937,1 948,2 956,7 963,3 968,6 976,7 984,9 993,1 997,2 1001 1006 1010 1014 1018
2 38,51 39,00 39,17 39,25 39,30 39,33 39,36 39,37 39,39 39,40 39,41 39,43 39,45 39,46 39,46 39,47 39,48 39,49 39,50
3 17,44 16,04 15,44 15,10 14,88 14,73 14,62 14,54 14,47 14,42 14,34 14,25 14,17 14,12 14,08 14,04 13,99 13,95 13,90
4 12,22 10,65 9,98 9,60 9,36 9,20 9,07 8,98 8,90 8,84 8,75 8,66 8,56 8,51 8,46 8,41 8,36 8,31 8,26

5 10,01 8,43 7,76 7,39 7,15 6,98 6,85 6,76 6,68 6,62 6,52 6,43 6,33 6,28 6,23 6,18 6,12 6,07 6,02
6 8,81 7,26 6,60 6,23 5,99 5,82 5,70 5,60 5,52 5,46 5,37 5,27 5,17 5,12 5,07 5,01 4,96 4,90 4,85
7 8,07 6,54 5,89 5,52 5,29 5,12 4,99 4,90 4,82 4,76 4,67 4,57 4,47 4,41 4,36 4,31 4,25 4,20 4,14
8 7,57 6,06 5,42 5,05 4,82 4,65 4,53 4,43 4,36 4,30 4,20 4,10 4,00 3,95 3,89 3,84 3,78 3,73 3,67
9 7,21 5,71 5,08 4,72 4,48 4,32 4,20 4,10 4,03 3,96 3,87 3,77 3,67 3,61 3,56 3,51 3,45 3,39 3,33

10 6,94 5,46 4,83 4,47 4,24 4,07 3,95 3,85 3,78 3,72 3,62 3,52 3,42 3,37 3,31 3,26 3,20 3,14 3,08
11 6,72 5,26 4,63 4,28 4,04 3,88 3,76 3,66 3,59 3,53 3,43 3,33 3,23 3,17 3,12 3,06 3,00 2,94 2,88
12 6,55 5,10 4,47 4,12 3,89 3,73 3,61 3,51 3,44 3,37 3,28 3,18 3,07 3,02 2,96 2,91 2,85 2,79 2,73
13 6,41 4,97 4,35 4,00 3,77 3,60 3,48 3,39 3,31 3,25 3,15 3,05 2,95 2,89 2,84 2,78 2,72 2,66 2,60
14 6,30 4,86 4,24 3,89 3,66 3,50 3,38 3,29 3,21 3,15 3,05 2,95 2,84 2,79 2,73 2,67 2,61 2,55 2,49

15 6,20 4,77 4,15 3,80 3,58 3,41 3,29 3,20 3,12 3,06 2,96 2,86 2,76 2,70 2,64 2,59 2,52 2,46 2,40
16 6,12 4,69 4,08 3,73 3,50 3,34 3,22 3,12 3,05 2,99 2,89 2,79 2,68 2,63 2,57 2,51 2,45 2,38 2,32
17 6,04 4,62 4,01 3,66 3,44 3,28 3,16 3,06 2,98 2,92 2,82 2,72 2,62 2,56 2,50 2,44 2,38 2,32 2,25
18 5,98 4,56 3,95 3,61 3,38 3,22 3,10 3,01 2,93 2,87 2,77 2,67 2,56 2,50 2,44 2,38 2,32 2,26 2,19
19 5,92 4,51 3,90 3,56 3,33 3,17 3,05 2,96 2,88 2,82 2,72 2,62 2,51 2,45 2,39 2,33 2,27 2,20 2,13

20 5,87 4,46 3,86 3,51 3,29 3,13 3,01 2,91 2,84 2,77 2,68 2,57 2,46 2,41 2,35 2,29 2,22 2,16 2,09
21 5,83 4,42 3,82 3,48 3,25 3,09 2,97 2,87 2,80 2,73 2,64 2,53 2,42 2,37 2,31 2,25 2,18 2,11 2,04
22 5,79 4,38 3,78 3,44 3,22 3,05 2,93 2,84 2,76 2,70 2,60 2,50 2,39 2,33 2,27 2,21 2,14 2,08 2,00
23 5,75 4,35 3,75 3,41 3,18 3,02 2,90 2,81 2,73 2,67 2,57 2,47 2,36 2,30 2,24 2,18 2,11 2,04 1,97
24 5,72 4,32 3,72 3,38 3,15 2,99 2,87 2,78 2,70 2,64 2,54 2,44 2,33 2,27 2,21 2,15 2,08 2,01 1,94

25 5,69 4,29 3,69 3,35 3,13 2,97 2,85 2,75 2,68 2,61 2,51 2,41 2,30 2,24 2,18 2,12 2,05 1,98 1,91
26 5,66 4,27 3,67 3,33 3,10 2,94 2,82 2,73 2,65 2,59 2,49 2,39 2,28 2,22 2,16 2,09 2,03 1,95 1,88
27 5,63 4,24 3,65 3,31 3,08 2,92 2,80 2,71 2,63 2,57 2,47 2,36 2,25 2,19 2,13 2,07 2,00 1,93 1,85
28 5,61 4,22 3,63 3,29 3,06 2,90 2,78 2,69 2,61 2,55 2,45 2,34 2,23 2,17 2,11 2,05 1,98 1,91 1,83
29 5,59 4,20 3,61 3,27 3,04 2,88 2,76 2,67 2,59 2,53 2,43 2,32 2,21 2,15 2,09 2,03 1,96 1,89 1,81

30 5,57 4,18 3,59 3,25 3,03 2,87 2,75 2,65 2,57 2,51 2,41 2,31 2,20 2,14 2,07 2,01 1,94 1,87 1,79
40 5,42 4,05 3,46 3,13 2,90 2,74 2,62 2,53 2,45 2,39 2,29 2,18 2,07 2,01 1,94 1,88 1,80 1,72 1,64
60 5,29 3,93 3,34 3,01 2,79 2,63 2,51 2,41 2,33 2,27 2,17 2,06 1,94 1,88 1,82 1,74 1,67 1,58 1,48
120 5,15 3,80 3,23 2,89 2,67 2,52 2,39 2,30 2,22 2,16 2,05 1,94 1,82 1,76 1,69 1,61 1,53 1,43 1,31
∞ 5,02 3,69 3,12 2,79 2,57 2,41 2,29 2,19 2,11 2,05 1,94 1,83 1,71 1,64 1,57 1,48 1,39 1,27 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTIL 99 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 4052 4999 5403 5625 5764 5859 5928 5981 6022 6056 6106 6157 6209 6235 6261 6287 6313 6339 6366
2 98,50 99,00 99,17 99,25 99,30 99,33 99,36 99,37 99,39 99,40 99,42 99,43 99,45 99,46 99,47 99,47 99,48 99,49 99,50
3 34,12 30,82 29,46 28,71 28,24 27,91 27,67 27,49 27,35 27,23 27,05 26,87 26,69 26,60 26,50 26,41 26,32 26,22 26,13
4 21,20 18,00 16,69 15,98 15,52 15,21 14,98 14,80 14,66 14,55 14,37 14,20 14,02 13,93 13,84 13,75 13,65 13,56 13,46

5 16,26 13,27 12,06 11,39 10,97 10,67 10,46 10,29 10,16 10,05 9,89 9,72 9,55 9,47 9,38 9,29 9,20 9,11 9,02
6 13,75 10,92 9,78 9,15 8,75 8,47 8,26 8,10 7,98 7,87 7,72 7,56 7,40 7,31 7,23 7,14 7,06 6,97 6,88
7 12,25 9,55 8,45 7,85 7,46 7,19 6,99 6,84 6,72 6,62 6,47 6,31 6,16 6,07 5,99 5,91 5,82 5,74 5,65
8 11,26 8,65 7,59 7,01 6,63 6,37 6,18 6,03 5,91 5,81 5,67 5,52 5,36 5,28 5,20 5,12 5,03 4,95 4,86
9 10,56 8,02 6,99 6,42 6,06 5,80 5,61 5,47 5,35 5,26 5,11 4,96 4,81 4,73 4,65 4,57 4,48 4,40 4,31

10 10,04 7,56 6,55 5,99 5,64 5,39 5,20 5,06 4,94 4,85 4,71 4,56 4,41 4,33 4,25 4,17 4,08 4,00 3,91
11 9,65 7,21 6,22 5,67 5,32 5,07 4,89 4,74 4,63 4,54 4,40 4,25 4,10 4,02 3,94 3,86 3,78 3,69 3,60
12 9,33 6,93 5,95 5,41 5,06 4,82 4,64 4,50 4,39 4,30 4,16 4,01 3,86 3,78 3,70 3,62 3,54 3,45 3,36
13 9,07 6,70 5,74 5,21 4,86 4,62 4,44 4,30 4,19 4,10 3,96 3,82 3,66 3,59 3,51 3,43 3,34 3,25 3,17
14 8,86 6,51 5,56 5,04 4,69 4,46 4,28 4,14 4,03 3,94 3,80 3,66 3,51 3,43 3,35 3,27 3,18 3,09 3,00

15 8,68 6,36 5,42 4,89 4,56 4,32 4,14 4,00 3,89 3,80 3,67 3,52 3,37 3,29 3,21 3,13 3,05 2,96 2,87
16 8,53 6,23 5,29 4,77 4,44 4,20 4,03 3,89 3,78 3,69 3,55 3,41 3,26 3,18 3,10 3,02 2,93 2,84 2,75
17 8,40 6,11 5,18 4,67 4,34 4,10 3,93 3,79 3,68 3,59 3,46 3,31 3,16 3,08 3,00 2,92 2,83 2,75 2,65
18 8,29 6,01 5,09 4,58 4,25 4,01 3,84 3,71 3,60 3,51 3,37 3,23 3,08 3,00 2,92 2,84 2,75 2,66 2,57
19 8,18 5,93 5,01 4,50 4,17 3,94 3,77 3,63 3,52 3,43 3,30 3,15 3,00 2,92 2,84 2,76 2,67 2,58 2,49

20 8,10 5,85 4,94 4,43 4,10 3,87 3,70 3,56 3,46 3,37 3,23 3,09 2,94 2,86 2,78 2,69 2,61 2,52 2,42
21 8,02 5,78 4,87 4,37 4,04 3,81 3,64 3,51 3,40 3,31 3,17 3,03 2,88 2,80 2,72 2,64 2,55 2,46 2,36
22 7,95 5,72 4,82 4,31 3,99 3,76 3,59 3,45 3,35 3,26 3,12 2,98 2,83 2,75 2,67 2,58 2,50 2,40 2,31
23 7,88 5,66 4,76 4,26 3,94 3,71 3,54 3,41 3,30 3,21 3,07 2,93 2,78 2,70 2,62 2,54 2,45 2,35 2,26
24 7,82 5,61 4,72 4,22 3,90 3,67 3,50 3,36 3,26 3,17 3,03 2,89 2,74 2,66 2,58 2,49 2,40 2,31 2,21

25 7,77 5,57 4,68 4,18 3,85 3,63 3,46 3,32 3,22 3,13 2,99 2,85 2,70 2,62 2,54 2,45 2,36 2,27 2,17
26 7,72 5,53 4,64 4,14 3,82 3,59 3,42 3,29 3,18 3,09 2,96 2,81 2,66 2,58 2,50 2,42 2,33 2,23 2,13
27 7,68 5,49 4,60 4,11 3,78 3,56 3,39 3,26 3,15 3,06 2,93 2,78 2,63 2,55 2,47 2,38 2,29 2,20 2,10
28 7,64 5,45 4,57 4,07 3,75 3,53 3,36 3,23 3,12 3,03 2,90 2,75 2,60 2,52 2,44 2,35 2,26 2,17 2,06
29 7,60 5,42 4,54 4,04 3,73 3,50 3,33 3,20 3,09 3,00 2,87 2,73 2,57 2,49 2,41 2,33 2,23 2,14 2,03

30 7,56 5,39 4,51 4,02 3,70 3,47 3,30 3,17 3,07 2,98 2,84 2,70 2,55 2,47 2,39 2,30 2,21 2,11 2,01
40 7,31 5,18 4,31 3,83 3,51 3,29 3,12 2,99 2,89 2,80 2,66 2,52 2,37 2,29 2,20 2,11 2,02 1,92 1,80
60 7,08 4,98 4,13 3,65 3,34 3,12 2,95 2,82 2,72 2,63 2,50 2,35 2,20 2,12 2,03 1,94 1,84 1,73 1,60
120 6,85 4,79 3,95 3,48 3,17 2,96 2,79 2,66 2,56 2,47 2,34 2,19 2,03 1,95 1,86 1,76 1,66 1,53 1,38
∞ 6,64 4,61 3,78 3,32 3,02 2,80 2,64 2,51 2,41 2,32 2,18 2,04 1,88 1,79 1,70 1,59 1,47 1,32 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTIL 99,5 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 16211 19999 21615 22500 23056 23437 23715 23925 24091 24224 24426 24630 24836 24940 25044 25148 25253 25359 25464
2 198,5 199,0 199,2 199,2 199,3 199,3 199,4 199,4 199,4 199,4 199,4 199,4 199,4 199,5 199,5 199,5 199,5 199,5 199,5
3 55,55 49,80 47,47 46,19 45,39 44,84 44,43 44,13 43,88 43,69 43,39 43,08 42,78 42,62 42,47 42,31 42,15 41,99 41,83
4 31,33 26,28 24,26 23,15 22,46 21,97 21,62 21,35 21,14 20,97 20,70 20,44 20,17 20,03 19,89 19,75 19,61 19,47 19,32

5 22,78 18,31 16,53 15,56 14,94 14,51 14,20 13,96 13,77 13,62 13,38 13,15 12,90 12,78 12,66 12,53 12,40 12,27 12,14
6 18,63 14,54 12,92 12,03 11,46 11,07 10,79 10,57 10,39 10,25 10,03 9,81 9,59 9,47 9,36 9,24 9,12 9,00 8,88
7 16,24 12,40 10,88 10,05 9,52 9,16 8,89 8,68 8,51 8,38 8,18 7,97 7,75 7,64 7,53 7,42 7,31 7,19 7,08
8 14,69 11,04 9,60 8,81 8,30 7,95 7,69 7,50 7,34 7,21 7,01 6,81 6,61 6,50 6,40 6,29 6,18 6,06 5,95
9 13,61 10,11 8,72 7,96 7,47 7,13 6,88 6,69 6,54 6,42 6,23 6,03 5,83 5,73 5,62 5,52 5,41 5,30 5,19

10 12,83 9,43 8,08 7,34 6,87 6,54 6,30 6,12 5,97 5,85 5,66 5,47 5,27 5,17 5,07 4,97 4,86 4,75 4,64
11 12,23 8,91 7,60 6,88 6,42 6,10 5,86 5,68 5,54 5,42 5,24 5,05 4,86 4,76 4,65 4,55 4,45 4,34 4,23
12 11,75 8,51 7,23 6,52 6,07 5,76 5,52 5,35 5,20 5,09 4,91 4,72 4,53 4,43 4,33 4,23 4,12 4,01 3,90
13 11,37 8,19 6,93 6,23 5,79 5,48 5,25 5,08 4,94 4,82 4,64 4,46 4,27 4,17 4,07 3,97 3,87 3,76 3,65
14 11,06 7,92 6,68 6,00 5,56 5,26 5,03 4,86 4,72 4,60 4,43 4,25 4,06 3,96 3,86 3,76 3,66 3,55 3,44

15 10,80 7,70 6,48 5,80 5,37 5,07 4,85 4,67 4,54 4,42 4,25 4,07 3,88 3,79 3,69 3,58 3,48 3,37 3,26
16 10,58 7,51 6,30 5,64 5,21 4,91 4,69 4,52 4,38 4,27 4,10 3,92 3,73 3,64 3,54 3,44 3,33 3,22 3,11
17 10,38 7,35 6,16 5,50 5,07 4,78 4,56 4,39 4,25 4,14 3,97 3,79 3,61 3,51 3,41 3,31 3,21 3,10 2,98
18 10,22 7,21 6,03 5,37 4,96 4,66 4,44 4,28 4,14 4,03 3,86 3,68 3,50 3,40 3,30 3,20 3,10 2,99 2,87
19 10,07 7,09 5,92 5,27 4,85 4,56 4,34 4,18 4,04 3,93 3,76 3,59 3,40 3,31 3,21 3,11 3,00 2,89 2,78

20 9,94 6,99 5,82 5,17 4,76 4,47 4,26 4,09 3,96 3,85 3,68 3,50 3,32 3,22 3,12 3,02 2,92 2,81 2,69
21 9,83 6,89 5,73 5,09 4,68 4,39 4,18 4,01 3,88 3,77 3,60 3,43 3,24 3,15 3,05 2,95 2,84 2,73 2,61
22 9,73 6,81 5,65 5,02 4,61 4,32 4,11 3,94 3,81 3,70 3,54 3,36 3,18 3,08 2,98 2,88 2,77 2,66 2,55
23 9,63 6,73 5,58 4,95 4,54 4,26 4,05 3,88 3,75 3,64 3,47 3,30 3,12 3,02 2,92 2,82 2,71 2,60 2,48
24 9,55 6,66 5,52 4,89 4,49 4,20 3,99 3,83 3,69 3,59 3,42 3,25 3,06 2,97 2,87 2,77 2,66 2,55 2,43

25 9,48 6,60 5,46 4,84 4,43 4,15 3,94 3,78 3,64 3,54 3,37 3,20 3,01 2,92 2,82 2,72 2,61 2,50 2,38
26 9,41 6,54 5,41 4,79 4,38 4,10 3,89 3,73 3,60 3,49 3,33 3,15 2,97 2,87 2,77 2,67 2,56 2,45 2,33
27 9,34 6,49 5,36 4,74 4,34 4,06 3,85 3,69 3,56 3,45 3,28 3,11 2,93 2,83 2,73 2,63 2,52 2,41 2,29
28 9,28 6,44 5,32 4,70 4,30 4,02 3,81 3,65 3,52 3,41 3,25 3,07 2,89 2,79 2,69 2,59 2,48 2,37 2,25
29 9,23 6,40 5,28 4,66 4,26 3,98 3,77 3,61 3,48 3,38 3,21 3,04 2,86 2,76 2,66 2,56 2,45 2,33 2,21

30 9,18 6,35 5,24 4,62 4,23 3,95 3,74 3,58 3,45 3,34 3,18 3,01 2,82 2,73 2,63 2,52 2,42 2,30 2,18
40 8,83 6,07 4,98 4,37 3,99 3,71 3,51 3,35 3,22 3,12 2,95 2,78 2,60 2,50 2,40 2,30 2,18 2,06 1,93
60 8,49 5,79 4,73 4,14 3,76 3,49 3,29 3,13 3,01 2,90 2,74 2,57 2,39 2,29 2,19 2,08 1,96 1,83 1,69
120 8,18 5,54 4,50 3,92 3,55 3,28 3,09 2,93 2,81 2,71 2,54 2,37 2,19 2,09 1,98 1,87 1,75 1,61 1,43
∞ 7,88 5,30 4,28 3,72 3,35 3,09 2,90 2,74 2,62 2,52 2,36 2,19 2,00 1,90 1,79 1,67 1,53 1,36 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
PERCENTIL 99,9 DE DISTRIBUCIONES F

gl2\gl1 1 2 3 4 5 6 7 8 9 10 12 15 20 24 30 40 60 120 ∞
1 4053 5000 5404 5625 5764 5859 5929 5981 6023 6056 6107 6158 6209 6235 6261 6287 6313 6340 6366
2 998,5 999,0 999,2 999,2 999,3 999,3 999,4 999,4 999,4 999,4 999,4 999,4 999,4 999,5 999,5 999,5 999,5 999,5 999,5
3 167,0 148,5 141,1 137,1 134,6 132,8 131,6 130,6 129,9 129,2 128,3 127,4 126,4 125,9 125,4 125,0 124,5 124,0 123,5
4 74,14 61,25 56,18 53,44 51,71 50,53 49,66 49,00 48,47 48,05 47,41 46,76 46,10 45,77 45,43 45,09 44,75 44,40 44,05

5 47,18 37,12 33,20 31,09 29,75 28,83 28,16 27,65 27,24 26,92 26,42 25,91 25,39 25,13 24,87 24,60 24,33 24,06 23,79
6 35,51 27,00 23,70 21,92 20,80 20,03 19,46 19,03 18,69 18,41 17,99 17,56 17,12 16,90 16,67 16,44 16,21 15,98 15,75
7 29,25 21,69 18,77 17,20 16,21 15,52 15,02 14,63 14,33 14,08 13,71 13,32 12,93 12,73 12,53 12,33 12,12 11,91 11,70
8 25,41 18,49 15,83 14,39 13,48 12,86 12,40 12,05 11,77 11,54 11,19 10,84 10,48 10,30 10,11 9,92 9,73 9,53 9,33
9 22,86 16,39 13,90 12,56 11,71 11,13 10,70 10,37 10,11 9,89 9,57 9,24 8,90 8,72 8,55 8,37 8,19 8,00 7,81

10 21,04 14,91 12,55 11,28 10,48 9,93 9,52 9,20 8,96 8,75 8,45 8,13 7,80 7,64 7,47 7,30 7,12 6,94 6,76
11 19,69 13,81 11,56 10,35 9,58 9,05 8,66 8,35 8,12 7,92 7,63 7,32 7,01 6,85 6,68 6,52 6,35 6,18 6,00
12 18,64 12,97 10,80 9,63 8,89 8,38 8,00 7,71 7,48 7,29 7,00 6,71 6,40 6,25 6,09 5,93 5,76 5,59 5,42
13 17,82 12,31 10,21 9,07 8,35 7,86 7,49 7,21 6,98 6,80 6,52 6,23 5,93 5,78 5,63 5,47 5,30 5,14 4,97
14 17,14 11,78 9,73 8,62 7,92 7,44 7,08 6,80 6,58 6,40 6,13 5,85 5,56 5,41 5,25 5,10 4,94 4,77 4,60

15 16,59 11,34 9,34 8,25 7,57 7,09 6,74 6,47 6,26 6,08 5,81 5,54 5,25 5,10 4,95 4,80 4,64 4,47 4,31
16 16,12 10,97 9,01 7,94 7,27 6,80 6,46 6,19 5,98 5,81 5,55 5,27 4,99 4,85 4,70 4,54 4,39 4,23 4,06
17 15,72 10,66 8,73 7,68 7,02 6,56 6,22 5,96 5,75 5,58 5,32 5,05 4,78 4,63 4,48 4,33 4,18 4,02 3,85
18 15,38 10,39 8,49 7,46 6,81 6,35 6,02 5,76 5,56 5,39 5,13 4,87 4,59 4,45 4,30 4,15 4,00 3,84 3,67
19 15,08 10,16 8,28 7,27 6,62 6,18 5,85 5,59 5,39 5,22 4,97 4,70 4,43 4,29 4,14 3,99 3,84 3,68 3,51

20 14,82 9,95 8,10 7,10 6,46 6,02 5,69 5,44 5,24 5,08 4,82 4,56 4,29 4,15 4,00 3,86 3,70 3,54 3,38
21 14,59 9,77 7,94 6,95 6,32 5,88 5,56 5,31 5,11 4,95 4,70 4,44 4,17 4,03 3,88 3,74 3,58 3,42 3,26
22 14,38 9,61 7,80 6,81 6,19 5,76 5,44 5,19 4,99 4,83 4,58 4,33 4,06 3,92 3,78 3,63 3,48 3,32 3,15
23 14,20 9,47 7,67 6,70 6,08 5,65 5,33 5,09 4,89 4,73 4,48 4,23 3,96 3,82 3,68 3,53 3,38 3,22 3,05
24 14,03 9,34 7,55 6,59 5,98 5,55 5,23 4,99 4,80 4,64 4,39 4,14 3,87 3,74 3,59 3,45 3,29 3,14 2,97

25 13,88 9,22 7,45 6,49 5,89 5,46 5,15 4,91 4,71 4,56 4,31 4,06 3,79 3,66 3,52 3,37 3,22 3,06 2,89
26 13,74 9,12 7,36 6,41 5,80 5,38 5,07 4,83 4,64 4,48 4,24 3,99 3,72 3,59 3,44 3,30 3,15 2,99 2,82
27 13,61 9,02 7,27 6,33 5,73 5,31 5,00 4,76 4,57 4,41 4,17 3,92 3,66 3,52 3,38 3,23 3,08 2,92 2,75
28 13,50 8,93 7,19 6,25 5,66 5,24 4,93 4,69 4,50 4,35 4,11 3,86 3,60 3,46 3,32 3,18 3,02 2,86 2,69
29 13,39 8,85 7,12 6,19 5,59 5,18 4,87 4,64 4,45 4,29 4,05 3,80 3,54 3,41 3,27 3,12 2,97 2,81 2,64

30 13,29 8,77 7,05 6,12 5,53 5,12 4,82 4,58 4,39 4,24 4,00 3,75 3,49 3,36 3,22 3,07 2,92 2,76 2,59
40 12,61 8,25 6,59 5,70 5,13 4,73 4,44 4,21 4,02 3,87 3,64 3,40 3,14 3,01 2,87 2,73 2,57 2,41 2,23
60 11,97 7,77 6,17 5,31 4,76 4,37 4,09 3,86 3,69 3,54 3,32 3,08 2,83 2,69 2,55 2,41 2,25 2,08 1,89
120 11,38 7,32 5,78 4,95 4,42 4,04 3,77 3,55 3,38 3,24 3,02 2,78 2,53 2,40 2,26 2,11 1,95 1,77 1,54
∞ 10,83 6,91 5,42 4,62 4,10 3,74 3,47 3,27 3,10 2,96 2,74 2,51 2,27 2,13 1,99 1,84 1,66 1,45 1,00

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4035583

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
TEMA 11: Muestreo y estimación

Muestreo en investigación

El muestreo es el procedimiento por el que vamos a elegir una muestra para llevar a
cabo una investigación. No nos vale una muestra cualquiera pues tiene que ser
representativa. Veamos unos conceptos fundamentales antes de entrar en materia. La
población es un conjunto de elementos (personas, animales o cosas), sea finito o
infinito, que presentan una o más características por las que son distinguidos de
cualquier otro conjunto. Por población entendemos la totalidad del universo que
interesa estudiar. Es necesario que la población esté bien definida para saber, en todo
momento, qué elementos la forman. Cuanto más conozcamos esa población más fácil
y fiable será el proceso de construir esa muestra que nos permita trabajar con ella.
Pasamos ahora al concepto de censo; en determinadas ocasiones es posible estudiar
cada uno de los elementos que componen la población. Esto solo ocurrirá cuando la
población sea finita. Es lo ideal para cualquier persona que realice un muestreo porque
ahí están identificados cada uno de los elementos que componen la población, de
forma que seleccionar aleatoriamente es muy fácil. Sin embargo, la realización de un
censo no siempre es posible ni aconsejable por varios motivos:

 Económicos: cuando la población es grande, el estudio de todos sus miembros


suele ser un problema costoso en tiempo y dinero y, por tanto, solo se lleva a
cabo cuando las circunstancias lo exigen. Por ejemplo, el censo electoral.
 Que las pruebas a las que hay que someter a los sujetos sean destructivas. Está
claro que este problema no aparece en investigaciones con humanos.
 Que la población sea finita o tan grande que exceda las posibilidades del
experimentador.

Plantear hacer un censo normalmente no es viable, pero lo que sí puede resultar viable
es aprovechar censos elaborados por las instituciones siempre que sea posible.

La muestra es una parte o subconjunto representativo de la población. La


representatividad es una característica muy importante de las muestras, ya que es la

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
que garantiza que el estudio realizado en ella puede ser aplicado a la población de la
que ha sido extraída con la menor probabilidad de error posible. La afirmación que
hacemos sobre una población, a partir de los resultados de una muestra, es lo que se
conoce como inferencia. El muestreo es el procedimiento por el que elegimos una

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
muestra de la población. Tenemos varios tipos de muestreo podemos dividirlo en:

 Muestreo Aleatorio o Probabilístico. Es todo proceso de muestreo en el que se


garantiza la misma oportunidad de formar parte de la muestra a todos los
elementos que pertenecen a la población. La muestra que obtenemos con este
proceso se llama muestra aleatoria. Puede calcularse de antemano la
probabilidad de obtener cada una de las muestras que sea posible seleccionar.
Es el único tipo de muestreo capaz de decirnos el riesgo que cometemos en la
inferencia.
 Muestreo no Aleatorio. En ciertas ocasiones se hace necesario el empleo de
procedimientos que sacrifiquen la aleatoriedad estadística de la muestra a fin
de conseguir una mayor simplicidad y rapidez en su obtención. Esto no quiere
decir que las muestras obtenidas mediante este procedimiento no sean
representativas, sino simplemente que, por realizarse la elección de forma no
aleatoria, no puede establecerse estadísticamente el grado de fiabilidad de los
resultados, pero igualmente podrían ser representativas (o no).

Dentro del Muestreo Aleatorio de una Población Finita podemos tener dos casos:

 Muestreo Aleatorio sin Reposición. Extraemos un primer elemento d ela


población de forma aleatoria, luego extraemos un segundo elemento sin haber
respuesto el rpimero, luego extraemos un tercer elemento sin reponer los
anteriores, y así sucesivamente. El tamaño de la población irá disminuyendo
con las sucesivas extracciones. Se cumplen dos condiciones:
o En cada extracción, cada miembro de la población tiene la misma
probabilidad de ser extraído.
o La probabilidad de las sucesivas extracciones va cambiando debidoa
una disminución progresiva de los miembros d ela población, por tanto,
no hay independencia de las distintas extracciones.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


 Muestreo Aleatorio con Reposición. Una vez extraído un elemento de los N
que componen la poblaicon, es repuesto antes de realizar una segunda
extracción; volvemos a extraer un segundo elemento y de nuevo es repuesto
antes de la siguiente extracción, y así sucesivamente. La población siempre

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
constará de N elementos antes de que se produzca cada una de las
extracciones, teniendo cada elemento, en todas las extracciones, la misma
probabilidad de salir.

Normalmente cuando nosotros construimos una muestra lo solemos hacer sin


reposición, porque si esa misma persona es escogida dos veces, la muestra no sería
representativa. Podemos hacer un pequeño resumen dentro de los muestreos:

 Muestreo aleatorio o probabilístico.


o Muestreo aleatorio simple (m.a.s). Se trata de un muestreo donde
todos los sujetos están identificados o numerados, sacaríamos números
y cada numero se corresponde con un sujeto. Así se formaría la
muestra. Necesitaríamos tener identificados a todos los miembros de la
población.
o Muestreo aleatorio Sistemático o Periódico. Vamos a calcular una
fracción entre el numero de elementos que componen la población y
entre el numero de elementos que componen la muestra, y esto nos va
a dar el valor sistemático con el que nos iremos moviendo. Se trataría
de elegir aleatoriamente el primer elemento de la muestra, y después
iríamos contando. Imaginad que la fracción es 4, elegimos
aleatoriamente el primer elemento de la muestra por ejemplo el sujeto
48. Pues como la fracción es cuatro, a partir del 48 contamos cuatro y
en el sujeto que haya caído es el segundo elemento de mi muestra. Es
decir, elegimos los sujetos contando de 4 en cuatro a partir del numero
escogido inicialmente. Por ejemplo, en nuestro ejemplo (valga la
redundancia) serían el 48, el 52, el 56, y así.
o Muestreo Aleatorio Estratificado. Forma estratos en función de
características que puedan ser relevantes a la hora de elegir la muestra.
Para formar los estratos hay dos formas: por aleatorización (hombres

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


por un lado y mujeres por otro) o por afijación. Hay 4 tipos: afijación
uniforme y la proporcional. Cuando hablamos de la uniforme quiere
decir que los dos estratos tendrán el mismo número de sujetos (50 y 50
sujetos en ambos estratos). Cuando es proporcional, los estratos se

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
corresponden con la representación que tiene en la población ese
estrato (por ejemplo, si en Psicología hay un 80% de mujeres y un 20%
de hombres, pues no tendría sentido que nuestra muestra estuviera
formada por 50 hombres y 50 mujeres porque los hombres estarían
sobrerrepresentados).
o Muestreo Aleatorio de Conglomerados. Se trata de grupos formados por
elementos. Un conglomerado puede ser un colegio, un edificio de
viviendas, un barrio, etc. Depende de la amplitud que establezcamos
dentro del conglomerado. Si necesito por ejemplo, una muestra de
escolares de Almería podemos considerar que cada colegio de la
provincia es un conglomerado. Elegiremos aleatoriamente los
conglomerados (los colegios) y una vez elegidos, todos los miembros del
colegio pasarían a formar parte de la muestra. Esa es una forma de
hacerlo en una etapa. Pero se puede hacer en dos etapas, que por
ejemplo, después de elegir el colegio aleatoriamente (la primera etapa),
se elige aleatoriamente dentro del conglomerado un número de
unidades que necesitamos, 10 o 15.
 Muestreo no aleatorio o no probabilístico.
o Muestreo por Cuotas. Se establecen cuotas en función de criterios
relevantes para el estudio (género, edad, nivel de estudios, etc.). A la
persona que se va a encargar se le dan unas instrucciones. Por ejemplo,
los típicos encuestadores de la calle tienen un listado de una cuota de
15 o un 20% de mujeres de X edad y buscan a las primeras personas que
tengan acceso que encajen en ese perfil. Esa persona tiene sus cuotas
apuntadas y sabe qué grupos son los que tiene que formar con las
primeras personas que se encuentren por la calle y coincidan con las
características que se le hayan pedido.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


Muestreo semialeatorio:
Muestreo por rutas: Normas sobre la ruta o camino que sebe seguir en la
selección de la muestra. Este procedimiento, suficientemente perfeccionado,
puede resultar prácticamente aleatorio. Cuando se utilizan muestras muy grandes
- NO sale o Muestreo por Juicio o intencional. Se trata de preguntarle a expertos
en el tema que estemos estudiando qué sujetos considera que son
adecuados para formar nuestra muestra. Ese juicio experto nos formará
la muestra con las características adecuadas.
- NO sale o Muestreo Autoelegido. Es un muestreo de voluntarios. Por ejemplo,
poner un anuncio y toda persona que se presente voluntaria formaría
parte de la muestra.
o Muestreo Accidental, sin Normas, Circunstancial. Trabaja con lo que
“tiene a mano”. Por ejemplo, es el muestreo que se usa en la
universidad, se utilizan los sujetos que tienen a mano, es decir, los
alumnos.
- NO sale o Muestreo por Bola de nieve. Sobre todo se usa con problemáticas
sociales o grupos sociales muy cerrados (drogodependientes por
ejemplo). Contactamos con una persona que nos da acceso a ese grupo
social que nos interese, esa persona contactaría con otros miembros y
conseguiría más miembros para formar parte de nuestra muestra.

Nosotros partimos de una población y a partir del muestreo formamos nuestra


muestra. A partir de esa muestra podemos llevar a cabo la estimación. Vamos a
estimar lo que podría suceder en la población a partir de lo observado en la muestra. A
este proceso en el que pasamos de lo observado en la muestra a lo esperado en la

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
población llamamos inferencia. Vamos a estimar parámetros. Lo que medimos en la
muestra se llama estadísticos y lo que se da en la población se llama parámetros. Los
estadísticos en la muestra los conocemos porque los estamos midiendo, sin embargo,
los de la población vamos a tener que inferirlos a partir de lo observado en la muestra.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esa estimación de parámetros la podemos hacer de tres formas:

- Puntual. Asumir que el valor que se da en la muestra se dará en la población.


- Intervalos de confianza. Vamos a establecer un intervalo o rango entre dos
valores, entre con los que con una probabilidad de error conocida, vamos a
asumir que se encuentran los valores en la población.
- Contraste de hipótesis. Lo que va a hacer es probar el valor del que nosotros
partimos. Contrastamos un valor que a priori conocemos de alguna manera.

ESTIMACIÓN

Distribución muestral de un estadístico

Es el resultado de calcular un determinado estadístico en todas las muestras posibles,


de tamaño n, que pueden ser tomadas de una población. Su estudio permite calcular la
probabilidad que se tiene, dada una sola muestra, de acercarse al parámetro de la
población. El estudio de determinadas características de una población se efectúa a
través de diversas muestras que pueden extraerse de ella. El muestreo puede hacerse
con o sin reposición y la población de partida puede ser infinita o finita. Una población
finita en la que se efectúa muestreo con reposición puede considerarse infinita
teóricamente. También, a efectos prácticas, una población muy grande puede
considerarse como infinita. Consideramos todas las posibles muestras de tamaño n en
una población. Para cada muestra podemos calcular un estadístico (media, desviación
típica, proporción…) que variará de una a otra. Así obtenemos una distribución del
estadístico que se llama distribución muestral. Las dos medidas fundamentales de esta
distribución son la media y la desviación típica, también denominada error típico. Si el
tamaño de la muestra es lo suficientemente grande, las distribuciones muestrales son
normales.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


Distribución muestral de la media

Cada muestra, de tamaño n, que podemos extraer de una población, proporciona una
media. Se trataría de ir eligiendo todas las posibles muestras, de tamaño n, y a partir
de ellas veríamos la probabilidad asociada a cada uno de los valores del estadístico en

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
cada muestra, de manera que nosotros contamos con esa distribución que nos
permitirá a la hora de llevar a cabo la inferencia, conocer esas probabilidades
asociadas a cada uno de los valores. Tendríamos que calcular las medias de todas las
muestras. Si consideramos cada una de estas medias como valores de una variable
aleatoria podemos estudiar su distribución que llamaremos distribución muestral de
la media.

 Si tenemos una población normal N( µ, σ ) y extraemos de ella muestras de


tamaño n, la distribución muestral de la media sigue también una distribución
normal.
 Si la población no sigue una distribución normal pero n > 30, aplicando el
llamado Teorema Central del Límite, la distribución muestral de la media se
aproxima también a la normal anterior. Este teorema nos dice que a medida
que el tamaño de la muestra aumenta la distribución se aproxima cada vez más
a la normal.

Estadística inferencial

Tenemos:

 Estimación de parámetros. Obtener un valor (estimación puntual) o un


intervalo de valores (estimación por intervalos confidenciales) que constituyan
la mejor estimación del parámetro desconocido, a partir de datos muestrales.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


 Contraste de Hipótesis. Probar si un valor atribuido al parámetro es compatible
o no con el valor obtenido por un estimador del mismo, en las observaciones
muestrales.

Propiedades deseables de los Estimadores

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Cuando hablamos de estimadores nos referimos a índices estadísticos que vamos a
utilizar para estimar esos parámetros. Pueden ser la media, mediana, desviación típica,
etc. Hay cuatro propiedades exigibles a todos los estimadores:

- Carencia de sesgo. Un estimador es insesgado si su valor esperado es igual al


del propio parámetro.
- Consistencia. Un estimador es consistente cuando las estimaciones que
proporciona se van aproximando cada vez más al valor del parámetro, a
medida que aumenta el tamaño de la muestra. Cuanto más grande sea la
muestra más consistencia tendrá a priori la estimación de ese estimador.
- Eficiencia relativa. Para que un estimador sea eficiente, es necesario que su
distribución esté muy concentrada alrededor del verdadero valor del
parámetro. Es decir, que su varianza sea pequeña. Una varianza significa que
los valores están muy concentrados.
- Suficiencia. Un estimador es suficiente si él solo basta para estimar el
parámetro. Si utiliza toda la información posible que existe en la muestra, de
modo que la estimación no pueda ser mejorada.

Sesgo o carencia de sesgo de diversos estimadores de parámetros de varios


problemas:

Parámetro Naturaleza de Estimador Evaluación


Población
µ Cualquier población Insesgado
µ Simétrica Md Insesgado
µ Simétrica y unimodal Mo Insesgado
µ Asimétrica Md Sesgado
µ Asimétrica Mo Sesgado

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


σ2 Cualquier población Ŝ2 Insesgado
σ Normal S Sesgado
π Normal P Insesgado
Pxy Normal Bivariada rxy Sesgado

Es para tener un poco claro los estimadores que están sesgados o insesgados.

Estimación puntual

Se toma el valor del estadístico para estimar el valor del parámetro. Este tipo de
estimación presenta el inconveniente de que no podemos establecer qué probabilidad
hay de que la estimación sea igual al valor del parámetro, no sabemos el error que
estamos cometiendo por lo que no podemos establecer la probabilidad de que la
estimación sea igual al verdadero valor del parámetro. Podemos suplir esta deficiencia
(como veremos en el siguiente tema) estableciendo un intervalo por dos valores entre
los que afirmamos, con una determinada probabilidad, que se encuentra el parámetro.

El problema fundamental de este tipo de estimación radica en que, aunque nuestro


estimador cumpla las propiedades deseables exigidas (carencia de sesgo, consistencia,
eficiencia relativa y suficiencia), no podemos establecer el error cometido al estimar el
parámetro, ni la fiabilidad de nuestra estimación. Lo único que podemos afirmar es
que dado un tamaño muestral “n”, el error cometido al estimar el parámetro
poblacional, se reducirá a medida que “n” aumente. Sin embargo, cuando se realiza
una estimación mediante intervalos confidenciales, en lugar de un único valor,
proponemos un intervalo de confianza, dentro del cuál podemos afirmar que se
encuentra el verdadero valor del parámetro indicando, además, el grado de certeza (o
indicando la probabilidad de error) que podemos tener respecto a esa estimación.

Estimación de parámetros mediante intervalos confidenciales

En general:

Iu = Estimador ± [ Z 1-α/2 * (Error típico) ]

Donde α es el error que cometemos en la estimación, también lo vamos a llamar error


de significación y normalmente será establecido en 0’05 o 5% y lo suele informar el

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
investigador y si no se informa asumimos que es 0’05. Este error nos va a permitir
establecer las puntuaciones de la distribución que hay asociadas a ese error que
estamos trabajando. (1 – α) es la fiabilidad de nuestra estimación (la probabilidad de
que el parámetro se encuentre dentro del intervalo calculado con la fórmula), y Z 1-α/2

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
es la puntuación típica que deja por debajo de sí un área de (1-α/2), es decir (1-α/2)
nos da el percentil.

ESTIMACIÓN DE PARÁMETROS MEDIANTE INTERVALOS CONFIDENCIALES

Dentro de los intervalos confidenciales tenemos dos tipos:

 Intervalos de Confianza para un parámetro.


o Intervalos de Confianza para una media.
o Intervalo de Confianza para una proporción.
o Intervalo de Confianza para una varianza.
o Intervalo de Confianza para un Coeficiente de Correlación de Pearson.
 Intervalos de Confianza para dos parámetros.
o Intervalos de Confianza para dos medias.
o Intervalos de Confianza para dos proporciones.

Intervalos de Confianza para una Media

Tenemos tres fórmulas para los intervalos de confianza para una media:

Para la varianza poblacional conocida. Se da cuando por ejemplo estamos trabajando


con un test que está validado, porque normalmente esos test tienen una varianza
conocida:

𝜎
Iµ = ± [ Z 1-α/2 * ]
√𝑛

Para la varianza poblacional desconocida cuando:

 n ≥ 100 como la muestra es grande probablemente siga una distribución


normal
Ŝ
Iµ = ± [ Z 1-α/2 * ]
√𝑛

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


 n < 100
Ŝ
Iµ = ± [ t 1-α/2, n-1 * ]
√𝑛

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ejemplo:

En una prueba de inteligencia aplicada a 100 sujetos, la media obtenida ha sido de


110. Por estudios realizados anteriormente, sabemos que en esta prueba, la varianza
poblacional es 225. Calcula el intervalo de confianza para la media, si α = 0’05.

Como vemos nos han dado una media y la varianza poblacional es conocida. Por lo que
la fórmula que tenemos que usar es:

𝜎
Iµ = ± [ Z 1-α/2 * ]
√𝑛

Ahora solo queda sustituir porque sabemos que: la media que nos han dado es 110, la
desviación típica podemos calcularla haciendo la raíz cuadrada de 225, que es 15.
Sabemos que n es 100. Realmente lo que nos queda saber es Z 1-α/2 y es muy fácil de
calcular.

𝛼 0′05
1- = 1- = 1 – 0’025 = 0’975
2 2

Ese resultado tenemos que buscarlo dentro de la tabla de la distribución normal y es:

El resultado de Z 1-α/2 es por lo


tanto 1’96.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


15
Iµ = 110 ± [ 1’96 * ]
√100

Iµ = 110 ± 2’94

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Los dos números que van a formar nuestro intervalo se logran sumando 110 + 2’94
(112’94) y restando 110 – 2’94 (107’06).

107’06 < µ < 112’94

Esto quiere decir que el valor de la media de la población estará comprendido entre
107’06 y 112’94.

Ejemplo 2:

En una prueba de inteligencia, hemos obtenido una media de 110 y una


cuasivarianza de 6724. Calcula el intervalo de confianza para la media, si n=100 y α=
0’01.

Vemos que nos dan una media, pero desconocemos la varianza poblacional y además
n es igual a 100 por lo que es una muestra grade. La fórmula a usar es:

Ŝ
Iµ = ± [ Z 1-α/2 * ]
√𝑛

Es prácticamente igual que el otro. Sabemos que la media es 110, la desviación Ŝ la


sacaríamos haciendo la raíz cuadrada de 6724, que da 82; n=100 y lo que nos queda es
calcular Z 1-α/2 que se hace igual que antes:

𝛼 0′01
1- = 1- = 1 – 0’005 = 0’995
2 2

Lo buscamos en la tabla de distribución normal y el número que nos sale es: 2’58 ya
que es el valor que más se aproxima.

82
Iµ = 110 ± [ 2’58 * ]
√100

Iµ = 110 ± 21’16

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


El intervalo que se nos queda es:

88’4 < µ < 131’16

Ahora, ¿la media poblacional de inteligencia podría valer 90? La respuesta es sí porque
90 se encuentra dentro del intervalo.

Ejemplo 3

Hemos obtenido las siguientes puntuaciones en una prueba de memoria: 8, 10, 12,
14, 16. Calcula el intervalo de confianza para la media si α= 0’05.

Aquí tenemos una media, desconocemos la varianza poblacional y n<100, es decir, es


una muestra pequeña. La fórmula a usar es:

Ŝ
Iµ = ± [ t 1-α/2, n-1 * ]
√𝑛

Sabemos que n=5 porque solo hay 5 puntuaciones. La media si la calculamos es 12 y Ŝ


si la calculamos también sale 3’16. Ahora lo que tenemos que hacer es:

t 1-α/2 , n-1
𝛼
Primero calculemos 1-
2

0′05
1- = 1 – 0’025 = 0’975
2

Ahora nos queda calcular n-1  5-1=4

Nos quedaría entonces:

t (0’975, 4)

Tenemos que buscarlo en la tabla de t de Student, concretamente en el percentil 97’5


y en el grado de libertad (fila) 4. El resultado como vemos es 2’776

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Ahora solo queda sustituir todo en la fórmula

3,16
Iµ = 12 ± [ 2’776 * ]
√5

Iµ = 12 ± 3’92

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Por lo tanto el intervalo resultante es:

8’08 < µ < 15’92

Intervalo de Confianza para una Proporción

Normalmente lo calcularemos siempre que tengamos un tamaño muestral de al menos


25 (n ≥ 25).

𝑝∗(1−𝑝)
Iπ = p ± [ Z 1-α/2 * √ ]
𝑛

Las proporciones van a ser dos, si tenemos p y 1-p, tenemos que tener cuidado con lo
que nos piden.

Ejemplo

En una clase de 100 alumnos, 36 aprueban y 64 suspenden. Con α= 0’05, ¿entre qué
valores estará la proporción de suspensos en la población? ¿y la de aprobados=

Sabemos que nos están hablando de proporciones. Tenemos los aprobados y


suspensos así que pasémoslos a proporción (como n=100 es más fácil incluso).

Proporción de suspensos = 0’64.

Proporción de aprobados = 0’36

La fórmula a usar solo puede ser una:

𝑝∗(1−𝑝)
Iπ = p ± [ Z 1-α/2 * √ ]
𝑛

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


Vamos a ir por partes. Primero nos preguntan por los valores de la proporción de
suspensos, por lo que la p en la que nos vamos a fijar es en la de suspensos, es decir,
p=0’64. Vamos ahora a sacar Z 1-α/2

0′05

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1- = 1 – 0’025 = 0’975 que sabemos ya de memoria que es 1’96 en la tabla.
2

Así que vamos a hacerlo ya:

0,64∗(1−0,64)
Iπ suspensos = 0’64 ± [ 1’96 * √ ]
100

0,64 ∗0,36)
Iπ suspensos = 0’64 ± [ 1’96 * √ ]
100

Iπ suspensos = 0’64 ± [ 1’96 * 0′048 ]  0’64 ± 0’09

El intervalo es:

0’55 < π suspensos < 0’73

Ahora tenemos que hacer lo mismo que acabamos de hacer pero con la proporción de
aprobados:

0,36∗(1−0,36)
Iπ aprobados = 0’36 ± [ 1’96 * √ ]
100

0,36 ∗0,64)
Iπ aprobados = 0’36 ± [ 1’96 * √ ]
100

Iπ aprobados = 0’36 ± [ 1’96 * 0′048 ]  0’36 ± 0’09

El intervalo es:

0’27 < π aprobados < 0’45

Intervalo de Confianza para una Varianza

Es un poco diferente porque hay que buscar en la tabla dos puntuaciones diferentes
porque trabajamos con dos regiones críticas vinculadas al nivel de significación.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


( n-1 ) * Ŝ2 ( n-1 ) * Ŝ2
< σ2 <
Χ2( n-1, 1- α/2 ) Χ2( n-1, α/2 )

Ejemplo:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
En una prueba de percepción auditiva, la media ha sido 80 y la cuasi-desviación típica
5. La muestra era de 11 sujetos. Calcula el intervalo de confianza para la varianza, si
α= 0’04.

Realmente lo que tenemos que hacer es sustituir:

( 11-1 ) * 52 ( 11-1 ) * 52
< σ2 <
Χ2( 10, 0’98 ) Χ2( 10, 0’02 )
Tenemos que buscar en la tabla de Chi-cuadrado:

Χ2( 10, 0’98 ) = 21’161


Χ2( 10, 0’02 ) = 3’059

Solo nos queda operar:


10 * 25 10 * 25
21’161 < σ2 < 3’059

11’81 < σ2 < 81’73

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


Intervalo de Confianza para un Coeficiente de Correlación de Pearson

Tiene un problema y es que para poder calcular el intervalo de confianza, hace falta
saber el valor del parámetro. Si sabemos el valor del parámetro, ¿para qué queremos
calcular el intervalo? Si no sabemos el valor del parámetro, no podemos calcular el
intervalo. Para solventar este problema, Fisher ideó una transformación en forma de
tabla en la que convertía las puntuaciones del coeficiente de correlación de Pearson en
puntuaciones Z de ese coeficiente de correlación, de forma que nos permite trabajar
con esa distinción y calcular el intervalo de confianza.

En la tabla de Fisher (que al dejo al final) a cada r le corresponde una puntuación de Zr.
Las puntuaciones de Pearson si recordamos oscilan entre -1 y 1.

Ejemplo

En un estudio entre edad y xenofobia, la correlación de Pearson obtenida ha sido


0’14. Con α= 0’01, calcula el intervalo de confianza si n=300.

Vamos a la tabla de conversiones de Fisher y vemos que la puntuación del coeficiente


de correlación de Pearson de 0’14 equivale a una puntuación Z de 0’141.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Rxy = 0’14  Zr = 0’141

Vamos a hacer Z 1-α/2

𝛼 0′01
1- = 1- = 1 – 0’005 = 0’995
2 2

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Si lo buscamos en la tabla es 2’58 (no hay que buscar este en la tabla de Fisher, sino en
la de siempre).

1
IZp = Zr ± [ Z 1-α/2 * √ ]
𝑛−3

1
IZp = 0’141 ± [2’58 * √ ]
297

IZp = 0’141 ± 0’15

El intervalo sería:

-0’009 < Zp < 0’291

Transformándolo con la tabla de Fisher:

-0’010 < p < 0’285

Cuando el limite inferior es negativo y el superior es positivo, concluiremos que en la


población no hay relación entre dos variables.

Intervalos de Confianza para la Diferencia de dos Medias

Para varianzas poblacionales conocidas tenemos esta fórmula:

σ21 σ22
Iµ1 - µ2 = ( 1 - 2) ± [ Z 1-α/2 * √ + ]
n1 n2

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


Para las varianzas poblacionales desconocidas y n1 y n2 ≥ 100

√ Ŝ2 1 Ŝ2 2
Iµ1 - µ2 = ( 1 - 2) ± [ Z 1-α/2 * + ]
n1 n2

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Para varianzas poblacionales desconocidas y n1 y n2 < 100

√ [ (n1 -1) * Ŝ21 ] + [ (n2 -1) * Ŝ22 ] 1 1


Iµ1 - µ2 = ( 1 - 2) ± t (1-α/2, n1 + n2 -2) * * n1 n2
n1 + n2 - 2

Ejemplo

Utilizamos 2 métodos diferentes para evaluar el aprendizaje de una segunda lengua


en un grupo de 9 alumnos. Con 4 de ellos utilizamos el método A y con los otros 5 el
B. Por estudios anteriores, sabemos que σ2A =10 y σ2B = 5. Los resultamos obtenidos
son:

A = 30 n A= 4 σ2A =10

B = 35 nB = 5 σ2B =5

α= 0’05

Calcula el intervalo de confianza de la diferencia de medias.

Tenemos dos medias con varianzas poblacionales conocidas.


σ21 σ22
Iµ1 - µ2 = ( 1 - 2) ± [ Z 1-α/2 * √ + ]
n1 n2

Sacamos Z 1-α/2

0′05
1- = 1 – 0’025 = 0’975 que sabemos ya de memoria que es 1’96 en la tabla.
2

√ 10 5
Iµ1 - µ2 = (30 - 35 ) ± [ 1’96 * + ]
4 5

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


-5 ± 3’67

El intervalo que sale es:

-8’67 < µ1 - µ2 < -1’33

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Las dos puntuaciones negativas quieren decir que, en cualquiera de los dos casos,
siempre la media del segundo método va a ser mayor. Si el 0 estuviera contenido
dentro del intervalo podríamos decir que no hay diferencia en la población entre los
dos métodos. Como ambos son negativos, la media del segundo método va a ser
mayor.

Ejemplo 2:

Utilizamos 2 métodos diferentes para evaluar el aprendizaje de una segunda lengua


en un grupo de 220 alumnos. Con 100 de ellos utilizamos el método A y con los otros
120 el B. Los resultados obtenidos son:

A = 50 nA= 100 σ2A =10

B = 40 nB= 120 σ2B =12

α= 0’05

Calcula el intervalo de confianza de la diferencia de medias.

Tenemos dos medias con varianzas poblacionales desconocidas, y con muestras


grandes por lo que la fórmula a usar es:

Ŝ2 1 Ŝ2 2
Iµ1 - µ2 = ( 1 - 2) ± [ Z 1-α/2 * √ + ]
n1 n2

Realmente es igual que el anterior ejercicio, porque si calculamos Z 1-α/2 sale 1’96.

√ 10 12
Iµ1 - µ2 = (50 - 40 ) ± [ 1’96 * + ]
100 120

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


10 ± 0’88

9’12 < µ1 - µ2 < 10’88

Ejemplo 3:

Utilizamos 2 métodos diferentes para evaluar el aprendizaje de una segunda lengua


en un grupo de 9 alumnos. Con 4 de ellos utilizamos el método A y con los otros 5 el
B. Los resultados obtenidos son:

A = 20 n A= 4 σ2A =16

B = 25 nB = 5 σ2B =25

α= 0’05

Calcula el intervalo de confianza de la diferencia de medias.

Ya vemos que son dos medias con varianzas poblacionales desconocidas, y son
muestras pequeñas. Nos toca el mostrenco de fórmula (lo siento mucho no voy a
escribirla a ordenador porque puedo llorar, adjunto foto de cómo se hace)

El primer paso es sacar t (1-α/2, n1 + n2 -2)

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Este resultado lo buscamos en la tabla t de Student, concretamente en el percentil
97’5 y g.l. 7. Si lo buscamos sale 2’365.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Solo nos queda sustituir y resolver:

El intervalo sería:

-12’29 < µ1 - µ2 < 2’29

Intervalo de Confianza para la Diferencia de dos Proporciones

Para muestras mayores o iguales de 25. En el caso que el tamaño de la muestra sea
menor que 25 tendríamos que concluir que no podemos calcularlo utilizando el
método que conocemos.

Ejemplo:

Un grupo de estudiantes de Psicología se divide en 2 grupos de forma aleatoria con


50 sujetos en cada uno de ellos. Cada grupo se somete a un ejercicio diferente.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


Luego, se les aplica una prueba para ver el dominio logrado en el ejercicio. Al
finalizar el experimento, encontramos que en el primer grupo han resuelto bien la
prueba el 70% y en el segundo grupo la proporción es de 0’60. Calcula el intervalo de
confianza para la diferencia de proporciones.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Recordad que al no decirnos nada, tomamos α= 0’05, y ya sabemos de memoria que
para α= 0’05, Z 1-α/2 = 1’96.

El intervalo que resulta es:

-0’09 <π1 - π2 < 0’29

No estamos hablando aquí de lo que sucede en la muestra, porque eso ya lo estamos


viendo, ya vemos que el número de aprobados ha sido mayor en el primer grupo que
en el segundo. Lo que concluiríamos es si hay diferencia en cuanto al dominio logrado
en el ejercicio en ambos métodos, ¿o no lo hay? Es decir, viendo estos resultados
¿podemos decir que la ejecución en ambos métodos es igual o diferente?, ¿un método
produce un porcentaje de aciertos más alto que el otro? Podríamos decir que ambos
métodos producen una ejecución parecida porque el limite inferior del intervalo es
negativo, el superior positivo, y el cero está contenido en el intervalo y se pueden dar
todos los casos posibles, que sea mayor una o la otra, o incluso que sean iguales.
Podemos concluir entonces que no habrá diferencias en la población entre ambos
métodos a la hora de producir resultados satisfactorios.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


TRANSFORMACIÓN Z DE FISHER DE rxy

r zr r zr r zr r zr r zr

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
,000 ,000 ,200 ,203 ,400 ,424 ,600 ,693 ,800 1,099
,005 ,005 ,205 ,208 ,405 ,430 ,605 ,701 ,805 1,113
,010 ,010 ,210 ,213 ,410 ,436 ,610 ,709 ,810 1,127
,015 ,015 ,215 ,218 ,415 ,442 ,615 ,717 ,815 1,142
,020 ,020 ,220 ,224 ,420 ,448 ,620 ,725 ,820 1,157

,025 ,025 ,225 ,229 ,425 ,454 ,625 ,733 ,825 1,172
,030 ,030 ,230 ,234 ,430 ,460 ,630 ,741 ,830 1,188
,035 ,035 ,235 ,239 ,435 ,466 ,635 ,750 ,835 1,204
,040 ,040 ,240 ,245 ,440 ,472 ,640 ,758 ,840 1,221
,045 ,045 ,245 ,250 ,445 ,478 ,645 ,767 ,845 1,238

,050 ,050 ,250 ,255 ,450 ,485 ,650 ,775 ,850 1,256
,055 ,055 ,255 ,261 ,455 ,491 ,655 ,784 ,855 1,274
,060 ,060 ,260 ,266 ,460 ,497 ,660 ,793 ,860 1,293
,065 ,065 ,265 ,271 ,465 ,504 ,665 ,802 ,865 1,313
,070 ,070 ,270 ,277 ,470 ,510 ,670 ,811 ,870 1,333

,075 ,075 ,275 ,282 ,475 ,517 ,675 ,820 ,875 1,354
,080 ,080 ,280 ,288 ,480 ,523 ,680 ,829 ,880 1,376
,085 ,085 ,285 ,293 ,485 ,530 ,685 ,838 ,885 1,398
,090 ,090 ,290 ,299 ,490 ,536 ,690 ,848 ,890 1,422
,095 ,095 ,295 ,304 ,495 ,543 ,695 ,858 ,895 1,447

,100 ,100 ,300 ,310 ,500 ,549 ,700 ,867 ,900 1,472
,105 ,105 ,305 ,315 ,505 ,556 ,705 ,877 ,905 1,499
,110 ,110 ,310 ,321 ,510 ,563 ,710 ,887 ,910 1,528
,115 ,116 ,315 ,326 ,515 ,570 ,715 ,897 ,915 1,557
,120 ,121 ,320 ,332 ,520 ,576 ,720 ,908 ,920 1,589

,125 ,126 ,325 ,337 ,525 ,583 ,725 ,918 ,925 1,623
,130 ,131 ,330 ,343 ,530 ,590 ,730 ,929 ,930 1,658
,135 ,136 ,335 ,348 ,535 ,597 ,735 ,940 ,935 1,697
,140 ,141 ,340 ,354 ,540 ,604 ,740 ,950 ,940 1,738
,145 ,146 ,345 ,360 ,545 ,611 ,745 ,962 ,945 1,783

,150 ,151 ,350 ,365 ,550 ,618 ,750 ,973 ,950 1,832
,155 ,156 ,355 ,371 ,555 ,626 ,755 ,984 ,955 1,886
,160 ,161 ,360 ,377 ,560 ,633 ,760 ,996 ,960 1,946
,165 ,167 ,365 ,383 ,565 ,640 ,765 1,008 ,965 2,014
,170 ,172 ,370 ,388 ,570 ,648 ,770 1,020 ,970 2,092

,175 ,177 ,375 ,394 ,575 ,655 ,775 1,033 ,975 2,185
,180 ,182 ,380 ,400 ,580 ,662 ,780 1,045 ,980 2,298
,185 ,187 ,385 ,406 ,585 ,670 ,785 1,058 ,985 2,443
,190 ,192 ,390 ,412 ,590 ,678 ,790 1,071 ,990 2,647
,195 ,198 ,395 ,418 ,595 ,685 ,795 1,085 ,995 2,994

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4078777

1 descarga sin publicidad = 1 coin


TEMA 12: Contraste de Hipótesis Estadísticas

Podemos hacer estadística inferencial de dos formas:

- Estimación de parámetros. Obtener un valor o un intervalo de valores que


constituyan la mejor estimación del parámetro desconocido, a partir de datos
muestrales. (Tema anterior). Aquí se pregunta qué valor tendrá la media en la
población.
- Contraste de Hipótesis. Probar si un valor atribuido al parámetro es compatible
o no con el valor obtenido por un estimador del mismo, en las observaciones
muestrales. Aquí nos vamos a preguntar: ¿valdrá X (por ejemplo 10) la media
en la población?

Una hipótesis estadística es una proposición o afirmación sobre la función de


probabilidad o de densidad de probabilidad de una o varias variables aleatorias.
Implica afirmaciones acerca de la población, que llamamos hipótesis porque pueden
ser ciertas o no. Estas afirmaciones pueden referirse a la forma de la distribución de la
población (Hipótesis de primer tipo) y/o al valor o valores de los parámetros que la
definen (Hipótesis de segundo tipo). Hay dos tipos de hipótesis en cuanto al objeto que
se refieren:

- Hipótesis de primer tipo (a la forma de la distribución o a los valores de los


parámetros que la definen). La variable aleatoria sigue una distribución
normal. La variable aleatoria sigue una distribución binomial.
- Hipótesis de segundo tipo (a los valores que pueden tomar los parámetros en
la población). La media de la población es 100. La varianza de la población es
50.

Otra clasificación que nos podemos encontrar es la de hipótesis simple o hipótesis


compuesta:

- Hipótesis Simple. Aquella que especifica completamente el valor del


parámetro. Por ejemplo, si digo que la media vale 50, esa hipótesis especifica
completamente el valor del parámetro.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4079364

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Hipótesis compuesta. La que no es simple. Por ejemplo, si nos dicen “la media
vale MÁS de 50”, porque deja un abanico de valores importante.

A la hora de plantear los contrastes de hipótesis vamos a tener que anunciar dos
hipótesis:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Simple De modo afirmativo
- Hipótesis nula (H0). Hipótesis que vamos a contrastar y que consideramos
provisionalmente como verdadera. Se supone que esta hipótesis nulifica los
efectos de cualquier tratamiento. Es decir, tengo un grupo experimental al que
le aplicamos un programa para aprender a leer y otro grupo control al que no le
aplicamos nada; si yo mido la variable en el grupo de control y experimental lo
esperable es que haya diferencias entre puntuaciones. Cuando planteemos la
hipótesis nula tenemos que plantearla en término de que no hay diferencias, es
decir, ambos grupos tendrán la misma puntuación. Siempre va a estar
planteada en términos de igualdad, es decir, como hipótesis simple. Es la
hipótesis a contrastar y la que en un primer momento vamos a considerarla
como verdadera.
Compuesta Complementaria u opuesta a la nula
- Hipótesis Alternativa (H1). Formada por los restantes estados posibles en la
situación experimental concreta. La vamos a plantear de acuerdo a los
resultados obtenidos a la muestra o de acuerdo a un planteamiento que me
permita responder la pregunta que me hagan. De forma que H1 siempre será
compuesta. Está formada por los restantes estados posibles de la situación
experimental completa y en cada caso vamos a elegir aquel que nos resulte
más conveniente.

Los pasos del Contraste de Hipótesis son los siguientes:

1. Establecer una afirmación acerca del parámetro: la hipótesis nula, junto a una
hipótesis alternativa.
2. Definir las características de la población de la que se ha o han extraído la
muestra o las muestras, especificando su forma. (Si es normal, bivariada…)
3. Especificar las características de la o las muestras, que generalmente serán
aleatorias, indicando el tamaño n. En caso de más de una muestra, indicar si

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4079364

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
son independientes o están relacionadas, así como el tamaño de cada una de
ellas. (La media, la desviación típica, etc.)
4. Determinar y calcular el estadístico de contraste, que nos ayudará a tomar
decisiones en el contraste de hipótesis. (La fórmula que vamos a calcular en

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
cada caso).
5. Especificar la distribución muestral del estadístico de contraste. (distribución t
de Student con x grados de libertad, etc.)
6. Fijar el nivel de significación α y la región crítica (o de rechazo) para dicho α,
indiciando si el contraste es unilateral o bilateral. Este nivel de significación nos
impone la condición de que la probabilidad de rechazar H0 sea cierta, sea igual
o menor que α.
7. Tomar una decisión en base a la región crítica adoptada. Si el estadístico de
contraste está dentro de la región crítica, rechazaremos H0. Si el estadístico de
contraste no está dentro de la región crítica, mantendremos H0. Nunca vamos a
hacer ningún comentario sobre H1.

Errores en el Contraste de Hipótesis (MIRAOS MUY BIEN ESTE APARTADO QUE VA A


EXAMEN)

La metodología usual del contraste de hipótesis, basándonos en la información que


proporciona la muestra, puede conducirnos a dos tipos de errores debido a las
fluctuaciones aleatorias en el muestro. Hay ocasiones en que H0 puede que sea cierta,
pero debido a la baja probabilidad del dato muestral, nuestra decisión es rechazarla.
Cometemos, pues, un error al rechazar H0 siendo en realidad verdadera: Error tipo I o
Error α. En otras ocasiones, por el contrario, basándonos en los datos muestrales,
decidimos mantener H0, siendo en realidad falsa: Error tipo II o Error β.

Estado de la naturaleza
H0 verdadera H1 verdadera
Aceptar H0 : d0 Decisión Correcta: 1-α Error tipo II o Error β
Decisión Rechazar H0 : d1 Error tipo I o Error α Decisión Correcta: 1-β

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4079364

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
Los errores no son más que probabilidades condicionales:

- α = P (d1 / H0 ) → Siendo H0 verdadera, rechazarla.


- β = P (d0 / H1 ) → Siendo H1 verdadera, rechazarla.

Contrastes Unilaterales y Bilaterales

De todas las infinitas regiones críticas asociadas con un α dado en el contraste de


hipótesis, utilizaremos solamente una de entre las tres siguientes:

Las dos primeras son unilaterales o de una cola, ya que establecen la región crítica sólo
a un lado de la distribución. La tercera es bilateral o de dos colas, ya que establece la
región crítica a ambos lados de la distribución. ¿Qué región crítica utilizaremos? La
solución viene dada por dos causas:

• Hay que utilizar aquella región cuya potencia de prueba (1-β) sea mayor.
• Hay que utilizar aquella región que se corresponda con la H1.

Para H0 : µ = µ0

- Si H1 : µ ≠ µ0 → Contraste Bilateral
- Si H1 : µ < µ0 → Contraste Unilateral Izquierdo
- Si H1 : µ > µ0 → Contraste Unilateral Derecho

Propiedades de los Contrastes:

- Contraste insesgado. Un contraste insesgado es aquel en el que la probabilidad


de rechazar H0 cuando es falsa, es siempre mayor o igual que la probabilidad de
rechazar H0 cuando es verdadera: 1- β ≥ α.
- Contraste Consistente. Una secuencia de contrastes es consistente, a lo largo
de todos los valores que pueda tomar H1, si la potencia de dichos contrastes se
aproxima a 1 a medida que n tiende a infinito, dado un valor fijo de α.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4079364

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
- Eficiencia relativa. Si tenemos dos contrastes con el mismo valor de α y con el
mismo valor de β, será mejor el contraste que utilice una muestra más
pequeña.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4079364

Te has descargado este apunte gracias a la publicidad. También puedes eliminarla con 1 coin.
TEMA 13: Contrastes paramétricos: media, varianza y proporción

CONTRASTES DE HIPÓTESIS PARA UNA MUESTRA

Contrastación de Hipótesis para una Media

Contraste de hipótesis para una media con varianza poblacional conocida

Ejemplo:

Un equipo de psicólogos escolares realizó un estudio acerca de los efectos de la


educación preescolar sobre le CI. A un grupo de niños que habían seguido este tipo
de educación, se les aplicó la Escala de Inteligencia de Terman a su ingreso en la
escuela (6 años). El CI promedio de estos niños fue de 110, siendo 100 el CI medio de
la población de ese nivel de edad y 16 la desviación típica. Los psicólogos publicaron
los resultados del estudio, concluyendo que la educación preescolar tenía efectos
beneficiosos sobre el CI. El estudio fue objeto de numerosas críticas que alegaban
que estos niños no tenían puntuaciones superiores al promedio, sino que realmente
el CI medio de la población es superior a 100 y a esto se debían los resultados. El
equipo de psicólogos, para poder hacer frente a las críticas, decide seleccionar una
muestra aleatoria de la población de niños de 6 años (n=64) a los que aplica la Escala
de Terman para poder comprobar la hipótesis de que el CI medio es realmente 100.
La media de las puntuaciones obtenidas fue =108 y α=0’05. ¿Quién tiene razón?

Es importante que nos quedemos con que nos dice que el CI promedio de los niños fue
de 110, siendo 100 el CI medio de la población de ese nivel de edad y 16 la desviación
típica (σ). Estos datos son datos poblacionales. Los pasos:

1. El primer paso es establecer una afirmación acerca del parámetro: la hipótesis


nula, junto a una hipótesis alternativa. En este caso las hipótesis las
encontraríamos aquí: ”poder comprobar la hipótesis de que el CI medio es
realmente 100”. Por lo que la hipótesis nula es:

H0 : µ = 100

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La hipótesis alternativa es:

H1 : µ > 100

Hemos puesto mayor que 100 porque cuando se ha investigado con esta escala

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
las medias siempre han salido superior a 100.

2. Definir las características de la población de la que se ha extraído la muestra,


especificando su forma. Normalmente aquí vamos a poner si tenemos valores
sobre la media, sobre la varianza, etc. En este caso lo más relevante es decir
que la población sigue una distribución normal con varianza conocida (σ2 = 256)
puesto que nos ha dicho antes que la desviación típica era 16 (solo tenemos
que elevarla al cuadrado).
3. Especificar las características de la muestra, que generalmente será aleatoria,
indicando el tamaño n. En este caso nuestra muestra aleatoria es de 64
observaciones (n=64), con media =108.
4. Determinar y calcular el estadístico de contraste, que nos ayudará a tomar
decisiones en el contraste de hipótesis. En este caso el estadístico de contraste
es:
- µ0 108 - 100
Zobs = 𝝈 = =4
𝟏𝟔
√𝒏 𝟖

5. Especificar la distribución muestral del estadístico de contraste. En este caso se


sigue una distribución de Zobs (Z observada) normal.
6. Fijar el nivel de significación α y la región crítica (o de rechazo) para dicho α,
indicando si el contraste es unilateral o bilateral. En este caso se trata de un
contraste unilateral derecho porque (H1 : µ > 100). La región critica siempre nos
viene dada, en este caso como es unilateral derecho la región crítica viene
observada por Zobs ≥ Z1-α. En este caso hay que buscar en la tabla la puntuación
Z correspondiente al percentil 1-α (1-0’05=0’95). Tendríamos que buscar Z0’95 y
sustituimos los valores en Zobs ≥ Z1-α. Para Zobs su valor es el obtenido en el
apartado 4 (Zobs = 4). Para Z1-α sería el valor obtenido dentro de la tabla, que en
este caso corresponde a 1’65.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
.
Aquí viene lo importante. Si se cumple cuando sustituimos Zobs ≥ Z1-α → 4 ≥
1’65. Es decir, si lo que obtenemos es cierto, rechazaremos la hipótesis nula. Si
lo que enunciamos no se cumple, aceptamos H0. En este caso como sí se
cumple porque 4 es mayor que 1’65, el estadístico de contraste cae en la región
crítica o de rechazo y tenemos que rechazar H0.
7. Hay que tomar una decisión en base a la región crítica adoptada. Si el
estadístico de contraste está dentro de la región crítica, rechazaremos H0. Si el
estadístico de contraste no está dentro de la región crítica, mantendremos H0.
En este caso como se cumple lo definido en el paso anterior sustituimos Zobs ≥
Z1-α → 4 ≥ 1’65 → rechazamos H0. Por tanto, el CI medio de la población es
superior a 100, y el resultado del estudio de los Psicólogos no se puede
mantener.

Contraste de Hipótesis para una Media con Varianza Poblacional Desconocida y


Muestra Grande (n ≥ 100).

Ejemplo:

En un centro de educación especial se utiliza un método de comprensión lectora con


el que se viene obteniendo un promedio de 6 en una prueba estandarizada de
comprensión lectora. Un educador especialista en problemas de lectura, ofrece al
centro la posibilidad de utilizar un nuevo método que, según él, es más económico y

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


eficaz. El centro estaría dispuesto a adoptar ese nuevo método siempre que no se
demostrara que con él el rendimiento es inferior al obtenido con el método antiguo.
Se selecciona una muestra aleatoria de 100 niños y, durante un período de tiempo,
se aplica el nuevo método. Tras la instrucción, se pasa la prueba estandarizada de

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
comprensión lectora y se obtiene una media de 5. Si la cuasidesviación típica es 2,
¿qué decisión deberá tomarse con α= 0’01?

Para empezar cuando nos dan la cuasidesviación típica ya nos da la clave de que la
varianza poblacional no se conoce. Seguimos los pasos de siempre:

1. Establecer una afirmación acerca del parámetro: la hipótesis nula, junto a una
hipótesis alternativa.
H0 : µ = 6

La hipótesis alternativa es:

H1 : µ < 6

Hemos puesto menor que 6 porque cuando se hace la segunda prueba se


obtiene una media de 5.

2. Definir las características de la población de la que se ha extraído la muestra,


especificando su forma. Normalmente aquí vamos a poner si tenemos valores
sobre la media, sobre la varianza, etc. En este caso la población sigue una
distribución normal con varianza poblacional desconocida.
3. Especificar las características de la muestra, que generalmente será aleatoria,
indicando el tamaño n. En este caso nuestra muestra aleatoria es de 100
observaciones (n=100), con media =5 y cuasidesviación típica de 2.
4. Determinar y calcular el estadístico de contraste, que nos ayudará a tomar
decisiones en el contraste de hipótesis. En este caso el estadístico de contraste
es:
- µ0 5- 6
Zobs = = = -5
Ŝ 𝟐
√𝒏 𝟏𝟎

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


5. Especificar la distribución muestral del estadístico de contraste. En este caso se
sigue una distribución de Zobs (Z observada) normal.
6. Fijar el nivel de significación α y la región crítica (o de rechazo) para dicho α,
indicando si el contraste es unilateral o bilateral. En este caso se trata de un
contraste unilateral izquierdo porque (H1 : µ <6 ). La región critica siempre nos
viene dada, en este caso como es unilateral izquierdo la región crítica viene
observada por Zobs ≤ Zα → Zobs ≤ Z0’01 → Zobs ≤ -2’33.
7. Hay que tomar una decisión en base a la región crítica adoptada. Si el
estadístico de contraste está dentro de la región crítica, rechazaremos H0. Si el
estadístico de contraste no está dentro de la región crítica, mantendremos H0.
En este caso como se cumple lo definido en el paso anterior sustituimos Zobs ≤
Zα → -5 ≤ -2’33 → rechazamos H0. Por tanto, el promedio obtenido con el
nuevo método es significativamente inferior al obtenido con el método
antiguo; en consecuencia, el centro decidirá no adoptar el nuevo método.

Contraste de Hipótesis para una Media con Varianza Poblacional Desconocida y


Muestra Pequeña (n < 100)

Ejemplo:

Algunos trabajos sobre memoria icónica indican que el promedio de letras


recordadas por un sujeto normal es de 4’5. Los trabajos que se vienen realizando en
la Universidad de Almería no están de acuerdo con tal hipótesis. Deseamos, pues,
contrastar la hipótesis de que µ= 4’5 frente a nuestros resultados que dicen que eso
es falso, para lo cual seleccionamos una muestra aleatoria simple de 25 sujetos
universitarios, estudiantes de psicología de la Universidad de Almería, y
encontramos que el promedio de palabras recordadas (tras exposición
taquistoscópica) es 3, con una cuasidesviación típica de 1’3. Utilizamos α=0’01.

1. La hipótesis nula que establecemos es

H0 : µ = 4’5.

H1 : µ ≠ 4’5

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
La hipótesis alternativa la podríamos haberlo planteado también como H1 : µ <
4’5, pero si la planteábamos de la forma en la que lo hemos hecho nos servía
para saber como se hace un contraste bilateral.

2. La población sigue una distribución normal con varianza poblacional

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
desconocida.
3. La muestra es aleatoria con 25 observaciones (n=25), con =3 y la Ŝ= 1’3.
4. El estadístico de contraste que tenemos que usar aquí es diferente a los otros
ejemplos:
- µ0 3 – 4’5
tobs = = = -5’77
Ŝ 𝟏′𝟑
√𝒏 𝟓

5. tobs sigue la distribución t de Student con gl= n-1. (n-1=24).


6. Esta vez tenemos un contraste bilateral porque H1 : µ ≠ 4’5. Este caso es un
poco especial:
Tenemos una región crítica a la izquierda
que vale α/2 y una región crítica a la
derecha que vale α/2 también. Tenemos
entonces dos regiones críticas y a la hora
de tomar la decisión no se pueden cumplir
las dos, se puede cumplir como máximo
una o ninguna. En el caso de que se cumpla una estaríamos diciendo que el
estadístico de contraste cae en la región crítica y rechazaríamos H0. Una región
crítica viene dada por tobs ≥ t (1-α/2 , n-1) que sería la región critica de la derecha; y
la región crítica de la izquierda vendría dada por tobs ≤t (α/2 , n-1). Tobs ya sabemos
que vale –5’77, por lo que tenemos que buscar las otras t. Empezamos con la
de la izquierda: tobs ≤ t (0’005 , 24) → -5’77 ≤ -2’797. Realmente en la tabla nos
viene 2’797 pero al ser simétrica los percentiles inferiores y superiores tendrían
la misma puntuación pero con signo negativo. Lo que tenemos que hacer con
contrastes bilaterales es buscar siempre el percentil superior siempre, es decir,
1-α/2 y la puntuación que nos de será la misma que la de la región derecha

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


pero en signo negativo. La región crítica de la derecha es: tobs ≥ t (1-α/2 , n-1) → tobs
≥ t (0’995 , 24) → -5’77 ≥ 2’797.
7. Como se cumple una de las regiones críticas: tobs ≤t (α/2 , n-1) → -5’77 ≤ -2’797 →
Rechazamos H0. Por tanto, el promedio de palabras recordadas es

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
significativamente distinto a 4’5. Aquí no vamos a decir que es menor que 4’5
puesto que la hipótesis alternativa hemos dicho que era distinto, ni mayor ni
menor, sino distinto. Solo podemos afirmar aquello que hemos estimado.

Contraste de Hipótesis para una Varianza

Ejemplo:

Un inspector de Primaria ha venido observando, durante muchos años, una varianza


de 25 en las pruebas estandarizadas de rendimiento en lenguaje en la población
escolar de 5º de primaria. Durante el último curso, se introdujo un nuevo método de
enseñanza de la materia en la zona, basado en la adaptación a diferencias
individuales. El inspector seleccionó una muestra aleatoria de 26 niños de la zona,
con objeto de comprobar si la variabilidad en el rendimiento había aumentado con la
introducción del nuevo método. En la muestra encontró una cuasivarianza de 40.
¿Son compatibles estos datos con la hipótesis nula de que la variabilidad no ha
cambiado? α=0’05.

1. Si lo que queremos probar es que la variabilidad no ha cambiado, la hipótesis


nula sería H0 : σ2 = 25. Por otro lado, la hipótesis alternativa sería H1 : σ2 > 25.
Podría ser también H1 : σ2 ≠25.
2. La población sigue una distribución normal con varianza desconocida que
queremos estimar.
3. La muestra de la que disponemos es aleatoria y se compone de 26
observaciones (n=26), con cuasivarianza Ŝ2 = 40.
4. El estadístico de contraste a calcular es:
( n – 1 ) * Ŝ2 25 * 40
χ2obs = = = 40
σ2 0 25
5. χ2obs sigue la distribución χ2 con gl= n-1 =25.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


6. Tenemos un contraste unilateral derecho porque H1 : σ2 > 25. Tenemos una sola
región crítica que se sitúa a la derecha de la distribución.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Esto nos dice que χ2obs ≥ χ2(1-α/2 , n-1 ) → χ2obs ≥ χ2(0’095 , 25) → si buscamos en la
tabla en el g.l 25 y en el percentil 95 vemos que χ2(0’095 , 25)= 37’652. Por lo tanto,
se nos quedaría así: 40 ≥ 37’652.
7. Como se cumple lo definido en el paso anterior ( 40 ≥ 37’652 ) rechazamos H0.
Por tanto, el nuevo método ha aumentado la variabilidad en el rendimiento.
Los resultados no son compatibles con la hipótesis nula.

Contraste de Hipótesis para una Proporción

Ejemplo:

Se desea conocer la postura de la población adulta española frente a la enseñanza de


la religión en primaria. Una empresa de encuestas elige una muestra aleatoria de
1000 personas. Se les pide que manifiesten si están a favor o en contra. Del total, 400
personas se manifiestan a favor y 600 en contra. ¿Son compatibles estos datos con la
hipótesis nula que establece que, en la población, la proporción de personas a favor
de la enseñanza de la religión es 0’50, o no? α=0’05.

1. La hipótesis nula sería H0 : π = 0’50. Por otro lado, la hipótesis alternativa sería
H1 : π ≠0’50.
2. Se trata de una población normal dicotómica: a favor y en contra de la
enseñanza de la religión.
3. Es una muestra aleatoria de 1000 observaciones (n=1000), con p=0’4. Hemos
cogido la proporción de 0’4 porque nos están preguntando por ella.
4. El estadístico de contraste es:
p - π0 0’4 – 0’50
Zobs = = = -6’325
√ π0 * (1- π0 ) / n √ 0’50 * 0’50 / 1000

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


5. La distribución que sigue es una distribución Zobs normal.
6. Tenemos un contraste bilateral. Por lo que tenemos dos regiones críticas. La de
la izquierda: Zobs ≤ Z (α/2) → Zobs ≤ Z 0’025 → buscamos dentro de la tabla de la
distribución normal el número 0’024 y la intersección resultante es -1’96 →
-6’325 ≤ -1’96 (con esto ya sabemos que la región de la derecha es 1’96, pero la
haremos igualmente). Región derecha: Zobs ≥ Z (1-α/2) → Zobs ≥ Z (0’975 ) → Si lo
buscamos en la tabla nos sale 1’96, por lo que Zobs ≥ 1’96. → -6’325 ≥ 1’96.
7. Como se cumple una de las regiones críticas: Zobs ≤ Z (α/2) →-6’325 ≤ -1’96 →
rechazamos H0. Por tanto, los resultados no son compatibles con la H0. La
proporción de personas a favor de la enseñanza de la religión no es 0’50. Si
como hipótesis alternativa hubiéramos puesto lo que nos ha dado el dato
muestral: H1 : π > 0’50, entonces no podríamos decir que “la proporción de la
persona a favor es distinta o no es 0’50” , sino que tendríamos que concluir que
la proporción de personas a favor es menor de 0’50.

Contraste de Hipótesis para un Coeficiente de Correlación de Pearson

Contraste de Hipótesis para un Coeficiente de Correlación de Pearson con valor en H0


distinto de cero

Ejemplo:

En una muestra de 65 estudiantes de Secundaria, se obtuvo una rxy = 0’15 entre


puntuaciones en el Test de Matrices Progresivas de Raven y la creatividad, medida
mediante el Test de Usos de Guilford. ¿Es compatible este resultado con la hipótesis
de que la correlación poblacional vale 0’25? α=0’05.

1. La hipótesis nula sería H0 : p = 0’25. Por otro lado, la hipótesis alternativa sería
H1 : p < 0’25 puesto que en la muestra tenemos un valor de 0’15.
2. Se trata de una población normal bivariada.
3. Es una muestra aleatoria bivariada con n=65 y rxy=0’15.
4. El estadístico de contraste es el siguiente:

Zr - Zp0 0’151 – 0’255


Zobs = 𝟏 = 𝟏 = -0’82

√𝒏 − 𝟑 √𝟔𝟓 − 𝟑

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Para sacar Zr y Zp tenemos que hacer uso de las tablas de transformación de Z
de Fisher. En ella vemos que una rxy=0’15 → Zr = 0’151. También vemos que
p=0’25 → Zp = 0’255.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
5. Sigue una distribución Zobs normal.
6. Se trata de un contraste unilateral izquierdo por lo que la región crítica es: Zobs
≤ Zα → Zobs ≤ Z0’05. Si buscamos dentro de la tabla observamos que la
intersección resultante y por lo tanto el resultado es -1’65. Por lo que -0’82 ≤
-1’65.
7. Como no se cumple lo definido en el paso anterior ( -0’82 ≤ -1’65 )
mantenemos H0, por lo que sí es compatible con los resultados muestrales que
la correlación población valga 0’25.

Contraste de Hipótesis para un Coeficiente de Correlación de Pearson con valor en H0


igual a cero.

Ejemplo:

En una muestra de 65 estudiantes de Secundaria, se obtuvo una rxy = 0’15 entre


puntuaciones en el Test de Matrices Progresivas de Raven y la creatividad, medida
mediante el Test de Usos de Guilford. ¿Cómo es la correlación poblacional,
significativa o no significativa? α=0’05.

1. La hipótesis nula sería H0 : p = 0 porque lo que me está preguntando es si hay


correlación o no. Por otro lado, la hipótesis alternativa sería H1 : p ≠ 0.
2. Se trata de una población normal bivariada.
3. Es una muestra aleatoria bivariada con n=65, y con rxy = 0’15.
4. El estadístico de contraste a usar es:

rxy * √𝒏 − 𝟐 0’15 * √𝟔𝟓 − 𝟐


tobs = = = 1’20
√ 1 – r2xy √ 1 – 0’152

5. El estadístico de contraste sigue la distribución t con gl= n-2 =63.


6. Es un contraste bilateral por lo que tiene dos regiones críticas. Primero
tobs ≥ t( 1-α/2 , n-2 ) → tobs ≥ t( 0’975 , 63 ) Como no hay como tal g.l. 63 vamos a la fila

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


de g.l. 60 y nos fijamos en la intersección con el percentil 97,5 y el número
resultante es 2 → 1’20 ≥ 2. Con esto ya sabemos el resultado de la otra región
crítica pero igualmente la hacemos: tobs ≤ t( α/2 , n-2 ) → tobs ≤ t( 0’025 , 63 ) como ya
sabemos el resultado (al que le tenemos que añadir el signo negativo) nos sale

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1’20 ≤ -2.
7. Como no se cumple lo definido en el paso anterior, mantenemos H0, por lo que
la correlación poblacional no es significativa.

Este es un pequeño resumen de lo que acabamos de ver:

CONTRASTES DE HIPÓTESIS PARA DOS MUESTRAS

Antes que nada debemos saber que son muestras independientes cuando se trata de
dos grupos de sujetos distintos a los que se les han medido las dos variables. Las
muestras dependientes o relacionadas son el mismo grupo de sujetos a quienes se les
miden las dos variables.

Contraste de Hipótesis para dos Varianzas

Contraste de Hipótesis para dos Varianzas. Muestras Independientes

Ejemplo:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


Disponemos de dos formas supuestamente paralelas de un test de memoria de
palabras sin sentido. Deseamos comprobar si las varianzas de las dos formas son
realmente iguales. Para ello, de una población de los sujetos a los que está destinado
el test, seleccionamos dos muestras aleatorias n1 = 41 y n2 = 21. A los sujetos de la

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
primera muestra les aplicamos el test de la forma 1, y a los sujetos de la segunda
muestra les aplicamos el test de la forma 2. Los resultados han sido Ŝ21 = 25 y Ŝ22=
40. ¿Las varianzas son iguales o son distintas?

1. Establecemos la hipótesis nula que es H0 : σ21 = σ22 y la hipótesis alternativa


sería H1 : σ21 ≠ σ22. No hemos escogido ningún número para las hipótesis
porque la pregunta que nos hacen es si las varianzas son iguales o son distintas.
2. Se tratan de poblaciones normales.
3. Son muestras independientes n1 = 41 y n2 = 21. Las cuasivarianzas son para el
primer grupo Ŝ21 = 25 y para el segundo Ŝ22= 40.
4. El estadístico de contraste es:

Ŝ21 25
Fobs = = = 0’625
Ŝ22 40

5. Fobs sigue la distribución de F de Snedecor, con gl1= n1-1= 40; y gl2= n2 – 1= 20.
6. Tenemos un contraste bilateral por lo que tenemos dos regiones críticas.
Empecemos por Fobs ≤ F(α/2 , gl1 , gl2 ) → Fobs ≤ F(0’025 , 40 , 20 ) → Fobs ≤ 1/2’07 = 0’48.
Fobs ≥ F(α/2 , gl1 , gl2 ) → Fobs ≤ F(0’975 , 40 , 20 ) → Fobs ≤ 2’29.
7. Como no se cumple lo definido en el paso anterior, mantenemos H0. Las
varianzas son iguales 0’48 < 0’625 < 2’29.

Contraste de Hipótesis para dos Varianzas. Muestras Dependientes

Ejemplo:

Se ha aplicado un test de aptitudes académicas a un grupo de 95 estudiantes al


ingresar en la escuela. Al comenzar el 2º año, al mismo grupo de estudiantes se le
aplicó de nuevo el test. El psicólogo del centro piensa que pueden haber diferencias
en la homogeneidad de los resultados obtenidos en 1º y 2º curso. Los resultados

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


obtenidos fueron: Ŝ21 = 144 y Ŝ22= 200. La correlación entre las series de
puntuaciones fue r12 = 0’85. α=0’05.

1. La hipótesis nula sería H0 : σ21 = σ22 y la hipótesis alternativa sería H1 : σ21 ≠ σ22.
2. Es una población que sigue una distribución normal.
3. Son muestras dependientes porque son los mismos sujetos, con n=95 pares de
puntuaciones.
4. El estadístico de contraste es:

( Ŝ21 - Ŝ22 ) * √𝒏 − 𝟐 ( 144 - 200 ) * √𝟗𝟑


tobs = = = -3’02
2 * Ŝ1 * Ŝ2 * √ 1 – r212 2 * 12 * 14’14 * √1 – (0’85)2

5. tobs sigue la distribución t de Student con gl= n-2 =93.


6. Se trata de un contraste bilateral. Empecemos con la región crítica
tobs ≥ t (1-α/2 , n-2 ) → tobs ≥ t (0’975 , 93 ) → buscamos en la tabla y → tobs ≥ 1’98 (es el
más cercano). Por lo que tenemos ya en esta región -3’02 ≥ 1’98. Vamos con la
otra región que ya sabemos que valdrá -1’98. Es: tobs ≤ t (α/2 , n-2 ) → tobs ≤ t (0’025 ,
93 ) → buscamos en la tabla y → tobs ≤ -1’98. Ya tenemos también esta región -
3’02 ≥ -1’98.
7. Como se cumple una de las regiones críticas tobs ≤ t (α/2 , n-2 ) → 3’02 ≥ -1’98,
rechazamos H0. Por tanto, las varianzas son distintas. Hay diferencias en la
homogeneidad de los resultados de 1º y 2º curso.

Contraste de Hipótesis para dos Medias

Contraste de Hipótesis para dos Medias. Muestras Independientes. Varianzas


Poblacionales Conocidas

Ejemplo: Seleccionamos aleatoriamente 50 sujetos rurales de 6º de primaria y 125


sujetos urbanos del mismo curso. Aplicamos un test de “Memoria de Caras” a los dos
grupos de sujetos. El grupo de sujetos rurales obtuvo en el test una media de 95, y el
de los sujetos urbanos una media de 98,5. Sabemos, por estudios anteriores
realizados con el test, que la desviación típica en grupos rurales es de 15, mientras
que es de 20 la de la población de niños urbanos. ¿Son compatibles nuestros

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
resultados con la hipótesis de que no existen diferencias entre niños rurales y
urbanos en el test de Memoria de Cartas?

1. La hipótesis nula sería H0 : µ1 - µ2 = 0 o también podemos decir que H0 : µ1 = µ2.


La hipótesis alternativa sería H1: µ1 - µ2 < 0 pero si he optado por la otra opción

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
de hipótesis nula tendríamos que poner H1: µ1 < µ2.
2. Se trata de poblaciones normales con σ1=15 y σ2=20.
3. Son muestras aleatorias e independientes con n1 = 50, n2 = 125. La media 1 =
95 y la media 2 =98’5.

4. El estadístico de contraste a usar es:

1 - 2 95 – 98’5
Zobs = = = -1’26
𝝈𝟐 𝝈𝟐 𝟐𝟐𝟓 𝟒𝟎𝟎
√ 𝟏+ 𝟐 √ +
𝒏𝟏 𝒏𝟐 𝟓𝟎 𝟏𝟐𝟓

5. Zobs sigue una distribución normal.


6. Tenemos un contraste unilateral izquierdo por lo que la región crítica es: Zobs ≤
Zα → Zobs ≤ Z0’05. Buscamos 0’05 dentro de la tabla y obtenemos -1’65, por lo
que : Zobs ≤ -1’65 → -1’26 ≤ -1’65.
7. Como no se cumple lo definido en el paso anterior ( -1’26 ≤ -1’65 ),
mantenemos H0. No existen diferencias en el test de memoria de caras entre
ambas poblaciones.

Contraste de Hipótesis para dos Medias. Muestras Independientes. Varianzas


Poblaciones Desconocidas. Supuestas Iguales.

Ejemplo:

Un gabinete de psicología industrial ha recibido el encargo de un grupo de empresas


para estudiar el absentismo laboral en su sector. Una de las variables que consideran
importante es el sexo, como posiblemente relacionada con el absentismo. Con
objeto de estudiar este aspecto, se eligen aleatoriamente 2 muestras, una de
varones y otra de mujeres, de 61 y 31 sujetos, respectivamente. El absentismo se
midió considerando el número de faltas de asistencia en un período de un año. Las
medias de faltas de asistencia/año fueron de 3,5 y 4,2 en las muestras de varones y

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


mujeres, respectivamente. Las cuasivarianzas muestrales fueron de 1,2 y 1,5. ¿Son
compatibles estos datos con la hipótesis de que no hay diferencias en absentismo
relacionadas con el sexo? α=0’01.

1. Empezamos poniendo la hipótesis nula H0 : µ1 - µ2 = 0. La hipótesis alternativa

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
sería H1: µ1 - µ2 < 0.
2. La población es normal pero las varianzas son desconocidas. Aquí tenemos que
meter el contraste de varianzas de forma que planteamos las hipótesis de las
varianzas que siempre serán igualdad y desigualdad.
H0 : σ21 = σ22 H1 : σ21 ≠ σ22
Calculamos entonces el estadístico de contraste

Ŝ𝟐𝟏 𝟏,𝟐
Fobs = = = 0’8.
Ŝ𝟐𝟐 𝟏,𝟓

Seguimos con las regiones críticas de este contraste bilateral.


Fobs ≤ F( α/2 , gl1, gl2 ) → Fobs ≤ F( 0’005 , 60, 30 ) → Fobs ≤ 1/2,19 = 0’46.
Fobs ≥ F( 1-α/2 , gl1, gl2 ) → Fobs ≥F( 0’995 , 60, 30 ) → Fobs ≥ 2’42
Como no se cumple lo definido en el paso anterior, mantenemos H0. Varianzas
iguales. Si las varianzas hubieran sido distintas tendríamos que hacer el
contraste que veremos en el siguiente apartado (Contraste de Hipótesis para
dos Medias. Muestras Independientes. Varianzas Poblacionales Desconocidas.
Supuestos Distintos)
3. Son muestras aleatorias e independientes con n1 = 61, con n2 = 31. Con media
1=3’5 y media 2=4’2. La Ŝ21 = 1’2, y Ŝ22 = 1’5.
4. El estadístico de contraste es:
1- 2
tobs = =
Ŝ𝟐𝟏
[ (𝒏𝟏 − 𝟏) ∗ ] + [ (𝒏𝟐 − 𝟏) ∗ Ŝ𝟐𝟐 ] 𝟏 𝟏
√( ∗ ( + ))
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝒏𝟏 𝒏𝟐

3’5 – 4’2
= -2’78
[ (𝟔𝟏 − 𝟏) ∗ 𝟏, 𝟐 ] + [ (𝟑𝟏 − 𝟏) ∗ 𝟏, 𝟓 ] 𝟏 𝟏
√( ∗ ( + ))
𝟔𝟏 + 𝟑𝟏 − 𝟐 𝟔𝟏 𝟑𝟏

5. tobs sigue la distribución t de Student con gl= n1 + n2 – 2= 90.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


6. Es un contraste unilateral izquierdo así que la región crítica es: tobs ≤ t (α , n1 + n2 -2)
→ tobs ≤ t (0’01 , 90). Buscamos en la tabla de t de Student, pero como no tenemos
percentil 1 pues buscamos en el de 99 y gl 120 y al número resultante de esta
intersección le colocamos un signo negativo. Por tanto: → tobs ≤ -2’358 →

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
-2’78 ≤ -2’358.
7. Como se cumple lo definido en el paso anterior ( -2’78 ≤ -2’358 ) rechazamos H0
y afirmamos que la media de absentismo masculino es menor que la media de
absentismo femenino.

Contraste de Hipótesis para dos Medias. Muestras Independientes. Varianzas


Poblacionales Desconocidas. Supuestos Distintos. Muestras Grandes (n 1 y n2 ≥ 100)

Ejemplo:

Un gabinete de Psicología Industrial ha recibido el encargo de un grupo de empresas


para estudiar el absentismo laboral relacionado con el sexo. Se eligen
aleatoriamente dos muestras, una de varones y otra de mujeres, con 121 sujetos
cada una. El absentismo se midió considerando el número de faltas de asistencia en
un año. Las medias de faltas de asistencia por año fueron 4,5 y 5,3 en las muestras de
varones y mujeres respectivamente. Las cuasivarianzas muestrales fueron 1 y 1.5.
¿Hay o no evidencias de absentismo relacionadas con el sexo?

1. La hipótesis nula es H0 : µ1 - µ2 = 0. La hipótesis alternativa sería H1: µ1 - µ2 ≠ 0.


2. Se trata de poblaciones normales con varianzas desconocidas.
Las hipótesis son H0 : σ21 = σ22 H1 : σ21 ≠ σ22
El estadístico de contraste:

Ŝ𝟐𝟏 𝟏
Fobs = = = 0’67.
Ŝ𝟐𝟐 𝟏,𝟓

Tenemos contrastes bilaterales así que dos regiones críticas


Fobs ≤ F( α/2 , gl1, gl2 ) → Fobs ≤ F( 0’025 , 120, 120 ) → Fobs ≤ 1/1’43 = 0’69.
Fobs ≥ F( 1-α/2 , gl1, gl2 ) → Fobs ≥F( 0’975 , 120, 120 ) → Fobs ≥ 1’43
Como se cumple lo definido en el paso anterior, rechazamos H0. Por lo que
tenemos varianzas distintas.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


3. Son muestras aleatorias e independientes con n n1 = 121, con n2 = 121. Con
media 1=4’5 y media 2=5’3. La Ŝ21 = 1, y Ŝ22 = 1’5. Son muestras grandes
porque superan las 100 observaciones.
4. El estadístico de contraste es:
1- 2 4’5 – 5’3
Zobs = = = -5’71
Ŝ𝟐𝟏 Ŝ𝟐𝟐 𝟏 𝟏,𝟓
√ + √ +
𝒏𝟏 𝒏𝟐 𝟏𝟐𝟏 𝟏𝟐𝟏

5. Zobs sigue la distribución normal.


6. Es un contraste bilateral por lo que tenemos dos regiones críticas.
Zobs ≤ Zα/2 → Zobs ≤ Z0’025. Buscamos en la tabla y tenemos que: Zobs ≤ -1’96
Zobs ≥ Z1-α/2 → Zobs ≤ Z0’975. Buscamos en la tabla y tenemos que: Zobs ≥ 1’96
7. Como se cumple una de las regiones críticas -5’71 ≤ -1’96 rechazamos H0.
Existen diferencias entre varones y mujeres en absentismo laboral. No
podemos concluir que una es mayor que la otra porque nuestra hipótesis
alternativa dice que son diferentes.

Contraste de Hipótesis para dos Medias. Muestras Independientes. Varianzas


Poblacionales Desconocidas. Supuestos Distintos. Muestras pequeñas (menores a
100). Muestras de Igual Tamaño: n1 = n2

Ejemplo:

Una medicina A es aplicada a 25 pacientes aquejados de cierta enfermedad. Otra


medicina B es aplicada a otros 25 pacientes aquejados de la misma enfermedad. Los
resultados fueron:

- Duración media requerida por la medicina A para curar la enfermedad: 20


días.
- Duración media requerida por la medicina B para curar la enfermedad: 17
días.
- Cuasivarianza de las 25 observaciones primeras: 10.
- Cuasivarianza de las 25 observaciones segundas: 25.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Decir si es compatible con los resultados obtenidos, la hipótesis nula: µA = µB frente a
la hipótesis alternativa : µA ≠ µB suponiendo α=0’05, y suponiendo que las varianzas
de las poblaciones son distintas.

1. La hipótesis nula es H0 : µ1 - µ2 = 0. La hipótesis alternativa sería H1: µ1 - µ2 ≠ 0.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
2. La población es normal, con varianzas desconocidas y supuestas distintas.
3. Tenemos dos muestras aleatorias e independientes, pequeñas y de igual
tamaño n1 = 25 y n2 = 25. La media 1 = 20 y 2= 17. La Cuasivarianza Ŝ21 = 10, y
Ŝ22=25.
4. El estadístico de contraste es:
1 – 2
tobs = =
Ŝ𝟐𝟏
[ (𝒏𝟏 − 𝟏) ∗ ] + [ (𝒏𝟐 − 𝟏) ∗ Ŝ𝟐𝟐 ] 𝟏 𝟏
√( ∗ ( + ))
𝒏𝟏 + 𝒏𝟐 − 𝟐 𝒏𝟏 𝒏𝟐

20 – 17
= 2’54
[ (𝟐𝟓 − 𝟏) ∗ 𝟏𝟎 ] + [ (𝟐𝟓 − 𝟏) ∗ 𝟐𝟓 ] 𝟏 𝟏
√( ∗ ( + ))
𝟐𝟓 + 𝟐𝟓 − 𝟐 𝟐𝟓 𝟐𝟓

5. tobs sigue una distribución t de Student con gl= n1 + n2 – 2 = 48


6. Se trata de un contraste bilateral con dos regiones críticas:
tobs ≥ t (1-α/2, n1 + n2 -2 ) → tobs ≥ t (0’975, 48 ). Buscamos en la tabla y tenemos que: tobs
≥ 2’021.
tobs ≤ t (α/2, n1 + n2 -2 ) → tobs ≤ t (0’025, 48 ). Buscamos en la tabla y tenemos que: tobs ≤
-2’021.
7. Como se cumple una de las regiones críticas ( 2’54 ≥ 2’021 ) rechazamos H0. No
es compatible. Las dos medicinas tardarán el mismo tiempo en curar la
enfermedad.

Contraste de Hipótesis para dos Medias. Muestras Independientes. Varianzas


Poblacionales Desconocidas. Supuestas Distintas. Muestras Pequeñas. Muestras de
Distinto Tamaño n1 ≠ n2

Ejemplo:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


Una medicina A es aplicada a 26 pacientes aquejados de cierta enfermedad. Otra
medicina B es aplicada a otros 25 pacientes aquejados de la misma enfermedad. Los
resultados son los siguientes:

- Duración media requerida por la medicina A para curar la enfermedad: 20

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
días.
- Duración media requerida por la medicina B para curar la enfermedad: 17
días.
- Cuasivarianza de las 25 observaciones primeras: 10.
- Cuasivarianza de las 25 observaciones segundas: 25.

Decir si es compatible con los resultados obtenidos, la hipótesis nula: µA = µB frente a


la hipótesis alternativa : µA ≠ µB suponiendo α=0’05, y suponiendo que las varianzas
de las poblaciones son distintas.

1. La hipótesis nula es H0 : µ1 - µ2 = 0. La hipótesis alternativa sería H1: µ1 - µ2 ≠ 0.


2. La población es normal, con varianzas desconocidas y supuestas distintas.
3. Tenemos dos muestras aleatorias e independientes, pequeñas y de distinto
tamaño n1 = 26 y n2 = 25. La media 1 = 20 y 2= 17. La Cuasivarianza Ŝ21 = 10, y
Ŝ22=25.
4. El estadístico de contraste es:
1- 2 20 – 17
Zobs = = = 2’55
Ŝ𝟐𝟏 Ŝ𝟐𝟐 𝟏𝟎 𝟐𝟓
√ + √ +
𝒏𝟏 𝒏𝟐 𝟐𝟔 𝟐𝟓

5. tobs sigue la distribución de t de Student con gl:

6. Se trata de un contraste bilateral con dos regiones críticas:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


tobs ≥ t (1-α/2, n1 + n2 -2 ) → tobs ≥ t (0’975, 42 ). Buscamos en la tabla y tenemos que: tobs
≥ 2’021.
tobs ≤ t (α/2, n1 + n2 -2 ) → tobs ≤ t (0’025, 42 ). Buscamos en la tabla y tenemos que: tobs ≤
-2’021.

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
7. Como se cumple una de las regiones críticas ( 2’55 ≥ 2’021 ) rechazamos H0. No
es compatible. Las dos medicinas no tardarán el mismo tiempo en curar la
enfermedad.

Contrastación de Hipótesis para Dos Medias. Muestras Dependientes. Varianza


Poblacional de las Diferencias Desconocida.

Ejemplo:

Según algunos autores, los niños deprivados socialmente aumentarían su


rendimiento con entrenamiento adecuado en ítems del Test de Raven que
habitualmente no resuelven por carecer de las estrategias adecuadas. Para
comprobarlo, se toma una muestra de 10 sujetos deprivados socialmente y se
entrenan durante algunos meses. A los sujetos se les pasó el test de Raven antes y
después del entrenamiento, obteniendo los siguientes resultados:

1 = 75’8 2= 81’8 Ŝ2D = 24’44

¿Hay evidencia en los datos para afirmar, con α=0’01, que el entrenamiento aumenta
el CI medio de los deprivados en el test de Raven?

1. La hipótesis nula es H0 : µD = 0 (µ1 - µ2 = 0). La hipótesis alternativa sería H1: µD <


0 (µ1 - µ2 < 0).
2. Se trata de una población normal y con varianza de las diferencias desconocida.
Son muestras aleatorias dependientes porque son los mismos sujetos con
n=10, 1 = 75’8 y 2= 81’8, y Ŝ2D = 24’44
3. El estadístico de contraste es:
1- 2 75’8 – 81’8
tobs = = = -3’85
𝑺𝑫 𝟒,𝟗𝟒
√𝒏 √𝟏𝟎
4. tobs sigue la distribución t de Student con gl= n-1=9.
5. Es un contraste unilateral izquierdo por lo que la región crítica es:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


6. tobs ≤ t (α, n-1 ) → tobs ≤ t (0’01, 9 ). Buscamos en la tabla y tenemos que: tobs ≤ -2’821.
7. Como se cumple lo definido en el paso anterior ( -3’85 ≤ -2’821 ) rechazamos
H0. El entrenamiento sí que aumenta el CI medio de los deprivados, en el test
de Raven.

Contraste de Hipótesis para la diferencia de dos Proporciones

Contraste de Hipótesis para la diferencia de dos Proporciones. Muestras


Independientes.

Ejemplo:

Un grupo de 100 estudiantes de Psicología se divide en 2 grupos de forma aleatoria


con n1 = 50 y n2 = 50. Cada grupo se somete a un ejercicio diferente. Luego se aplica
una prueba para ver el dominio logrado en la tarea, pues deseamos saber si las
proporciones de sujetos que dominan la tarea, p1 y p2 son iguales. Al finalizar el
experimento, encontramos que en el primer grupo han resuelto bien la tarea el 70%
y en el segundo grupo la proporción es de 0’60. Queremos comprobar si estos datos
son compatibles con la hipótesis de igualdad de las proporciones.

1. La hipótesis nula es H0 : π1 – π2 = 0. La hipótesis alternativa sería H1: : π1 – π2 >0.


2. Son poblaciones normales y dicotómicas.
3. Muestras aleatorias independientes con n1 = 50 y n2 = 50. p1 =0’70 y p2 = 0’60.
4. El estadístico de contraste es:
p1 – p2
Zobs =
(𝒏𝟏 ∗ 𝒑𝟏 ) + (𝒏𝟐 ∗ 𝒑𝟐 ) (𝒏𝟏 ∗ 𝒑𝟏 ) + (𝒏𝟐 ∗ 𝒑𝟐 ) 𝟏 𝟏
√[[ ] ∗ (𝟏 − )∗ ( + )]
𝒏𝟏 + 𝒏𝟐 𝒏𝟏 + 𝒏𝟐 𝒏𝟏 𝒏𝟐

0’70 – 0’60
Zobs =
(𝟓𝟎 ∗ 𝟎, 𝟕) + (𝟓𝟎 ∗ 𝟎, 𝟔) (𝟓𝟎 ∗ 𝟎, 𝟕) + (𝟓𝟎 ∗ 𝟎, 𝟔) 𝟏 𝟏
√[[ ] ∗ (𝟏 − )∗ ( + )]
𝟓𝟎 + 𝟓𝟎 𝟓𝟎 + 𝟓𝟎 𝟓𝟎 𝟓𝟎

Zobs = 1’05
5. Zobs sigue una distribución normal.
6. Es un contraste unilateral derecho y su región crítica es:
Zobs ≥ Z1-α → Zobs ≥ Z0’95. Buscamos en la tabla y → Zobs ≥ 1’65.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
7. Como no se cumple lo definido en el paso anterior (1’05 ≥ 1’65 ) mantenemos
H0. Por tanto, los datos son compatibles con la hipótesis de igualdad de las
proporciones.

Contraste de Hipótesis para la diferencia de dos Proporciones. Muestras

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Dependientes.

Ejemplo:

Estamos considerando la actitud referida al aborto libre. La muestra es de 60


personas, a las que se les pregunta su opinión antes y después de la exposición a la
filmación de un aborto. Los resultados son:

Con α=0’01 Comprueba si la película ha tenido efecto o no en la opinión sobre el


aborto.

1. La hipótesis nula es H0 : π1 = π2 (A=D). La hipótesis alternativa sería H1: π1 ≠ π2


(A≠D)
2. Son poblaciones normales y dicotómicas.
3. Muestras aleatorias dependientes con n = 60.
4. El estadístico de contraste es:
𝑫−𝑨 𝟐𝟔−𝟏𝟎
Zobs = = = 2’67
√𝑫+𝑨 √𝟐𝟔+𝟏𝟎
5. Zobs sigue la distribución normal.
6. Es un contraste bilateral con dos regiones críticas:
Zobs ≥ Z1-α/2 → Zobs ≥ Z0’995 Buscamos en la tabla y → Zobs ≥ 2’58.
Zobs ≤Zα/2 → Zobs ≤ Z0’005 Buscamos en la tabla y → Zobs ≤ -2’58
7. Como se cumple una de las regiones críticas ( 2’67 ≥ 2’58 ) rechazamos H0. La
película sí que ha tenido efecto en la opinión sobre el aborto.

Contraste de Hipótesis para dos Coeficientes de Correlación de Pearson.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


Contraste de Hipótesis para dos Coeficientes de Correlación de Pearson. Muestras
Independientes.

Ejemplo:

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
Un psicólogo escolar encontró una correlación de Pearson de 0’25 en una muestra de
200 niños de 2º de primaria, entre extroversión y rendimiento académico. En otra
muestra de 100 estudiantes de 1º de Secundaria encontró una correlación de 0’05.
Las correlaciones poblacionales ¿son iguales o no? α=0’05

1. La hipótesis nula es H0 : p1 = p2. La hipótesis alternativa sería H1: p1 ≠ p2


2. Son poblaciones normales bivariadas.
3. Son muestras aleatorias bivariadas independientes con n1 = 200 y n2 = 100; r1 =
0’25 y r2 = 0’05.
4. El estadístico de contraste es:
Tenemos que utilizar la tabla de transformación de Fisher por lo que:
r1 = 0’25 → Zr1 = 0’255 r2 = 0’05 → Zr2 = 0’05
𝒁𝒓𝟏 − 𝒁𝒓𝟐 𝟎,𝟐𝟓𝟓−𝟎,𝟎𝟓
Zobs = = = 1’65
𝟏 𝟏 𝟏 𝟏
√( + ) √( + )
𝒏𝟏 −𝟑 𝒏𝟐 −𝟑 𝟏𝟗𝟕 𝟗𝟕

5. El estadístico de contraste sigue la distribución normal.


6. Es un contraste bilateral con dos regiones críticas:
Zobs ≥ Z1-α/2 → Zobs ≥ Z0’975 Buscamos en la tabla y → Zobs ≥ 1’96.
Zobs ≤Zα/2 → Zobs ≤ Z0’025 Buscamos en la tabla y → Zobs ≤ -1’96
7. Como no se cumple lo definido en el paso anterior mantenemos H0. Las
correlaciones poblacionales son iguales.

Contraste de Hipótesis para dos Coeficientes de Correlación de Pearson. Muestras


Dependientes o Relacionadas.

Ejemplo:

En una muestra de 103 personas, un psicólogo calculó las intercorrelaciones entre


velocidad de lectura (VL), inteligencia (I), y comprensión lectora (CL). Los resultados
fueron:

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin


En la población, ¿son iguales o distintas la correlación entre inteligencia y velocidad
de lectura que la correlación entre inteligencia y comprensión lectora? α=0’05

Tenemos 3 variables. Inteligencia (X), velocidad de lectura (Y) y comprensión


lectora (Z).

Reservados todos los derechos. No se permite la explotación económica ni la transformación de esta obra. Queda permitida la impresión en su totalidad.
1. La hipótesis nula es H0 : pxy = pxz. La hipótesis alternativa sería H1: pxy ≠ pxz
2. Son poblaciones normales trivariadas.
3. Son muestras aleatorias trivariadas dependientes con n= 103 ; rxy = 0’34, rxz =
0’422 y ryz = 0’25.
4. El estadístico de contraste es:

(𝒓𝒙𝒚 −𝒓𝒙𝒛 )∗ √(𝒏−𝟑)∗ (𝟏+ 𝒓𝒚𝒛 )


tobs = =
√𝟐∗ [𝟏− 𝒓𝟐𝒙𝒚 −𝒓𝟐𝒙𝒛 − 𝒓𝟐𝒚𝒛 + (𝟐∗ 𝒓𝒙𝒚 ∗𝒓𝒙𝒛∗ 𝒓𝒚𝒛 ) ]

(𝟎,𝟑𝟒−𝟎.𝟒𝟐𝟐 )∗ √𝟏𝟎𝟎∗ (𝟏+𝟎,𝟐𝟓)


= -0’77
√𝟐∗ [𝟏− 𝟎,𝟑𝟒𝟐 −𝟎,𝟒𝟐𝟐𝟐 − 𝟎,𝟐𝟓𝟐 + (𝟐∗ 𝟎,𝟑𝟒 ∗𝟎,𝟒𝟐𝟐 ∗ 𝟎,𝟐𝟓) ]

5. El Estadístico de contraste sigue la distribución de t de Student con gl= n-3 =


100.
6. Es un contraste bilateral:
tobs ≥ t(1-α/2 ; n-3 ) → tobs ≥ t(0’975 ; 100) Buscamos en la tabla y → tobs ≥ 1’98.
tobs ≤t(α/2 , n-3 ) → tobs ≤ t(0’025 , 100 ) Buscamos en la tabla y → tobs ≤ -1’98.
7. Com no se cumple lo definido en el paso anterior mantenemos H0. Las
correlaciones poblacionales son iguales.

a64b0469ff35958ef4ab887a898bd50bdfbbe91a-4093578

1 descarga sin publicidad = 1 coin

También podría gustarte