Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Distribucion T Student PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 32

DISTRIBUCIÓN

T DE STUDENT
Aspectos teóricos

Antecedentes

La distribución t de student fue


descubierta por William S.
Gosset en 1908. Gosset era un
estadístico empleado por la
compañía de cerveza
Guinness.
Aspectos teóricos
Bases teóricas

En probabilidad y estadística, la distribución -t es una


distribución de probabilidad que surge del problema de
estimar la media de una población normalmente distribuida
cuando el tamaño de la muestra es pequeño

En muchas ocasiones no se conoce s y el número de


observaciones en la muestra es menor de 30.

En estos casos. Se puede utilizar la desviación estándar de la


muestra S como una estimación des , pero no es posible usar
la distribución Z como estadístico de prueba.
El estadístico de prueba adecuado es la distribución t.
Grados de libertad
Existen varias distribuciones t. Cada una de ellas esta
asociada con los que se denominan “Grados de libertad”
Este se define como el numero de valores que podemos
elegir libremente, o sea, el número de observaciones
menos uno

Se encuentran mediante la fórmula:


n–1
Distribución T de
Student
Una variable aleatoria se distribuye según el modelo de
probabilidad t o T de Student con k grados de libertad,
donde k es un entero positivo.

Distribución t-student con 10 grados de libertad


Características de la
distribución t de student
1. La distribución T de student, es una distribución
continua

2. La distribución t tiene una media de cero,

3. Tiene forma acampanada y simétrica

4. No hay una distribución t, sino una "familia" de


distribuciones t. todas con la misma media cero, pero con
su respectiva desviación estándar, identificada cada una
por sus respectivos grados de libertad.
Es decir, existe una distribución t para una muestra de 20,
otra para una muestra de 22, y así sucesivamente.
Características de la
distribución t de student
5. La distribución t es mas ancha y mas plana en el centro que la
distribución normal estándar como resultado de ello se tiene una
mayor variabilidad en las medias de muestra calculadas a partir
de muestras más pequeñas. Sin embargo, a medida que
aumenta el tamaño de la muestra, la distribución t se aproxima a
la distribución normal estándar.
Aplicaciones de la
distribución t de student
 Sus aplicaciones en la inferencia estadística son para
estimar y probar una media y una diferencia de
medias (independiente y pareada).

 Para determinar el intervalo de confianza dentro del


cual se puede estimar la media de una población a
partir de muestras pequeñas (n<30).

 Para probar hipótesis cuando una investigación se


basa en muestreo pequeño.
Cálculo de la distribución T de
Student
 Prueba de hipótesis para Medias de t-student

La prueba de hipótesis para medias usando Distribución t


de student se usa cuando se cumplen las siguientes dos
condiciones:
 Es posible calcular la media y la desviación estándar a
partir de la muestra.
 El tamaño de la muestra es menor a 30.

El procedimiento obedece a los 5 pasos esenciales:


Cálculo de la distribución T de
Student
Paso 1:
Plantear Hipótesis Nula (Ho) e Hipótesis Alternativa Hi).
 La Hipótesis alternativa plantea matemáticamente lo que
queremos demostrar.
 La Hipótesis nula plantea exactamente lo contrario.

Paso 2:
Determinar nivel de significancia.(Rango de aceptación de
hipótesis alternativa).
Se considera: α
 0.05 para proyectos de investigación.
 0.01 para aseguramiento de calidad.
 0.10 para encuestas de mercadotecnia y políticas.
Cálculo de la distribución T de
Student
Paso 3:
Evidencia muestral.
Se calcula la media y la desviación estándar a partir de la
muestra.

x1 + x2 + x3... + xn
X=
N

(x1 - X)2 + (x2 - X)2 +... + (xn - X)2


s=
N
Cálculo de la distribución T de
Student
Paso 4:
Se aplica la Distribución t-student para calcular la
probabilidad de error (P) por medio de la fórmula:

X-m
t=
S
n
Grados de libertad = n-1
X = Media (muestra)
μ = Valor a analizar (media de la población)
S= Desviación Estándar (muestra)
n= Tamaño de muestra
Cálculo de la distribución T de
Student
Paso 5:
En base a la evidencia disponible se acepta o se
rechaza la hipótesis alternativa.

• Si la probabilidad de error (P) es mayor que el


nivel de significancia:
SE RECHAZA HIPÓTESIS ALTERNATIVA.

• Si la probabilidad de error (P) es menor que el


nivel de significancia:
SE ACEPTA LA HIPÓTESIS ALTERNATIVA
Ejercicio explicativo
Se aplica una prueba de conocimientos teóricos de
software a 25 alumnos de ingeniería en sistemas
quienes obtienen una calificación promedio de 62.1
con una desviación estándar de 5.83 Se sabe que
el valor correcto de la prueba debe ser mayor a 60.
¿Existe suficiente evidencia para comprobar que no
hay problemas de conocimiento de software en el
grupo seleccionado?

Paso 1:
Hipótesis Alternativa (Hi): (Lo que se quiere comprobar)
El grupo no tiene problemas de conocimiento de sotfware . Valor
de conocimiento de sotfware mayor a 60.

Hipótesis Nula (Ho): (Lo contrario a la hipótesis Alternativa)


El grupo tiene problemas de conocimiento de sotfware. Valor de
conocimiento de sotfware menor a 60.
Ejercicio explicativo

Paso 2:
Determinar nivel de significancia: como es para
un proyecto de investigación, entonces α =0.05

Paso 3:
Evidencia muestral.

X=62.1 y S=5.83
Ejercicio explicativo
Paso 4:
Aplicando la distribución de probabilidad t-student:

X-m 62.1- 60 2.1


t= t= t= =1.8
S 5.83 1.166
n 25
g.l. = n - 1 = 25 - 1 = 24
Ejercicio explicativo
Buscando en la tabla de Distribución de t-student,
encuentras el valor del área:

t = 1.8
gl = 24

Paso 5:
Resultados: P = 0.042 y α =0.05 Siendo P < α
Por lo tanto: Se acepta la Hipótesis Alternativa.

“Existe suficiente evidencia para demostrar que el grupo no


tiene problemas de conocimiento de software”.
Tabla T-Student
Ejercicios
Los alumnos de ingeniería en sistemas computacionales
realizan pruebas con leds. El representante del grupo dice
que sus leds duran 300 días.
Entonces los ing. en electromecánica van a varios
supermercados y compran 15 leds para probar esa
afirmación. Los leds de la muestra duran en promedio 290
días con una desviación estándar de 50 días.
Entonces, si quieren desmentir al representante de
sistemas necesitan saber cual es la probabilidad de que
15 leds seleccionados al azar tengan una vida promedio
no mayor de 290 días
Ejercicios

Datos: Fórmula: Sustitución:


X = 290
μ = 300 X-m 290 - 300 -10
t= t= = = -0.7746
S = 50 S 50 12.91
n = 15
n 15
Ejercicios

No veas esto, después veremos la probabilidad


Trata de hacer los
siguientes ejercicios
IMPORTANTE:
Solo debes hacerlos utilizando los pasos
vistos en clase, luego estudiaremos la
probabilidad, ya que esto aun no será
evaluado
Ejercicios
Suponiendo que las calificaciones de una
prueba de los alumnos de la carrera de
Ingeniera de sistemas del Tecnológico están
distribuidas normalmente con una media de 100.
Ahora supongamos que seleccionamos a 20
estudiantes y les hacemos un examen de
diagnostico de sistemas operativos. La media es
110 y la desviación estándar de la muestra es
de 15.
Datos: Fórmula: Sustitución:
X
= 100 X-m 100 -110 -10
t= t= = = -2.9850
μ = 110 S 15 3.35
S = 15
n 20
n = 20
Ejercicios
Usando estos valores nos da un resultado de probabilidad
acumulada de 0.00496.
Esto implica que hay una probabilidad de 0.45% de que el
promedio en una muestra sea mayor de 110.

Resultado gráficamente: después entenderemos la probabilidad


Distribución t
19 grados de libertad
Ejercicios
Los ingenieros en sistemas del Instituto Tecnológico han
desarrollado una aplicación que desarrolla las habilidades de
los niños para poder empezar a hablar a temprana edad.
En su localidad, el promedio de edad, en la cual un niño
emite su primera palabra, es de 13 meses. No se conoce la
desviación estándar poblacional.
Los ingenieros ponen en práctica dicha aplicación a una
muestra aleatoria de 15 niños. Los resultados arrojan que la
edad media muestra en la que se pronuncia la primera
palabra es de 11 meses, con una desviación estándar de 3.34.

1.¿Cuál es la hipótesis alternativa ?


2.¿Cuál es la hipótesis nula?
3.¿Funciona la técnica? Utilice =0,05 2colas
Ejercicios

Hipótesis alternativa H1: La aplicación afecta la edad en que los


niños comienzan a hablar.

Por lo tanto, la muestra Xobtenido =11, 0


es una muestra aleatoria, extraída de una población donde  ≠
13,0.

Hipótesis Nula H0: La aplicación no afecta la edad en que los


niños comienzan a hablar.
X =11, 0
Por lo tanto, la muestra con obtenido es una muestra
aleatoria , extraída de una población con  = 13,0.
Ejercicios

Datos: Fórmula: Sustitución:


X = 11
μ = 13 X-m 11  13 2
t= t   2.32
S = 3.34 S 3.34 0.862
n = 15 n 15

tCrítico=t2.14
Si tObtenido Crítico

Entonces, se rechaza la Hipótesis Nula; por lo que se acepta la Hipótesis


Alterna:
“La técnica afecta la edad en que los niños comienzan a hablar”
Ejercicios
La maestra de química del Instituto Tecnológico de Cancún afirma
que el rendimiento medio de cierto proceso en una planta es 500
gramos por milímetro de materia. Para verificar esta afirmación toma
una muestra de 25 plantas cada mes.
Si el valor de t calculado cae entre –t0.05 y t0.05’ aceptaría su
afirmación (con 90% de confianza). ¿Qué conclusión extraería de
una muestra que tiene una media de 518 gramos por milímetro y una
desviación estándar de 40 gramos? Suponga que la distribución de
rendimientos es aproximadamente normal.
Solución: de la tabla encontramos que t ± 0.05 para 24 grados de
libertad es ±1.711. Por tanto, la maestra queda satisfecha con esta
afirmación si una muestra de 25 plantas rinde un valor t entre –1.711 y
1.711.
Se procede a calcular el valor de t:
X Datos: Fórmula: Sustitución:
= 100
μ = 110 X-m 518 - 500 18
t= t= = = 2.25
S = 15 S 40 8
n = 20
n 25
Ejercicios
Este es un valor muy por arriba de 1.711, por lo que el maestra diría
que no es cierta la afirmación. Sin embargo, si se encuentra la
probabilidad de obtener un valor de t con 24 grados de libertad
igual o mayor a 2.25 se busca en la tabla y es aproximadamente de
0.02 De aquí es probable que la maestra concluya que el proceso
produce un mejor rendimiento de producto que el que suponía.
Ejercicios propuestos
Imagine que la administradora de una universidad quiere determinar el IQ promedio
de los alumnos de sistemas del ITC. Como es muy costoso hacer una prueba a todos
los alumnos, se extrae una muestra aleatoria de 20 alumnos de la carrera. Cada
alumno recibe un examen diseñado para medir el IQ; los resultados proporcionan
una media muestral de 135 y una desviación estándar de 8. Construya el intervalo de
confianza del 95% para la media poblacional.
a)¿Qué significa que el intervalo de confianza del 95% es igual a cierto rango?.

Un consejo universitario quiere determinar el tiempo promedio de estudio


que dedican los estudiantes de Ingeniería en Sistemas Computacionales,
de primer año, a sus materias. Extrae una muestra aleatoria de 61 alumnos
de primer año y les pregunta cuántas horas a la semana estudian. La
media de los datos resultantes es de 20 horas, y la desviación estándar es
de 6,5 horas.
a) Construya un intervalo de confianza del 95% para la media poblacional.
b) Construya un intervalo de confianza del 99% para la media poblacional.
Ejercicios propuestos
El director del Instituto Tecnológico les ha dejado Altura (en
de tarea a los alumnos de Sistemas desarrollar Pulgadas)
una aplicación que demuestre que las alumnas 64
han aumentado su estatura ya que generaciones
pasadas han estado bajas de estatura .El sabe 66
que hace 3 años el promedio de estatura de una 68
alumna en el instituto, fue de 63 pulgadas. No se
conoce la desviación estándar. Los alumnos 60
toman una muestra aleatoria de ocho alumnas y 62
miden sus estaturas. Se obtienen los datos de la
siguiente tabla:
65
66
a) Cuál es la hipótesis nula?
63
b) Cuál es la hipótesis alterna?
c) Si utilizamos =0,01 2cola , qué se puede
concluir?
Ejercicios propuestos
Una profesora, del programa de estudios para la mujer,
cree que la cantidad de cigarrillos fumados por las mujeres
se ha incrementado en años recientes. Un censo, realizado
hace dos años con mujeres de una ciudad vecina, mostró
que el número promedio de cigarrillos fumados
diariamente por una mujer era de 5,4, con una desviación
estándar de 2,5. Para evaluar esta hipótesis, la profesora
determinó el número de cigarrillos fumados diariamente
por una muestra aleatoria de 120 mujeres que viven
actualmente en la ciudad donde habita. Los datos
muestran que el número de cigarrillos fumados diariamente
por las 120 mujeres tiene una media de 6,1 y una
desviación estándar de 2,7.
a)¿Es correcta la hipótesis de la profesora?. Utilice =0.05 2
cola, para tomar su decisión y la t-Students.

También podría gustarte