Semana 7
Semana 7
Semana 7
PARAMETRO
PARAMETRO P=п
Proporción éxito
µ.
Promedio
poblacional FRACASO Q
SEPTIMA SEMANA
ESTIMACION EN DOCIMAS DE
VARIABLES HIPOTESIS
CUALITATIVAS
NO
PUNTUAL INTERVALOS PARAMETRICAS
PARAMETRICAS
CLASES DE ESTIMACIONES
Datos
P=Π=? Π = p ± zSp
n = 64
Confianaza 95%= Zt = 1.96
n1 = 40 n2 = 24
p = 40/64 =0.625 Π = 62.50 ± 1.96*6.05
q = 24/64 = 0.375
Π = 62.50 ± 11.86
Sp = 6.05
54.64 ≤ Π ≤ 74.360
95% confianza
54.64 ≤ Π ≤ 74.36
• Modelos estadísticos
PARAMETRICAS • Pruebas de Medias
(Datos de diversa • Prueba de Diferencia de
fuentes) Madias
DOCIMAS • Pruebas de %
DE HIPOTESIS
NO
PARAMETRICAS • Prueba Chi Cuadrado (X2 )
(Encuestas) • Prueba Rho de Spearman
POBLACION (N) MUESTRA (n)
Parámetro
µ= ??? Estimador
x = Conocido
PRUEBA DE HIPOTESIS
PRUEBAS PARAMETRICAS
Pasos para Probar una Hipótesis
α
Rechazo
Ho
5. Toma de decisiones:
Uso de la tabla
ERRORES EN UNA DOCIMAS DE HIPOTESIS
Decisión
dictada por el
Ho es Verdadera Ho es Falsa
resultado de la
muestra
Decisión
Rechazar Ho Error de Tipo I
Correcta
Nivel de Significación (α )
TABLA NORMAL ESTANDAR
Validación de los Modelos Estadísticos en pruebas
paramétricas:
Los modelos estadísticos se miden y validan mediante las Pruebas:
• Prueba T Student : Prueba de los parámetros.
• Prueba F-Fisher : Prueba del modelo
• Coeficiente de Correlación : Indica la dirección del modelo
• Coeficiente de determinación : Determina la explicación del
modelo por parte de la variable independiente.
• Coeficiente de Durbin y Watson : Si existe autocorrelación.
Datos Pasos:
µ = 300 grs
σ = 20 grs Probar que el contenido sea de 300 grs (µ = 300)
1. Hipótesis Nula Ho: µ < 300
α = 5% 2. Hipótesis Alterna Ha: µ ≥ 300
n = 36 3. Nivel de significación: α = 5% , Z = - 1.65
x = 295 4. Prueba estadística:
Reemplazando
Uso de la tabla
5. Toma de decisiones:
Con un nivel de significación del 5% se acepta la hipótesis nula, es decir,
existen evidencias estadísticas para concluir que el peso del producto está por
debajo de lo estipulado.
PROBLEMAS DE DOCIMAS DE HIPOTESIS
4. Un fabricante de ropa de algodón desea probar si los
polos rotulados con talla “M” que elabora el departamento
de confecciones satisfacen las especificaciones en
promedio. Los registros indican que en promedio el largo
de los polos es de 52 centímetros con una desviación
estándar de 4 centímetros. Se toma una muestra aleatoria
de 50 polos y se registró que el largo promedio es de 50
centímetros. Haga la respectiva prueba con un nivel de
signific. de 5%.
5. El jefe de seguridad de “Metro” sabe que el
estacionamiento ha estado siendo usado por personas que
no son clientes, en promedio por más de 80 minutos con
varianza de 25, se toma una muestra de 25 vehículos que
se encontraban en el estacionamiento y que no eran
clientes con promedio de 78 minutos. Esta muestra
sustenta lo que el jefe de seguridad afirma con un nivel de
significancia de 5%.
PROBLEMAS DE DOCIMAS DE HIPOTESIS
5. Toma de decisiones:
Con un nivel de significación del 5% se acepta la hipótesis nula, es decir,
existen evidencias estadísticas para concluir que la afirmación del gerente del
banco, no se ajusta a la verdad.
El secretario general del Sindicato de trabajadores de la empresa DELTA, señala
que el ingreso mensual es de 3500, el Gerente de la empresa menciona que dicha
aseveración no es verdad, para tal efecto selecciona una muestra de 64 trabajadores,
dando un promedio de 4000 soles con una desviación estándar de 1200 soles,
trabaje con un nivel de significación del 5% para probar la hipótesis.
Pasos:
Datos
µ = 3500 soles Probar que el ingreso es de 3500 soles (µ ≤ 3500)
σ = 1200 1. Hipótesis Nula Ho: µ > 3500
2. Hipótesis Alterna Ha: µ ≤ 3500
α = 5% 3. Nivel de significación: α = 5% , Z = - 1.65
n = 64 4. Prueba estadística:
x = 4000
Uso de la tabla
α
Rechazo
Ho
5. Toma de decisiones:
Con un nivel de significación del 5% se rechaza la hipótesis nula y se acepta la
hipótesis alterna, es decir, los sueldos están por encima de lo señalad o por el
Sindicato.
6. Un fabricante de café instantáneo envasa su producto en
frascos de 300 gramos peso neto. Con la finalidad de
realizar una promoción a nivel nacional, desea realizar un
control previo durante una hora, para lo cual una muestra de
36 frascos da como resultado un promedio entre 301 y 302
grs. con desviación estándar de 7,5 grs., Probar la hipótesis
sobre la afirmación del fabricante, usando un nivel de
significación del 5%.
MEDIDAS DE
TENDENCIAS
CENTRAL
POSICION
MEDIA
PROMEDIO
MODA
MEDIANA
CENTRALIZACION
MEDIA GEOMETRICA
MEDIA ARMÓNICA
DISTRIBUCION SIMETRICA
Media
Mediana
Moda
MEDIANA
CUARTIL
POSICION QUINTIL
UBICACIÓN
DECIL
PERCENTIL
COEFICENTE DE ASIMETRIA
COEFICENTE DE
APUNTAMIENTO
DESVIACION MEDIA
VARIANZA V(x)
MEDIDAS DE DESVIACION
DISPERSION ESTANDAR
ABSOLUTA
COEFICIENTE DE
VARIACION
DESVIACION
CUARTILICA
ESPERANZA MATEMATICA DE UNA FUNCION DE PROBABILIDAD
DISCRETO
ESPERANZA
MATEMATICA DE Є (x ) = x = Σ x p(x)
UNA FUNCION
DE PROBABILIDAD
Є(X) = x CONTINUO
Є (x ) = x = ∫xf(x)dx
VARIANZA DE UNA FUNCION DE PROBABILIDAD
La tabla muestra el comportamiento de daños a la agricultura por las heladas ocurridas
en el Perú: 2003-2014; calcular el valor esperado
Cálculo de la varianza
Reemplazando en la v(x)
95%
Función de Probabilidad
Reemplazando
Integrando
Respuesta
Reemplazando tenemos:
95%
USOS * Valor de p ~ ½
* Valor de n < 30
MEDIA
VARIANZA
Función de Probabilidad Discreta
P = probabilidad de éxito
Q= probabilidad de fracaso
n = Ensayos o tamaño de muestra
ADEMAS
x = probabilidad de pregunta
Función de probabilidad dictómica
p + q =1
FUNCIÓN DE PROBABILIDAD DISCRETA
USOS * Valor de p ~ 0
* Valor de n >> 100
MEDIA
VARIANZA
Función de Probabilidad Discreta
P = valor tiende a cero
n = Tamaño de muestra valor grande
x = Variable = pregunta
ADEMAS
Función de probabilidad dictómica
e = 2.718281
DISTRIBUCION HIPERGEOMETRICA
CARACTERISTICAS
• Se usa en probabilidades combinadas
• El muestreo se realiza sin reposición
• La muestra se realiza se obtiene de una población relativamente
pequeña.
• La probabilidad de éxito no permanece igual de un ensayo a otro.
• En estos casos se usa este tipo de distribución:
X = 0, 1, 2, 3, 4…
Siendo:
N : Población finita
S : Cantidad de éxitos de población
X : Éxitos en la muestra o probabilidad solicitada
n : Tamaño de muestra o número de ensayos n ≥ 5%N
Distribución Normal
f(x)
f(x)
Función estandarizadora µ
f(z)
V(x) = 1)
Distribución Normal
Estándar f(z)
LEY NORMAL ESTANDAR– f(z)
USOS DE LA TABLA NORMAL ESTANDARD
Conocida el área o
probabilidad, hallar el
valor de z.
Conocido z, hallar la
probabilidad o área
Las vidas útiles de las pilas de una cierta marca están distribuidas normalmente. Si
el 6.68% de las pilas duran mas de 56 horas, el 30.85% duran menos de 52 horas
¿cuál es la media y cual es la desviación estándar?
Datos
X : vida útil de las pilas
6.68% duran + de 56 horas
X > 56 horas
30.85% duran - de 52 horas 30.85% 19.15%
43.32% 6.68%
X < 52 horas
σ=? μ= ? X<52 X>56
f(x) f(z)
30.85% 19.15%
43.32% 6.68%
=
Z = - 0.5 Z = 1.50
Pero
Reemplazando se tiene
Datos
X : vida útil de las pilas =
6.68% duran + de 56 horas
X > 56 horas,
Z= 1.50
=
30.85% duran - de 52 horas
X < 52 horas,
Z= -0.50
=
σ=? μ= ?
Desarrollando se tiene
1.50(52- μ ) = -0.50(56-μ )
Calculo de la desviación
μ = 53
estándar
APROXIMACIÓN DE DISTRIBUCIÓN NORMAL A LA BINOMIAL
np ≥ 5
CASOS nqq ≥ 5.
I.- INSESGAMIENTO
Sea ô una estimación del parámetro θ, asociado con la
distribución de la variable aleatoria X, entonces θ, es un
estimador insesgado si: E(ô ) = θ
Ejemplos:
La media muestral es un estimador Insesgado de la media poblacional.
III. EFICIENTE
Se dice que ô es un estimador eficiente del parámetro θ,
cuando existe otro estimador ô1 y se cumple la relación:
ô / ô1 > 1
PROPIEDADES DE LOS ESTIMADORES
IV. PRECISOS:
Es aquel que tiene un varianza mínima.
ε(s) =
V. CONSISTENTES
Un estimador ô es consistente, si para muestras grandes su
valor probabilístico difiere del valor del parámetro θ en una
cantidad muy pequeña.
P|ô–θ|~ 0
RELACION PARAMETRO-ESTIMADOR
Vendedor Nº Automóviles
Juan 6
Pedro 7
Manuel 5
Roberto 2
Luis 8
Estadística
Paramétrica
(BD N se conoce
Archivos,
información)
DETERMINACIÓN DE
LA POBLACION (N) Si N no se conoce o
Y MUESTRA (n) Estadística Poblaciones Grandes
No
Paramétrica
Técnica de
Encuestas y N conoce
Entrevistas
DISEÑO MUESTRAL PARA TRABAJOS DE INVESTIGACION
N no se conoce
Estadística
Paramétrica
(BD N se conoce
Archivos,
información)
DETERMINACIÓN DE
LA POBLACION (N) Si N no se conoce o
Y MUESTRA (n) Estadística Poblaciones Grandes
No
Paramétrica
Técnica de
Encuestas y N conoce
Entrevistas
PUNTUAL
ESTIMACION
INTERVALOS
ESTIMACIONES
Parámetro Estimador ±±Error
= =Estimador
Parámetro Error
Estimación
ESTIMACIONES
ALGUNAS CONSIDERACIONES
ESTIMACIONES
ESTRATIFICADO
Determinación de tamaño de
muestra y usos del muestreo
SISTEMATICO
MUESTREO ESTRATIFICADO
Estratos – Grupos
• Externamente muy heterogéneos.
• Internamente muy homogéneos
MUESTREO SISTEMÁTICO
Aplicación del Muestreo Sistemático
Se tiene el directorio ordenado de 88 empresas referente a la extracción minera,
se desea determinar el tamaño de muestra para analizar el tema de
responsabilidad social, se tiene conocimiento que los hombres representa el 70%,
se desea un error de 9% y una confianza del 90%
Datos
N = 88 Ɛ = 9%
P= 0.7 Q= 0.3
n = ??
PASOS
1. N = 88 Directorio
2. n = 34
3. K = 3 (constante elevación) K
= N/n = 88/34 = 3
4. Arranque Aleatorio 1 ≤ A ≤ K
1≤ A≤3 Para la cuarta empresa: 8+3 = 11
Sea la primera empresa seleccionada
Así sucesivamente hasta llegar hasta la
la segunda, entonces A = 2
5. Para la segunda empresa agregar el empresa número 34, según lo
valor de K ( 2+3 =5) determinado en el diseño de la muestra
Para la tercera empresa: 5 +3 = 8
POBLACION (N)
ESTIMACION
PUNTUAL
ESTIMACIONES
INTERVALOS
POBLACION (N) MUESTRA (n)
Parámetro
µ= ??? Estimador
x = Conocido
PRUEBA DE HIPOTESIS
Pasos para Probar una Hipótesis