Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
34 vistas89 páginas

Semana 7

Descargar como pdf o txt
Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1/ 89

ESCUELA PROFESIONAL DE ECONOMIA

ESTADISTICA INFERENCIAL APLICADA

Dr. Santiago S. Montenegro Canario


Estadistico
smontenegro@indeci.gob.pe
mocasa_03@hotmail.com

LIMA, PERÚ – 2020


POBLACION (N)

Variables cuantitativas Variables cualitativas

PARAMETRO

PARAMETRO P=п
Proporción éxito
µ.
Promedio
poblacional FRACASO Q
SEPTIMA SEMANA

ESTIMACION EN DOCIMAS DE
VARIABLES HIPOTESIS
CUALITATIVAS

NO
PUNTUAL INTERVALOS PARAMETRICAS
PARAMETRICAS
CLASES DE ESTIMACIONES

Siendo: ε = error Además p = n1/n q =n2/n


ESTIMACIONES EN VARIABLES CUALITATIVAS (P = п)
Una empresa dedicada a la Investigación de mercados desea conocer el
porcentaje de personas que trabajan fuera del distrito de residencia, para
lo cual selecciona una muestra de 64 personas, la cual indica que 40
personas viven en un lugar distinto a la zona de residencia.
Con una confianza del 95%, calcule la verdadera proporción de
trabajadores que laboran fuera del distrito de residencia.

Datos
P=Π=? Π = p ± zSp
n = 64
Confianaza 95%= Zt = 1.96
n1 = 40 n2 = 24
p = 40/64 =0.625 Π = 62.50 ± 1.96*6.05
q = 24/64 = 0.375

Π = 62.50 ± 11.86
Sp = 6.05

54.64 ≤ Π ≤ 74.360
95% confianza

54.64 ≤ Π ≤ 74.36

Interpretación: Con una confianza del 95% se afirma que el porcentaje de


trabajadores que laboran fuera del distrito de residencia varía entre el
54.64% y 74.36%
PROBLEMAS DE ESTIMACIONES

1. Un político desea conocer el porcentaje de aceptación que goza en


su distrito. Una muestra de 400 electores arroja que 140 electores
votarán por el dicho candidato. Estimar el porcentaje de la
población que votarán por este candidato, estime con un intervalo
de confianza del 95%
Soluciòn
Datos:
n= 400 n1= 140, n2 = 260
p= n1/n = 140/400 = 0.35 = p. q= n2/n = 260/400 = 0.65 = q.
sp = √pq/n = √(0.35*0.65)/400 = √0.0056875 = 0.0238= 2.23%.
Confianza 95%, Z= 1.96.
Π = p ± z√pq/n Π = 0.35 ± 1.96(0.0238)
Π = 0.35 ± 0.046648
0.3034 ≤ Π ≤ 0.3966
30.34% ≤ Π ≤ 39.66%
30.34%≤ Π ≤ 39.66%

Interpretación: Con una confianza del 95% se asegura que el candidato


tiene una aceptación que varía entre el 30.34% y 39.66%
PROBLEMAS DE ESTIMACIONES

2. Una empresa dedicada a la Investigación de mercados desea


conocer el porcentaje de personas que trabajan fuera del distrito
de residencia, para lo cual selecciona una muestra de 64
personas, la cual indica que 40 personas viven en un lugar
distinto a la zona de residencia.
Con una confianza del 95%, calcule la verdadera proporción de
trabajadores que laboran fuera del distrito de residencia.
3. Con los siguientes datos, estime un intervalo de confianza del
90% a fin de conocer, el verdadero valor de alumnos q no
aprueban el curso.
n = 20 alumnos matriculados en el curso de estadística básica.
n1= 8 alumnos que son reprobados en el mencionado curso.
4. Se sabe que el 52% de los electores inscritos en un distrito apoyan
al candidato X. Cual es la probabilidad de que en una muestra de
aleatoria de 300 lectores. a) El apoyo sea más del 54%. b) El
apoyo sea de 48% y 56%.
PROBLEMAS DE ESTIMACIONES

5. Una empresa desea conocer sobre el dominio de idiomas de los


estudiantes universitarios. Una muestra de 250 estudiantes, se
encuentra que 54 han seguido estudios de idiomas. Calcule la
proporción de estudiantes en todo el país que han seguido idiomas,
emplee un intervalo de confianza del 95%.
6. El decano de la facultad de una Universidad desea saber el grado de
aceptación de cada profesor que cuenta en su plana docente. Con tal
motivo se realizó una encuesta a 250 alumnos de la facultad, de los
cuales 150 dijeron estar de acuerdo con la actual plana docente, con un
95% de confianza.
a. Estime el verdadero porcentaje de población que están de
acuerdo con la actual plana docente.
b. Si la facultad cuenta con 1200 alumnos, cuantos están a favor de
la plana docente.
7. Un fabricante estima en 5% la proporción de piezas defectuosas de los
5,000 producidos.
a) Determine un intervalo de confianza del 90% para estimar la
proporción de todas las piezas defectuosas si se tiene una muestra de
64 productos.
8. Una encuestadora utilizó una muestra aleatoria de 600 electores
que en las últimas elecciones votaron a favor del candidato A.
a. estimar el % de electores que estàn a favor del candidato A en
toda la población, utilice un intervalo de confianza del 95%.
b. Si la proporción a favor del candidato A se estime en 40%. ¿
cual es el error máximo en la estimación si se requiere tener una
confianza del 98%
c. Para la misma muestra, la proporción a favor de B se estima
en 38%, con una confianza del 98%, que el error no exceda a
4.62%, ¿ se puede proclamar al candidato A Como ganador?
9. Una muestra de 400 menores de 16 años, indica que 220
consumen licor.
a. Estimar la proporción de menores de 16 años que consumen
licor en toda la población mediante un intervalo de confianza del
95%.
8. Un fabricante de helados desea que el contenido de grasa de sus
helados sea de 10% con el objeto de mantener una calidad uniforme
en su producto. Un análisis de una muestra de 49 cajas de helado da
un contenido graso promedio de 0,103 con una desviación estándar
de 0,014. Utilice un nivel de significación 0,05 ¿rechazará el
fabricante la hipótesis de que el contenido medio de su helado está
en el nivel apropiado?.

9. Un fabricante de salsa de tomate está estudiando la posibilidad


de fabricar un producto similar con bajo contenido de condimentos.
El departamento de investigación de mercados empleo una encuesta
telefónica de 6000 hogares y encontró que la salsa de tomate
propuesta para el lanzamiento sería adquirida por 335 amas de casa.
Un estudio mas extenso efectuado hace dos años indicó que el 5%
de los hogares habrían comprado el producto. A un nivel de
significación del 2% ¿debería concluir que ahora existe un mayor
interés en el sabor condimentado?
DOCIMAS DE HIPÓTESIS

Llamadas también pruebas de significación, es una metodología


estadística que permite evaluar las proposiciones o afirmaciones
acerca de los valores de los parámetros en la población.

• Modelos estadísticos
PARAMETRICAS • Pruebas de Medias
(Datos de diversa • Prueba de Diferencia de
fuentes) Madias
DOCIMAS • Pruebas de %
DE HIPOTESIS
NO
PARAMETRICAS • Prueba Chi Cuadrado (X2 )
(Encuestas) • Prueba Rho de Spearman
POBLACION (N) MUESTRA (n)

Parámetro

µ= ??? Estimador
x = Conocido

PRUEBA DE HIPOTESIS
PRUEBAS PARAMETRICAS
Pasos para Probar una Hipótesis

Para contrastar las hipótesis mediante las técnicas de encuestas o


mediante el procesamiento de datos se utiliza los siguientes
pasos:
Plantear el enunciado de la hipótesis a probar
1. Formular la hipótesis nula (Ho):
Consiste en negar la hipótesis que se desea probar.
2. Formular la hipótesis alternante (Ha):
Consiste en afirmar la hipótesis a probar.
3. Fijar el nivel de significación (α)
Es la probabilidad de rechazar la hipótesis siendo verdadera;
rango de variación del 1% ≤ α ≤ 10%, hay dos maneras de
comprobar la validez de la hipótesis a probar:
- Usando las tablas Estadísticas Z, T o F
- Usando el Software Estadístico. (α-sig < 5%)
Paso 4 Prueba Estadística
Pruebas Paramétricas (datos recopilados de diversas fuentes)
CASOS
I. Usando datos con la media y desviación estándar
a. Si n ≥ 30 entonces, la media de la muestra se distribuye como una normal, por
lo tanto la función pivotal será:

b. Si n < 30, la media de la muestra se distribuye como una T-Student


con (n-1) g. l., la función pivotal será:

II. Usando datos con la formulación de modelos de regresión:


a. Prueba F- Fisher: Prueba de significación del Modelo
b. Prueba T-Student: Prueba de significación de los parámetros
c. Coeficiente de correlación
d. Coeficiente de Determinación
5. Toma de
Uso de la tabla
decisiones:
5. Toma de decisiones:
Uso de la tabla

α
Rechazo
Ho
5. Toma de decisiones:
Uso de la tabla
ERRORES EN UNA DOCIMAS DE HIPOTESIS

Decisión
dictada por el
Ho es Verdadera Ho es Falsa
resultado de la
muestra

Decisión
Rechazar Ho Error de Tipo I
Correcta

Aceptar Ho Decisión Correcta Error de tipo II

Nivel de Significación (α )
TABLA NORMAL ESTANDAR
Validación de los Modelos Estadísticos en pruebas
paramétricas:
Los modelos estadísticos se miden y validan mediante las Pruebas:
• Prueba T Student : Prueba de los parámetros.
• Prueba F-Fisher : Prueba del modelo
• Coeficiente de Correlación : Indica la dirección del modelo
• Coeficiente de determinación : Determina la explicación del
modelo por parte de la variable independiente.
• Coeficiente de Durbin y Watson : Si existe autocorrelación.

Uso de Software para cálculo de Modelo Lineal


Ruta en Excel:
Fórmula/función/estadística/estimación lineal/ingresar datos.
Ruta en SPSS:
Analizar/regresión/lineal/ingresar variables/aceptar
PROBLEMAS DE DOCIMAS DE HIPOTESIS

1. Un fabricante de pilas de 3 voltios afirma que el promedio


de vida es 15 horas con una desviación estándar de 3
horas. Una muestra de 36 pilas da un promedio de vida de
14:45 horas, con un nivel de significación del 5%. Pruebe la
afirmación del fabricante de pilas.
2. Un fabricante de Cereales vende su producto cuyo rótulo
dice peso neto “300 grs.”, y una desviación estándar de 20
grs, una muestra aleatoria de 36 bolsitas dio un contenido
neto de 295 gramos, con un nivel de significación del 5%
probar la hipótesis referente al contenido neto del producto
3. En un informe preparado por el Dpto. de Investigación Económica
de un Banco Comercial, se expresa que el ingreso familiar anual
medio en una ciudad es de $ 26.000. Que conclusión se saca
acerca de la validez del informe si una muestra aleatoria de 400
familias de la zona da un ingreso medio de $. 25.800, con una S
= $ 6.000. Utilice un nivel de significación de 0,05
1.Un fabricante de Cereales vende su producto cuyo rótulo dice peso
neto “300 grs.”, y una desviación estándar de 20 grs, una muestra
aleatoria de 36 bolsitas dio un contenido neto de 295 gramos, con un
nivel de significación del 5% probar la hipótesis referente al contenido
neto del producto

Datos Pasos:
µ = 300 grs
σ = 20 grs Probar que el contenido sea de 300 grs (µ = 300)
1. Hipótesis Nula Ho: µ < 300
α = 5% 2. Hipótesis Alterna Ha: µ ≥ 300
n = 36 3. Nivel de significación: α = 5% , Z = - 1.65
x = 295 4. Prueba estadística:

Reemplazando
Uso de la tabla

5. Toma de decisiones:
Con un nivel de significación del 5% se acepta la hipótesis nula, es decir,
existen evidencias estadísticas para concluir que el peso del producto está por
debajo de lo estipulado.
PROBLEMAS DE DOCIMAS DE HIPOTESIS
4. Un fabricante de ropa de algodón desea probar si los
polos rotulados con talla “M” que elabora el departamento
de confecciones satisfacen las especificaciones en
promedio. Los registros indican que en promedio el largo
de los polos es de 52 centímetros con una desviación
estándar de 4 centímetros. Se toma una muestra aleatoria
de 50 polos y se registró que el largo promedio es de 50
centímetros. Haga la respectiva prueba con un nivel de
signific. de 5%.
5. El jefe de seguridad de “Metro” sabe que el
estacionamiento ha estado siendo usado por personas que
no son clientes, en promedio por más de 80 minutos con
varianza de 25, se toma una muestra de 25 vehículos que
se encontraban en el estacionamiento y que no eran
clientes con promedio de 78 minutos. Esta muestra
sustenta lo que el jefe de seguridad afirma con un nivel de
significancia de 5%.
PROBLEMAS DE DOCIMAS DE HIPOTESIS

6. Se indica que el sueldo promedio en una región del país es


de 500 dólares. Un sector indica que esto no es verdad y
que este sueldo promedio es menor. Para probar las
hipótesis se tomó una muestra de tamaño 64 y de ahí se
encontró que el promedio es de 480 dólares. Hacer la
prueba usando un nivel de significancia del 5%, sabiendo
que los sueldos tienen distribución normal con desviación
estándar de 50 dólares.
7. Un determinado proceso de empaquetar un producto esta
controlado, si el peso medio del producto empaquetado es
de 400 grs. Una muestra aleatoria de 100 paquetes da un
peso medio de 395 grs. ¿ se podría decir que el proceso
está fuera de control al nivel de significación del 95%.
Suponga que el peso de los productos empaquetados se
distribuye normalmente con desviación estándar de 20
gramos.
9. El Gerente de un banco señala que sus empleados calificados ganan al
menos 8000 soles mensuales, probar la hipótesis del gerente, si una muestra
aleatoria de 100 trabajadores, da un promedio de 7800 soles con una
desviación estándar de 1500 soles trabaje con un nivel de significación del
5%.

10. El peso de un medicamento es de 50 miligramos, con una desviación


estándar de 5 miligramos, para validar su contenido se saca una muestra de
16 pastillas y da un promedio de 48 miligramos, cual es la conclusión que
usted arribaría sobre dicho medicamento, trabaje con un nivel de
significación del 5%.

11. El secretario general del Sindicato de trabajadores de la empresa


DELTA, señala que el ingreso mensual es de 3500, el Gerente de la
empresa menciona que dicha aseveración no es verdad, para tal efecto
selecciona una muestra de 64 trabajadores, dando un promedio de 4200
soles con una desviación estándar de 1200 soles, trabaje con un nivel de
significación del 5% para probar la hipótesis.
El Gerente de un banco señala que sus empleados calificados ganan al menos 8000
soles mensuales, probar la hipótesis del gerente, si una muestra aleatoria de 100
trabajadores, da un promedio de 7800 soles con una desviación estándar de 1500 soles
trabaje con un nivel de significación del 5%.
Pasos:
Datos
µ = 8000 Probar que el ingreso es superior a 8000 soles (µ ≥ 8000)
σ = 1500 1. Hipótesis Nula Ho: µ < 8000
2. Hipótesis Alterna Ha: µ ≥ 8000
α = 5% 3. Nivel de significación: α = 5% , Z = - 1.65
n = 100 4. Prueba estadística:
x = 7800
Uso de la tabla

5. Toma de decisiones:
Con un nivel de significación del 5% se acepta la hipótesis nula, es decir,
existen evidencias estadísticas para concluir que la afirmación del gerente del
banco, no se ajusta a la verdad.
El secretario general del Sindicato de trabajadores de la empresa DELTA, señala
que el ingreso mensual es de 3500, el Gerente de la empresa menciona que dicha
aseveración no es verdad, para tal efecto selecciona una muestra de 64 trabajadores,
dando un promedio de 4000 soles con una desviación estándar de 1200 soles,
trabaje con un nivel de significación del 5% para probar la hipótesis.
Pasos:
Datos
µ = 3500 soles Probar que el ingreso es de 3500 soles (µ ≤ 3500)
σ = 1200 1. Hipótesis Nula Ho: µ > 3500
2. Hipótesis Alterna Ha: µ ≤ 3500
α = 5% 3. Nivel de significación: α = 5% , Z = - 1.65
n = 64 4. Prueba estadística:
x = 4000
Uso de la tabla

α
Rechazo
Ho

5. Toma de decisiones:
Con un nivel de significación del 5% se rechaza la hipótesis nula y se acepta la
hipótesis alterna, es decir, los sueldos están por encima de lo señalad o por el
Sindicato.
6. Un fabricante de café instantáneo envasa su producto en
frascos de 300 gramos peso neto. Con la finalidad de
realizar una promoción a nivel nacional, desea realizar un
control previo durante una hora, para lo cual una muestra de
36 frascos da como resultado un promedio entre 301 y 302
grs. con desviación estándar de 7,5 grs., Probar la hipótesis
sobre la afirmación del fabricante, usando un nivel de
significación del 5%.

7. Una firma desea comprar una gran cantidad de PCs y


afirma que en promedio solo el 3% de las Pcs tienen fallas.
Al examinar 400 de ellos. Se encuentra 15 con fallas. Probar
la Hipótesis al 5%.
REPASO GENERAL PARA EL EXAMEN
PARCIAL
CENTRALIZACION

MEDIDAS DE
TENDENCIAS
CENTRAL

POSICION
MEDIA
PROMEDIO

MODA

MEDIANA
CENTRALIZACION

MEDIA GEOMETRICA

MEDIA ARMÓNICA
DISTRIBUCION SIMETRICA

Media = Moda = Mediana

Media
Mediana
Moda
MEDIANA

CUARTIL

POSICION QUINTIL
UBICACIÓN
DECIL

PERCENTIL
COEFICENTE DE ASIMETRIA
COEFICENTE DE
APUNTAMIENTO
DESVIACION MEDIA

VARIANZA V(x)

MEDIDAS DE DESVIACION
DISPERSION ESTANDAR
ABSOLUTA
COEFICIENTE DE
VARIACION

DESVIACION
CUARTILICA
ESPERANZA MATEMATICA DE UNA FUNCION DE PROBABILIDAD

DISCRETO
ESPERANZA
MATEMATICA DE Є (x ) = x = Σ x p(x)
UNA FUNCION
DE PROBABILIDAD

Є(X) = x CONTINUO

Є (x ) = x = ∫xf(x)dx
VARIANZA DE UNA FUNCION DE PROBABILIDAD
La tabla muestra el comportamiento de daños a la agricultura por las heladas ocurridas
en el Perú: 2003-2014; calcular el valor esperado

AÑOS HELADAS DAÑOS EN CULTIVO


TOTAL 6,177 260,397
2003 124 2,166
2004 573 14,109
2005 414 12,939
2006 239 5,181
2007 866 30,761
2008 493 79,338
2009 468 1,152
2010 548 7,149
2011 493 16,183
2012 582 38,588
2013 867 18,624
2014 510 34,207
INDICADORES ESTADISTICOS
Desv Estándar 213 21,968
Media 515 21,700
+DESVESTA (RANGEAR) +PROMEDIO(RANGEAR)
Procedimiento de Cálculo
DAÑOS EN
AÑOS HELADAS P(X) X*P(X)
CULTIVO (X)
TOTAL 6,177 260,397 1 24152 976987585
2003 124 2,166 0.02007447 43 94180
2004 573 14,109 0.092763477 1309 18465858
2005 414 12,939 0.067022827 867 11220809
2006 239 5,181 0.038691922 200 1038598
2007 866 30,761 0.140197507 4313 132660366
2008 493 79,338 0.079812207 6332 502379390
2009 468 1,152 0.075764934 87 100548
2010 548 7,149 0.088716205 634 4534126
2011 493 16,183 0.079812207 1292 20901978
2012 582 38,588 0.094220495 3636 140297497
2013 867 18,624 0.140359398 2614 48684131
2014 510 34,207 0.082564352 2824 96610104
Método Clásico Método Probabilistico
Media 515 21,700 Media 24,152
Desv Estándar 213 21,968 Desv. Estad. 19,841
a. Calcular el valor esperado
b. Calcular la desviación estándar
Cálculo de la media para datos discretos

Cálculo de la varianza

Reemplazando en la v(x)

Desviación estándar (S)


S = 19.842 has

95%

4310 24.152 43994

Interpretación: Con un 95% de confianza se tiene que la pérdida promedio por


desastres naturales es de 24 mil 152 has. de cultivo, teniendo una perdída máxima
estimada de 43 mil 994 has de cultivo perdidas y un mínimo estimado de 4 mil 310
has.
Problemas sobre esperanza matemática y varianza de
funciones de Probabilidad
Solución problema

Función de Probabilidad

Calculo del promedio

Reemplazando
Integrando

Respuesta

Interpretación: El peso medio de la fruta es de un kilo con 100 gramos

b. Cual es su desviación estándar e interprete


Calculo de la varianza

Solución: desviación estándar

La media es valor conocido

Este valor se debe calcular


Finalmente, la varianza será:

Reemplazando tenemos:

La desviación estándar de la fruta es de 800 gramos


Para efectos de interpretación se tiene:

95%

300 1.100 1.900

Interpretación Conjunta: Con un 95% de confianza se tiene que el peso medio de la


fruta es de un kilo con 100 gramos, siendo el máximo peso de la fruta un kilo con
900 gramos y el mínimo 300 gramos
FUNCIÓN DE PROBABILIDAD DISCRETA

BINOMIAL x= 0,1,2 3 4….

USOS * Valor de p ~ ½
* Valor de n < 30

MEDIA

VARIANZA
Función de Probabilidad Discreta
P = probabilidad de éxito
Q= probabilidad de fracaso
n = Ensayos o tamaño de muestra
ADEMAS
x = probabilidad de pregunta
Función de probabilidad dictómica
p + q =1
FUNCIÓN DE PROBABILIDAD DISCRETA

POISSON x= 0,1,2 3 4….

USOS * Valor de p ~ 0
* Valor de n >> 100

MEDIA

VARIANZA
Función de Probabilidad Discreta
P = valor tiende a cero
n = Tamaño de muestra valor grande
x = Variable = pregunta
ADEMAS
Función de probabilidad dictómica
e = 2.718281
DISTRIBUCION HIPERGEOMETRICA
CARACTERISTICAS
• Se usa en probabilidades combinadas
• El muestreo se realiza sin reposición
• La muestra se realiza se obtiene de una población relativamente
pequeña.
• La probabilidad de éxito no permanece igual de un ensayo a otro.
• En estos casos se usa este tipo de distribución:

X = 0, 1, 2, 3, 4…

Siendo:
N : Población finita
S : Cantidad de éxitos de población
X : Éxitos en la muestra o probabilidad solicitada
n : Tamaño de muestra o número de ensayos n ≥ 5%N
Distribución Normal
f(x)
f(x)

Función estandarizadora µ

f(z)

V(x) = 1)

Distribución Normal
Estándar f(z)
LEY NORMAL ESTANDAR– f(z)
USOS DE LA TABLA NORMAL ESTANDARD

Conocida el área o
probabilidad, hallar el
valor de z.

Encontrar z Encontrar Área

Conocido z, hallar la
probabilidad o área
Las vidas útiles de las pilas de una cierta marca están distribuidas normalmente. Si
el 6.68% de las pilas duran mas de 56 horas, el 30.85% duran menos de 52 horas
¿cuál es la media y cual es la desviación estándar?
Datos
X : vida útil de las pilas
6.68% duran + de 56 horas
X > 56 horas
30.85% duran - de 52 horas 30.85% 19.15%
43.32% 6.68%
X < 52 horas
σ=? μ= ? X<52 X>56
f(x) f(z)

30.85% 19.15%
43.32% 6.68%
=

Z = - 0.5 Z = 1.50
Pero
Reemplazando se tiene

Datos
X : vida útil de las pilas =
6.68% duran + de 56 horas
X > 56 horas,
Z= 1.50
=
30.85% duran - de 52 horas
X < 52 horas,
Z= -0.50
=
σ=? μ= ?

Desarrollando se tiene

1.50(52- μ ) = -0.50(56-μ )

Calculo de la desviación
μ = 53
estándar
APROXIMACIÓN DE DISTRIBUCIÓN NORMAL A LA BINOMIAL

La evaluación de una función de probabilidad binomial, realizada a mano o con


una calculadora, se dificulta cuando el número de ensayos o tamaño de muestra es
muy grande.

np ≥ 5

CASOS nqq ≥ 5.

factor de corrección por


Fcpc= 0.5 continuidad

Ante esta situación, la distribución normal proporciona una aproximación a las


probabilidades binomiales que es fácil de usar.
Cuando se usa la aproximación normal a la binomial, en la definición de la curva
normal se tiene que:
μ = np
APROXIMACIÓN NORMAL A LA BINOMIAL

La función estandarizadora de la distribución normal


Como aplicar el factor de corrección por continuidad (fcpc)

1. Para la probabilidad que por lo menos ocurra x, en este caso se


usa el área sobre los valores mayores que (x-0.5)
p( x ≥ xo)
2. Para la probabilidad que ocurra mas de x, en este caso se usa el
área sobre los valores mayores que (x + 0.5).
p( x > xo)
3. Para la probabilidad que x o menos, en este caso se usa el área
sobre los valores menores que (x + 0.5).
p( x ≤ xo)
4. Para la probabilidad que ocurra menos de x, en este caso se usa el
área sobre los valores menores que (x-0.5)
p( x < xo)
PRINCIPALES DISTRIBUCIONES MUESTRALES

• Distribución de la Media de Muestra


• Distribución de Diferencia de Media de Muestras
• Distribución T-Student
• Distribución F-Fisher
• Distribución Proporcional
• Distribución de Diferencia de Proporciones
• Distribución de Varianza
• Distribución Ji-Cuadrado
• Distribución de Rho de Spearman.
PROPIEDADES DE LOS ESTIMADORES

I.- INSESGAMIENTO
Sea ô una estimación del parámetro θ, asociado con la
distribución de la variable aleatoria X, entonces θ, es un
estimador insesgado si: E(ô ) = θ
Ejemplos:
La media muestral es un estimador Insesgado de la media poblacional.

II. SUFICIENTE (depende del tamaño de muestra)


Se dice que un estimador es suficiente, si contiene la
información necesaria para efectuar adecuadamente un
estudio.

III. EFICIENTE
Se dice que ô es un estimador eficiente del parámetro θ,
cuando existe otro estimador ô1 y se cumple la relación:
ô / ô1 > 1
PROPIEDADES DE LOS ESTIMADORES

IV. PRECISOS:
Es aquel que tiene un varianza mínima.
ε(s) = 

V. CONSISTENTES
Un estimador ô es consistente, si para muestras grandes su
valor probabilístico difiere del valor del parámetro θ en una
cantidad muy pequeña.
P|ô–θ|~ 0
RELACION PARAMETRO-ESTIMADOR

Existe una importante relación entre parámetro y


estimador, ya que los estimadores son valores
estimativos de los parámetros.
Se sabe por propiedad que el valor esperado de la
media de la muestra es igual a la media en la
población.
Є [m(x) ] = x = µ

Sólo para comprobar la veracidad de la relación


existente entre un parámetro y estimador se pone
un ejemplo en el cual se puede apreciar la
importancia de esta propiedad.
N° (X1 X2) Media
1 2 4 3
2 2 6 4
3 2 8 5
4 4 6 5
5 4 8 6
6 6 8 7
VOLVO DEL PERU, tiene cinco representantes de ventas. Los cincos
representantes y la cantidad de automóviles que cada uno de ellos
vendió el mes pasado fueron:

Vendedor Nº Automóviles
Juan 6
Pedro 7
Manuel 5
Roberto 2
Luis 8

a. Cuántas muestras diferentes de tamaño 2 son posibles


b. Enumere todas las muestras de tamaño 2 y calcule la
media de cada muestra.
c. Compare la media de la distribución muestral de las
medias de muestras con la de la población.
DISEÑO MUESTRAL PARA TRABAJOS DE INVESTIGACION
N no se conoce

Estadística
Paramétrica
(BD N se conoce
Archivos,
información)

DETERMINACIÓN DE
LA POBLACION (N) Si N no se conoce o
Y MUESTRA (n) Estadística Poblaciones Grandes
No
Paramétrica
Técnica de
Encuestas y N conoce
Entrevistas
DISEÑO MUESTRAL PARA TRABAJOS DE INVESTIGACION
N no se conoce

Estadística
Paramétrica
(BD N se conoce
Archivos,
información)

DETERMINACIÓN DE
LA POBLACION (N) Si N no se conoce o
Y MUESTRA (n) Estadística Poblaciones Grandes
No
Paramétrica
Técnica de
Encuestas y N conoce
Entrevistas
PUNTUAL

ESTIMACION

INTERVALOS
ESTIMACIONES
Parámetro Estimador ±±Error
= =Estimador
Parámetro Error

Estimación
ESTIMACIONES
ALGUNAS CONSIDERACIONES
ESTIMACIONES
ESTRATIFICADO

Determinación de tamaño de
muestra y usos del muestreo

SISTEMATICO
MUESTREO ESTRATIFICADO

Estratos – Grupos
• Externamente muy heterogéneos.
• Internamente muy homogéneos
MUESTREO SISTEMÁTICO
Aplicación del Muestreo Sistemático
Se tiene el directorio ordenado de 88 empresas referente a la extracción minera,
se desea determinar el tamaño de muestra para analizar el tema de
responsabilidad social, se tiene conocimiento que los hombres representa el 70%,
se desea un error de 9% y una confianza del 90%
Datos
N = 88 Ɛ = 9%
P= 0.7 Q= 0.3
n = ??

PASOS
1. N = 88 Directorio
2. n = 34
3. K = 3 (constante elevación) K
= N/n = 88/34 = 3
4. Arranque Aleatorio 1 ≤ A ≤ K
1≤ A≤3 Para la cuarta empresa: 8+3 = 11
Sea la primera empresa seleccionada
Así sucesivamente hasta llegar hasta la
la segunda, entonces A = 2
5. Para la segunda empresa agregar el empresa número 34, según lo
valor de K ( 2+3 =5) determinado en el diseño de la muestra
Para la tercera empresa: 5 +3 = 8
POBLACION (N)

Parámetro MUESTRA (n)


µ µ=?
Estimador
X = Media de la
muestra

ESTIMACION
PUNTUAL

ESTIMACIONES

INTERVALOS
POBLACION (N) MUESTRA (n)

Parámetro

µ= ??? Estimador
x = Conocido

PRUEBA DE HIPOTESIS
Pasos para Probar una Hipótesis

Para contrastar las hipótesis mediante las técnicas de encuestas o


mediante el procesamiento de datos se utiliza los siguientes
pasos:
Plantear el enunciado de la hipótesis a probar
1. Formular la hipótesis nula (Ho):
Consiste en negar la hipótesis que se desea probar.
2. Formular la hipótesis alternante (Ha):
Consiste en afirmar la hipótesis a probar.
3. Fijar el nivel de significación (α)
Es la probabilidad de rechazar la hipótesis siendo verdadera;
rango de variación del 1% ≤ α ≤ 10%, hay dos maneras de
comprobar la validez de la hipótesis a probar:
- Usando las tablas Estadísticas Z, T o F
- Usando el Software Estadístico. (α-sig < 5%)
a. Pruebas Paramétricas (datos recopilados de diversas fuentes)
CASOS
I. Usando datos con la media y desviación estándar
a. Si n ≥ 30 entonces, la media de la muestra se distribuye como
una normal, por lo tanto la función pivotal será:

b. Si n < 30, la media de la muestra se distribuye como una T-Student


con (n-1) g. l., la función pivotal será:

II. Usando datos con la formulación de modelos de regresión:


a. Prueba F- Fisher: Prueba de significación del Modelo
b. Prueba T-Student: Prueba de significación de los parámetros
c. Coeficiente de correlación
d. Coeficiente de Determinación

También podría gustarte