Estadistica Descriptiv
Estadistica Descriptiv
Estadistica Descriptiv
Estadística Descriptiva
Muestras
• Resumir e ilustrar información
Estadística Inferencial Estimación
Población
• Estimar parámetros
Conocimiento
• Contrastar hipótesis
Ejemplo
• Para una investigación de análisis sobre la satisfacción del
consumidor de pizza se toma una muestra de 63 personas
las cuales probaron dos marcas de pizza A y B
Resultados
• 31 prefiere la pizza A
• 15 prefiere la pizza B
• 17 no muestra preferencia
Estadística descriptiva
Resultados
• 49,2% → A A – B = 25,4%
• 23,8% → B
• 27% → AB
Estadística inferencial estimación
Resultados
• El valor de la diferencia A-B en la
población estará comprendido en
Intervalo de Confianza de 95%
Resultados predicción
• Si conocemos las características de los
consumidores podríamos dar la
probabilidad de que prefiera la pizza A
al B con mayor precisión
Población
• Conjunto de individuos u objetos de los que
se desea conocer algo en una investigación
• Unidad de observación: elementos de la
población en que se medirán o estudiaran
las variables de interes
N
POBLACION
n
Muestra
1. IDENTIFICAR LA POBLACION
2. APLICAMOS FORMULA PARA OBTENER
LA MUESTRA
EJEMPLO
• Clientes varones que solicitan crédito agrario
menor de S/ 5000,00
• Población Perú = 31 826,00 (millones)
• Sabemos que varones son 50,1%
• Sabemos población rural que es 23%
• Sabemos rango de edad de 25 a 39 años que son 23,6%
e ± =3,16%
Precisión Grado de seguridad Diversidad de opiniones
Intervalo de confianza riesgo que aceptamos de equivocarnos estimada en la población
p = q = 0,50
p1 p
Z = 95% = ∞ = 0,05
EE Z = 99% = ∞ = 0,01
n
EE
n
p1 p
EE
n
Y
40
30
20
10
0 Z
-2 -1 0 1 2
Población 865 174,38 miles
Aplicamos formula para la
muestra
ESTADISTICA DESCRIPTIVA
VARIABLES
estadísticas
ESTADISTICO
Caracteres Caracteres
Cuantitativos Cualitativos
¿Existe Organizar la
relación lineal? información
MEDIDAS DE LOCALIZACION
Cuantitativas Cualitativas
Puntuaciones Tablas de
combinadas contingencia
• Media Tablas de
• Moda frecuencia
• Moda
• Cuartiles
MEDIDAS DE VARIABILIDAD
Cuantitativas Cualitativas
Grafico de serie
temporal
ANALISIS ESTADISTICO DE DOS VARIABLES
Cuantitativas Cualitativas
¿Existe Tablas
relación lineal? contingencia
TIPOS DE VARIABLES
Carácter estadístico: propiedad de la población (atributo)
Cuantitativas Cualitativas
sus sus
modalidades modalidades no
son medibles pueden ser
medidas
Cuantitativas Cualitativas
Peso Raza
Talla Sexo
Pulso Profesión
Edad Estado civil
Variable
estadística
Tabla de contingencia
Medidas asociación
HIPÓTESIS
• Existen múltiples problemas en los cuales, en
lugar de estimar el valor de un parámetro, se
debe decidir si una afirmación relativa a un
parámetro es verdadera o falsa; es decir, se
debe probar una HIPÓTESIS relativa a un
parámetro.
• Se convierte en un problema de decisión
29
HIPÓTESIS ESTADÍSTICA
• Una hipótesis estadística es un enunciado acerca de la
distribución de probabilidad de una variable aleatoria. Las
hipótesis estadísticas a menudo involucran una o más
características de la distribución.
• Es importante recordar que las hipótesis son siempre
enunciados relativos a la población o distribución bajo estudio,
no enunciados en torno a la muestra.
• El objetivo entonces de la prueba de hipótesis suele ser
entonces determinar si la situación experimental ha cambiado.
• Este valor puede determinarse a partir de alguna teoría o
modelo con respecto al objeto que se estudia. Verificar la teoría
o modelo.
• Surge cuando el valor del parámetro de la población es
resultado de consideraciones experimentales, tales como
especificaciones de diseñoMg.oCarlos
ingeniería,
valencia
o de obligaciones 30
contractuales. Prueba de conformidad.
HIPÓTESIS ESTADÍSTICA
• En la práctica es necesario la formulación de dos hipótesis
estadísticas complementarias:
La hipótesis nula (H0) y La hipótesis alternativa (H1).
• La hipótesis nula está relacionada con una concepción
parsimoniosa de la realidad. Corresponde al estado actual de
conocimiento, por el cual, si no se hiciese el estudio sería la
que prevalecería.
• La hipótesis alternativa, por contra, está relacionada con el
objetivo del estudio. Es la hipótesis que necesita la evidencia
experimental y la recogida de evidencia para ser aceptada.
• Las hipótesis conjeturan acerca de cómo es la población de
origen. Posteriormente se decidirá cual de las dos hipótesis es
más compatible con los datos muestrales. Pero este proceso
no está exento de riesgo puesto que nada garantiza que la
Mg. Carlos valencia 31
decisión final está 100% exenta de error.
Tipos de errores
Ho cierta H1 cierta
Rechazo de Decisión
Error tipo I
Ho correcta
Aceptación Decisión
Error tipo II
de Ho correcta
z
alterna
m < m0 z < - za
m > m0 z > za
n m ≠ m0 z < - za/2
z > za/2
t
x1 x2 n1n2 n1 n2 2
n1 1s1 n2 1s2
2 2
n1 n2
α 0.05 5%
Nivel de confianza
«Valor de la confianza que permite aceptar que
los datos obtenidos en la muestra describen
correctamente a la población»
1 - α 0.95 95%
=0.05
μ=0
σ=1
Región de
Aceptación
Región de Ho
rechazo Ho
1-
=0.025 =0.025
z = -1.96 z = +1.96
=0.05
μ=0
σ=1
Región de
Aceptación
Región de Ho
rechazo Ho
1-
=0.05
z = +1.64
=0.05
μ=0
σ=1
Región de
Aceptación
Región de Ho
rechazo Ho
1-
=0.05
z = -1.64
Calculo función pivotal
x -μ x -μ P-p
z t n 1 z
s s pq
n n n
n > 30 n ≤ 30
VARIANZAS
• El estadístico para una prueba relativa a una varianza es el c2,
(n 1) s 2
2
0 2
s2 ≠ s 20
2 < 21-a/2 0 2 > 2a/2
2
r c o ij eij
2
i 1 j 1 eij
Hipótesis Especifica
a) Los niveles del rendimiento académico de los alumnos de administración
en relación con la profundidad de los conocimientos en administración
exigidos por los planes curriculares es en promedio insuficiente
VARIABLE DEPENDIENTE
rendimiento académico de los alumnos
ENCUESTA
TEST
a) Los niveles del rendimiento académico de los alumnos de administración en
relación con la profundidad de los conocimientos en administración exigidos por
los planes curriculares es en promedio insuficiente
Ho: μ1 ≥14
H1 : μ 1 ˂ 0
Prueba de una sola cola
• Nivel de significancia = 5% = 0.05
• Estadístico «t student» para la media
Interpretación grafica
Región de
Aceptación
Ho
Región de rechazo Ho
1-
=0.05
• H1: μ1 ˂ 0
→“el rendimiento académico promedio de los alumnos de administración
en relación con la profundidad de los conocimientos de administración
exigidos por los planes curriculares, es insuficiente”.
Análisis individual por Universidad
• Para el caso de Universidad X el valor de t calculado es - 1.26, la cual se
ubica en la región de aceptación de la hipótesis nula. Por lo tanto se
acepta la hipótesis nula y se rechaza la hipótesis de investigación.
“el rendimiento académico de los alumnos de administración de la
Universida X en relación con la profundidad de los conocimientos de
administración exigidos por los planes curriculares, no es insuficiente”.
Ho : μ 1 - μ 1 = 0
H1 : μ 1 – μ 2 ≠ 0
Prueba de dos colas
• Nivel de significancia = 5% = 0.05
• Estadístico «t student» para la diferencia de
medias
t calculada
Ambas Universidades
(n1 – 1)S2 + (n1 – 1)S2
S2 = S2 = 3.4119
n 1+ n 2 - 2
z
x1 x 2
2
s1 s 2
2
t = 8.6323
n1 n 2
t tabulada
Ambas Universidades
t (1 – α/2, «n1+n2» – 2) t (1 – 0.05/2, 218 – 2) = -1.6518
NIVEL DE CONFIANZA = 1 - α
Interpretación grafica
Región de
Aceptación
Ho
Región de rechazo Ho
1-
=0.05
• H1: μ1 ˂ 0
→“el rendimiento académico promedio de los alumnos de administración
en relación con la profundidad de los conocimientos de administración
exigidos por los planes curriculares, es insuficiente”.
a) Los niveles del rendimiento académico de los alumnos de administración en
relación con la profundidad de los conocimientos en administración exigidos por
los planes curriculares es en promedio insuficiente
Ho : μ 1 – μ 2 = 0
H1 : μ 1 – μ 2 ≠ 0
Ejemplo
Supongamos que un investigador está
interesado en evaluar la asociación entre uso de
cinturón de seguridad en vehículos particulares
y el nivel socioeconómico del conductor del
vehículo. Con este objeto se toma una muestra
de conductores a quienes se clasifica en una
tabla de asociación, encontrando los siguientes
resultados:
Nivel socioeconómico
Bajo medio alto total
si 8 15 28 51
no 13 16 14 43
Total 21 31 42 94
1-
=0.05
X2c = 5.24 X2t = 5.99
CONCLUSION
Si X2c ˂ X2t se Acepta H0
X2c = 5.24 ˂ X2t = 5.99
1-
=0.01
X2t = 5.99 X2c = 9.21
Si cambiamos (error tipo I)
Si X2c ˂ X2t se Acepta H0
X2c = 9.21 > X2t = 5.99
se rechaza Ho
CONCLUSION: Aceptamos H1
H1: El uso de cinturón de seguridad depende del nivel socioeconómico
Ejemplo de la prueba t
Grupo N°1 Grupo N°2 Grupo N°3
12 18 6
18 17 4
16 16 14
8 18 4
6 12 6
12 17 12
10 10 14
Medias
3.92 2.92 4.24 3.69
Promedio
17.90 9.95 20.95 16.27
Varianza
4.23 3.15 4.58 3.83
Decisión Estándar
Prueba t para dos muestras suponiendo varianzas iguales
Variable 1 Variable 2
Media 11.7142857 15.4285714
Varianza 17.9047619 9.95238095
Observaciones 7 7
Varianza agrupada 13.9285714
Diferencia
hipotética de las
medias 0
Grados de libertad 12
Estadístico t -1.86189867
P(T<=t) una cola 0.04363853
Valor crítico de t
(una cola) 1.78228756
P(T<=t) dos colas 0.08727707
Valor crítico de t
(dos colas) 2.17881283
Contrates de medias
• Entre el G N°1 y G N°2, t=1.723
• Entre el G N°2 y G N°3, t=3.181
• Entre el G N°1 y G N°1, t=1.458
=0.01
=0.10
=0.05
Entre
EntreelelGGN°1
N°1 yyGGN°2,
N°2, 3.72
3.72 es
es inferior
inferior7.47
4.93 →→no
Nosignificativa
significativa
Entre el G N°1 y G N°2, 3.72 es inferior 5.74 → no significativa
Entre
EntreelelGGN°2
N°2 yyGGN°3,
N°3, 3.14
3.14 es
es inferior
inferior7.47
4.93 →→no
Nosignificativa
significativa
Entre el G N°2 y G N°3, 3.14 es inferior 5.74 → no significativa
Entre
EntreelelGGN°1
N°1 yyGGN°1,
N°1, 6.86
6.86 es
es inferior
superior7.47
4.93→→no significativa
significativa
Entre el G N°1 y G N°1, 6.86 es superior 5.74→ significativa
Formulas
=0.05 =0.01 =0.10
t = √(k-1)F t = √(k-1)F t = √(k-1)F
t = √(3-1)3.51 t = √(3-1)6.01 t = √(3-1)2.62
t = 2.664 t = 3.446 t = 2.289
│M1-M2│= t √ CM (1/n1+1/n2)
│M1-M2│= 2.664 √ 16.26 (1/7+1/7) = 5.74
│M1-M2│= 3.446 √ 16.26 (1/7+1/7) = 7.47
│M1-M2│= 2.664 √ 16.26 (1/7+1/7) = 4.93
X2t = 11.34
(
X2c = 0.73
α
- - -X2 - - -
VALIDEZ DE LOS INSTRUMENTOS
• EN QUE MIDA LO QUE TIENE QUE MEDIR
• AL ESTIMAR LA VALIDEZ ES NECESARIO SABER
QUE VARIABLE CRITERIO SE DESEA ESTUDIAR
TIPOS DE VALIDEZ
• VALIDEZ DE CONTENIDO
• VALIDEZ DE CONSTRUCTO
• VALIDEZ DE CRITERIO EXTERNO O EMPIRICA
VALIDEZ DE CONTENIDO
• Validez racional o logica
• Se refiere al grado en que un instrumento
refleja un dominio especifico del contenido de
lo que se quiere medir
• El instrumento debe tener representados
todos los itemes del dominio de contenido de
las variables a medir
CRITERIOS A EVALUAR
Lenguaje Observaciones (si debe
Mide lo eliminarse o modificarse
Claridad de Coherencia Induccion a adecuado con el
ITEM redaccion interna la respuesta nivel del
que un item)
pretende
informante
si no si no si no si no si no
1
2
3
n
Aspectos generales si no
Validez
Aplicable si no Aplicable atendiendo las observaciones si no
________________
Validado por:
Firma
ALFA CRONBRACH
X2=genero 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 total
femenino 1 1 1 1 1 1 6
masculino 2 2 2 2 2 2 2 2 2 9
total 15
X3=ejercicio 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 total
Intenso 2 2 2 2 2 2 6
moderado 1 1 1 1 1 5
ninguno 0 0 2 0 3
total 14
Definir las Hipótesis
Ho: El estado general de salud es independiente del
genero
Grados de Libertad= 3
TABLA
Nivel de confianza = 0.05
Chi cuadrada Tabla = 7.81
CONCLUSION
Grados de Libertad= 3
Nivel de confianza = 0.05
Se rechaza Ho
(
Aceptación
Ho
X2c = 8.65
α
X2t = 7.81 - - -X2 - - -
x 2 x2 , x3 femenino
intenso
1
moderado
1
ninguno
4
total
6
masculino 5 4 0 9
total 6 5 4 15
Grados de libertad=3
Chi = 8.6
Nivel de significancia al 5%
Conclusión
Como α*=0.0351 < 0.05 → Se rechaza Ho
CONCLUSION
Grados de Libertad= 3
Nivel de confianza = 0.05
Se rechaza Ho
(
Aceptación
Ho
α* = 0.0351
α=0.05
Se Acepta:
H1: El estado general de salud esta asociado al genero (P=0.0351)
Test G
fo
G 2 fo * In
fe
universidades Grupo socio económico
alto Medio alto Medio bajo bajo
Estatal 13 17 4 3
Privada 38 19 2 2
total 51 36 6 5
Conclusión
Como α*=0.0351 < 0.05 → Se rechaza Ho
CONCLUSION
Grados de Libertad= 3
Nivel de confianza = 0.05
Se rechaza Ho
(
Aceptación
Ho
α* = 0.0351
α=0.05
Se Acepta:
H1: El estado general de salud esta asociado al genero (P=0.0351)