Libro Estadistica y Probabilidades PDF
Libro Estadistica y Probabilidades PDF
Libro Estadistica y Probabilidades PDF
i
3.1.1. Media o promedio poblacional (µ):............................................................ 23
3.1.2. Media aritmética de datos tabulados .......................................................... 25
3.1.3. La Media Ponderada .................................................................................. 25
3.1.4. La Media Aritmética para datos agrupados ................................................ 27
3.2. La Mediana ...................................................................................................... 29
3.2.1. Características: .......................................................................................... 29
3.2.2. Cálculo de la Mediana: .............................................................................. 29
3.2.3. La Mediana Para datos agrupados.............................................................. 30
3.3. Moda ................................................................................................................ 31
3.3.1. La Moda para Datos Agrupados ................................................................ 31
3.4. La media geométrica ( xg) ................................................................................ 32
3.5. La Media Armónica (Xh) ................................................................................. 33
3.6. Cuartiles, Deciles y Percentiles ......................................................................... 37
3.6.1. Cuartiles, deciles y percentiles para datos agrupados ................................. 37
4. CAPÍTULO Nº 4 MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS
40
4.1. EL RANGO (AMPLITUD TOTAL) (R) .......................................................... 40
4.2. LA DESVIACIÓN MEDIA.............................................................................. 41
4.3. LA VARIANZA; LA DESVIACIÓN ESTÁNDAR ......................................... 42
4.3.1. Fórmulas ................................................................................................... 42
4.3.2. Cálculos abreviados de la varianza y la desviación estándar....................... 43
4.4. MEDIDAS DE VARIABILIDAD (DISPERSIÓN) ASIMETRÍA Y CURTOSIS DE
LOS DATOS. ......................................................................................................... 44
4.4.1. Formas de Curvas de frecuencias. .............................................................. 44
4.4.2. El coeficiente de variación (c.v.)................................................................ 45
4.4.3. Coeficiente de asimetría de pearson (sesgo) ............................................... 46
4.4.4. El rango y los rangos modificados para datos agrupados. ........................... 47
4.5. DESVIACIÓN MEDIA PARA DATOS AGRUPADOS .................................. 47
4.6. LA VARIANZA YLA DESVIACIÓN ESTANDAR PARA DATOS
AGRUPADOS. ....................................................................................................... 48
PARTE II ................................................................................................................ 52
PROBABILIDADES, DISTRIBUCIÓN DE PROBABILIDADES ........................ 52
5. CAPÍTULO V PROBABILIDAD, DISTRIBUCIÓN DE PROBABILIDADES 52
5.1. Experimento Aleatorio ..................................................................................... 52
5.2. Espacio muestral () ........................................................................................ 52
ii
5.3. Evento .............................................................................................................. 52
5.3.1. Eventos mutuamente excluyentes .............................................................. 52
5.3.2. Eventos no excluyentes ............................................................................. 52
5.3.3. Eventos complementarios .......................................................................... 53
5.4. DEFINICIÓN CLÁSICA DE PROBABILIDAD .............................................. 53
5.5. Propiedades de probabilidad ............................................................................. 54
5.6. Reglas de probabilidad: suma ó adición de probabilidades ................................ 54
5.7. Eventos dependientes e independientes............................................................. 55
5.8. Probabilidad condicional .................................................................................. 56
5.8.1. Definición de probabilidad condicional ..................................................... 56
5.8.2. Probabilidad conjunta: ............................................................................... 56
5.8.3. Regla de la multiplicación (ab) : para eventos independientes. ................ 57
5.8.4. Uso de Diagramas de árbol para eventos Independientes. .......................... 57
5.8.5. Regla de la multiplicación: para eventos dependientes. .............................. 57
5.8.6. Uso del Diagrama de Árbol para Eventos Dependientes. ........................... 58
6. CAPÍTULO VI DISTRIBUCIONES DE PROBABILIDADES ....................... 61
6.1. Esperanza matemática (valor esperado o promedio).......................................... 61
6.2. LA DISTRIBUCIÓN BINOMIAL ................................................................... 64
6.2.1. Fórmula de Distribución Binomial:............................................................ 64
6.2.2. Uso de las Tablas de Probabilidades Binomiales........................................ 65
6.2.3. LA DISTRIBUCIÓN POISSON ............................................................... 67
7. CAPÍTULO 7 DISTRIBUCIÓN NORMAL, DISTRIBUCIÓN DE LA MEDIA
MUESTRAL ........................................................................................................... 72
7.1. Distribución de probabilidades para variables aleatorias continuas ................... 72
7.1.1. Distribución Normal .................................................................................. 72
7.1.2. La Distribución Normal de Probabilidad.................................................... 72
7.1.3. Uso de las Tablas de Distribución Normales .............................................. 73
8. CAPÍTULO Nº 8 DISTRIBUCIÓN DE LA MEDIA MUESTRAL .................. 75
8.1. Consideraciones generales ................................................................................ 75
8.2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA .............................................. 75
iii
8.3.1. Calculo de una proporción muestral de éxitos – media de las proporciones
muestrales. .............................................................................................................. 78
8.3.2. CALCULO DEL ERROR ESTÁNDAR DE LA PROPORCIÓN .............. 78
8.3.3. Teorema del límite central – distribución normal para proporciones muestrales
79
9. CAPÍTULO IX PRUEBA DE HIPÓTESIS .................................................... 82
9.1. ¿Qué es una hipótesis?...................................................................................... 82
9.2. ¿Qué es una prueba de hipótesis?...................................................................... 82
9.3. La prueba estadística de ji – cuadrada pruebas para la independencia de dos variables
categóricas (pruebas para tablas de contingencias) .................................................. 85
APENDICE I: DISTRIBUCION BINOMIAL ......................................................... 90
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 91
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 93
APENDICE II: DISTRIBUCION BINOMIAL (CONT).......................................... 93
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 94
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 95
APENDICE III: DISTRIBUCION DE POISSON ................................................... 97
APENDICE III: DISTRIBUCION DE POISSON ................................................... 98
APENDICE III: DISTRIBUCION DE POISSON (CONT) ..................................... 99
APENDICE III: DISTRIBUCION DE POISSON (CONT) ................................... 100
APENDICE III: DISTRIBUCION DE POISSON (CONT) ................................... 100
APENDICE III: DISTRIBUCION DE POISSON (CONT) ................................... 101
APENDICE IV: DISTRIBUCION NORMAL ....................................................... 103
APENDICE V DISTRIBUCION t DE STUDENT ................................................ 104
BIBLIOGRAFIA .................................................................................................. 105
iv
1. CAPÍTULO I DEFINICIONES IMPORTANTES EN LA ESTADISTICA
Las dos grandes ramas en que se divide a la estadística son: Descriptiva e inferencial.
1
Planteamiento del problema.
Fijación de los objetivos.
Formulación de la hipótesis.
Definición de la unidad de observación y de la unidad de medida.
Determinación de la población y de la muestra.
La recolección.
Crítica, clasificación y ordenación.
Tabulación.
Presentación.
Análisis.
Publicación.
2
establecerse bajo qué unidad se tomarán las observaciones ya sea en metros, pulgadas, libras,
kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la información.
Variable Cualitativa
Se denomina así cuando está asociada a una característica cualitativa que toma niveles de
valorización.
Número de periódicos que compran los lectores de prensa diaria de Santa Cruz
Gastos municipales
Variable Cuantitativa
Se llama así cuando está asociada a una característica cuantitativa. Estas variables se dividen
en discretas y continúas.
La afiliación política de los paceños: MNR, UN, PDC, MAS, otro.
Variable Discreta
Se dice que una variable es discreta si sólo asume valores enteros o mejor dicho que varían
de uno en uno, Ejm: El número de miembros de una familia o el número de personas que
habitan la casa; el número de alumnos aprobados en una asignatura.
Variable Continua
3
Una variable es continua cuando puede tomar cualquier valor dentro de un intervalo,
dependiendo éste principalmente de la precisión con que se trabaje. Por Ejm: La talla de los
individuos medida con la precisión de un centímetro y expresada en metros: 1,69 m; 1,74 m;
etc.
4
casa de origen afroamericano de las comunidades suburbanas, con ingresos y educación
promedios. Los textos publicitarios del producto deberán, por tanto, estar dirigidos a esta
audiencia. Y si los registros del hospital muestran que un número mayor de pacientes ha
utilizado el aparato de rayos X en junio que en enero, el departamento de personal del
hospital deberá determinar si esto sucedió sólo ese año o es indicativo de una tendencia y, tal
vez, debería ajustar su programa de contratación y asignación de vacaciones de acuerdo con
la información.
Cuando los datos se ordenan de manera compacta y útil, los responsables de tomar
decisiones pueden obtener información confiable sobre el entorno y usarla para tomar
decisiones inteligentes.
En la actualidad, las computadoras permiten a los especialistas en estadística recolectar
enormes volúmenes de observaciones y comprimirlas en tablas, gráficas y cifras
instantáneamente.
Los administradores deben tener mucho cuidado y cerciorarse que los datos empleados estén
basados en suposiciones e interpretaciones correctas. Antes de depositar nuestra confianza en
cualquier conjunto de datos interpretados, vengan de una computadora o no, póngalos a
prueba mediante las siguientes preguntas:-
Ejemplo Nº 1.21.
Generalizando:
A = {x1, x2, x3, .................. xi .................., xn }
Ejemplo Nº 1.2.
Corresponde a una muestra de 100 observaciones sobre las tallas de los alumnos, expresada
en metros:
B=
1,60 1,70 1,55 1,68 1,72 1,70 1,63 1,76 1,54 1,71
1,78 1,74 1,65 1,63 1,55 1,68 1,69 1,74 1,80 1,66
1,65 1,69 1,59 1,68 1,70 1,73 1,74 1,76 1,75 1,69
1,78 1,77 1,69 1,71 1,70 1,75 1,76 1,77 1,68 1,64
1,69 1,70 1,71 1,76 1,71 1,72 1,74 1,69 1,58 1,59
1,60 1,63 1,64 1,65 1,68 1,70 1,70 1,72 1,75 1,58
1,71 1,75 1,74 1,71 1,70 1,69 1,68 1,73 1,72 1,74
1,71 1,70 1,72 1,79 1,78 1,82 1,80 1,79 1,71 1,71
1,70 1,72 1,76 1,75 1,70 1,71 1,69 1,68 1,60 1,62
1,59 1,58 1,61 1,65 1,69 1,71 1,75 1,74 1,70 1,78
5
En este caso n = 100. Tamaño de la muestra.
1.4.9. Tabulación
Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad
al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener
por lo menos: Un título adecuado el cual debe ser claro y conciso. La Tabla propiamente
dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes ítems
de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales
de la tabla, u otorguen los créditos a la fuente de la información.
1.4.10. Presentación
Una información estadística adquiere más claridad cuando se presenta en la forma
adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con
las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un
informe con tablas y gráficos redundantes que, antes que claridad, crean confusión.
Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse
no sólo en función de las variables que relaciona, sino del lector a quien va dirigido el
informe.
1.4.11. Análisis
La técnica estadística ofrece métodos y procedimientos objetivos que convierten las
especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisión.
Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los
parámetros y estadísticos muéstrales para las estimaciones e inferencias respecto a la
población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de
establecer y redactar las conclusiones definitivas.
1.4.12. Publicación
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del
mismo problema a quienes se les puede aportar información, conocimientos y otros puntos
de vista acerca de él.
6
Práctica Nº 1
1. ¿Por qué se considera importante la estadística?
2. Enuncie las ramas en las que se divide la estadística y establezca su campo de acción.
3. Enumere las etapas del método estadístico.
4. ¿Por qué es importante la revisión bibliográfica en el desarrollo de una investigación
5. estadística?.
6. ¿Qué es la hipótesis nula?.
7. Defina: Población, Muestra, Censo y Muestreo.
8. ¿Por qué usualmente se recurre al análisis a través de muestras y no de poblaciones?.
9. ¿Para qué se utiliza un muestreo piloto?.
10. ¿Con qué fin se critica una información?
11. ¿Cuáles son los componentes de una tabla?
7
2.1.1. Distribución de frecuencias: Variable cualitativa
Supongamos que en una muestra de n unidades estadísticas se observan k categorías o
modalidades diferentes C1,C 2 ,—,Ck, de alguna variable cualitativa X.
La tabulación de estos n datos, es la distribución de frecuencias por categorías..
Ck fk hk. pk
Total n 1.00 100
Gráfica.
Existe una gran variedad de gráficas para la distribución de frecuencias de variable
cualitativa, las más comunes son la de barras y la de sectores circulares.
En una gráfica de barras los datos de cada una de las modalidades C se representan por una
barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su frecuencia.
Las barras se dibujan dejando un espacio entre ellas.
Si la escala es nominal las categorías pueden ser colocadas en cualquier orden. Pero, si el
nivel es ordinal las categorías deben ir ordenadas
En una gráfica circular, los datos de cada categoría C, se representan por un sector circular
cuyo ángulo en el centro es igual a 360°.
Si la gráfica por sectores circulares es tridimensional es denominada de torta
Ejemplo 2.1.
En una encuesta de opinión acerca de las preferencias de Partido Político en las elecciones
Nacionales se obtuvieron las siguientes respuestas:
8
Frecuencia Frecuencia Relativa
Partido Político (fi) (hi) Porcentaje (pi)
FV 20 0,29 28,57
MAS 23 0,33 32,86
Otros 5 0,07 7,14
PDC 15 0,21 21,43
UN 7 0,10 10,00
Total general 70 1,00 100,00
Frecuencia (fi)
25 23
20
20
15
15
10
7
5
5
0
FV MAS Otros PDC UN
9
Porcentaje (pi)
10,0%
28,6% FV
21,4% MAS
Otros
PDC
7,1% UN
32,9%
10
Resultados encuesta percepción sobre trabajo concejales
Municipio Copacabana
8. ¿Cómo calificaría usted, el trabajo que desarrollan los
Concejales Municipales? (sólo una opción)
Frecuencia Porcentaje
No conozco el trabajo 1 5,0
de los concejales
Hace un mal trabajo 1 5,0
Hace un trabajo 13 65,0
regular
Hace un buen trabajo 5 25,0
Total 20 100,0
¿Usted cree que en el último año han aumentado o han disminuido los
delitos en su zona como ser…?Una agresión o intento de agresión por parte
de una pandilla
Frecuencia Porcentaje
NS/NR 10 5,0
Ha aumentado 93 46,5
Sigue igual 76 38,0
Ha disminuido 21 10,5
Total 200 100,0
11
Valores de la Frecuencias Frecuencias Frecuencias
variable Xi absolutas simples relativas simples Porcentajes pj
fj hj
x1 f1 h1 p1
x2 f2 h2 p2
…. ..
xk fk hk. pk
Total n 1.00 100
Ejemplo 2.2.
Ante la pregunta del número de hijos por familia (variable X) una muestra de 20 hogares,
marcó las siguientes respuestas
Número de
hijos (xi) Frecuencia (fi) Frecuencia Relativa (hi) Porcentaje (pi)
0 1 0,05 5
1 4 0,2 20
2 7 0,35 35
3 6 0,3 30
4 2 0,1 10
20 1 100
12
Frecuencia absoluta y relativa
8 0,4
7 0,35
6 0,3
5 0,25
4 0,2
3 0,15
2 0,1
1 0,05
0 0
0 1 2 3 4
13
2.1.5. Marca de clases. (x)
Es el punto medio del intervalo de clase. Se obtiene como la semi- suma de los límites de clases.
los datos de cada clase se consideran que coincide con su correspondiente marca de clases.
Ejemplo Nº 2.3.
Sean las alturas en cm. De 40 alumnos
138 164 150 132 144 125 149 157 146 158
140 147 136 148 152 144 168 126 138 176
163 119 154 165 146 173 142 147 135 153
140 135 161 145 135 142 150 156 145 128
3.-
Histograma: rectángulos de bases en el eje x , sus centros coinciden con los marcas de clases y de
longitud igual , cada altura igual a su frecuencia f
Polígonos Frecuencia: Se obtiene uniendo los puntos medios de las bases superiores
14
de los rectángulos del histograma y dos mascas de clases inferior y superior de frecuencia cero.
12
Ejemplo Nº 2.4.
Después de realizar el conteo y hallado la frecuencia por intervalo el cálculo del Nro de
intervalos (K): Por la regla de Sturges.
Para n = 100
k = 1 + 3,332 log n
k = 1 + 3,332 log 100
k = 7,7
Consideramos el valor:
k =7
q1 = 1.54
q2 = 1.82
q2 – q1
c = k
1,82 – 1,54
15
c = 7 = 0,04,
Clases Frecuencia
Marcas Conteo
(Estaturas f
1,56 [1,54 – 1,58] IIIII I 6
1,60 (1,58 – 1,62] IIIII III 8
1,64 (1,62 – 1,66] IIIII IIIII 10
1,68 (1,66 – 1,70] IIIII IIIIIIIIIIIIIIIIIIII III 28
1,72 (1,70 – 1,74] IIIII IIIIIIIIIIIIIIIIIIII I 26
1,76 (1,74 – 1,78] IIIII IIIIIIIIII II 17
1,80 (1,78 – 1,82] IIIII 5
Histograma de Frecuencias
28
FA 30
rl
e u 25
cm 20 17
u n
e o 15
n s 10
10 8
c 6 5
i
a 5
s
Edad (%)
17,3%
15,7%
13,6% 12,6% 12,0%
9,2% 10,2%
8,6%
0,8%
15 - 21 22 - 28 29 - 35 36 - 42 43 - 49 50 - 56 57 - 63 64 - 70 70 - 77
Es la frecuencia total de todos los valores menores o iguales al límite superior del
intervalo de clase respectivo, se obtiene sumando las frecuencias absolutas
correspondientes a los intervalos inferiores.
FA3 = f1 + f2 + f3
FA = f1 + f2 + f3 + .............. + fn
FA3 = 24
Interpretación:
Es la frecuencia relativa total de todos los valores menores o iguales al límite superior
del intervalo de clase respectivo, se obtiene sumando las frecuencias relativas
siguientes a los intervalos inferiores.
Ejemplo Nº 2.6.
En la muestra del Ejm Nro. 2, la frecuencia relativa acumulada hasta la cuarta clase
(FAR4) será:
Generalizando:
FAR4 = 0,52
Interpretación:
La gráfica que muestra las frecuencias acumuladas “mayor que” o las que son “menor o igual
que” toman el nombre de Polígono de Frecuencias Acumuladas u Ojivas.
Ejemplo Nº 2.6.
Presentaremos las frecuencias acumuladas a partir de la muestra del Ejm. Nro 2.
18
x Clases(estaturas) fi fR FA FAR
1.56 [1.54 – 1.58] 6 0.06 ; 6% 6 0.06 ; 6%
1.60 (1.58 – 1.62] 8 0.08 : 8% 14 0.14 ; 14%
1.64 (1.62 – 1.66] 10 0.10 ; 10% 24 0.24 ; 24%
1.68 (1.66 – 1.70] 28 0.28 ; 20% 52 0.52 ; 52%
1.72 (1.70 – 1.74] 26 0.26 ; 26% 78 0.78 ; 78%
1.76 (1.74 – 1.78] 17 0.17 ; 17% 95 0.95 ; 95%
1.80 (1.78 – 1.82] 5 0.05 ; 5% 100 1.00 ;100%
n = 100 f R =1ó100%
Ejemplo Nº 2.6.
Se entrevistaron a 81 familias en una comunidad, donde se les pregunto:
¿Cuál es el gasto diario en transporte?, dando los siguientes resultados:
Las marca de clase correspondientes son 3,6,9,12,15 además n2 = 10 ; n4 = 22; h1 = 0,06172839
H3 = 0,432097
Reconstruya la tabla
81 familias
Xi ni Ni hi Hi
3 5 5 0.0617283 0.0617283
6 10 15 0.1234567 0.185185
9 20 35 0.2469135 0.432097
12 22 57 0.2716046 0.7037036
15 24 81 0.2962962 1
81 1
H3 = N3 h1 = n1
N n
0.432097 = N3 0.0617283 = n1
81 81
N3 =35 n1 = 5
Gráfica de Frecuencias Acumuladas Ojiva
FA
100 100 100
94 95
86
80
76 78
“Menor oigual”
60
19
52
48
40
24 “Mayor que”
20 22
14
6 5
Intervalos de clase
Ejemplo Nº 2.7.
El auxiliar de docencia muy divertido, pierde los exámenes de estadística. Pero recuerda que las
120 notas tenían una distribución simétrica con 7 intervalos de clases de amplitud constante.
Además en sus archivos encuentra la siguiente información:
h1 = 0.05, h3 = 0,15 H3* = 0.85 x4 = 72 x3+x4+ x5 +x6+x7 = 400
Donde xi = marca de clase
Hi* = Frecuencia relativa acumulada “mayor o igual que”
a. Reconstruya la tabla de distribución de frecuencias
b. Si para aprobar en examen se necesita obtener por lo menos 70 puntos ¿Cuántos
desaprobaron dicho examen?
n = 120
Li – Ls Xi ni Ni Ni* hi Hi HI*
44-52 48 6 6 120 0.05 0.05 1
52-60 56 12 18 114 0.10 0.15 0.95
60-68 64 18 36 102 015 030 0.85
68-76 72 48 84 84 0.40 0.70 0.70
76-84 80 18 102 36 0.15 0.85 0.30
84-92 88 12 114 18 0.10 0.95 0.15
92-100 96 6 120 6 0.05 1 0.05
X3 + X4 + X5 + X6 + X7 = 400
X4 = 72
72 – C + 72 + 72 +C + 72 +2C +72 +3C = 400
360 + 5C = 400
5C = 400 -360
5C = 40
C=8
C–8=4
2 2
c. 44 – 69
20
Li – Ls Xi ni
44-52 → 48 6
52-60 → 56 12
60-68 → 64 18
68-69 → X
De 44 – 69 serian 6+12+18+x =
36+x
68-76 → 48 8 →48 X = 1.48
68-69 → X 1 →x 8
X=6
Desaprobaron 36+6 =42
PRÁCTICA Nº 2
Variables Discretas y Continuas
614627245686532
525756146459236
Organizar los datos en un cuadro de distribución de frecuencias.
2. Construya una tabla de frecuencias para los datos siguientes, correspondiente al número de
faltas a clases en el primer semestre del 2005 para estudiantes del curso de Economía.
9 8 7 8 4 3
2 1 0 5 3 2
1 1 7 3 2 8
7 6 6 4 3 2
2 0 9 4 6 9
6 9 4 3 5 7
3 2 1 4 4 2
3. Un conjunto de datos tiene 100 observaciones, de las cuales la mayor es 212 y la menor 42.
Suponga que desea una tabla de frecuencias con siete clases.
4. El Profesor Rojas puso un examen final consistente en 100 preguntas a su grupo de Estadistica
I, los datos siguientes representan el número de respuestas correctas en cada examen,
constrúyase una tabla de frecuencias agrupadas con 5 clases para que, el profesor Rojas pueda
analizar los resultados.
21
17 15 78 21 10 32 7 65 18 87
4 22 34 42 9 9 82 79 98 4
44 65 62 77 81 81 45 37 83 44
77 13 41 16 13 13 82 37 5 54
7 67 88 41 22 22 92 16 67 85
Distribución de Frecuencias, Intervalos de Clase y Métodos Gráficos.
5. Los siguientes datos constituyen las vidas útiles, en horas de una muestra aleatoria de 60
bombillas de luz de 100 watts.
807 811 620 650 817 732 747 823 844 907
660 753 1050 918 857 867 675 880 878 890
881 872 869 841 847 833 829 827 822 811
766 787 923 792 803 933 947 717 817 753
1056 1076 958 970 776 828 831 781 1088 1082
832 863 852 788 980 889 1030 897 755 891
6. Las siguientes observaciones son los tiempos (en minutos) que tardan 30 estudiantes en
terminar su primer examen de matemáticas financieras.
7. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
P eso [ 50, 60 ) [ 60, 70) [ 70, 80) [ 80, 90) [ 90, 100) [ 100, 110) [ 110, 120)
22
fi 8 10 16 14 10 5 2
a . C o ns tr ui r l a t a bl a de f r e c u e n ci a s .
b. R e pr e s e n ta r el h is t o gr a m a y e l po lí go n o de f r e c u e n c i as .
8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen
de Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39,
44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48,
15, 32, 13.
a . C o ns tr ui r l a t a bl a de f r e c u e n ci a s .
b. D i bu j a r e l hi s t o gr am a y e l po l í go no de f r e c u e n c i a s.
De un conjunto de datos numéricos es la suma de todas las observaciones del conjunto, dividida
entre el número de observaciones.
Simbología.-Fórmulas.
Dependiendo de la información disponible ( poblacional o muestral) se puede tener:
3.1.1. Media o promedio poblacional (µ):
N
µ= 1
N
i=1
xi
Xi =..............................
N
(2.1)
n
x= 1
n xi
Xi =..............................
n
(2.2)
23
i=1
Propiedades:
2. Si se sustituye el valor de cada observación por el valor del Promedio Aritmético no varía la
suma de todas las observaciones.
3. La suma de las desviaciones de las observaciones con respecto al promedio aritmético es igual
a cero.
4. Si cada observación de una muestra se le suma una constante el promedio de las nuevas
observaciones será igual al promedio de la muestra original más la constante.
5. Si a cada observación de una muestra se le multiplica por una constante, el promedio de las
nuevas observaciones será igual al promedio de la muestra original multiplicada por la constante.
Ejemplo Nº 3.1.
Cantidad de cigarrillos consumidos por un fumador en una semana.
Lunes: 18
Martes: 21
Miércoles: 22
Jueves: 21
Viernes: 20
Sábado: 19
Domingo: 19
Entonces la media aritmética es.
∑
x= =
Ejemplo Nº 3.2.
24
34,500 30,700 32,900 36,000 34,100 33,800 32,500
µ
7
µ = S/. 33,500; µ representa el salario medio anual para los miembros de esta planilla.
frecuencias absolutas respectivas f1, f 2,…….f k , entonces, su media aritmética es el número que
resulta de sumar de todos los valores de la variable ponderados por sus frecuencias absolutas y
divididas todo ello por el número total de observaciones
x f i i
x
i 1
N
La media aritmética es siempre el centro de gravedad de la distribución y es siempre un valor que
entra dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada intervalo para su
cálculo.
Calcular la media aritmética de la distribución del número de hijos por familia del ejemplo 3.2.
SOLUCION
La distribución de frecuencias del ejemplo 1.2 se repite en el cuadro 2.2, donde se ha incluido
una columna de productos xi*fi
x f i i
x
i 1
=
N
3.1.3. La Media Ponderada
Fórmula:
(px)
p 25
upó X P = ....................................
dónde:
p = factor de ponderación.
x = datos
Ejemplo Nº 3.3.
E3: Una empresa comercializadora de teléfonos celulares dispone de tres vendedores, c/u. de
los cuales cobra diferente comisión por teléfono vendido y realizan diferentes números de
ventas. Calcule e interprete el valor medio de la comisión.
X P = S/. 38,67
Interpretación:
Si se elige al azar un vendedor se espera que cobre una comisión de: S/. 38.67 por cada
teléfono vendido.
Ejemplo Nº 3.4.
Suponga que los costos de producción y las cantidades producidas por tres sucursales A, B
y C son:
Solución
26
X P = 1,16 Bs.
Interpretación:
El costo de producción promedio por artículo, para la empresa es de 1,16 bolivianos por
cada unidad producida.
N = Nº de datos de la Población.
n = Nº de datos de la muestra.
Ambas fórmulas señalan que cada punto medio de cada clase (Xc), se multiplica por la
frecuencia de clase correspondiente (f), luego se suman estos productos () para después
dividir esta suma entre el número total de observaciones (f) representadas en la
distribución de frecuencias.
Ejemplo Nº 3.5.
27
Desempeño Número de Marca de (fx)
(Puntos) Técnicos (f) Clase (x)
12 – 16 4 14 56
17 – 21 8 19 152
22 – 26 15 24 360
27 – 31 23 29 667
32 – 36 10 34 340
Total 60 (fx)=1575
Solución
En la misma tabla calculamos la marca de clase (xc), es decir el valor intermedio de cada
clase ó intervalo, y (fx), obtenemos:
fx 1575
x = n = 60 = 26,25
x = 26,25
Interpretación:
Ejemplo Nº 3.6.
En la tabla siguiente se muestra una distribución de frecuencias de salarios mensuales de 100
trabajadores. Calcule e interprete la Media.
Número de Marca de
Salario Mensual (fx)
Trabajadores (f) Clase (x)
S/.2400 – 2599 7 2499,50 S/. 17496,50
2600 – 2799 20 2699,50 53990,50
2800 – 2999 33 2899,50 95683,50
3000 – 3199 25 3099,50 77487,50
3200 – 3399 11 3299,50 36294,50
3400 – 3599 4 3499,50 13998,00
28
Solución
Interpretación:
Si se elige al azar un trabajador se espera que tenga un salario mensual de S/. 2949,50.
3.2. La Mediana
3.2.1. Características:
Para un grupo con un número par de elementos, la mediana se encuentra a la mitad entre los
dos valores adyacentes al centro es decir:
Ejemplo Nº 3.7.
Los siguientes datos se refieren al número de clientes atendidos durante los últimos 11 días
en una tienda de artefactos. Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Solución
En este caso los datos ordenados son:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 y con
29
n = 11 se tiene:
Interpretación:
Solución
3, 4, 5, 5, 6, 7, 8, 9 y con n = 8 se tiene:
X (n / 2) X (n / 2 1) X (8 / 2) X (8 / 2 1) X 4 X 5 5 6
Med 5,5
2 2 2 2
El valor de la mediana se encuentra entre los valores cuarto y quinto de este conjunto
ordenado, es decir 5 y 6 en este caso, la mediana es 5.5.
La clase que contiene la mediana es la primera cuya frecuencia acumulada iguala o excede la
mitad del total de observaciones.
Fórmula Utilizada:
N/2 - faA
Med = LI + fc
( ) i ..................................... (2,8)
Donde:
faA= La frecuencia acumulada de la clase que precede (antes) a la clase que contiene la
mediana.
30
Ejemplo Nº 3.8.
La siguiente tabla muestra el salario mensual de 100 trabajadores. Hallar la Mediana.
Tabla : Salarios Mensuales de 100 trabajadores
Interpretación:
La mitad de los trabajadores gana menos o igual a S/. 2938,89 y la otra mitad de trabajadores
gana más o igual a S/. 2938,89.
3.3. Moda
Donde:
LI = Límite exacto inferior de la clase que contiene la moda.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase precedente.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase siguiente.
i = Tamaño de intervalo de clase.
31
Ejemplo Nº 3.9.
Número de
Salario Mensual Frecuencia Acumulada (fa)
Trabajadores (f)
2400 – 2599 7 7
2600 – 2799 20 27
2800 – 2999 33 60
3000 – 3199 25 85
3200 – 3399 11 96
3400 - 3599 4 100
Total: 100
Solución
d1 13
Mo LI ( )i 2799,50 ( )200 S / .2923,31
d1 d 2 13 8
Interpretación:
Se utiliza para calcular tasas medias de variación, como la tasa media de crecimiento
poblacional, la tasa media de inflación mensual, la tasa media de mortalidad, entre otros.
Fórmula
n
xg = x1 . x2 . x3 . x4 . .................... xn ....................... (2.17)
Donde:
x = n valores de una serie
Ejemplo Nº 3.10
32
La siguiente tabla muestra la tasa de aumento en las ventas durante los últimos meses.
Calcule e interprete la tasa media mensual.
Solución
La tasa 2.6 % también se puede expresar como 0,026 y como se refiere a un aumento a partir
de 100%, el factor de variación será 1,026 (1 representa el 100%, aumento representa >1)
para los otros datos se procede igual.
Reemplazando en la fórmula:
xg = n x1 . x2 . x3 . x4 . .................... xn ; para n = 5
5
xg = (1,026) (1,054) (1,038) (1,005) (1,014)
5
xg = 1,14390337
Interpretación:
Si se selecciona al azar un mes entre Enero y Mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes anterior.
Se utiliza para calcular el tiempo medio, velocidad y aceleración media, como el tiempo
medio para realizar un proceso productivo.
Fórmula:
1 ............................................ (2.18)
Xh
1/ x
n
33
Donde:
xh = media armónica
Ejemplo Nº 3.11.
Los siguientes datos registran el tiempo medio que utilizan 4 clientes al realizar una compra
de un artefacto doméstico. Calcule e interprete el tiempo medio.
Cliente A B C D
Tiempo
(Minutos) 45 38 52 40
SOLUCIÓN
Para n = 4
Reemplazando en la fórmula
4 4 x88920
Xh
1
1
1
1 1976 2340 1710 2223
45 38 52 40
X h = 43,117953 min.
34
Práctica Nº 3 MEDIDA DE TENDENCIA CENTRAL Y POSICIÓN
EJERCICIOS Y PROBLEMAS
1. De en una empresa que tiene 200 empleados, el ingreso promedio es S/. 1200,¿cual es la
cantidad de dinero destinado al pago sueldos?
2. Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se
piensa incrementar el sueldo de cada trabajador en S/. 100¿Con cuánto dinero se debe contar
para poder pagar los nuevos sueldos?
3.Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se
piensa incrementar el sueldo de cada trabajador en 20% de su sueldo actual ¿Con cuánto
dinero se debe contar para poder pagar los nuevos sueldos?
4 Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se
piensa incrementar el sueldo de cada trabajador en 20% de su sueldo actual y además da una
bonificación de S/. 50 ¿Con cuánto dinero se debe contar para poder pagar los nuevos
sueldos?
5. Una muestra de 20 trabajadores de una compañía pequeña obtuvieron los siguientes salarios
para un mes determinado. (En dólares)
240, 240, 240, 240, 240, 240, 240, 240, 255, 255, 265, 265,
280, 280, 290, 300, 305, 325, 330 y 340.
6. Si estuviera usted en cada uno de las siguientes situaciones, señale qué medida de “promedio”
reportaría para los datos del problema anterior y en qué sentido puede considerarse típico
cada valor. a) Como Vicepresidente responsable de las negociaciones colectivas con los
trabajadores, b) Como Presidente de los representantes de los trabajadores.
2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5, 1.
8. En una compañía que maneja 4 productos, los márgenes de utilidad correspondientes a c/u
de ellos durante el año fiscal anterior fueron: producto A, 4,2 %; producto B, 5,5 %;
producto C, 7,4 % y producto D, 10,1 %. Hallar el margen de utilidad promedio.
35
9. Supongamos que Ramiro el dueño de un grifo vende (en miles de bolivianos) 5 tipos de
combustibles. En la tabla siguiente se muestra c/u de ellos junto con el costo por galón y el
número de galones vendidos. Calcular la media aritmética simple y la media ponderada del
costo obtenido por Ramiro.
La Media Ponderada
10. Suponga que los precios al menudeo de determinados artículos han sufrido los cambios que
se muestran en la tabla siguiente. Determine el cambio porcentual promedio de los precios
al menudeo con referencia al promedio de gastos que se indica en la tabla.
Tabla (d) Cambios en los precios al menudeo de algunos artículos durante un año.
Artículo Aumento Gasto Mensual Promedio
Porcentual (Antes del Aumento)
Leche 10% S/. 2000,00
Carne Molida -6 3000,00
Ropa -8 3000,00
Gasolina 20 5000,00
11. Las siguientes cifras son los importes del consumo en dólares de quince personas en un
restaurante en orden ascendente; 10, 10, 25, 25, 25, 35, 40, 53, 90, 125, 135, 245, 275, 309,
410. Determinar:
80,6; 89,9; 101,4; 102,6; 115,0; 120,1; 123,4; 126,3; 131,8; 138,6; 151,6 y 160,5.
Determine:
13. Hallar la media geométrica de una serie 18, 21, 23, 24 y 22 tomada en este orden.
36
3.6. Cuartiles, Deciles y Percentiles
Ejemplo Nº 3.12.
a) Segundo Cuartil.
b) Segundo Decil
c) Punto Percentil 40.
Solución
Siendo n = 15:
a) Q2 = X[2n/4 + ½] = X[2x15/4 + ½] = X8 = 5300
37
Se utilizan algunos ejemplos de fórmulas como:
faA = Frecuencia acumulada de la clase que precede (antes)a la clase que contiene Q, D ó P.
Ejemplo Nº 3.13.
Con referencia a la siguiente tabla la cual indica el tiempo requerido para auditar saldos de
cuentas.
a) Determinar el valor del Tercer Cuartil.
b) El Primer Decil.
c) El Punto Percentil 90.
Tiempo de Número de
Frecuencia Acumulada (fa)
Auditoría Registros (f)
10 – 19 3 3
20 – 29 5 8
30 – 39 10 18
40 – 49 12 30
50 – 59 20 50
Total: 50
Solución
En la misma tabla calculamos fa. En primer lugar, calculamos la clase que tiene el punto de
interés 3n/4 = 3x50/4 = 37,5 (Quinta clase) de acuerdo con las frecuencias acumuladas.
38
a) Q3 = L1 + ( 3n/4 – faA ) i = 49.5 + ( 3x50/4 – 30 )10 = 53,25
fc 20
Conclusión:
49,5 es el límite exacto inferior de la clase que contiene la medición 3n/4 ó 37.5, por
tanto el cuartil 3 se encuentra en el quinto intervalo y su valor es 53,25 min.
Conclusión:
19,5 es el límite superior de la clase que contiene la medición n/10 ó 5, por tanto el decil
1 se encuentra en el segundo intervalo y su valor es 23.5 min.
Conclusión:
39
4. CAPÍTULO Nº 4 MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS
Mientras que las medidas de Tendencia Central identifican el valor “Típico” representativo en
un conjunto de datos en contraste:
Las medidas de variación (dispersión) describen la medida de esta variabilidad según sea
grande o pequeña con respeto a una Medida de Tendencia Central (Media) x o u.
En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia
central o de posición, ya que, por ejemplo, cuando pretendemos representar toda una
información con la media aritmética, no estamos siendo absolutamente fieles a la realidad,
pues suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales, en
honor a la verdad, no están siendo bien representados por este parámetro.
En dos informaciones con igual media aritmética, no significa este hecho, que las
distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de
homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmética,
y mediana que los valores 49, 50,51; sin embargo, para la primera información la media
aritmética, se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la
segunda información que posee igual media aritmética y mediana, vemos entonces que la
primera información es mas heterogénea o dispersa que la segunda.
Ejemplo: 4.1.
Conocidos los porcentajes o notas (x) de 80 estudiantes de Métodos Cuantitativos 1 se les
puede disponer formando una distribución de frecuencias que da una idea más ordenada de las
características de la variable x (calificación o puntos).
1ro se le calcula la media de la variable x. Con este valor se puede representar la
distribución de frecuencias.
Si los puntajes (Notas) son muy altos con respeto a la media la variabilidad será grande.
Si los puntajes (Notas) son muy próximos a la media, la variabilidad será pequeña.
La Medida de esta variabilidad es lo que se llama Medidas de Variación o Dispersión.
Ejemplo: 4.3.
Dos grupos de estudiantes (A y B) tienen la misma media = 70 puntos c/grupo.
40
Los puntajes más altos y más bajo de cada grupo son:
A: 93 y 25.
B: 73 y 66.
Hallar el Rango ó Amplitud.
Solución
Para A: 93-25 = 68 puntos
Para B: 73 – 66 = 7
Observamos: Que la Medida del Rango se funda sólo en los valores
extremos pero no se analiza la variabilidad de los datos internos por
consiguiente estudiaremos la Desviación Media.
4.2. LA DESVIACIÓN MEDIA
Incluye todos los datos. Es la media de las desviaciones a partir de algún valor central. Tal
como la media o la mediana de una distribución.
Cuando se refiere a la Media como valor central se tiene la Desviación Media es decir
alrededor de la Media.
Ejemplo: 4.4.
Para encontrar las fórmulas: Si tenemos las siguientes calificaciones de alumnos (sobre 100
puntos)
50, 55, 60, 70, 75, 80.
Hallar al Desviación Media:
Solución
1ro Seleccionamos la Media.
2do Medimos la variabilidad a partir de la media.
3ro Se halla el promedio de variabilidad.
x 50 55 60 70 75 80 390
1) x 65
n 6 6
15 10 5 5 10 5 60
10
6 6
xu
D M Poblacional =
N
xx
DM Muestral =
n
Donde:
x = datos del Problema.
u = media poblacional de los datos.
n,N = Nº de datos.
x = media muestral de los datos.
Ejemplo: 4.5.
Para los datos de ventas de aparatos eléctricos que se dieron en el E1, hallar la Desviación
Media (DM).
Solución
x 5 8 8 11 11 11 14 16
1ro u = 10,5
n 8
X x-u x-u
5 5-10,5=-5,5 5,5
8 8-10,5=-2,5 2,5
8 8-10,5=-2,5 2,5
11 11-10,5=0,5 0,5
11 11-10,5=0,5 0,5
11 11-10,5=0,5 0,5
14 14-10,5=3,5 3,5
16 16-10,5=5,5 5,5
Total 21,0
xu 21,0
DM = 2,625 2,6 unidades
N 8
Interpretación:
En Promedio, las ventas de ventiladores por vendedor difiere en 2,6 unidades de la media
del grupo, en cualquier dirección.
Debido a que se dificulta la interpretación del significado del valor de una varianza, porque
las unidades en que se expresa son valores al cuadrado.
42
Surge la Desviación estándar (,s), que es la raíz cuadrada de la varianza, representada
mediante la letra griega o s para una muestra; su fórmula es:
( x u ) 2
Desviación Estándar Poblacional
N
( x x ) 2
Desviación Estándar Muestral s
n 1
Ejemplo: 4.6.
X x-u (x-u)2
5 -5,5 30,25
8 -2,5 6,25
8 -2,5 6,25
11 0,5 0,25
11 0,5 0,25
11 0,5 0,25
14 3,5 12,25
16 5,5 30,25
Total 86,00
( x u ) 2 86
Desviación Estándar 10,75 3,3unidades
N 8
Para no realizar el cálculo de c/u de las desviaciones con respecto a la Media Grupal,
existen Fórmulas abreviadas equivalentes, las cuales son:
x 2 Nu 2
Varianza Poblacional: 2
N
x 2 Nu 2
Desviación Estándar Poblacional:
N
x 2 n x
2
Varianza Muestral: s 2
n 1
43
x 2 n x
2
Ejemplo: 4.7.
Como verificación de resultados, calcular por fórmula abreviada la desviación estándar
respectiva del problema anterior, siendo x = u = 10,5.
x x2
5 25
8 64
8 64
11 121
11 121
11 121
14 196
16 256
Total 968
x 2 Nu 2 968 8(10,5) 2
10,75 3,3 unidades
N 8
(1) Asimétrica
x (2) Asimétrica
x (3) Simétrica
x
Negativa Positiva (Insesgada)
(Esta sesgada (Sesgada hacia
hacia la izquierda) la derecha)
44
En términos de Kurtosis (vértice superior), una curva de frecuencia puede ser:
x x x
(1) Platikúrtica (2) Leptokúrtica (3) Mesocúrtica
Se aplica para comparar la variabilidad de 2 conjuntos de datos con respeto al nivel general
de los valores de c/conjunto (y, por ello respeto a la media).
Ejemplo: 4.8.
Para 2 Acciones Comunes de Empresas
(Telefónica A –Claro B)
45
El precio promedio de cierre en la bolsa de un mes fue:
Acción A = $15000 con desviación estándar de 500.
Acción B = $5000, con desviación estándar de 300.
500 300
CV ( A) 0,033 y CV ( B) 0,060
u 15000 5000
Interpretación: El Precio de la acción B ha sido casi 2 veces más variable que la acción A.
(Con respecto al precio promedio para c/u de las 2).
Su Fórmula:
3(u Med )
Asimetría Poblacional:
3( x Med )
Asimetría de la Muestra:
S
Para una distribución Simétrica, el valor del coeficiente de asimetría siempre es = 0, porque
la media y la mediana son iguales.
Para una distribución con asimetría (+), la x es siempre > que la Med. => Asimetría = (+).
Para una distribución con asimetría (-) la x es siempre < que la Med. => Asimetría = (-).
Ejemplo: 4.9.
Del ejemplo dado E1 de 8 vendedores que vendieron ventiladores.
u = x =10.5 =
x 84 10,5
n 8
X X5
Med = X (5 8 8 11 11 11 14 16) = 4
2
11 11
Med = 11
2
= 3,3
3(u Med ) 3(10,5 11,0)
Asimetría = 0,45
3,3
(El grado en que están sesgados se refleja en este valor)
Así, la distribución de las unidades vendidas tiene una ligera asimetría negativa, es decir,
está sesgada hacia la izquierda.
46
FIG. 3.3. ASIMETRÍA DE PEARSON.
f
X
Asimetría Negativa
E9: En los siguientes datos agrupados de las salarios mensuales de 100 trabajadores hallar
el rango.
Para los datos agrupados en una distribución de frecuencias, se asume que el punto medio de cada
clase (Intervalo), representa a todas las mediciones incluidas en esa clase (intervalo); es igual que
el cálculo de la media para datos agrupados.
Fórmula Empleada:
DMPOBLACIONAL =
( f ) x u
N
47
Ejemplo: 4.10.
Para los datos de salarios diarios del Problema anterior calcular la Desviación Media.
Solución
Pto. Medio
Salario (f) Nº de
de clase f(x) | x u| f x u
Mensual Trabajadores
(Intervalo) x
2400 2599 2499,50 7 17496,50 450 3150
2600 2799 2699,50 20 53990,00 250 5000
2800 2999 2899,50 33 95683,50 50 1650
3000 3199 3099,50 25 77487,50 150 3750
3200 3399 3299,50 11 36294,50 350 3850
3400 3599 3499,50 4 13998,00 550 2200
Total: 100 294950,00 Total: 19600
Varianza Poblacional:
2
f x x
2
Varianza Muestral: S
2
n 1
f x u
2
f x x
2
Ejemplo: 4.11.
Para los datos de salarios diarios que se presentan a continuación.
Hallar la Desviación Estándar muestral
Pto. Medio
Salario
Diario
de clase
(f) Nº de
Trabajadores xi*fi
x x x x
2
f xx
2
(Intervalo)x
2400 - 2599 2499,50 7 17496,50 -450 202500 1417500
2600 - 2799 2699,50 20 53990,00 -250 62500 1250000
2800 - 2999 2899,50 33 95683,50 -50 2500 82500
3000 - 3199 3099,50 25 77487,50 150 22500 562500
48
3200 - 3399 3299,50 11 36294,50 350 122500 1347500
3400 - 3599 3499,50 4 13998,00 550 302500 1210000
Total: 100 294900,50 Total: 5870000
Solución
1ro: Cálculo del Pto. Medio de Intervalo
2do: Cálculo f x
5to: f x x Tabla
2
6toReemplazo de fórmula
f x x
2
5870000
S 59292.93
n 1 99
S 243.50
FORMULAS ABREVIADAS PARA DATOS AGRUPADOS SON LOS
SIGUIENTES:
Varianza Poblacional:
2 f x 2 Nu 2
N
Varianza Muestral: S
2
n 1
fx n x
2 2
49
875825025 1002949
2
S 243,50
100 1
Práctica Nº 4
2. Una empresa fabrica clavos que se venden por cajas. Para una muestra de 40 cajas, se
observaron los siguientes números de clavos por caja.
Número de clavos 18 19 20 21 22
Número de Cajas 4 9 15 10 2
3. Calcule la Desviación Media para los siguientes datos: 1000, 1000, 2500, 2500, 2500,
3500, 4000, 5300, 9000, 12500, 13500, 24500, 27500, 30900 y 41000.
4. Calcular la desviación estándar muestral para los datos del problema anterior utilizando:
a) La Fórmula de Desviaciones y b) La Fórmula abreviada alternativa, y demuestre
que las respuestas son iguales.
5. Una muestra de 20 trabajadores calificados de una compañía pequeña obtuvieron
los siguientes salarios en un mes determinado: $240000, 240000, 240000, 240000,
240000, 240000, 240000, 240000, 255000, 255000, 265000, 265000, 280000, 280000,
290000, 300000, 305000, 325000, 330000 y 340000.Determine: La Desviación
Media, La Varianza Muestral, La Desviación Estándar Muestral, utilizando las
fórmulas de desviación.
6. Determine el coeficiente de variación según datos del problema anterior.
7. Calcule el coeficiente de asimetría para los datos del problema 3.
8. Para los siguientes datos de las rentas por departamento.
Renta Mensual Nro. De Departamentos
350-379 3
380-409 8
410-439 10
440-469 13
470-499 33
500-529 40
530-559 35
560-589 30
590-619 16
620-649 12
TOTAL 200
50
Calcule: La Desviación Media y la Desviación Estándar utilizando las fórmulas de
desviaciones, las fórmulas abreviadas y demuestra que las fórmulas son
equivalentes.
9. En la siguiente tabla se reproducen los datos sobre el número promedio de lesiones por
millar de horas – hombre en una industria especifica.
51
PARTE II
PROBABILIDADES, DISTRIBUCIÓN DE PROBABILIDADES
5.3. Evento
Hemos definido el espacio muestral como el conjunto de todos los resultados posibles de
un experimento aleatorio. Es decir, podemos concebir al espacio muestral como un
conjunto universal. Hablaremos, entonces en él, de subconjuntos y elementos. Se llama
Evento a cualquier Subconjunto del espacio muestral y lo denotaremos por A,B,C,D,E,F.
etc. Así, si A es un evento y llamaremos suceso a todo elemento de un del espacio muestral
y lo designaremos por w, x, y, etc. Esto es, si x es un suceso, entonces x Є Ω. Un evento
con un sólo elemento es un evento elemental, así A = {w} es un evento elemental.
52
Evento A: masculino
Evento B: menor de 30 años
No son mutuamente excluyentes porque una persona elegida al azar podría estar en ambas
categorías .
En los dos eventos “as” y “oros”, estos eventos no son mutuamente excluyentes porque
una carta determinada puede ser al mismo tiempo as y oro, sin embargo, esto no indica
que todo as sea oro o todo oro sea as.
5.3.3. Eventos complementarios
Dos eventos A y B son complementarios si son mutuamente excluyentes y su unión es el
espacio muestral. Es decir si A B = y A B = A y B son eventos
complementarios, y se puede expresar que:
Ac
A =B
Bc = A
B
Ejemplo Nº 5.1.
En una cantidad de cartas bien barajadas que contiene 4 ases y 48 cartas de otras tipo, la
probabilidad de obtener 1 (as) en una sola extracción es:
N A
P(A) = = 4/52 = 1/13
N S
Ejemplo Nº 5.2.
53
Solución
a) El Espacio Muestral () = {CCC CCS CSC SCC CSS SCS SSC SSS}
P(A) = 3/8
c) Exactamente 2 sellos?
3/8
d) Exactamente 3 caras
1/8
5.5. Propiedades de probabilidad
1. La Probabilidad de ocurrencia de cada Punto Muestral, debe estar entre 0 y 1.
0 P(A) 1
2. La Suma de las Probabilidades de todos los puntos Muestrales debe ser igual a 1.
3. P(A) + P(A’) = 1
Es decir en una observación o experimento dados, el evento debe ocurrir o No. Por ello la
suma de la probabilidad de ocurrencia + la Probabilidad de no ocurrencia siempre es igual a
1.
(AB = ):
A B P(AB)=PA+PB
Ejemplo Nº 5.3.
Se extrae una carta de una baraja de 52, los eventos “as” (A) y “rey” (R) son mutuamente
excluyentes.
54
Hallar la probabilidad de extraer ya sea un as o un rey en una sola extracción.
Solución
E7: Un cliente ingresa a una panadería. La Probabilidad de que compre (a) pan es 0,60,
b) Leche es 0,50 y c) Pan y leche es 0,30. ¿Cuál es la Probabilidad de que compre pan,
leche o ambos?.
Solución
Ejemplo Nº 5.4.
Cuando se extrae una carta de un mazo de 52 cartas, los eventos “as” y una espada no son
mutuamente excluyentes.
Hallar la Probabilidad de obtener un AS (A) o una Espada (E) o ambos en una sola extracción.
Solución
Ejemplo Nº 5.5.
El lanzamiento de una moneda por dos veces se considera eventos independientes, porque
el resultado del primer lanzamiento no tiene ningún efecto sobre las respectivas
probabilidades de que ocurra una cara o sello en el segundo lanzamiento.
Ejemplo Nº 5.6.
La extracción de dos cartas sin reemplazo de un mazo de barajas son eventos dependientes,
por que las probabilidades asociadas con la segunda extracción dependen del resultado de
la primera extracción. Específicamente si saliera un as en la primera extracción entonces la
probabilidad de que salga as en la segunda extracción, es la razón del número de ases que
sigue habiendo en las barajas con respecto al número total de cartas, o 3/51.
55
5.8. Probabilidad condicional
Una medida de la probabilidad de que ocurra un evento particular, dado el hecho que otro
ya ha ocurrido o de que hay certeza de que ocurra, se llama probabilidad condicional.
Para dos eventos A y B, dicha probabilidad se denota, siempre por P (A/B) o P (B/A), lo
que se lee como “la probabilidad de A, dado B” o “la probabilidad de B, dada A” ya que la
línea vertical quiere decir “dada” ó “dado”.
P( AyB ) P( A B)
P( B / A)
P( A) P( A)
Donde:
Una Medida de la Probabilidad del acontecer simultáneo de dos o más eventos se llama
probabilidad conjunta. Para los eventos A y B, esta probabilidad se simboliza por P(AyB) o
P(AB).
Ejemplo Nº 5.7.
Solución
56
P A B 2 / 6 2
P B / A
P A 3/ 6 3
Este resultado queda comprobado por el hecho que de los 3 resultados pares 2, 4, 6
sólo 2 son mayores que 3.
5.8.3. Regla de la multiplicación (ab) : para eventos independientes.
Ejemplo Nº 5.8.
Cuál es la probabilidad de que en una familia con 2 hijos ambos sean varones.
Útiles para ilustrar los posibles eventos asociados con observaciones o ensayos
secuenciales, del ejemplo anterior obtenemos:
C1 y C2 1/4
1/2 C2
C1
1/2
1/2
S2 C1 y S2 1/4
S1 y C2 1/4
1/2 C2
1/2
S1
1/2 1/4
S2 S1 y S2
4/4 = 1.00
57
Esta dada por la fórmula:
P(AB) = P(A) P(B/A)
Probabilidad de ocurrencia .
de A y B.
Ejemplo Nº 5.10.
Una urna contiene 6 bolitas blancas y 4 negras, se extraen 2 bolitas sucesivamente y sin restitución.
a) ¿Cuál es la probabilidad de que ambas bolitas sean blancas?.
b) ¿Cuál es la probabilidad de que la primera sea blanca y la segunda negra?.
c) ¿Cuál es la probabilidad de que la primera sea negra y la segunda blanca?.
d) ¿Cuál es la probabilidad de que ambas sean negras?.
Solución
58
Estos mismos resultados lo expresamos en el diagrama de árbol siguiente.
Prob. Simple x Prob. Condicional = Prob. Conjunta
1. Se lanza un dado:
a) Enumérese los elementos del espacio muestral.
b) Enumérese los elementos de contenido en el suceso de que el resultado sea par.
c) Enumérese los elementos de contenidos en el suceso de que el resultado sea, mayor que
4.
59
5. Se lanza dos monedas. ¿ Cuál es la probabilidad de obtener.
a) Exactamente una cara?.
b) Por lo menos una cara?.
c) No obtener una cara?.
8. La probabilidad de que llueva el 12 de octubre es 0,10; de que truene es 0,05 y de que llueva
y truene es 0,03. ¿Cuál es la probabilidad de que llueva o truene en ese día?.
9. En cierta zona de la ciudad, la probabilidad de que una persona tenga televisor es 0,80; una
máquina lavadora es 0,50 y que tenga ambos es 0,45. ¿Cuál es la probabilidad de que una
familia tengan televisor o máquina lavadora o ambas cosas?.
10. La probabilidad de que un vendedor de autos venda por lo menos 3 autos en un día es 0,20. ¿
Cuál es la probabilidad de que venda 0, 1 ó 2 autos en ese día?.
11. La probabilidad de que la señora hablantina reciba a lo más 5 llamadas telefónicas en un día
es 0,20; y por lo menos 9 llamadas telefónicas en un día es 0,50. ¿Cuál es la probabilidad de
que la señora hablantina reciba 6, 7 ú 8 llamadas en un día?.
12. Una caja contiene 100 tubos de televisor. La probabilidad de que haya al menos un tubo
defectuoso es 0,05 y de que tenga al menos dos tubos defectuosos es 0,01. ¿Cuál es la
probabilidad de que la caja contenga:
a) Ningún tubo defectuoso?.
b) Exactamente un tubo defectuoso?.
c) A lo más un tubo defectuoso?.
Cálculo de Probabilidades Regla de la Multiplicación
14. De los estudiantes de una universidad, el 35% son varones y el 8% son varones que
estudian contabilidad. Si se elige un estudiante al azar y éste resulta ser varón. ¿Cuál es la
probabilidad de que estudie contabilidad?.
60
15. Una urna contiene 7 bolas blancas y 5 negras, si se saca dos bolas. ¿Cuál es la
probabilidad de que las dos sean blancas si:
a) Se extrae sin restitución.
b) Se extrae con restitución.
16. La urna A contiene 5 bolitas blancas y 7 rojas y la urna B contiene 3 bolitas blancas y 6
rojas. Se saca una bolita de la urna A y una de la urna B. ¿Cuál es la probabilidad de que las
dos bolitas sean blancas?.
17. La urna A contiene 4 bolitas blancas y 6 rojas, la urna B contiene 3 bolitas blancas y 5
rojas y la urna C 7 blancas y 7 rojas. Se saca una bolita de cada urna. ¿Cuál es la
probabilidad de que sean las tres del mismo color?
18. Se sacan dos cartas , sin restitución, de una baraja de 52 cartas. ¿Cuál es la
probabilidad de que:
a) La primera carta sea un as y la segunda un 5?.
b) Se obtenga un as y un 5?.
c) Ninguna de las dos cartas sea as?.
d) Ninguna de las cartas sea as ni 5?.
19. Se sacan dos cartas sin restitución de una baraja de la cual se han eliminado
previamente las cartas con figuras. ¿Cuál es la probabilidad de que la suma de los
puntos de las cartas sea 19?.
20. Se sacan 5 cartas sin restitución de una baraja. ¿Cuál es la probabilidad de que:
a) Las primeras tres cartas sean reinas y las dos ultimas reyes?.
b) Sólo las tres primeras cartas sean reinas?.
c) Las tres primeras cartas sean reinas?.
21. Se extraen cartas sucesivas y sin restitución una baraja. ¿Cuál es la probabilidad de que:
a) La primera Reyna aparezca en la tercera extracción?.
b) Aparezca una Reyna en la tercera extracción?.
61
Así como en los conjuntos de datos muéstrales y poblacionales ya estudiados; es útil
también describir una variable aleatoria en términos de su media
Ejemplo Nº 6.1.
Considerando el Nº de caras que puede resultar al lanzar 3 monedas simultáneamente. Los
ocho resultados posibles de este experimento aparecen a continuación en el lado izquierdo.
Designando cada número posible de caras por x y su probabilidad por P(x), enumeramos en
la tabla de la derecha todos los números posibles de caras con sus respectivas
probabilidades. Observamos que hay mayor posibilidad de obtener 1 o 2 caras que 0 y 3.
Supongamos ahora que las tres monedas se lanzan un número infinito de veces. Si bien en
este número infinito de ensayos esperamos obtener un promedio de 1,5 caras por
lanzamiento.
Este promedio “A largo plazo” de 1,5 caras por lanzamiento se llama esperanza
matemática.
62
E(x) = xP(x)
= 12/8
= 1,5 caras.
E3: Con base en la tabla del 1er. ejemplo, hallar el valor esperado de la variable aleatoria.
(Promedio de alquiler diario de camionetas)
Solución
Interpretación:
63
Suponiendo que se haga este juego varios miles de veces. Cada vez se ganará $2 o perderá
$1. Sin embargo en esos miles de juegos se puede esperar una pérdida promedio de $0,10
por juego.
n!
p xqn x
= x!( n x )!
Donde:
n!
nCx = C = Coeficiente Binomial = x!(n x)!
n
x
E5:La Probabilidad de que un gerente de compras elegido al azar realice una compra es de
0.20. Si un vendedor visita a 6 gerentes de compras, hallar la probabilidad de que realice
exactamente 4 ventas.
Solución
Datos:
P = 0.20 n=6
q = 1-0.20 = 0.80 x=4
6!
= (0.20) 4 (0.80)2
4!(6 4)!
6 x5 x 4 x3x 2
= (0.0016)(0.64)
(4 x3x 2)(2)
64
= 0.01536 0.015
Ejemplo Nº 6.3.
En relación con el ejemplo anterior, hallar la probabilidad de que el vendedor logre 4 o más
ventas.
Solución
P(x 4/n = 6, P = 0,20) = P(x = 4) + P(x =5) + P(x=6)
= 0,01536 + 0,001536 + 0,000064
= 0,016360 0,017
En donde:
6!
P(x=5) = 6C5 (0,20)5 (0,80)1 = (0,20)5(0,80)
5! 1!
= 6(0,00032) (0,80) = 0,001536
6!
P(x=6) = 6C6(0,20)6(0,80)0 = (0,000064)(1)
6! 0!
= (1) (0,000064) = 0,000064
Sabemos:
P(x < 3, n = 15, p = 0,20) = P(x 2)
= P(x = 0) + P(x =1) + P(x = 2)
= 0,0352 + 0,1319 + 0,2309 (Ver Apéndice 2)
= 0,3980 0,40
65
a) Localizamos en la tabla el valor de n = 30, p = 0,45 y para x = 13 obtenemos un
valor de 0,1433, es decir existen 14,33% de probabilidad de que 13 de los 30
estudiantes trabajen en verano para ganarse el dinero de la enseñanza.
b) Con n=30 y p=0,45, la tabla indica de que la probabilidad de que no trabaje
ninguno es p(x=0) = 0,0000.
c) Se observa que la probabilidad de que más de 23 estudiantes trabajen es de P(x
>23) / n =30, p = 0,45 = 0000.
Ejemplo Nº 6.7.
Ejemplo caso en que p > 0,50
Solución
n 20
x 16 no contiene valor para p 0,95
p 0,95
La respuesta deseada se puede encontrar si se modifica la pregunta en términos de fracaso
en lugar de éxito.
El trabajador no instala correctamente los circuitos el 5% del tiempo. Si ahora leemos p
como la probabilidad de fracaso en cualquier ensayo. Podemos hallar en la columna p =
0,05 una probabilidad de obtener precisamente cuatro circuitos defectuosos como 0,0133.
Esto implica también una probabilidad de obtener 16 circuitos perfectos.
Es decir:
n = 20
p( x=4/n=20, p=0,05) = 0,0133
x=4
66
Observamos que la suma de ambas respuestas suman 1,00.
Es decir: P(x4/n=20, p=0,05) = 1–P(x3/n=20, p=0,05)
67
Ejemplo Nº 6.10.
Si en un Dpto. de reparación de maquinaria se recibe un promedio de 5 solicitudes de
servicio por hora, hallar la probabilidad de que se reciban menos de 3 llamadas en una hora
elegida al azar.
Solución
P(x < 3/ = 5.0) = P(x 2) = P(x=0) + P(x=1) + P(x=2)
= 0.0067 + 0.0337 + 0.0842
= 0.1246 Respuesta.
Donde:
P(x=0/=5.0) = 0.0067
P(x=1/=5.0) = 0.0337 Apéndice 4
P(x=2/=5.0) = 0.0842
Como se supone que un proceso Poisson es estacionario, se concluye que la media del
Proceso es siempre proporcional a la longitud del continuo del tiempo o espacio.
Nota 2: Si se tiene disponible una media para una longitud de tiempo, puede determinarse
la media para cualquier otro periodo de tiempo que se requiere.
Esto es importante porque el valor de que se utiliza debe aplicarse al periodo de tiempo
pertinente.
68
También se puede calcular así: más corto
P(x 3) = 1 – P(x < 3/=2.0)
= 1 – (P(x=2/=2.0)+ P(x=1/=2.0) + P(x=0/=2.0))
= 1 – (0.2707 + 0.2707 + 0.1353)
= 1 – (0.6767)
= 0.3233
PRÁCTICA Nº 7
DISTRIBUCIONES DE PROBABILIDADES
A. Valor Esperado
1. Se ha determinado que el número de camiones que llegan cada hora a un almacén tiene la
distribución de probabilidad que se muestra en la tabla dada.
Número de Camiones 0 1 2 3 4 5 6
2. Las ventas por hora de una máquina automática pueden se 20, 21 o 22 cajetillas de cigarrillos
con probabilidades de 0,3; 0,5; y 0,2 respectivamente. ¿Cuál es la venta por hora esperada para
esta máquina?
3. Una urna contiene 5 bolitas negras y 8 blancas. Se saca una bolita de la urna si esta es negra
usted gana 15 bolivianos, pero si es blanca usted pierde 13 bolivianos. ¿Cuál es el Valor
Esperado de este juego?.
B. Distribución Binomial
a) P(X 2) c) P(X 4)
b) P(X = 2) d) P(X = 4)
69
5. Dada la distribución binomial con p = 0,85 y n = 9, utilícese la tabla de distribución binomial
para determinar:
a) P(X 7) c) P(X 5)
b) P(X = 7) d) P(X = 5)
7. Dada la distribución binomial con p = 0,70 y n = 20, utilícese la tabla de distribución binomial
para determinar:
8. Debido a las elevadas tasas de interés, una empresa reporta que el 30% de sus cuentas por
cobrar de otras empresas están vencidas. Si un contador toma una muestra aleatoria de cinco de
esas cuentas.
Determine la probabilidad de cada uno de los siguientes eventos, utilizando la fórmula de la
probabilidad binomial:
a. Ninguna de las cuentas está vencida
b. Exactamente 2 cuentas están vencidas.
c. La mayor parte de las cuentas están vencidas.
d. Exactamente el 20% de las cuentas están vencidas.
C. Distribución Poisson
10. El promedio anual de terremotos en Chile es de 0,5. Utilícese la distribución de Poisson para
determinar la probabilidad de que no haya terremotos en Chile en los 3 años.
11. El Promedio mensual de incendios grandes en una ciudad es de 1.5. Utilícese la distribución
de Poisson para determinar la probabilidad de que haya exactamente un incendio grande en un
periodo de dos meses.
12. La mesa conmutadora del Gran Hotel Emperador recibe un promedio de 10 llamadas
telefónicas por minuto. Utilícese la distribución de Poisson para determinar la probabilidad de
que lleguen exactamente 4 llamadas en un periodo de 30 segundos.
70
13. El número promedio de fallas en un rollo de un cierto tipo de papel mural es de 2.5. Utilícese
la distribución de Poisson para determinar la probabilidad de que un rollo tenga 4 o más fallas.
71
7. CAPÍTULO 7 DISTRIBUCIÓN NORMAL, DISTRIBUCIÓN DE LA MEDIA
MUESTRAL
Ejemplo Nº 7.1.
Para la distribución continua de probabilidad de la figura dada, la probabilidad de que un
embargue seleccionado al azar tenga un peso neto entre 6000 y 8000 kilogramos es igual a
la proporción del área total bajo la curva que se encuentre bajo el área sombreada. Es decir
se define que el área total bajo la función de densidad de probabilidad es igual a 1, y se
puede determinar la proporción de esta área que se encuentra entre dos puntos
determinados.
f(x)
Peso, Kg
2000 4000 6000 8000 10000 12000
72
7.1.3. Uso de las Tablas de Distribución Normales
Las tablas de las probabilidades normales se basan en una distribución específica: la
Distribución Normal Estándar.
Esta es una distribución normal en la que u = 0 y = 1. Cualquier valor x de una población
con distribución normal estándar equivalente, z, mediante la fórmula.
xu
Z
En el apéndice 5 se obtienen las posiciones de área para diversos intervalos de valores para
la distribución normal estándar, en donde el límite inferior del intervalo es siempre la
media.
Aquí se transforman los valores designados de la variable x en valores normales estándar.
Ejemplo Nº 7.2.
Se ha ajustado el proceso de fabricación de un tornillo de precisión de manera que la
longitud promedio de los tornillos sea u = 13.0 cm.
Por supuesto, no todos los tornillos tienen una longitud exacta de 13 centímetros, debido a
fuentes aleatorias de variabilidad. La desviación estándar de la longitud de los tornillos es
= 0,1 cm. y se sabe que la distribución de las longitudes tienen una forma normal.
Determine la probabilidad de que: un tornillo elegido al azar tenga una longitud de entre
13,0 y 13,2 cm., e ilustre la proporción del área bajo la curva normal asociada con este
valor de probabilidad.
De la figura (a)
Ejemplo Nº 7.3.
Del problema E16, ¿Cuál es la probabilidad de que la longitud de los tornillos se
encuentren entre 12, 8 y 13,1 cm.? Ilustre la proporción del área bajo la curva normal para
este caso.
Solución
u = 13,0
= 0,1
P(12,8 x 13,1)
Si
xu
Z
73
Práctica Nº 8
1. La Distribución Normal de trabajadores de una Industria tiene u = 50 años y = 5 años, 20 %
de los trabajadores están bajo una cierta edad. ¿Cuál es la edad?.
2. La estatura media de los soldados de un regimiento es de 170 cm., 10% de estos soldados
miden más de 175 cm. Si tiene una distribución Normal. ¿Cuál es ?
3. La estatura de los soldados de un regimiento está distribuida normalmente con una media de
69 pulgadas y una desviación estándar de 2 pulgadas.
a. ¿Cuál es la probabilidad de que un soldado mida mas de 72 pulgadas?
b. ¿Cuál es el porcentaje de soldados cuyas estaturas están entre 69 y 73 pulgadas?
c. Si para la realización de una cierta misión, un soldado debe estar en el 20% de los de mayor
estatura, ¿Cuál es la estatura mínima para participar en esta misión?.
4. Un rodamiento es considerado defectuoso y por lo tanto es rechazado si su diámetro es mayor
que 2.02 pulgadas o menor que 1,98 pulgadas. ¿Cuál es el número esperado de rodamientos
rechazados si los diámetros de una partida de 10,000 rodamientos están distribuidos,
normalmente con una media de 2 pulgadas y una desviación estándar de 0.01 pulgadas?.
5. Los puntajes finales en un curso de Psicología están distribuidos normalmente con una media
de 60 y una desviación estándar de 10.
a. Si el puntaje mínimo para aprobar es 48, ¿Cuál es el porcentaje de fracasos?
b. Si han de aprobar el 80% de los estudiantes, ¿Cuál debe ser el puntaje mínimo aprobatorio?
6. En una industria alimenticia se comercializa harina en paquetes de “PESO NETO 500 grs.”. El
proceso automático de llenado de los paquetes puede regularse de modo que la cantidad media
de harina por paquete puede ajustarse al nivel que se desee. Suponiendo que la cantidad de
harina por paquete se distribuye normalmente con una desviación estándar de 0,2 onzas.
a. ¿A qué nivel debe ajustarse el llenado medio de modo que solo el 0,001 de los paquetes tengan
un peso neto inferior a 12 onzas?
b. ¿A qué nivel debe ajustarse el llenado medio de modo que solo el 0,05 de los paquetes tengan
un peso neto superior a 12,4 onzas?.
7. El peso medio de una piña en una partida grande es de 5 libras. El 10% de las piñas pesan
menos de 4 libras. Suponiendo que los pesos están distribuidos normalmente. ¿Cuál es la
desviación estándar de la partida?.
8. Un estudio reporta los salarios iniciales anuales de los contadores recientemente egresados, y
los promediaba en 22500 bolivianos, con una desviación estándar de 2250 bolivianos. Si los
salarios siguen una distribución normal. ¿Cuál es la probabilidad y los porcentajes de que un
recién egresado gane:
74
8. CAPÍTULO Nº 8 DISTRIBUCIÓN DE LA MEDIA MUESTRAL
Debido a factores como tiempo y costo, se estiman los parámetros poblacionales desconocidos por
ejemplo la media (u) examinando la información de la muestra ( x ) de la población, la cual debe
ser representativa de la población objeto del estudio.
Por ejemplo, si deseamos hallar el interés hacia el estudió por parte de los estudiantes
universitarios de un facultad; en este caso la población más importante es la recolección de
respuestas de los estudiantes de la facultad sobre el interés hacia el estudio.
Aquí tomaremos una parte de esta población (muestra), y la usaremos para normar el interés de los
estudiantes hacia el estudio.
Si nos basamos en las respuestas de miembros de otras fuentes u otras instituciones obtendremos
sobre todo respuestas sesgadas (visión distorsionada de las actitudes de las actitudes de los
estudiantes en conjunto) o desviadas a favor del estudio.
Si obtenemos muestras aleatorias de una población, éstas por su naturaleza propia no se pueden
predecir, sólo se pueden hacer afirmaciones probabilísticas sobre una población cuándo se usan
muestras representativas de la misma.
Para cualquier tamaño de muestra n, tomado de una misma población con media (u), los valores de
la media muestral x , varían de una muestra a otra. Esta variabilidad sirve de base para la
distribución muestral.
Ejemplo Nº 8.1.
Si tenemos una población de N=4, que indican los ingresos anuales de 4 analistas de sistemas 10,
20, 30 y 40 (en miles de bolivianos)
a.- Calcular la media de la población (u)
b.- La desviación estándar poblacional ()
c.- Si tomamos muestras aleatorias de tamaño n=2 hacer una lista de todos los pares posibles de
las diferentes muestras de la media.
Para cada uno de los pares identificados, calcule la media muestral x con su respectiva
probabilidad, y demuestre que la media de todas las medias muestrales posibles (u x ) es igual a la
media de la población (u) de donde se seleccionaron las muestras.
75
8.2.1. ERROR ESTÁNDAR MUESTRAL DE LA MEDIA ( x ) S x
La Distribución muestral de las medias Muestrales tiene una desviación estándar, a esta desviación
estándar de la distribución de todas las medias Muestrales también se le denomina error estándar
de la media el cual mide la dispersión de las observaciones individuales (medias muestrales) en
torno a la media de las medias muestrales u x = u, también indica la precisión de la media
muestral.
x x
2 2
x
Ns Ns
donde:
N n
x
n N 1
Ejemplo Nº 8.2.
Del primer ejemplo demostraremos que al utilizar las dos fórmulas del error estándar dadas, el
resultado es el mismo.
INTERPRETACIÓN: las 6 medias Muestrales posibles tienen una media = 25 = ux = u, las cuales
tienden apartarse de 25 en 6,45.
Ejemplo Nº 8.3.
Un contador toma una muestra aleatoria de tamaño n =16 de un conjunto de N = 100 cuentas por
cobrar. No se conoce la desviación estándar de los montos de las cuentas por cobrar para el total de
76
las 100 cuentas. Sin embargo, la desviación estándar de la muestra es S = $57.00. Hallar el error
estándar para la distribución muestral de la Media.
Solución
s N n 57 100 16 57 84
sx
n N 1 16 100 1 4 99
En el ejemplo dado se estima el error estándar de la media con base en la desviación estándar
muestral, y se requiere utilizar el factor de corrección por población finita porque no es cierto que
n < 0,05 N, es decir 16 > 0,05(100)
El error estándar de la Media ofrece la base principal para la inferencia estadística con respecto a la
media de una población que se desconoce. En este capítulo un teorema de la estadística usado para
hallar la utilidad del error estándar de la media es:
Ejemplo Nº 8.4.
En un estudio para comparar la producción promedio mensual en miles de unidades producidas
por COCA-COLA y KOLA REAL se usará una muestra aleatoria de 20 y 25 trabajadores de c/u
de las empresas . Se sabe que la producción por trabajador siguen una distribución normal. El
promedio de la producción de todos los trabajadores de COCA_COLA es de 100 unidades y su
desviación estándar es de 14.142, mientras que el promedio de la producción de todos los
trabajadores KOLA REAL es de 85 unidades y su desviación estándar es de 12.247 unidades. Si
y representan el promedio muestral de la producción de los 20 y 25 trabajadores
respectivamente. Encuentre la probabilidad de que el promedio de las unidades producidas por los
20 trabajadores sea al menos 20 unidades más que el de los 25 trabajadores.
Solución:
Datos:
1 = 100 unidades; 2 = 85 unidades ; 1 = 14.142 unidades; 2 = 12.247
77
Por lo tanto, la probabilidad de que el promedio de las unidades producidas de la muestra de
trabajadores de COCA-COLA sea al menos 20 unidades más que el de la muestra de los
trabajadores de KOLAREAL es 0.1056.
Las distribuciones Muestrales de proporciones son usadas en muchos casos, sobre todo cuando se
trata de hallar si una observación cumple o no una determinada característica.
Por ejemplo, los políticos no siempre desean saber cuantas personas votarán por ellos, sino que
porcentaje de la gente lo hará, es decir en lugar de medias Muestrales, nos encontramos con
proporciones Muestrales.
78
8.3.3. Teorema del límite central – distribución normal para proporciones muestrales
(1 ) N n
P
n N 1
Ejemplo Nº 8.5.
Un médico administra un medicamento a N = 5 pacientes. Los resultados de cada paciente son
respectivamente muere, vive, vive, muere, muere. Hallar la media de todas las proporciones
Muestrales, si se toman muestras de tamaño n = 2. También hallar el error estándar de las
proporciones muestrales.
Solución
Las muestras posibles de tamaño n = 2 y la proporción de éxitos (vive), se indican en la tabla
siguiente.
Se cumple también 5C2 = 10. M = muere, Vive = V.
Ns = Nº de muestras posibles = 10
S
p
Sabemos: n
Donde:
p = proporción muestral de éxitos.
S = proporción de éxitos en una muestra.
n = 2.
Proporción de
Muestra
Éxitos P
M1 V2 0,5
M1 V3 0,5
M1 M4 0,0
M1 M5 0,0
V2 V3 1,0
V2 M4 0,5
V2 M5 0,5
V3 M4 0,5
V3 M5 0,5
M4 M5 0,0
79
P = 4,0
P
P 4 0,40
Ns 10
donde:
p = proporciones.
p = media de todas las proporciones.
Ns = Nº de muestras posibles.
Es decir P (media de todas las proporciones ) es igual a u(media de la población) = 0,40.
(1 ) N n (0,4)(0,6) 5 2
P 0,3
n N 1 2 5 1
E8: Con referencia al problema E7. Si él médico administra el medicamento a muchos pacientes,
de los cuales viven = 45%. Si se elige una muestra de 80 pacientes. ¿Cuál es la probabilidad que
vivan más de 40?.
PRÁCTICA Nº 9
DISTRIBUCIONES MUESTRALES
1. Se sabe que la vida útil promedio de los focos de transparencias es = 9000 horas, con una
desviación estándar de 500 horas. Determine el valor esperado y el valor estándar de la
distribución muestral de la media, con un tamaño de muestra de n = 25. Interprete el significado
de los valores calculados.
2. Para una población grande de saldos de cuentas que tienen distribución normal, se tiene un
saldo promedio de = $ 150,000.00, con desviación estándar = $ 35,000 cuál es la probabilidad
de que una cuenta muestrada al azar tenga un saldo que excede de $ 160,000.
3. Con referencia al problema anterior, ¿cuál es la probabilidad de que la media de una muestra
aleatoria de n = 40 cuentas exceda de $ 160,000?
4. De un estudio contable se toma alzar una muestra de 500 empleados de un número mayor a
ellos. Los trabajadores realizan labores a destajo y se encuentran que el producto medio de pago
por cliente es de 2000 nuevos Bolivianos, con una desviación estándar muestral S=200 Nuevos
Bolivianos. Hallar el pago promedio a destajo para todos los empleados de la empresa, con un
intervalo de confianza del 90%.
5. El banco de Crédito toma una muestra n = 600 de una población de 1200 clientes que
cuentan con tarjeta de crédito, el valor promedio de los créditos es de 3200 con una desviación
estándar poblacional de 600 Nuevos Bolivianos . Hallar la probabilidad de que la media muestral
sea superior a 3350 Nuevos Bolivianos.
80
6. Para ilustrar el significado de la distribución muestral de la media se hace referencia a una
población altamente simplificada. Suponga que una población consta solamente de cuatro valores:
3, 5, 7 y 8. Calcule (a) la media de la población , y (b) la desviación estándar de la población .
7.- Para la población que se describió en el problema anterior, suponga que se toma muestras
aleatorias simples de tamaño n = 2, de esa población. En cada una de las muestras, antes de elegir
el segundo elemento muestral, no se reemplaza el primer elemento escogido.
Hacer una lista de todos los pares posibles que puede constituir una muestra.
Para cada uno de los pares identificados en (a), calcule la media muestral X y demuestre que la
media de todas las medias muestrales posibles x es igual a la media de la población de donde se
seleccionaron las muestras.
8. Para la situación de muestreo que se describió en los problemas anteriores, calcule el error
estándar de la media determinando la desviación estándar de las seis medias muestrales posibles
que se identificaron en el problema anterior, con respecto a la media poblacional . Después
calcule el error estándar de la media con base en la que se conoce y, tratándose de un muestreo
en una población finita, utilice la fórmula apropiada y verifique que los dos valores del error
estándar sean iguales.
9. Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una
desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de
la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de
40 tubos de la compañía B.
81
9. CAPÍTULO IX PRUEBA DE HIPÓTESIS
Prueba de Hipótesis.
82
Prueba de significancia de dos colas:
Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis
alterna H1, como:
H0:el ingreso medio de las mujeres es igual al ingreso medio de los hombres
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.
Ejemplo Nº 9.1.
Un Fabricante de “Crispy” un nuevo alimento para el desayuno, está preocupando por el peso
medio de cereales que se envasa en sus cajas. Estas anuncian un peso neto de 36 onzas. Si el
fabricante desea realizar la prueba de hipótesis aun nivel de significancia del 5%. Si se elige al azar
una muestra de x = 37,6 onzas y una desviación estándar de S = 3 onzas. Determinar el sistema de
hipótesis y realizar la prueba
Solución
u = 36 onzas
= 5%
x = 37,6
S = 3 onzas
n = 100 95%
Ho: u = 36 Rechazo
H1: u 36 /2 = 0,025
Sabemos:
xCR uH ZSx 35,41 uH=36 36,59
= 36 (1,96)(0,3)
= 36 0,588
35,41 hasta 36,59
INTERPRETACIÓN.
Como la media muestral x = 37,6 la cual está sobre 36,59; entonces se rechaza la hipótesis nula. Es
improbable que u = 36, soló hay una probabilidad del 2,5% de que una muestra diera un media
mayor que 36,59.
Ejemplo Nº 9.2.
Un contador piensa que el número medio de días necesarios para realizar un trabajo debe ser u =
27. Si la media es menor que 27, el contador teme que el trabajo se ejecute con descuido de
calidad, mientras que una media por encima de 27 puede dar lugar a unos gastos innecesarios. Se
eligen al azar 50 trabajos con objeto de probar (contrastar esta afirmación).
83
Se encuentra que la media es x =25,3 días, con una desviación estándar S = 2,1 días. El contador
desea probar (contrastar) la hipótesis con nivel de significancia del 1% (99% de confianza).
Determinar el sistema de hipótesis y realizar la prueba. Si rechaza la Hipótesis nula, el contador
tendrá que volver a valorarel proceso de trabajo para garantizar que se siguen procedimientos
adecuados
Solución
u = 27
n = 50
x = 25,3
S = 2,1 Rech
= 1% Ho:0,99 azo
Ho: u = 27 /2 = 0,005
0,4950
H1: u 27 26,23 uH=27 27,77
Ejemplo Nº 9.3.
Si la vida útil de las focos de una marca específica es cuando menos 4200 hrs. La vida útil
promedio para una muestra aleatoria de n = 10 focos es x 4000 hrs. con desviación estándar
muestral S = 200hrs.
Si tiene vida útil D. normal – probar la hipótesis con alfa = 5%
Solución
n = 10 Ho: 4200 hrs.
H1: < 4200
tCRÍTICA (gl = 9, x = 0,05) = -1,833
S 200 200
Sx 63,3hrs.
n 10 3.16
x 0 4000 4200
CAL 3,16
Sx 63.3
HO
Acepta
HI
84
tCAL = -3,16 t CRITICO = -1,833
Interpretación: Se rechaza Ho, se acepta H1 de que 1< 4200
Mediante la expresión r x c se definen las dimensiones de este tipo de Tablas, en donde r indica el
número de renglones (filas) y c el número de columnas.
Pero la Ji – cuadrada nos permite también comparar dos atributos (variables) para determinar si
hay alguna relación entre ellos. Consideremos, por ejemplo, que un especialista en marketing
quisiera determinar si hay alguna conexión entre los niveles de renta de los consumidores y su
preferencia por el producto que él vende. Este procedimiento implicaría comparar dos atributos:
rentas y preferencias. La comparación de dos atributos para determinar si son independientes se
realiza analizando la diferencia entre frecuencias observadas reales y frecuencias esperadas.
El cálculo de la JI cuadrada (x2) para el análisis de una tabla de contingencia también es fácil de
hallarla e interpretarla usando el programa apropiado de alguno de los paquetes estadísticos como
el SAS, Minitab, SPSS y otros.
EJEMPLO DEL TIPO 1: Este es un ejemplo del formato mas resumido de una tabla de
contingencia donde se consideran las dos variables, se trata de una tabla de contingencia de 2 x 2.
CUADRO 1
Jabón
Ingresos Total
B1 B2
A1 40 60 100
A2 110 90 200
85
Total 150 150 300
En el Cuadro 1
Observamos en los totales de las filas (renglones) y columnas que:
150 + 150 = 300 personas
100 + 200 = 300 Personas
100 tienen ingresos A1, y
200 tienen ingresos A2
También
150 usan jabón B1, y
150 usan jabón B2
Resultando:
CUADRO 2
Jabón
Ingresos Total
B1 B2
A1 100
A2 200
Total 150 150 300
86
frfc 200 x150
fe4 = 100
n 300
Obtenemos:
CUADRO 3
Jabón
Ingresos Total
B1 B2
A1 40 (50) 60 (50) 100
A2 110 (100) 90 (100) 200
Total 150 150 300
Prueba de hipótesis nula de independencia para los datos de la tabla anterior utilizando un
nivel de significancia del 5 %
FORMULADE JI CUADRADA:
( f fe )
X2 = 0
fe
Donde:
fe = Frecuencia esperada
f0 = Frecuencia observada
Hipótesis nula = H0 = No existe una relación estadísticamente significativa entre los ingresos
de una persona y la clase de jabón que usa. Por tanto son independientes.
Hipótesis alterna: HA = Existe una relación estadísticamente significativa entre los ingresos de
una persona y la clase de jabón que usa por tanto son dependientes.
gl = (r – 1) (c – 1) = (2 – 1 ) (2 – 1) = 1
( f fe )
X2 = 0
fe
En la tabla de la Ji cuadrada (X2), y para un nivel de significancia de 5 por ciento hallamos 3.841
entonces como la estadística de prueba de 6 excede el valor crítico de 3.841. Por ello se rechaza la
hipótesis Nula de independencia y se concluye que existe una relación estadísticamente
significativa entre los ingresos de una persona y la clase de jabón que usa.
Práctica Nº 10
PRUEBA DE HIPÓTESIS
87
1. Un auditor desea probar el supuesto de que el valor promedio de toda las cuentas por cobrar
en una empresa determinada es 260 000 bolivianos, tomando una muestra de n = 36 y
calculando la media muestral, desea rechazar el valor supuesto de 260 000 bolivianos solo
si la media muestral lo contradice en forma clara, por lo que debe (darse el beneficio de la
duda) al valor hipotético en el procedimiento de prueba. Hallar las hipótesis nula y
alternativa para esta prueba.
2. Con referencia al problema 9, determinar los valores críticos de la media muestral para
probar la hipótesis con un nivel de significancia del 5%. Sabiendo que a la desviación
estándar de las cuentas por cobrar es = 43 000.
3. Con referencia a los 2 problemas anteriores suponga que la x = 240 000.
Determine si se debe aceptar o rechazar la hipótesis nula.
4. 12 Con referencia a los problemas anteriores partimos de la hipótesis nula que la media de
todas las cuentas por cobrar es de cuando menos 260 000 bolivianos, probar la hipótesis
con un nivel de significancia del 5%.
88
APENDICES
89
APENDICE I: DISTRIBUCION BINOMIAL
90
APENDICE II: DISTRIBUCION BINOMIAL (CONT)
91
92
APENDICE II: DISTRIBUCION BINOMIAL (CONT)
93
APENDICE II: DISTRIBUCION BINOMIAL (CONT)
94
APENDICE II: DISTRIBUCION BINOMIAL (CONT)
95
APENDICE II: DISTRIBUCION BINOMIAL (CONT)
96
APENDICE III: DISTRIBUCION DE POISSON
97
APENDICE III: DISTRIBUCION DE POISSON
98
APENDICE III: DISTRIBUCION DE POISSON (CONT)
99
APENDICE III: DISTRIBUCION DE POISSON (CONT)
100
APENDICE III: DISTRIBUCION DE POISSON (CONT)
101
APENDICE III: DISTRIBUCION DE POISSON (CONT)
102
APENDICE IV: DISTRIBUCION NORMAL
103
APENDICE V DISTRIBUCION t DE STUDENT
104
BIBLIOGRAFIA
Básica
1. Anderson, D., Sweeney, D. y Willians, T. (2008). Estadística para administración y
economía (10a. ed.). México: Thomson Learning.
2. Berenson, M. y Levine. D. (1991). Estadística para administración y economía: conceptos y
aplicación. México: McGraw-Hill.
Complementaria
3. Spiegel, R. (2009).Estadística (4a. ed.). México: McGarw-Hill.
4. Moya Rufino Estadística Descriptiva
5. Levin, R. y Rubin, D. (2004). Estadística para administración y economía (7a. ed.) México:
Pearson Educación
105