Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Libro Estadistica y Probabilidades PDF

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 109

Tabla de contenido

1. CAPÍTULO I DEFINICIONES IMPORTANTES EN LA ESTADISTICA ....... 1


1.1. DEFINICIÓN DE ESTADÍSTICA ..................................................................... 1
1.2. DIVISIÓN DE LA ESTADÍSTICA .................................................................... 1
1.2.1. Estadística Descriptiva ................................................................................ 1
1.2.2. Estadística Inferencial o inductiva ............................................................... 1
1.3. IMPORTANCIA DE LA ESTADÍSTICA .......................................................... 1
1.4. MÉTODO ESTADÍSTICO................................................................................. 1
1.4.1. Planteamiento del problema......................................................................... 2
1.4.2. Fijación de los objetivos .............................................................................. 2
1.4.3. Formulación de las hipótesis ........................................................................ 2
1.4.4. Definición de la unidad de observación y de la unidad de medida ................ 2
1.4.5. Variables estadísticas .................................................................................. 3
1.4.6. Determinación de la población y de la muestra ............................................ 4
1.4.7. Recolección ................................................................................................. 4
1.4.8. Critica, clasificación y ordenación ............................................................... 6
1.4.9. Tabulación .................................................................................................. 6
1.4.10. Presentación............................................................................................. 6
1.4.11. Análisis.................................................................................................... 6
1.4.12. Publicación .............................................................................................. 6
2. CAPÍTULO II. ORDENAMIENTO DE DATOS EN ARREGLOS DE DATOS Y
DISTRIBUCIONES DE FRECUENCIAS................................................................. 7
2.1. Distribución de frecuencias ................................................................................ 7
2.1.1. Distribución de frecuencias: Variable cualitativa ......................................... 8
2.1.2. Distribución de frecuencias: Variable cuantitativa discreta ........................ 11
2.1.3. Distribución de frecuencias por intervalos ................................................. 13
2.1.4. Construcción de la distribución de frecuencias .......................................... 13
2.1.5. Marca de clases. (x) ................................................................................... 14
2.1.6. Histograma, polígonos y curvas de frecuencia ........................................... 14
2.1.7. Distribución de Frecuencias Acumuladas Absolutas y Relativas. ............... 17
3. CAPÍTULO III MEDIDAS DE TENDENCIA CENTRAL ............................... 23
3.1. La media aritmética .......................................................................................... 23

i
3.1.1. Media o promedio poblacional (µ):............................................................ 23
3.1.2. Media aritmética de datos tabulados .......................................................... 25
3.1.3. La Media Ponderada .................................................................................. 25
3.1.4. La Media Aritmética para datos agrupados ................................................ 27
3.2. La Mediana ...................................................................................................... 29
3.2.1. Características: .......................................................................................... 29
3.2.2. Cálculo de la Mediana: .............................................................................. 29
3.2.3. La Mediana Para datos agrupados.............................................................. 30
3.3. Moda ................................................................................................................ 31
3.3.1. La Moda para Datos Agrupados ................................................................ 31
3.4. La media geométrica ( xg) ................................................................................ 32
3.5. La Media Armónica (Xh) ................................................................................. 33
3.6. Cuartiles, Deciles y Percentiles ......................................................................... 37
3.6.1. Cuartiles, deciles y percentiles para datos agrupados ................................. 37
4. CAPÍTULO Nº 4 MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS
40
4.1. EL RANGO (AMPLITUD TOTAL) (R) .......................................................... 40
4.2. LA DESVIACIÓN MEDIA.............................................................................. 41
4.3. LA VARIANZA; LA DESVIACIÓN ESTÁNDAR ......................................... 42
4.3.1. Fórmulas ................................................................................................... 42
4.3.2. Cálculos abreviados de la varianza y la desviación estándar....................... 43
4.4. MEDIDAS DE VARIABILIDAD (DISPERSIÓN) ASIMETRÍA Y CURTOSIS DE
LOS DATOS. ......................................................................................................... 44
4.4.1. Formas de Curvas de frecuencias. .............................................................. 44
4.4.2. El coeficiente de variación (c.v.)................................................................ 45
4.4.3. Coeficiente de asimetría de pearson (sesgo) ............................................... 46
4.4.4. El rango y los rangos modificados para datos agrupados. ........................... 47
4.5. DESVIACIÓN MEDIA PARA DATOS AGRUPADOS .................................. 47
4.6. LA VARIANZA YLA DESVIACIÓN ESTANDAR PARA DATOS
AGRUPADOS. ....................................................................................................... 48
PARTE II ................................................................................................................ 52
PROBABILIDADES, DISTRIBUCIÓN DE PROBABILIDADES ........................ 52
5. CAPÍTULO V PROBABILIDAD, DISTRIBUCIÓN DE PROBABILIDADES 52
5.1. Experimento Aleatorio ..................................................................................... 52
5.2. Espacio muestral () ........................................................................................ 52

ii
5.3. Evento .............................................................................................................. 52
5.3.1. Eventos mutuamente excluyentes .............................................................. 52
5.3.2. Eventos no excluyentes ............................................................................. 52
5.3.3. Eventos complementarios .......................................................................... 53
5.4. DEFINICIÓN CLÁSICA DE PROBABILIDAD .............................................. 53
5.5. Propiedades de probabilidad ............................................................................. 54
5.6. Reglas de probabilidad: suma ó adición de probabilidades ................................ 54
5.7. Eventos dependientes e independientes............................................................. 55
5.8. Probabilidad condicional .................................................................................. 56
5.8.1. Definición de probabilidad condicional ..................................................... 56
5.8.2. Probabilidad conjunta: ............................................................................... 56
5.8.3. Regla de la multiplicación (ab) : para eventos independientes. ................ 57
5.8.4. Uso de Diagramas de árbol para eventos Independientes. .......................... 57
5.8.5. Regla de la multiplicación: para eventos dependientes. .............................. 57
5.8.6. Uso del Diagrama de Árbol para Eventos Dependientes. ........................... 58
6. CAPÍTULO VI DISTRIBUCIONES DE PROBABILIDADES ....................... 61
6.1. Esperanza matemática (valor esperado o promedio).......................................... 61
6.2. LA DISTRIBUCIÓN BINOMIAL ................................................................... 64
6.2.1. Fórmula de Distribución Binomial:............................................................ 64
6.2.2. Uso de las Tablas de Probabilidades Binomiales........................................ 65
6.2.3. LA DISTRIBUCIÓN POISSON ............................................................... 67
7. CAPÍTULO 7 DISTRIBUCIÓN NORMAL, DISTRIBUCIÓN DE LA MEDIA
MUESTRAL ........................................................................................................... 72
7.1. Distribución de probabilidades para variables aleatorias continuas ................... 72
7.1.1. Distribución Normal .................................................................................. 72
7.1.2. La Distribución Normal de Probabilidad.................................................... 72
7.1.3. Uso de las Tablas de Distribución Normales .............................................. 73
8. CAPÍTULO Nº 8 DISTRIBUCIÓN DE LA MEDIA MUESTRAL .................. 75
8.1. Consideraciones generales ................................................................................ 75
8.2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA .............................................. 75

8.2.1. ERROR ESTÁNDAR MUESTRAL DE LA MEDIA ( x ) S x .............. 76


8.2.2. Muestras de poblaciones finitas – factor de corrección............................... 76
8.3. DISTRIBUCIONES MUESTRALES DE PROPORCIONES ........................... 78

iii
8.3.1. Calculo de una proporción muestral de éxitos – media de las proporciones
muestrales. .............................................................................................................. 78
8.3.2. CALCULO DEL ERROR ESTÁNDAR DE LA PROPORCIÓN .............. 78
8.3.3. Teorema del límite central – distribución normal para proporciones muestrales
79
9. CAPÍTULO IX PRUEBA DE HIPÓTESIS .................................................... 82
9.1. ¿Qué es una hipótesis?...................................................................................... 82
9.2. ¿Qué es una prueba de hipótesis?...................................................................... 82
9.3. La prueba estadística de ji – cuadrada pruebas para la independencia de dos variables
categóricas (pruebas para tablas de contingencias) .................................................. 85
APENDICE I: DISTRIBUCION BINOMIAL ......................................................... 90
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 91
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 93
APENDICE II: DISTRIBUCION BINOMIAL (CONT).......................................... 93
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 94
APENDICE II: DISTRIBUCION BINOMIAL (CONT) .......................................... 95
APENDICE III: DISTRIBUCION DE POISSON ................................................... 97
APENDICE III: DISTRIBUCION DE POISSON ................................................... 98
APENDICE III: DISTRIBUCION DE POISSON (CONT) ..................................... 99
APENDICE III: DISTRIBUCION DE POISSON (CONT) ................................... 100
APENDICE III: DISTRIBUCION DE POISSON (CONT) ................................... 100
APENDICE III: DISTRIBUCION DE POISSON (CONT) ................................... 101
APENDICE IV: DISTRIBUCION NORMAL ....................................................... 103
APENDICE V DISTRIBUCION t DE STUDENT ................................................ 104
BIBLIOGRAFIA .................................................................................................. 105

iv
1. CAPÍTULO I DEFINICIONES IMPORTANTES EN LA ESTADISTICA

1.1. DEFINICIÓN DE ESTADÍSTICA

Estadística.- es la ciencia que estudia los métodos científicos en la toma, organización,


presentación y análisis de datos, para la deducción de conclusiones y/o toma decisiones
razonables.

Estadística es la ciencia que se ocupa de la creación, desarrollo y aplicación de las técnicas


que permiten hacer un análisis confiable de una población. En términos generales, se ocupa
de la colección, resumen y presentación de información, del análisis e interpretación de datos
y resultados, de modo tal que pueda evaluarse la confiabilidad y riesgos asociados a las
condiciones que se pueden derivar a partir de la información captada.
En síntesis la estadística es un conjunto de técnicas que, partiendo de la observación de
fenómenos, permiten al investigador obtener conclusiones útiles sobre ellos.

1.2. DIVISIÓN DE LA ESTADÍSTICA

Las dos grandes ramas en que se divide a la estadística son: Descriptiva e inferencial.

1.2.1. Estadística Descriptiva


Es la parte de la estadística que estudia un grupo de datos dado, sin inferir sus conclusiones a
un grupo mayor.
1.2.2. Estadística Inferencial o inductiva
Es la parte de la estadística que estudia condiciones bajo las cuales las conclusiones de la
muestra son válidas para la población, la Estadística inferencial usa el concepto de
PROBABILIDAD, que es la medida de la incertidumbre.

1.3. IMPORTANCIA DE LA ESTADÍSTICA


En las últimas décadas la estadística ha alcanzado un alto grado de desarrollo, hasta el punto
de incursionar en la totalidad de las ciencias; inclusive, en la lingüística se aplican técnicas
estadísticas para esclarecer la paternidad de un escrito o los caracteres más relevantes de un
idioma.
La estadística es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende
mejor si tenemos en cuenta que los quehaceres y decisiones diarias embargan cierto grado de
incertidumbre... y la Estadística ayuda en la incertidumbre, trabaja con ella y nos orienta para
tomar las decisiones con un determinado grado de confianza.

1.4. MÉTODO ESTADÍSTICO


El método estadístico, parte de la observación de un fenómeno, y como no puede siempre
mantener las mismas condiciones predeterminadas o a voluntad del investigador, deja que
actúen libremente, pero se registran las diferentes observaciones y se analizan sus
variaciones.
Para el planeamiento de una investigación, por norma general, se siguen las siguientes
etapas:

1
 Planteamiento del problema.
 Fijación de los objetivos.
 Formulación de la hipótesis.
 Definición de la unidad de observación y de la unidad de medida.
 Determinación de la población y de la muestra.
 La recolección.
 Crítica, clasificación y ordenación.
 Tabulación.
 Presentación.
 Análisis.
 Publicación.

1.4.1. Planteamiento del problema


Al abordar una investigación se debe tener bien definido qué se va a investigar y por qué se
pretende estudiar algo. Es decir, se debe establecer una delimitación clara, concreta e
inteligible sobre el o los fenómenos que se pretenden estudiar, para lo cual se deben tener en
cuenta, entre otras cosas, la revisión bibliográfica del tema, para ver su accesibilidad y
consultar los resultados obtenidos por investigaciones similares, someter nuestras
proposiciones básicas a un análisis lógico; es decir, se debe hacer una ubicación histórica y
teórica del problema.

1.4.2. Fijación de los objetivos


Luego de tener claro lo que se pretende investigar, Debemos presupuestar hasta dónde
queremos llegar; en otras palabras, debemos fijar cuales son nuestras metas y objetivos.
Estos deben plantearse de tal forma que no haya lugar a confusiones o ambigüedades y debe,
además, establecerse diferenciación entre lo de corto, mediano y largo plazo, así como entre
los objetivos generales y los específicos.

1.4.3. Formulación de las hipótesis


Una hipótesis es ante todo, una explicación provisional de los hechos objeto de estudio, y su
formulación depende del conocimiento que el investigador posea sobre la población
investigada. Una hipótesis estadística debe ser susceptible de docimar, esto es, debe poderse
probar para su aceptación o rechazo.
Una hipótesis que se formula acerca de un parámetro (media, proporción, varianza, etc.), con
el propósito de rechazarla, se llama Hipótesis de Nulidad y se representa por Ho; a su
hipótesis contraria se le llama Hipótesis Alternativa (H1).

1.4.4. Definición de la unidad de observación y de la unidad de medida


La Unidad de Observación, entendida como cada uno de los elementos constituyentes de la
población estudiada, debe definirse previamente, resaltando todas sus características; pues, al
fin de cuentas, es a ellas a las que se les hará la medición.
La unidad de observación puede estar constituida por uno o varios individuos u objetos y
denominarse respectivamente simple o compleja.
El criterio sobre la unidad de medición debe ser previamente definido y unificado por todo el
equipo de investigación. Si se trata de medidas de longitud, volumen, peso, etc., debe

2
establecerse bajo qué unidad se tomarán las observaciones ya sea en metros, pulgadas, libras,
kilogramos, etc.
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las
cuales se ha de efectuar la toma de la información.

1.4.5. Variables estadísticas


Se denomina variable estadística a una característica definida en la población por la tarea o
investigación estadística, que puede tomar dos o más valores (cualidades o números).
Se representa por una letra del alfabeto. Por ejemplo, en la población constituida por los
empleados de la universidad, algunas variables estadísticas definidas en ésta población son:
X: "sexo". Valores: Masculino, Femenino
Y: "estado civil". Valores: Soltero, casado, viudo, divorciado
La variable es una característica de la población que se va a investigar y puede tomar
diferentes valores. Se clasifican en: cualitativas y cuantitativas.
 La afiliación política de los paceños: MNR, UN, PDC, MAS, otro.
 La situación de trabajo de los sucrences: desempleo, tiempo parcial,
tiempo completo.
 Número de periódicos que compran los lectores de prensa diaria de Santa Cruz
 Gastos municipales

Variable Cualitativa

Se denomina así cuando está asociada a una característica cualitativa que toma niveles de
valorización.
 Número de periódicos que compran los lectores de prensa diaria de Santa Cruz
 Gastos municipales

Variable Cuantitativa

Se llama así cuando está asociada a una característica cuantitativa. Estas variables se dividen
en discretas y continúas.
 La afiliación política de los paceños: MNR, UN, PDC, MAS, otro.

 La situación de trabajo de los sucrences: desempleo, tiempo parcial,


tiempo completo.

Las Variables cuantitativas pueden ser discretas o continuas

Variable Discreta

Se dice que una variable es discreta si sólo asume valores enteros o mejor dicho que varían
de uno en uno, Ejm: El número de miembros de una familia o el número de personas que
habitan la casa; el número de alumnos aprobados en una asignatura.

Variable Continua

3
Una variable es continua cuando puede tomar cualquier valor dentro de un intervalo,
dependiendo éste principalmente de la precisión con que se trabaje. Por Ejm: La talla de los
individuos medida con la precisión de un centímetro y expresada en metros: 1,69 m; 1,74 m;
etc.

1.4.6. Determinación de la población y de la muestra


Estadísticamente, la población se define como un conjunto de individuos o de objetos que
poseen una o varias características comunes. No se refiere esta definición únicamente a los
seres vivientes; una población puede estar constituida por los habitantes de un país o por los
peces de un estanque, así como por los establecimientos comerciales de un barrio o las
unidades de vivienda de una ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aquí el
término infinito no está siendo tomado con el rigor semántico de la palabra; por ejemplo, los
peces dentro de un estanque son un conjunto finito; sin embargo, en términos estadísticos,
puede ser considerado como infinito.
Muestra es un subconjunto de la población a la cual se le efectúa la medición con el fin de
estudiar las propiedades del conjunto del cual es obtenida.
.
1.4.7. Recolección
Una de las etapas más importantes de la investigación es la recolección de la información, la
cual ha de partir, a menos que se tenga experiencia con muestras análogas, de una o varias
muestras piloto en las cuales se pondrán a prueba los cuestionarios y se obtendrá una
aproximación de la variabilidad de la población, con el fin de calcular el tamaño exacto de la
muestra que conduzca a una estimación de los parámetros con la precisión establecida.
El establecimiento de las fuentes y cauces de información, así como la cantidad y
complejidad de las preguntas, de acuerdo con los objetivos de la investigación son
decisiones que se han de tomar teniendo en cuenta la disponibilidad de los recursos
financieros, humanos y de tiempo y las limitaciones que se tengan en la zona geográfica, el
grado de desarrollo, la ausencia de técnica, etc.
Los especialistas en estadística seleccionan sus observaciones de manera que todos los
grupos relevantes estén representados en los datos. Para determinar el mercado potencial de
un nuevo producto, por ejemplo, los analistas podrían estudiar cien consumidores de cierta
área geográfica. Dichos analistas deben tener la certeza de que este grupo incluya personas
que representan distintas variables como nivel de ingresos, raza, nivel educativo y
vecindario.
Los datos pueden provenir de observaciones reales o de registros elaborados con otros
propósitos. Por ejemplo, con fines de facturación e informes médicos, un hospital registra el
número de pacientes que utilizan los servicios de rayos X. Esta información puede
organizarse para producir datos que los especialistas en estadística puedan describir e
interpretar.
Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones
razonadas acerca de las causas y, por tanto, de los efectos probables de ciertas características
en situaciones dadas.
El conocimiento de tendencias derivado de la experiencia previa puede, también, permitir a
los ciudadanos conscientes anticipar resultados posibles y actuar en consecuencia. Una
investigación de mercado puede revelar que determinado producto es preferido por amas de

4
casa de origen afroamericano de las comunidades suburbanas, con ingresos y educación
promedios. Los textos publicitarios del producto deberán, por tanto, estar dirigidos a esta
audiencia. Y si los registros del hospital muestran que un número mayor de pacientes ha
utilizado el aparato de rayos X en junio que en enero, el departamento de personal del
hospital deberá determinar si esto sucedió sólo ese año o es indicativo de una tendencia y, tal
vez, debería ajustar su programa de contratación y asignación de vacaciones de acuerdo con
la información.
Cuando los datos se ordenan de manera compacta y útil, los responsables de tomar
decisiones pueden obtener información confiable sobre el entorno y usarla para tomar
decisiones inteligentes.
En la actualidad, las computadoras permiten a los especialistas en estadística recolectar
enormes volúmenes de observaciones y comprimirlas en tablas, gráficas y cifras
instantáneamente.
Los administradores deben tener mucho cuidado y cerciorarse que los datos empleados estén
basados en suposiciones e interpretaciones correctas. Antes de depositar nuestra confianza en
cualquier conjunto de datos interpretados, vengan de una computadora o no, póngalos a
prueba mediante las siguientes preguntas:-

Ejemplos de recolección de Datos

Ejemplo Nº 1.21.

Corresponde a una muestra de 30 familias sobre el número de hijos por familia:


A = {1,2,5,3,4,2,0,5,3,2,4,2,1,0,3,2,1,0,3,2,1,0,1,3,5,6,2, 5,4,2,}

Generalizando:
A = {x1, x2, x3, .................. xi .................., xn }

En este caso se tiene que n = 30. Tamaño de la muestra.

Ejemplo Nº 1.2.
Corresponde a una muestra de 100 observaciones sobre las tallas de los alumnos, expresada
en metros:

B=
1,60 1,70 1,55 1,68 1,72 1,70 1,63 1,76 1,54 1,71
1,78 1,74 1,65 1,63 1,55 1,68 1,69 1,74 1,80 1,66
1,65 1,69 1,59 1,68 1,70 1,73 1,74 1,76 1,75 1,69
1,78 1,77 1,69 1,71 1,70 1,75 1,76 1,77 1,68 1,64
1,69 1,70 1,71 1,76 1,71 1,72 1,74 1,69 1,58 1,59
1,60 1,63 1,64 1,65 1,68 1,70 1,70 1,72 1,75 1,58
1,71 1,75 1,74 1,71 1,70 1,69 1,68 1,73 1,72 1,74
1,71 1,70 1,72 1,79 1,78 1,82 1,80 1,79 1,71 1,71
1,70 1,72 1,76 1,75 1,70 1,71 1,69 1,68 1,60 1,62
1,59 1,58 1,61 1,65 1,69 1,71 1,75 1,74 1,70 1,78

5
En este caso n = 100. Tamaño de la muestra.

1.4.8. Critica, clasificación y ordenación


Después de haber reunido toda la información pertinente, se necesita la depuración de los
datos recogidos. Para hacer la crítica de una información, es fundamental el conocimiento de
la población por parte de quien depura para poder detectar falsedades en las respuestas,
incomprensión a las preguntas, respuestas al margen, amén de todas las posibles causas de
nulidad de una pregunta o nulidad de todo un cuestionario.
Separado el material de "desecho" con la información depurada se procede a establecer las
clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los
cruces necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de
tabulación de las diferentes variables que intervienen en la investigación.
El avance tecnológico y la popularización de los computadores hacen que estas tareas,
manualmente dispendiosas, puedan ser realizadas en corto tiempo.

1.4.9. Tabulación
Una tabla es un resumen de información respecto a una o más variables, que ofrece claridad
al lector sobre lo que se pretende describir; para su fácil interpretación una tabla debe tener
por lo menos: Un título adecuado el cual debe ser claro y conciso. La Tabla propiamente
dicha con los correspondientes subtítulos internos y la cuantificación de los diferentes ítems
de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones especiales
de la tabla, u otorguen los créditos a la fuente de la información.

1.4.10. Presentación
Una información estadística adquiere más claridad cuando se presenta en la forma
adecuada. Los cuadros, tablas y gráficos facilitan el análisis, pero se debe tener cuidado con
las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar un
informe con tablas y gráficos redundantes que, antes que claridad, crean confusión.
Además la elección de determinada tabla o gráfico para mostrar los resultados, debe hacerse
no sólo en función de las variables que relaciona, sino del lector a quien va dirigido el
informe.

1.4.11. Análisis
La técnica estadística ofrece métodos y procedimientos objetivos que convierten las
especulaciones de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y
ofrecer una premisa medible en la toma de una decisión.
Es el análisis donde se cristaliza la investigación. Esta es la fase de la determinación de los
parámetros y estadísticos muéstrales para las estimaciones e inferencias respecto a la
población, el ajuste de modelos y las pruebas de las hipótesis planteadas, con el fin de
establecer y redactar las conclusiones definitivas.

1.4.12. Publicación
Toda conclusión es digna de ser comunicada a un auditorio. Es más, hay otros estudiosos del
mismo problema a quienes se les puede aportar información, conocimientos y otros puntos
de vista acerca de él.

6
Práctica Nº 1
1. ¿Por qué se considera importante la estadística?
2. Enuncie las ramas en las que se divide la estadística y establezca su campo de acción.
3. Enumere las etapas del método estadístico.
4. ¿Por qué es importante la revisión bibliográfica en el desarrollo de una investigación
5. estadística?.
6. ¿Qué es la hipótesis nula?.
7. Defina: Población, Muestra, Censo y Muestreo.
8. ¿Por qué usualmente se recurre al análisis a través de muestras y no de poblaciones?.
9. ¿Para qué se utiliza un muestreo piloto?.
10. ¿Con qué fin se critica una información?
11. ¿Cuáles son los componentes de una tabla?

2. CAPÍTULO II. ORDENAMIENTO DE DATOS EN ARREGLOS DE DATOS Y


DISTRIBUCIONES DE FRECUENCIAS
Después de recoger toda la información correspondiente a la investigación estamos en
presencia de un cúmulo de datos y cifras desordenadas los cuales, al ser tomados como
observaciones individuales, dicen muy poco sobre la población estudiada; es, entonces, tarea
del investigador “hacer hablar las cifras”, comenzando por la clasificación y ordenación,
consignando la información en tablas inteligibles que denominamos distribuciones de
frecuencias.
Una ordenación de datos es una de las formas más sencillas de presentarlos: organiza los
valores en orden ascendente o descendente. La ordenación de datos ofrece varias ventajas
con respecto a los datos sin procesar:

A pesar de las ventajas, en algunas ocasiones un ordenamiento de datos no resulta útil, es


decir, una lista de todos los valores, es una forma incómoda de mostrar grandes cantidades de
datos. Por lo que suele ser necesario comprimir la información sin que pierda su utilidad para
la interpretación y la toma de decisiones en una distribución de frecuencias como la mejor
forma de organizar los datos.

2.1. Distribución de frecuencias


Es distribuir los datos en clases, determinando el número de datos pertenecientes a cada
clase, denominado frecuencia de clase (f).
Una distribución de frecuencias muestra el número de observaciones del conjunto de datos
que caen en cada una de las clases. Si se puede determinar la frecuencia con la que se
presentan los valores en cada clase de un conjunto de datos, se puede construir una
distribución de frecuencias.

7
2.1.1. Distribución de frecuencias: Variable cualitativa
Supongamos que en una muestra de n unidades estadísticas se observan k categorías o
modalidades diferentes C1,C 2 ,—,Ck, de alguna variable cualitativa X.
La tabulación de estos n datos, es la distribución de frecuencias por categorías..

La frecuencia absoluta f, es el número de datos observados en cada categoría o modalidad.


La suma de todas las frecuencias absolutas es igual al total n de datos observados.
La frecuencia relativa h, se define en cada categoría por h¡ = fi/n . La suma de todas las
frecuencias relativas es igual a uno.

Categorías de la Frecuencias Frecuencias Frecuencias


variable Xi absolutas simples relativas simples Porcentajes pj
fj hj
C1 f1 h1 p1
C2 f2 h2 p2
…. ..

Ck fk hk. pk
Total n 1.00 100

Gráfica.
Existe una gran variedad de gráficas para la distribución de frecuencias de variable
cualitativa, las más comunes son la de barras y la de sectores circulares.
En una gráfica de barras los datos de cada una de las modalidades C se representan por una
barra rectangular vertical (u horizontal), cuya altura (o largo) es proporcional a su frecuencia.
Las barras se dibujan dejando un espacio entre ellas.
Si la escala es nominal las categorías pueden ser colocadas en cualquier orden. Pero, si el
nivel es ordinal las categorías deben ir ordenadas
En una gráfica circular, los datos de cada categoría C, se representan por un sector circular
cuyo ángulo en el centro es igual a 360°.
Si la gráfica por sectores circulares es tridimensional es denominada de torta

Ejemplo 2.1.
En una encuesta de opinión acerca de las preferencias de Partido Político en las elecciones
Nacionales se obtuvieron las siguientes respuestas:

8
Frecuencia Frecuencia Relativa
Partido Político (fi) (hi) Porcentaje (pi)
FV 20 0,29 28,57
MAS 23 0,33 32,86
Otros 5 0,07 7,14
PDC 15 0,21 21,43
UN 7 0,10 10,00
Total general 70 1,00 100,00

Frecuencia (fi)
25 23
20
20
15
15

10
7
5
5

0
FV MAS Otros PDC UN

El gráfico es la representación mediante gráfica de sectores circulares del cuadro 1.2. La


frecuencia 29% es equivalente a 0,29 x 360°= 104.4°, la frecuencia 33% es equivalente a
0.33 x 360°= 118.8°, la frecuencia 7% es equivalente a 0.07x 360°= 25.2°, la frecuencia
21.4% es equivalente a 0.214x 360°= 77.04° y la frecuencia 10% es equivalente a 0.10 x 360
° = 36°

9
Porcentaje (pi)
10,0%

28,6% FV
21,4% MAS
Otros
PDC
7,1% UN

32,9%

Resultados encuesta trabajadoras del hogar de Bolivia


sobre su sindicato
El Sindicato se interesa por conocer tus
reclamos
Frecuencia Porcentaje
Siempre 9 16,4
A veces 8 14,5
Nunca 16 29,1
No sabe 22 40,0
Total 55 100,0

10
Resultados encuesta percepción sobre trabajo concejales
Municipio Copacabana
8. ¿Cómo calificaría usted, el trabajo que desarrollan los
Concejales Municipales? (sólo una opción)
Frecuencia Porcentaje
No conozco el trabajo 1 5,0
de los concejales
Hace un mal trabajo 1 5,0
Hace un trabajo 13 65,0
regular
Hace un buen trabajo 5 25,0
Total 20 100,0

Encuesta sobre Policía Comunitaria. Gobierno municipal de La Paz.


Macrodistrito Zona de control. Miraflores, Villa Pabón, Casco Urbano Central,
Villa Pabón I

¿Usted cree que en el último año han aumentado o han disminuido los
delitos en su zona como ser…?Una agresión o intento de agresión por parte
de una pandilla

Frecuencia Porcentaje
NS/NR 10 5,0
Ha aumentado 93 46,5
Sigue igual 76 38,0
Ha disminuido 21 10,5
Total 200 100,0

2.1.2. Distribución de frecuencias: Variable cuantitativa discreta


Suponga que se han recolectado n valores de alguna variable discreta X. El procedimiento
más simple de organizar estos n datos, consiste en ordenar estos valores numéricos en forma
ascendente.
Si todos los n datos son distintos entre si, se obtendrá una distribución de frecuencias de n
valores de la variable X, donde cada uno de estos valores tienen frecuencia absoluta igual a
uno.
Si algunos valores se repiten, y si al terminar el ordenamiento se obtienen k ( k < n ) valores
distintos de X, digamos, Jt,, x 2 ,...,x k , con frecuencias absolutas respectivas f1, f 2,… f k ,
la distribución de frecuencias de estos n datos

11
Valores de la Frecuencias Frecuencias Frecuencias
variable Xi absolutas simples relativas simples Porcentajes pj
fj hj
x1 f1 h1 p1
x2 f2 h2 p2
…. ..

xk fk hk. pk
Total n 1.00 100

Las frecuencias absolutas relativas y porcentajes poseen, en el caso de variable discreta y


continua, el mismo significado y propiedades, que en el caso de la variable cualitativa.
La representación gráfica más común de una distribución de frecuencias de variable discreta
es del tipo bastón que consiste en trazar en cada valor distinto de
la variable, segmentos de recta proporcionales a su frecuencia. También, se pueden usar
barras rectangulares para graficar una distribución de frecuencias de variable discreta.

Ejemplo 2.2.
Ante la pregunta del número de hijos por familia (variable X) una muestra de 20 hogares,
marcó las siguientes respuestas

2. 1.2. 4. 1.3. 2. 3. 2. 0. 3, 2. 1,3. 2, 3, 3. 1,2, 4.

Al ordenar estos datos en forma ascendente, se obtienen cinco valores distintos 0, 1, 2, 3, 4


que se repiten respectivamente 1, 4, 7, 6, 2 veces. La distribución de frecuencias de X es:

Número de
hijos (xi) Frecuencia (fi) Frecuencia Relativa (hi) Porcentaje (pi)
0 1 0,05 5
1 4 0,2 20
2 7 0,35 35
3 6 0,3 30
4 2 0,1 10
20 1 100

12
Frecuencia absoluta y relativa
8 0,4
7 0,35
6 0,3
5 0,25
4 0,2
3 0,15
2 0,1
1 0,05
0 0
0 1 2 3 4

Frecuencia (fi) Frecuencia Relativa (hi)

2.1.3. Distribución de frecuencias por intervalos


Usualmente los valores de los datos no permiten un agrupamiento de ellos en una tabla de
frecuencias simple, debido a que se encuentran distribuidos a través de todo el recorrido y el
número de veces que se repite cada observación no es significativo en todos los casos, y en la
mayoría de ellos su frecuencia es baja. Una tabla de frecuencias construida en estas
condiciones, no presenta ninguna utilidad

La distribución de frecuencias por intervalos o clases se usa cuando la variable estadística es


continua o cuando el número de valores distintos de una variable discreta es muy grande
(más de 2 0 líneas en el monitor de una computadora) Esta distribución se obtiene dividiendo
el ran g o de variación de los datos en k intervalos y determinando el número de datos que
contiene cada intervalo.
2.1.4. Construcción de la distribución de frecuencias
Dados n valores de alguna variable cuantitativa X continua (o discreta con más de 20 valores
distintos) uno de los métodos para construir la distribución de frecuencias es:
1. Determinar el rango (R) de variación de los datos que se define por
R = Xmax – Xmin donde Xmax es el dato máximo y Xmin es el dato mínimo.
2. Determinar el número de intervalos, k, teniendo en base al siguiente criterio: Un valor aproximado del número de
intervalos, k, nos proporciona la regla de Sturqcs, donde,
k = 1 + 3.31og(n), n > 10, redondeado el número al entero inmediato mayor.
3. Determinar la amplitud A del intervalo, dividiendo el rango entre el número de intervalos. Esto es,
A=R/k.
Si la división A = R /k no es exacta en el número de decimales de los datos, entonces, el número A se aproxima por
exceso de manera que se cubra todo el rango, esto es. de manera que kA > R .
Si los datos son enteros, A es entero, si los datos tienen un decimal, A tiene un decimal, etc. Por ejemplo, si los datos
tienen dos decimales y si R / k =5.3416, se elige A = 5.35. (no 5.34).
4. Determinar los extremos de los intervalos de la siguiente manera:
I1 = [ X m¡n. X min + A l
I2 = [ X min + A, X min + 2 Al
I3 = [ X min + 2A, Xmin+ 3/l[
Ik = [ Xmin + /K – 1)A, Xmin + k A ]
Observe que se cierra por la derecha el último intervalo. Esto se debe a que
si la división R/k es exacta en el número de decimales de los datos, entonces,
X max = X mn + k A .

13
2.1.5. Marca de clases. (x)

Es el punto medio del intervalo de clase. Se obtiene como la semi- suma de los límites de clases.
los datos de cada clase se consideran que coincide con su correspondiente marca de clases.

Ejemplo Nº 2.3.
Sean las alturas en cm. De 40 alumnos

138 164 150 132 144 125 149 157 146 158

140 147 136 148 152 144 168 126 138 176

163 119 154 165 146 173 142 147 135 153

140 135 161 145 135 142 150 156 145 128

1.- R= 176 – 119 = 57


2.- k = Nº de clases = √N = √ 40 = 6.3 = 6 ;
Amplitud A =

Para facilitar la construcción de la tabla de frecuencias, por comodidad de cálculo se eligió el


tamaño del intervalo de 10.

3.-

Clases Conteo Frecuencia x fR fA fAR


(f)Nº niños

118 -127 III 3 122.5 7.5 % 3 7.5%


128 - 137 IIIII I 6 132.5 15.0% 9 22.5%
138 - 147 IIIII IIIII 14 142.5 35.0% 23 57.5%
IIII
184 - 157 IIIII IIII 9 152.5 22.0% 32 50.0%
158 – 167 IIIII 5 162.5 12.5% 37 92.5%
168 - 177 III 3 172.5 7.5% 40 100.0%
Nº 40 100.0%
2.1.6. Histograma, polígonos y curvas de frecuencia

Histograma: rectángulos de bases en el eje x , sus centros coinciden con los marcas de clases y de
longitud igual , cada altura igual a su frecuencia f

Polígonos Frecuencia: Se obtiene uniendo los puntos medios de las bases superiores

14
de los rectángulos del histograma y dos mascas de clases inferior y superior de frecuencia cero.

Curvas de frecuencia: se obtiene suavizando los vértices de polígonos de frecuencia


Frecuencia relativas (fR): fR = __f__ x 100 %
N
Frecuencia Acumulada (FA): FA = f1 + f2 +…………….fn
Frecuencia Acumulada Relativa (FAR): FAR =__ f A __ x 100 %

Histograma y Polígono de Frecuencias


f
15

12

112,5 122,5 132,5 142,5 152,5 162,5 172,5

Ejemplo Nº 2.4.

La tabla de distribución de frecuencias correspondiente al ejemplo Nro. 2 es el siguiente:

Después de realizar el conteo y hallado la frecuencia por intervalo el cálculo del Nro de
intervalos (K): Por la regla de Sturges.

Para n = 100

k = 1 + 3,332 log n
k = 1 + 3,332 log 100
k = 7,7

Consideramos el valor:

k =7
q1 = 1.54
q2 = 1.82
q2 – q1
c = k
1,82 – 1,54
15
c = 7 = 0,04,

Con estos datos se construye la tabla de frecuencias siguiente

Clases Frecuencia
Marcas Conteo
(Estaturas f
1,56 [1,54 – 1,58] IIIII I 6
1,60 (1,58 – 1,62] IIIII III 8
1,64 (1,62 – 1,66] IIIII IIIII 10
1,68 (1,66 – 1,70] IIIII IIIIIIIIIIIIIIIIIIII III 28
1,72 (1,70 – 1,74] IIIII IIIIIIIIIIIIIIIIIIII I 26
1,76 (1,74 – 1,78] IIIII IIIIIIIIII II 17
1,80 (1,78 – 1,82] IIIII 5

Gráfica de Frecuencias f= 100


. Histograma y Polígono de Frecuencias

Histograma de Frecuencias

28
FA 30
rl
e u 25
cm 20 17
u n
e o 15
n s 10
10 8
c 6 5
i
a 5
s

1,56 1,60 1,64 1,68 1,72 1,76 1,80


Marcas de clase(Estaturas)
16
Ejemplo 2.5
Edad de encuestados MACRODISTRITO MAX PAREDES
Encuesta de percepciones sobre la Policía Comunitaria

Edad (%)
17,3%
15,7%
13,6% 12,6% 12,0%
9,2% 10,2%
8,6%

0,8%

15 - 21 22 - 28 29 - 35 36 - 42 43 - 49 50 - 56 57 - 63 64 - 70 70 - 77

2.1.7. Distribución de Frecuencias Acumuladas Absolutas y Relativas.

Frecuencias Acumuladas Absolutas (FA).

Es la frecuencia total de todos los valores menores o iguales al límite superior del
intervalo de clase respectivo, se obtiene sumando las frecuencias absolutas
correspondientes a los intervalos inferiores.

Ejemplo Nº 3: En la muestra de Ejm. Nro. 2, la frecuencia absoluta acumulada hasta la


tercera clase (FA ) será:

FA3 = f1 + f2 + f3

FA = f1 + f2 + f3 + .............. + fn

Reemplazando con los valores del ejemplo:


17
FA3 = 6 + 8 + 10 = 24

FA3 = 24

Interpretación:

Existen 24 observaciones cuyos estaturas son menores o iguales a 1.66 m.

Frecuencias Acumuladas Relativas ( FAR )

Es la frecuencia relativa total de todos los valores menores o iguales al límite superior
del intervalo de clase respectivo, se obtiene sumando las frecuencias relativas
siguientes a los intervalos inferiores.

Ejemplo Nº 2.6.

En la muestra del Ejm Nro. 2, la frecuencia relativa acumulada hasta la cuarta clase
(FAR4) será:

FAR4= fR1 + fR2 + fR3 + fR4

Generalizando:

FAR= fRt = fR1 + fR2 + fR3+ ..............+ fRk

Reemplazando con los valores del ejemplo:

FAR4 = 0,06 + 0,08 + 0,10 + 0,28 = 0,52

FAR4 = 0,52

Interpretación:

Al multiplicar por 100 para obtener la respuesta en %:


Significa que el 52 % de observaciones tienen estaturas menor o igual 1,70 m.

Gráfica de las Frecuencias Acumuladas, Ojiva.

La gráfica que muestra las frecuencias acumuladas “mayor que” o las que son “menor o igual
que” toman el nombre de Polígono de Frecuencias Acumuladas u Ojivas.
Ejemplo Nº 2.6.
Presentaremos las frecuencias acumuladas a partir de la muestra del Ejm. Nro 2.

18
x Clases(estaturas) fi fR FA FAR
1.56 [1.54 – 1.58] 6 0.06 ; 6% 6 0.06 ; 6%
1.60 (1.58 – 1.62] 8 0.08 : 8% 14 0.14 ; 14%
1.64 (1.62 – 1.66] 10 0.10 ; 10% 24 0.24 ; 24%
1.68 (1.66 – 1.70] 28 0.28 ; 20% 52 0.52 ; 52%
1.72 (1.70 – 1.74] 26 0.26 ; 26% 78 0.78 ; 78%
1.76 (1.74 – 1.78] 17 0.17 ; 17% 95 0.95 ; 95%
1.80 (1.78 – 1.82] 5 0.05 ; 5% 100 1.00 ;100%

n = 100 f R =1ó100%

Ejemplo Nº 2.6.
Se entrevistaron a 81 familias en una comunidad, donde se les pregunto:
¿Cuál es el gasto diario en transporte?, dando los siguientes resultados:
Las marca de clase correspondientes son 3,6,9,12,15 además n2 = 10 ; n4 = 22; h1 = 0,06172839
H3 = 0,432097
Reconstruya la tabla

81 familias
Xi ni Ni hi Hi
3 5 5 0.0617283 0.0617283
6 10 15 0.1234567 0.185185
9 20 35 0.2469135 0.432097
12 22 57 0.2716046 0.7037036
15 24 81 0.2962962 1
81 1

H3 = N3 h1 = n1
N n
0.432097 = N3 0.0617283 = n1
81 81
N3 =35 n1 = 5
Gráfica de Frecuencias Acumuladas Ojiva

FA
100 100 100
94 95
86
80
76 78

“Menor oigual”
60

19
52
48
40

24 “Mayor que”
20 22
14
6 5

1,54 1,58 1,62 1,66 1,70 1,74 1,78 1,82

Intervalos de clase
Ejemplo Nº 2.7.
El auxiliar de docencia muy divertido, pierde los exámenes de estadística. Pero recuerda que las
120 notas tenían una distribución simétrica con 7 intervalos de clases de amplitud constante.
Además en sus archivos encuentra la siguiente información:
h1 = 0.05, h3 = 0,15 H3* = 0.85 x4 = 72 x3+x4+ x5 +x6+x7 = 400
Donde xi = marca de clase
Hi* = Frecuencia relativa acumulada “mayor o igual que”
a. Reconstruya la tabla de distribución de frecuencias
b. Si para aprobar en examen se necesita obtener por lo menos 70 puntos ¿Cuántos
desaprobaron dicho examen?
n = 120

Li – Ls Xi ni Ni Ni* hi Hi HI*
44-52 48 6 6 120 0.05 0.05 1
52-60 56 12 18 114 0.10 0.15 0.95
60-68 64 18 36 102 015 030 0.85
68-76 72 48 84 84 0.40 0.70 0.70
76-84 80 18 102 36 0.15 0.85 0.30
84-92 88 12 114 18 0.10 0.95 0.15
92-100 96 6 120 6 0.05 1 0.05

0.85+H2 = H2* n1 = 0.05. 120 N3 = 0.15.120 N3* =0.85.120


H2*+0.05 =1 n1 = 6 n3 = 18 N3* = 120

X3 + X4 + X5 + X6 + X7 = 400
X4 = 72
72 – C + 72 + 72 +C + 72 +2C +72 +3C = 400
360 + 5C = 400
5C = 400 -360
5C = 40
C=8
C–8=4
2 2
c. 44 – 69

20
Li – Ls Xi ni
44-52 → 48 6
52-60 → 56 12
60-68 → 64 18
68-69 → X
De 44 – 69 serian 6+12+18+x =
36+x
68-76 → 48 8 →48 X = 1.48
68-69 → X 1 →x 8
X=6
Desaprobaron 36+6 =42

PRÁCTICA Nº 2
Variables Discretas y Continuas

1. Se encuestó a 30 contadores sobre el número de balances presentados el año pasado y se


obtuvo la información siguiente.

614627245686532
525756146459236
Organizar los datos en un cuadro de distribución de frecuencias.
2. Construya una tabla de frecuencias para los datos siguientes, correspondiente al número de
faltas a clases en el primer semestre del 2005 para estudiantes del curso de Economía.

9 8 7 8 4 3
2 1 0 5 3 2
1 1 7 3 2 8
7 6 6 4 3 2
2 0 9 4 6 9
6 9 4 3 5 7
3 2 1 4 4 2

3. Un conjunto de datos tiene 100 observaciones, de las cuales la mayor es 212 y la menor 42.
Suponga que desea una tabla de frecuencias con siete clases.

a) ¿Cuál es el intervalo de clase?

b) ¿Cuál es la marca de la primera clase si el límite inferior se fija en 40?.

4. El Profesor Rojas puso un examen final consistente en 100 preguntas a su grupo de Estadistica
I, los datos siguientes representan el número de respuestas correctas en cada examen,
constrúyase una tabla de frecuencias agrupadas con 5 clases para que, el profesor Rojas pueda
analizar los resultados.

21
17 15 78 21 10 32 7 65 18 87
4 22 34 42 9 9 82 79 98 4
44 65 62 77 81 81 45 37 83 44
77 13 41 16 13 13 82 37 5 54
7 67 88 41 22 22 92 16 67 85
Distribución de Frecuencias, Intervalos de Clase y Métodos Gráficos.

5. Los siguientes datos constituyen las vidas útiles, en horas de una muestra aleatoria de 60
bombillas de luz de 100 watts.

Vida útil de 60 bombillas de luz.

807 811 620 650 817 732 747 823 844 907
660 753 1050 918 857 867 675 880 878 890
881 872 869 841 847 833 829 827 822 811
766 787 923 792 803 933 947 717 817 753
1056 1076 958 970 776 828 831 781 1088 1082
832 863 852 788 980 889 1030 897 755 891

a) Constrúyase una distribución de frecuencias con anchos de clases iguales.


b) Trazar el histograma y polígono de frecuencias.
c) Trazar el Ojiva correspondiente “mayor que” y “menor que”.
d) Hallar la frecuencia Acumulada Relativa (Hi) de la cuarta y sexta clase, interprete su respuesta.
e) Hallar la frecuencia Acumulada Absoluta y Relativa “mayor que” de la primera y segunda
clase, interprete su respuesta.

6. Las siguientes observaciones son los tiempos (en minutos) que tardan 30 estudiantes en
terminar su primer examen de matemáticas financieras.

42,3 67,7 53,3 63,9 70,1


70,0 52,6 61,9 41,7 39,2
37,2 63,2 45,7 38,9 68,3
69,2 39,2 42,7 52,4 52,5
41,9 58,9 69,1 68,3 64,9
39,2 45,5 55,5 61,2 69,8

a) Determinar el Nº de clases y el intervalo respectivo.


b) Construir la tabla de frecuencias. Marcar el recuento de las observaciones y registrar la
frecuencia de c/clase.
c) Construir una distribución de frecuencias acumuladas menor o igual, mayor que.
d) Construir una distribución de frecuencias relativas acumuladas menor o igual, mayor que.
e) Construir un histograma, un polígono de frecuencias una Ojiva. Con los datos de tiempos
invertidos por los estudiantes del problema.

7. Los pesos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
P eso [ 50, 60 ) [ 60, 70) [ 70, 80) [ 80, 90) [ 90, 100) [ 100, 110) [ 110, 120)

22
fi 8 10 16 14 10 5 2

a . C o ns tr ui r l a t a bl a de f r e c u e n ci a s .
b. R e pr e s e n ta r el h is t o gr a m a y e l po lí go n o de f r e c u e n c i as .

8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen
de Física.
3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39,
44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48,
15, 32, 13.
a . C o ns tr ui r l a t a bl a de f r e c u e n ci a s .
b. D i bu j a r e l hi s t o gr am a y e l po l í go no de f r e c u e n c i a s.

3. CAPÍTULO III MEDIDAS DE TENDENCIA CENTRAL

3.1. La media aritmética


Cotidiana e inconscientemente estamos utilizando la media aritmética. Cuando por ejemplo,
decimos que un determinado fumador consume una cajetilla de cigarrillos diaria, no aseguramos
que diariamente deba consumir exactamente los 20 cigarrillos que contiene un paquete sino que
es el resultado de la observación, es decir, dicho sujeto puede consumir 18, un día; 19 otro; 20,
21, 22; pero según nuestro criterio, el número de unidades estará alrededor de 20.
Matemáticamente, la media aritmética se define como la suma de los valores observados dividida
entre el número de observaciones.

De un conjunto de datos numéricos es la suma de todas las observaciones del conjunto, dividida
entre el número de observaciones.

Simbología.-Fórmulas.
Dependiendo de la información disponible ( poblacional o muestral) se puede tener:
3.1.1. Media o promedio poblacional (µ):

N
µ= 1
N 
i=1
xi
Xi =..............................
N
(2.1)

Media o promedio muestral ( X ):

n
x= 1
n  xi
Xi =..............................
n
(2.2)
23
i=1

Dónde: Xi = Valor de la i – enésima observación de la variable (suma de todos los datos)

N = Tamaño de la población (Nro. De datos)

n = Tamaño de la muestra (Nro. De datos)

Propiedades:

1. La Media aritmética es un valor representativo debido a que es el centro de gravedad o punto


de equilibrio de un conjunto de observaciones.

2. Si se sustituye el valor de cada observación por el valor del Promedio Aritmético no varía la
suma de todas las observaciones.

3. La suma de las desviaciones de las observaciones con respecto al promedio aritmético es igual
a cero.

4. Si cada observación de una muestra se le suma una constante el promedio de las nuevas
observaciones será igual al promedio de la muestra original más la constante.

5. Si a cada observación de una muestra se le multiplica por una constante, el promedio de las
nuevas observaciones será igual al promedio de la muestra original multiplicada por la constante.
Ejemplo Nº 3.1.
Cantidad de cigarrillos consumidos por un fumador en una semana.
Lunes: 18
Martes: 21
Miércoles: 22
Jueves: 21
Viernes: 20
Sábado: 19
Domingo: 19
Entonces la media aritmética es.


x= =

El fumador consume en promedio 20 cigarrillos diarios.

Ejemplo Nº 3.2.

E1: Tenemos los salarios anuales (en Bolivianos) de 7 supervisores.


34,500; 30,700; 32,900; 36,000; 34,100; 33,800; 32,500. Calcular la media (µ).

24
34,500  30,700  32,900  36,000  34,100  33,800  32,500
µ
7

µ = S/. 33,500; µ representa el salario medio anual para los miembros de esta planilla.

3.1.2. Media aritmética de datos tabulados


Media para datos tabulados de variable discreta.
Si n valores de una variable estadística discreta X se clasifican en k valores distintos x1, x2….,,
xk con
Número de hijos (xi) Frecuencia (fi) Xi*fi
0 1 0
1 4 4
2 7 14
3 6 18
4 2 8
Total 20 44

frecuencias absolutas respectivas f1, f 2,…….f k , entonces, su media aritmética es el número que
resulta de sumar de todos los valores de la variable ponderados por sus frecuencias absolutas y
divididas todo ello por el número total de observaciones

 x f i i

x
i 1

N
La media aritmética es siempre el centro de gravedad de la distribución y es siempre un valor que
entra dentro del campo de variación de la variable.
Si los datos están agrupados en intervalos se toma la marca de clase de cada intervalo para su
cálculo.

Calcular la media aritmética de la distribución del número de hijos por familia del ejemplo 3.2.
SOLUCION
La distribución de frecuencias del ejemplo 1.2 se repite en el cuadro 2.2, donde se ha incluido
una columna de productos xi*fi

 x f i i

x
i 1
=
N
3.1.3. La Media Ponderada

Fórmula:

(px)
p 25
upó X P = ....................................

dónde:

p = factor de ponderación.

x = datos

Ejemplo Nº 3.3.

E3: Una empresa comercializadora de teléfonos celulares dispone de tres vendedores, c/u. de
los cuales cobra diferente comisión por teléfono vendido y realizan diferentes números de
ventas. Calcule e interprete el valor medio de la comisión.

Vendedor Número de Telefs. Comisión por


Vendidos ( p ) Venta S/. (x)
Pedro 30 30
Juan 25 40
Pablo 20 50

30(30)  25(40)  20(50) 2900


XP  
30  25  20 75

X P = S/. 38,67

Interpretación:

Si se elige al azar un vendedor se espera que cobre una comisión de: S/. 38.67 por cada
teléfono vendido.

Ejemplo Nº 3.4.
Suponga que los costos de producción y las cantidades producidas por tres sucursales A, B
y C son:

Sucursal Costo de Producción (x) Cantidad Producida (p)


A 1,20 500
B 1,60 200
C 1,05 900

Calcular el costo de producción promedio por unidad producida.

Solución

XP = (px) = 500(1,20) + 200(1,60) + 900 (1,05) = 1865


p
500 + 200 + 900 1600

26
X P = 1,16 Bs.

Interpretación:
El costo de producción promedio por artículo, para la empresa es de 1,16 bolivianos por
cada unidad producida.

3.1.4. La Media Aritmética para datos agrupados

Los datos agrupados son datos dados en tablas de frecuencias.


Cuando se agrupan datos en una distribución de frecuencias, se utiliza el punto medio de
cada clase (xc) como aproximación de todos los valores contenidos en ella.
Fórmulas Usadas:

Media o promedio Poblacional (u)


fxi fx
u= ó en forma simple u = ................... (2.6)
f N

Media o Promedio Muestra ( X )


fxi fx
X = ó en forma simple X = ................... (2.7)
f n
dónde:

xi = x = Marca de clase (Punto medio) de cada clase.

f = frecuencia observada de valores en cada clase respectiva.

N = Nº de datos de la Población.

n = Nº de datos de la muestra.

Ambas fórmulas señalan que cada punto medio de cada clase (Xc), se multiplica por la
frecuencia de clase correspondiente (f), luego se suman estos productos () para después
dividir esta suma entre el número total de observaciones (f) representadas en la
distribución de frecuencias.

Ejemplo Nº 3.5.

E9: La distribución de frecuencias siguiente, representa los puntajes obtenidos en una


evaluación del desempeño aplicado al personal técnico de una empresa. El puntaje máximo
de la prueba es 60. Calcule e interprete en Media.

Tabla 2.1 Distribución de frecuencias de los puntajes por evaluación de 60 Técnicos.

27
Desempeño Número de Marca de (fx)
(Puntos) Técnicos (f) Clase (x)
12 – 16 4 14 56
17 – 21 8 19 152
22 – 26 15 24 360
27 – 31 23 29 667
32 – 36 10 34 340

Total 60 (fx)=1575

Solución

En la misma tabla calculamos la marca de clase (xc), es decir el valor intermedio de cada
clase ó intervalo, y (fx), obtenemos:

fx 1575
x = n = 60 = 26,25

x = 26,25

Interpretación:

Si se elige al azar un técnico se espera que tenga un puntaje de 26.25 en su evaluación de


desempeño.

Ejemplo Nº 3.6.
En la tabla siguiente se muestra una distribución de frecuencias de salarios mensuales de 100
trabajadores. Calcule e interprete la Media.

Tabla 2.2 Salarios Mensuales de 100 trabajadores

Número de Marca de
Salario Mensual (fx)
Trabajadores (f) Clase (x)
S/.2400 – 2599 7 2499,50 S/. 17496,50
2600 – 2799 20 2699,50 53990,50
2800 – 2999 33 2899,50 95683,50
3000 – 3199 25 3099,50 77487,50
3200 – 3399 11 3299,50 36294,50
3400 – 3599 4 3499,50 13998,00

Total : 100 (fx) = S/. 294950,00

28
Solución

En la misma tabla calculamos x y fx, obtenemos:


fx 2949,50
x = n = 100 = S/. 2949,50

Interpretación:

Si se elige al azar un trabajador se espera que tenga un salario mensual de S/. 2949,50.

3.2. La Mediana

La mediana de un conjunto de observaciones ordenadas de acuerdo a su magnitud, es el


valor de la observación que ocupa la posición central de dicho conjunto.

3.2.1. Características:

1. La mediana divide a un conjunto de observaciones en dos partes iguales. El 50% con


valores mayores a la mediana y el otro 50% con valores menores a la mediana.

2. Como medida de posición, la mediana es influenciada por el número de observaciones y


no por los valores de las observaciones.
3.2.2. Cálculo de la Mediana:

Para determinar la posición de la mediana se usa la siguiente fórmula:

Med = X (n/2 + ½) ..............................................(2.4)


Si n es impar.

Para un grupo con un número par de elementos, la mediana se encuentra a la mitad entre los
dos valores adyacentes al centro es decir:

Med = X (n/2) + X(n/2 + 1)


2
Si n es par.

Ejemplo Nº 3.7.
Los siguientes datos se refieren al número de clientes atendidos durante los últimos 11 días
en una tienda de artefactos. Calcule e interprete la mediana.
12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
Solución
En este caso los datos ordenados son:
5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17 y con

29
n = 11 se tiene:

Med = X (n/2 + ½) = X(11/2 + ½) = X6 = 11

Interpretación:

Durante 5 días se atendieron a menos de 11 clientes, y durante 5 días se atendieron a mas de


11 clientes.

E6: Si se tiene las observaciones: 5, 8, 7, 9, 6, 5, 4, 3. Calcular la Mediana.

Solución

En este caso los datos ordenados son:

3, 4, 5, 5, 6, 7, 8, 9 y con n = 8 se tiene:

X (n / 2)  X (n / 2  1) X (8 / 2)  X (8 / 2  1) X 4  X 5 5  6
Med      5,5
2 2 2 2
El valor de la mediana se encuentra entre los valores cuarto y quinto de este conjunto
ordenado, es decir 5 y 6 en este caso, la mediana es 5.5.

3.2.3. La Mediana Para datos agrupados

Primero, se determina la clase (intervalo) que contiene el valor de la mediana, luego


determinar el valor de la mediana dentro de la clase.

La clase que contiene la mediana es la primera cuya frecuencia acumulada iguala o excede la
mitad del total de observaciones.

Fórmula Utilizada:
N/2 - faA
Med = LI + fc
( ) i ..................................... (2,8)

Donde:

LI = Límite exacto inferior de la clase que contiene la mediana.


N = Número Total de observaciones.

faA= La frecuencia acumulada de la clase que precede (antes) a la clase que contiene la
mediana.

fc = Número de observaciones en la clase que contiene la mediana.

i = Tamaño del intervalo de clase.

30
Ejemplo Nº 3.8.
La siguiente tabla muestra el salario mensual de 100 trabajadores. Hallar la Mediana.
Tabla : Salarios Mensuales de 100 trabajadores

Salario Mensual Número de Frecuencia Acumulada (fa)


Trabajadores (f)
S/. 2400 – 2599 7 7
2600 – 2799 20 27
2800 – 2999 33 60
3000 – 3199 25 85
3200 – 3399 11 96
3400 - 3599 4 100
Total: 100
Solución
En la misma tabla calculamos (fa); la clase ó intervalo que contiene a la mediana es la que
incluye el valor N/2 = 100/2 =50. La Primera cuya frecuencia acumulada es igual o superior
a 50 es la clase que tiene los límites 2800 – 2999 ( con límite exacto inferior 2799.50).

Para hallar el valor de la mediana en esta clase:


n/2 - faA 100/2 - 27
Med = LI + fc( ) i = 2799,50 + ( 33 ) 200 =

Med = S/. 2938,89

Interpretación:

La mitad de los trabajadores gana menos o igual a S/. 2938,89 y la otra mitad de trabajadores
gana más o igual a S/. 2938,89.

3.3. Moda

3.3.1. La Moda para Datos Agrupados


Para datos agrupados en una distribución de frecuencias con intervalos de clases iguales,
para hallar la moda, primero se identifica la clase que contiene la moda determinando cuál de
ellos tiene el mayor número de observaciones, luego se aplica la fórmula de la moda.
Fórmula Utilizada:
d1
Mo = LI +d(1 + d2 ) i ............................................ (2.9)

Donde:
LI = Límite exacto inferior de la clase que contiene la moda.
d1 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase precedente.
d2 = Diferencia entre la frecuencia de la clase modal y la frecuencia de la clase siguiente.
i = Tamaño de intervalo de clase.

31
Ejemplo Nº 3.9.

Con referencia a los datos agrupados de la tabla 2.3. Hallar la moda.

Tabla : Salarios Mensuales de 100 trabajadores.

Número de
Salario Mensual Frecuencia Acumulada (fa)
Trabajadores (f)
2400 – 2599 7 7
2600 – 2799 20 27
2800 – 2999 33 60
3000 – 3199 25 85
3200 – 3399 11 96
3400 - 3599 4 100
Total: 100

Solución

La clase ó intervalo que contiene el mayor número de observaciones (frecuencia), es el que


corresponde a 2800 – 2999 (clase modal).

Para hallar el valor de la moda es esta clase:

d1 13
Mo  LI  ( )i  2799,50  ( )200  S / .2923,31
d1  d 2 13  8

Interpretación:

El salario de valor más frecuente es de S/. 2923,31

3.4. La media geométrica ( xg)

Se utiliza para calcular tasas medias de variación, como la tasa media de crecimiento
poblacional, la tasa media de inflación mensual, la tasa media de mortalidad, entre otros.

Fórmula
n
xg = x1 . x2 . x3 . x4 . .................... xn ....................... (2.17)
Donde:
x = n valores de una serie

x1, x2 ............... xn datos de la serie.

Ejemplo Nº 3.10

32
La siguiente tabla muestra la tasa de aumento en las ventas durante los últimos meses.
Calcule e interprete la tasa media mensual.

Meses Ene Feb Mar Abril Mayo


Aumento
2.6 % 5.4 % 3.8 % 0.5 % 1.4 %
de Ventas

Solución

La tasa 2.6 % también se puede expresar como 0,026 y como se refiere a un aumento a partir
de 100%, el factor de variación será 1,026 (1 representa el 100%, aumento representa >1)
para los otros datos se procede igual.

Reemplazando en la fórmula:

xg = n x1 . x2 . x3 . x4 . .................... xn ; para n = 5

5
xg = (1,026) (1,054) (1,038) (1,005) (1,014)

5
xg = 1,14390337

xg = 1,02725 (factor de Crecimiento o Medio)

Tasa Media de Variación = (Xg – 1) 100

= (1,02725 – 1)x 100 = 2,72 %

Interpretación:

Si se selecciona al azar un mes entre Enero y Mayo, se espera que las ventas se hayan
incrementado 2.72% con respecto al mes anterior.

3.5. La Media Armónica (Xh)

Se utiliza para calcular el tiempo medio, velocidad y aceleración media, como el tiempo
medio para realizar un proceso productivo.

Fórmula:
1 ............................................ (2.18)
Xh 
1/ x
n

33
Donde:

xh = media armónica

n = n valores de una serie

1/xi = Suma de todos los datos a la inversa.

Ejemplo Nº 3.11.

Los siguientes datos registran el tiempo medio que utilizan 4 clientes al realizar una compra
de un artefacto doméstico. Calcule e interprete el tiempo medio.

Cliente A B C D
Tiempo
(Minutos) 45 38 52 40

SOLUCIÓN

Para n = 4
Reemplazando en la fórmula

4 4 x88920
Xh  
1

1

1

1 1976  2340  1710  2223
45 38 52 40

X h = 43,117953 min.

34
Práctica Nº 3 MEDIDA DE TENDENCIA CENTRAL Y POSICIÓN

EJERCICIOS Y PROBLEMAS

Media, Mediana Y Moda

1. De en una empresa que tiene 200 empleados, el ingreso promedio es S/. 1200,¿cual es la
cantidad de dinero destinado al pago sueldos?

2. Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se
piensa incrementar el sueldo de cada trabajador en S/. 100¿Con cuánto dinero se debe contar
para poder pagar los nuevos sueldos?

3.Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se
piensa incrementar el sueldo de cada trabajador en 20% de su sueldo actual ¿Con cuánto
dinero se debe contar para poder pagar los nuevos sueldos?

4 Una empresa tiene 100 trabajadores cuyo sueldo promedio es de S/. 900. El próximo mes se
piensa incrementar el sueldo de cada trabajador en 20% de su sueldo actual y además da una
bonificación de S/. 50 ¿Con cuánto dinero se debe contar para poder pagar los nuevos
sueldos?

5. Una muestra de 20 trabajadores de una compañía pequeña obtuvieron los siguientes salarios
para un mes determinado. (En dólares)

240, 240, 240, 240, 240, 240, 240, 240, 255, 255, 265, 265,
280, 280, 290, 300, 305, 325, 330 y 340.

Calcule: a) la media, b) la mediana y c) la moda, para este conjunto de salarios.

6. Si estuviera usted en cada uno de las siguientes situaciones, señale qué medida de “promedio”
reportaría para los datos del problema anterior y en qué sentido puede considerarse típico
cada valor. a) Como Vicepresidente responsable de las negociaciones colectivas con los
trabajadores, b) Como Presidente de los representantes de los trabajadores.

7. El número de accidentes ocurridos durante determinado mes en 13 áreas de manufactura de


una planta industrial fueron:

2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5, 1.

Calcule: a) la media, b) la mediana, y c) la moda para el número de accidentes por área.

8. En una compañía que maneja 4 productos, los márgenes de utilidad correspondientes a c/u
de ellos durante el año fiscal anterior fueron: producto A, 4,2 %; producto B, 5,5 %;
producto C, 7,4 % y producto D, 10,1 %. Hallar el margen de utilidad promedio.

35
9. Supongamos que Ramiro el dueño de un grifo vende (en miles de bolivianos) 5 tipos de
combustibles. En la tabla siguiente se muestra c/u de ellos junto con el costo por galón y el
número de galones vendidos. Calcular la media aritmética simple y la media ponderada del
costo obtenido por Ramiro.

Combustible Costo por Volumen de


Galón Ventas en balones
Diesel S/.2,00 3
84 3,50 7
90 5,00 15
97 7,50 12
95 6,00 15

La Media Ponderada
10. Suponga que los precios al menudeo de determinados artículos han sufrido los cambios que
se muestran en la tabla siguiente. Determine el cambio porcentual promedio de los precios
al menudeo con referencia al promedio de gastos que se indica en la tabla.

Tabla (d) Cambios en los precios al menudeo de algunos artículos durante un año.
Artículo Aumento Gasto Mensual Promedio
Porcentual (Antes del Aumento)
Leche 10% S/. 2000,00
Carne Molida -6 3000,00
Ropa -8 3000,00
Gasolina 20 5000,00

Media, Mediana y Moda Para Datos Agrupados

11. Las siguientes cifras son los importes del consumo en dólares de quince personas en un
restaurante en orden ascendente; 10, 10, 25, 25, 25, 35, 40, 53, 90, 125, 135, 245, 275, 309,
410. Determinar:

a) La media, la mediana y la moda.


b) El segundo cuartil, el segundo decil y el percentil 40.

12. Una muestra de doce trabajadores sé probó en cuanto a su capacidad de sostener


firmemente un objeto; las medidas, ordenadas de menor a mayor fueron:

80,6; 89,9; 101,4; 102,6; 115,0; 120,1; 123,4; 126,3; 131,8; 138,6; 151,6 y 160,5.
Determine:

a) El primero, segundo y tercer cuartil.


b) El segundo decil.

13. Hallar la media geométrica de una serie 18, 21, 23, 24 y 22 tomada en este orden.

36
3.6. Cuartiles, Deciles y Percentiles

Mientras que la mediana divide a una distribución de datos en dos mitades.


Los Cuartiles los dividen en cuatro cuartos iguales.
Los Deciles los dividen en 10 décimas iguales.
Los Percentiles los dividen en 100 partes iguales.

Fórmulas Usadas para datos no agrupados:

Q1 (Primer Cuartil) = X[n/4 + ½] .................................. (2.11)

D3 (tercer Decil) = X [3n/10 + ½] ................................... (2.12)

P70 (Percentil 70) = X[70n/100 + ½] ................................ (2.13)

Ejemplo Nº 3.12.

Los importes mensuales (en bolivianos) de 15 personas en un restaurante, en forma


ascendente son:
1000, 1000, 2500, 2500, 2500, 3500, 4000, 5300, 9000, 12500, 13500, 24500, 27500, 30300
y 41000.

Determinar los valores de:

a) Segundo Cuartil.
b) Segundo Decil
c) Punto Percentil 40.

Solución
Siendo n = 15:
a) Q2 = X[2n/4 + ½] = X[2x15/4 + ½] = X8 = 5300

Por definición este valor es equivalente a la Mediana.

b) D2 = X[2n/10 + ½] = X[2x15/10 + ½] = X3,5 = 2500+2500 = 2500


2
X3,5 corresponde al valor de la mitad entre el 3ro y 4to ascendente.

c) P40 = X[40n/100 + ½] = X[40x15/100 + ½] = X6,5 = 3500 + 4000 = 3750


2
X6,5 corresponde al valor de la mitad entre el 6to y 7mo ascendente.

3.6.1. Cuartiles, deciles y percentiles para datos agrupados

37
Se utilizan algunos ejemplos de fórmulas como:

Q1 (Primer cuartil) = LI + ( n/4 – faA ) i .......................... (2.14)


fc
D3 (Terceldecil) = LI + (3n/10 – faA) i ............................ (2.15)
fc
P70 (Percentil 70) = LI + (70n/100 – faA) i ........................(2.16)
Fc
Donde:

LI = Límite exacto inferior de la clase que contiene Q, D ó P.

faA = Frecuencia acumulada de la clase que precede (antes)a la clase que contiene Q, D ó P.

fc = Número de observaciones en la clase que contiene Q, D ó P.

i = Tamaño del intervalo de clase.


Como podemos observar, la fórmula de la mediana (2,8) se modifica de acuerdo con el punto
fraccionario de interés (Q, D, P se encuentran en la clase cuya frecuencia acumulada excede
al valor del Q, D, P solicitado).

Ejemplo Nº 3.13.
Con referencia a la siguiente tabla la cual indica el tiempo requerido para auditar saldos de
cuentas.
a) Determinar el valor del Tercer Cuartil.
b) El Primer Decil.
c) El Punto Percentil 90.

Tabla: Tiempo requerido para auditar saldos de cuentas.

Tiempo de Número de
Frecuencia Acumulada (fa)
Auditoría Registros (f)
10 – 19 3 3
20 – 29 5 8
30 – 39 10 18
40 – 49 12 30
50 – 59 20 50
Total: 50

Solución
En la misma tabla calculamos fa. En primer lugar, calculamos la clase que tiene el punto de
interés 3n/4 = 3x50/4 = 37,5 (Quinta clase) de acuerdo con las frecuencias acumuladas.

Luego según fórmula:

38
a) Q3 = L1 + ( 3n/4 – faA ) i = 49.5 + ( 3x50/4 – 30 )10 = 53,25
fc 20

Conclusión:
49,5 es el límite exacto inferior de la clase que contiene la medición 3n/4 ó 37.5, por
tanto el cuartil 3 se encuentra en el quinto intervalo y su valor es 53,25 min.

b) La clase que contiene el punto de interés (primer decil) = 1xn/10 = 50/10 = 5, L I se


encuentra en la clase (intervalo) cuya fa excede a n/10 ó 5 x (8).

Luego según fórmula:


 n   5 
 10  f a A   10  3 
D1  LI   i  19,5   10  23,5 min .
 fc   5 

 
 
 

Conclusión:
19,5 es el límite superior de la clase que contiene la medición n/10 ó 5, por tanto el decil
1 se encuentra en el segundo intervalo y su valor es 23.5 min.

c) La clase que contiene el punto de interés (percentil 90) = 90xn/100 = 90x50/100 = 45

LI se encuentra en el intervalo cuya fa excede a 90n/100 ó 45x 50.


Luego según fórmula:

P90 = LI + ( 90xn/100 – faA)i = 49,5+ (9500/100 – 30) 10 = 57


fc 20

Conclusión:

El valor P90 = 57 min y se encuentra en el quinto intervalo.

9.5 – 19.5 – 29.5 – 39.5 – 49.5 – 59.5


1 2 3 4 5

39
4. CAPÍTULO Nº 4 MEDIDAS DE DISPERSIÓN O VARIACIÓN DE LOS DATOS

Mientras que las medidas de Tendencia Central identifican el valor “Típico” representativo en
un conjunto de datos en contraste:
Las medidas de variación (dispersión) describen la medida de esta variabilidad según sea
grande o pequeña con respeto a una Medida de Tendencia Central (Media) x o u.
En el análisis estadístico no basta el cálculo e interpretación de las medidas de tendencia
central o de posición, ya que, por ejemplo, cuando pretendemos representar toda una
información con la media aritmética, no estamos siendo absolutamente fieles a la realidad,
pues suelen existir datos extremos inferiores y superiores a la media aritmética, los cuales, en
honor a la verdad, no están siendo bien representados por este parámetro.
En dos informaciones con igual media aritmética, no significa este hecho, que las
distribuciones sean exactamente iguales, por lo tanto, debemos analizar el grado de
homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene igual media aritmética,
y mediana que los valores 49, 50,51; sin embargo, para la primera información la media
aritmética, se encuentra muy alejada de los valores extremos 5 y 95, cosa que no ocurre con la
segunda información que posee igual media aritmética y mediana, vemos entonces que la
primera información es mas heterogénea o dispersa que la segunda.
Ejemplo: 4.1.
Conocidos los porcentajes o notas (x) de 80 estudiantes de Métodos Cuantitativos 1 se les
puede disponer formando una distribución de frecuencias que da una idea más ordenada de las
características de la variable x (calificación o puntos).
 1ro se le calcula la media de la variable x. Con este valor se puede representar la
distribución de frecuencias.
Si los puntajes (Notas) son muy altos con respeto a la media la variabilidad será grande.
Si los puntajes (Notas) son muy próximos a la media, la variabilidad será pequeña.
La Medida de esta variabilidad es lo que se llama Medidas de Variación o Dispersión.

4.1. EL RANGO (AMPLITUD TOTAL) (R)

Es la diferencia entre los valores mayor y menor del conjunto de datos.


R = My – Mn Donde:
R = Rango o Amplitud.
My = mayor valor del grupo.
Mn = Menor valor del grupo.
Ejemplo: 4.2.
Durante un mes determinado del verano, 8 vendedores de aparatos eléctricos vendieron el
siguiente Nº de ventiladores:
8, 11, 5, 14, 8, 11, 16, 11.
Hallar el rango de unidades vendidas.
Solución
R = My – Mn = 16 – 5 = 11,0 unidades.

Ejemplo: 4.3.
Dos grupos de estudiantes (A y B) tienen la misma media = 70 puntos c/grupo.

40
Los puntajes más altos y más bajo de cada grupo son:
A: 93 y 25.
B: 73 y 66.
Hallar el Rango ó Amplitud.
Solución
Para A: 93-25 = 68 puntos
Para B: 73 – 66 = 7
Observamos: Que la Medida del Rango se funda sólo en los valores
extremos pero no se analiza la variabilidad de los datos internos por
consiguiente estudiaremos la Desviación Media.
4.2. LA DESVIACIÓN MEDIA

Incluye todos los datos. Es la media de las desviaciones a partir de algún valor central. Tal
como la media o la mediana de una distribución.

Cuando se refiere a la Media como valor central se tiene la Desviación Media es decir
alrededor de la Media.

Ejemplo: 4.4.
Para encontrar las fórmulas: Si tenemos las siguientes calificaciones de alumnos (sobre 100
puntos)
50, 55, 60, 70, 75, 80.
Hallar al Desviación Media:

Solución
1ro Seleccionamos la Media.
2do Medimos la variabilidad a partir de la media.
3ro Se halla el promedio de variabilidad.

x 50  55  60  70  75  80 390
1) x     65
n 6 6

2) Los desvíos de este valor son:


-15, -10, -5, 5, 10, 15.
El signo (-) indica que la dirección de los desvíos es hacia la
izquierda.
3) La distancia de las desviaciones (Cantidad de Variabilidad):
Ignorando los signos (-) (Observamos que la suma algebraica de
los desvíos a partir de la media es siempre = 0).
Hallamos la media de las desviaciones:

15  10  5  5  10  5 60
   10
6 6

Entonces la Desviación media (DM) = 10.


41
Por Tanto: La fórmula empleada para hallar la desviación Media:

 xu
D M Poblacional =
N
xx
DM Muestral =
n
Donde:
x = datos del Problema.
u = media poblacional de los datos.
n,N = Nº de datos.
x = media muestral de los datos.

Ejemplo: 4.5.
Para los datos de ventas de aparatos eléctricos que se dieron en el E1, hallar la Desviación
Media (DM).
Solución

x 5  8  8  11  11  11  14  16
1ro u =   10,5
n 8
X x-u x-u
5 5-10,5=-5,5 5,5
8 8-10,5=-2,5 2,5
8 8-10,5=-2,5 2,5
11 11-10,5=0,5 0,5
11 11-10,5=0,5 0,5
11 11-10,5=0,5 0,5
14 14-10,5=3,5 3,5
16 16-10,5=5,5 5,5
Total 21,0
 xu 21,0
 DM =   2,625  2,6 unidades
N 8

Interpretación:

En Promedio, las ventas de ventiladores por vendedor difiere en 2,6 unidades de la media
del grupo, en cualquier dirección.

4.3. LA VARIANZA; LA DESVIACIÓN ESTÁNDAR


4.3.1. Fórmulas

Debido a que se dificulta la interpretación del significado del valor de una varianza, porque
las unidades en que se expresa son valores al cuadrado.

42
Surge la Desviación estándar (,s), que es la raíz cuadrada de la varianza, representada
mediante la letra griega  o s para una muestra; su fórmula es:

( x  u ) 2
Desviación Estándar Poblacional  
N

( x  x ) 2
Desviación Estándar Muestral s 
n 1

Ejemplo: 4.6.

De acuerdo al ejemplo dado Donde:


8 vendedores vendieron el siguiente Nº de ventiladores 8, 11, 5, 14, 8, 11, 16, 11.
2do Tabla: Considerando estas ventas como población:

X x-u (x-u)2
5 -5,5 30,25
8 -2,5 6,25
8 -2,5 6,25
11 0,5 0,25
11 0,5 0,25
11 0,5 0,25
14 3,5 12,25
16 5,5 30,25
 Total 86,00

( x  u ) 2 86
Desviación Estándar     10,75  3,3unidades
N 8

4.3.2. Cálculos abreviados de la varianza y la desviación estándar.

Para no realizar el cálculo de c/u de las desviaciones con respecto a la Media Grupal,
existen Fórmulas abreviadas equivalentes, las cuales son:
x 2  Nu 2
Varianza Poblacional:  2 
N
x 2  Nu 2
Desviación Estándar Poblacional:  
N
x 2  n x
2

Varianza Muestral: s 2 
n 1

43
x 2  n x
2

Desviación Estándar Muestral: s 


n 1

Ejemplo: 4.7.
Como verificación de resultados, calcular por fórmula abreviada la desviación estándar
respectiva del problema anterior, siendo x = u = 10,5.
x x2
5 25
8 64
8 64
11 121
11 121
11 121
14 196
16 256
Total 968

x 2  Nu 2 968  8(10,5) 2
   10,75  3,3 unidades
N 8

4.4. MEDIDAS DE VARIABILIDAD (DISPERSIÓN) ASIMETRÍA Y CURTOSIS


DE LOS DATOS.

4.4.1. Formas de Curvas de frecuencias.


Después de haber dibujado el polígono de frecuencias y la curva ojiva para la distribución
de frecuencias acumuladas, también tenemos los siguientes tipos de curvas:

En términos de ASIMETRÍA (Lados Laterales), una curva de frecuencia puede ser:

(1) Asimétrica Negativa: Asimétrica con la cola hacia la izquierda.


(2) Asimétrica Positiva: Con la “cola” hacia la derecha.
(3) Simétrica.

FIG.3.1. ASIMETRÍA DE PEARSON


f f f

(1) Asimétrica
x (2) Asimétrica
x (3) Simétrica
x
Negativa Positiva (Insesgada)
(Esta sesgada (Sesgada hacia
hacia la izquierda) la derecha)
44
En términos de Kurtosis (vértice superior), una curva de frecuencia puede ser:

(1) Platikúrtica: Plana, con las observaciones distribuidas de manera relativamente


uniforme en todas las clases.
(2) Leptokúrtica: Puntiaguda, con las observaciones concéntricas en un estrecho rango de
valores.
(3) Mesocúrtica: Ni plana ni puntiaguda, en términos de la distribución de los valores
observados.

FIG. 3.2. KURTOSIS


f f f

x x x
(1) Platikúrtica (2) Leptokúrtica (3) Mesocúrtica

4.4.2. El coeficiente de variación (c.v.)

Indica la Magnitud relativa de la Media de la Distribución:


Su fórmula es:

Población: CV = x 100
u
s
Muestra: CV = x 100
x

Donde: CV = Coeficiente de Variación


 = desviación estándar.
x , u = media.

Si consideramos 2 o más distribuciones con medios bastantes diferentes o si se miden en


unidades distintas, será peligroso extraer conclusiones sobre la dispersión a partir de un
único valor de la Desviación Estándar. Es como comparar manzanas con naranjos: por tanto
se recurre frecuentemente al uso del C.V.

Se aplica para comparar la variabilidad de 2 conjuntos de datos con respeto al nivel general
de los valores de c/conjunto (y, por ello respeto a la media).
Ejemplo: 4.8.
Para 2 Acciones Comunes de Empresas
(Telefónica A –Claro B)

45
El precio promedio de cierre en la bolsa de un mes fue:
Acción A = $15000 con desviación estándar de 500.
Acción B = $5000, con desviación estándar de 300.

Haciendo una comparación absoluta, resultó ser superior la variabilidad en el precio de la


acción A, debido a que muestra una mayor desviación estándar. Pero con respecto al nivel
de precios, deben compararse los respetivos coeficientes de variación:

 500 300
CV ( A)    0,033 y CV ( B)   0,060
u 15000 5000
Interpretación: El Precio de la acción B ha sido casi 2 veces más variable que la acción A.
(Con respecto al precio promedio para c/u de las 2).

4.4.3. Coeficiente de asimetría de pearson (sesgo)

Mide la desviación de la simetría, expresando la diferencia entre la media y la mediana con


respecto a la desviación estándar del grupo de mediciones.

Su Fórmula:
3(u  Med )
Asimetría Poblacional:

3( x  Med )
Asimetría de la Muestra:
S
Para una distribución Simétrica, el valor del coeficiente de asimetría siempre es = 0, porque
la media y la mediana son iguales.
Para una distribución con asimetría (+), la x es siempre > que la Med. => Asimetría = (+).
Para una distribución con asimetría (-) la x es siempre < que la Med. => Asimetría = (-).

Ejemplo: 4.9.
Del ejemplo dado E1 de 8 vendedores que vendieron ventiladores.

u = x =10.5 =
 x  84  10,5
n 8
X  X5
Med = X (5 8 8 11 11 11 14 16) = 4
2
11  11
Med =  11
2
 = 3,3
3(u  Med ) 3(10,5  11,0)
 Asimetría =   0,45
 3,3
(El grado en que están sesgados se refleja en este valor)
Así, la distribución de las unidades vendidas tiene una ligera asimetría negativa, es decir,
está sesgada hacia la izquierda.

46
FIG. 3.3. ASIMETRÍA DE PEARSON.
f

X
Asimetría Negativa

4.4.4. El rango y los rangos modificados para datos agrupados.

Para datos agrupados en una Dist. De frecuencias el Rango (R):


Limite Exacto Superior de la clase (intervalo) más alto Ls(A) y el límite exacto inferior de
la clase (Intervalo) más baja LI (B)
Así: R= Ls (A)- LI (B)

E9: En los siguientes datos agrupados de las salarios mensuales de 100 trabajadores hallar
el rango.

Salario Mensual Límites Exactos


$ De Clase
2400 – 2599 2399,50 – 2599,50
2600 – 2799 2599,50 – 2799,50
2800 – 2999 2799,50 – 2999,50
3000 – 3199 2999,50 – 3199,50
3200 – 3399 3199,50 – 3399,50
3400 – 3599 3399,50 – 3599,50
R = Ls(A) – LI(B) = 3599,50 – 2399,50 = 1200

4.5. DESVIACIÓN MEDIA PARA DATOS AGRUPADOS

Para los datos agrupados en una distribución de frecuencias, se asume que el punto medio de cada
clase (Intervalo), representa a todas las mediciones incluidas en esa clase (intervalo); es igual que
el cálculo de la media para datos agrupados.

Fórmula Empleada:

DMPOBLACIONAL =
 ( f ) x  u 
N

47
Ejemplo: 4.10.
Para los datos de salarios diarios del Problema anterior calcular la Desviación Media.
Solución

Pto. Medio
Salario (f) Nº de
de clase f(x) | x u| f x u
Mensual Trabajadores
(Intervalo) x
2400 2599 2499,50 7 17496,50 450 3150
2600 2799 2699,50 20 53990,00 250 5000
2800 2999 2899,50 33 95683,50 50 1650
3000 3199 3099,50 25 77487,50 150 3750
3200 3399 3299,50 11 36294,50 350 3850
3400 3599 3499,50 4 13998,00 550 2200
Total: 100 294950,00 Total: 19600

4.6. LA VARIANZA YLA DESVIACIÓN ESTANDAR PARA DATOS AGRUPADOS.


Se asume que el punto medio de clase (intervalo) representa a todas las mediciones
incluidas en esa clase.
Fórmulas Empleadas:
  f x  u  
2

Varianza Poblacional:  
2

  f x  x 
2

Varianza Muestral: S
2

n 1

  f x  u  
2

Desviación Estándar Poblacional:  


N

  f x  x  
2

Desviación Estándar Muestral: S 


n 1

Ejemplo: 4.11.
Para los datos de salarios diarios que se presentan a continuación.
Hallar la Desviación Estándar muestral
Pto. Medio
Salario
Diario
de clase
(f) Nº de
Trabajadores xi*fi
x  x x  x 
2
f xx
2
 
(Intervalo)x
2400 - 2599 2499,50 7 17496,50 -450 202500 1417500
2600 - 2799 2699,50 20 53990,00 -250 62500 1250000
2800 - 2999 2899,50 33 95683,50 -50 2500 82500
3000 - 3199 3099,50 25 77487,50 150 22500 562500

48
3200 - 3399 3299,50 11 36294,50 350 122500 1347500
3400 - 3599 3499,50 4 13998,00 550 302500 1210000
Total: 100 294900,50 Total: 5870000
Solución
1ro: Cálculo del Pto. Medio de Intervalo
2do: Cálculo f x 

3ro: Cálculo de la media x 


 f x   294950  2949,50
n 100
4 : x  x  Tabla
to

5to: f x  x   Tabla
2

6toReemplazo de fórmula
  f x  x   
2
5870000
S  59292.93
n 1 99
S  243.50
FORMULAS ABREVIADAS PARA DATOS AGRUPADOS SON LOS
SIGUIENTES:

Varianza Poblacional:  
2   f x 2   Nu 2
N

Desviación Estándar Poblacional:  


 f x 2  Nu 2 
N
 f x  nx
2 2

Varianza Muestral: S
2

n 1
  fx   n x
2 2

Desviación Estándar Muestral: S 


n 1
Ejemplo: 4.12.
Del problema anterior calcular la Desviación Estándar resultante probando de esta manera
la Respuesta, usando Fórmulas abreviadas.

Salario Pto. Medio (f) Nº de x2 fx 2


Diario de clase Trabajadores
(Intervalo)x
2400 2599 2499,50 7 6247500,25 43732501,00
2600 2799 2699,50 20 7287300,25 145746005,00
2800 2999 2899,50 33 8407100,25 277434308,25
3000 3199 3099,50 25 9606900,25 240172506,25
3200 3399 3299,50 11 10886700,25 119753702,75
3400 3599 3499,50 4 12246500,25 48986001,00
Total 100 Total: 875825025.00

49
875825025  1002949
2
S  243,50
100  1
Práctica Nº 4

MEDIDAS DE DISPERSIÓN (VARIACIÓN)

1. En un estudio contable, las utilidades de empresas son: 15, 9, 11,10 y 11 en millones de


S/. Calcule la varianza y desviación estándar de estas utilidades.

2. Una empresa fabrica clavos que se venden por cajas. Para una muestra de 40 cajas, se
observaron los siguientes números de clavos por caja.

Número de clavos 18 19 20 21 22
Número de Cajas 4 9 15 10 2

Hallar la varianza y desviación estándar

3. Calcule la Desviación Media para los siguientes datos: 1000, 1000, 2500, 2500, 2500,
3500, 4000, 5300, 9000, 12500, 13500, 24500, 27500, 30900 y 41000.
4. Calcular la desviación estándar muestral para los datos del problema anterior utilizando:
a) La Fórmula de Desviaciones y b) La Fórmula abreviada alternativa, y demuestre
que las respuestas son iguales.
5. Una muestra de 20 trabajadores calificados de una compañía pequeña obtuvieron
los siguientes salarios en un mes determinado: $240000, 240000, 240000, 240000,
240000, 240000, 240000, 240000, 255000, 255000, 265000, 265000, 280000, 280000,
290000, 300000, 305000, 325000, 330000 y 340000.Determine: La Desviación
Media, La Varianza Muestral, La Desviación Estándar Muestral, utilizando las
fórmulas de desviación.
6. Determine el coeficiente de variación según datos del problema anterior.
7. Calcule el coeficiente de asimetría para los datos del problema 3.
8. Para los siguientes datos de las rentas por departamento.
Renta Mensual Nro. De Departamentos
350-379 3
380-409 8
410-439 10
440-469 13
470-499 33
500-529 40
530-559 35
560-589 30
590-619 16
620-649 12
TOTAL 200

50
Calcule: La Desviación Media y la Desviación Estándar utilizando las fórmulas de
desviaciones, las fórmulas abreviadas y demuestra que las fórmulas son
equivalentes.
9. En la siguiente tabla se reproducen los datos sobre el número promedio de lesiones por
millar de horas – hombre en una industria especifica.

Número Promedio de Lesiones Número de Empresas


1,5 – 1,7 3
1,8 – 2,0 12
2,1 – 2,3 14
2,4 – 2,6 9
2,7 – 2,9 7
3,0 – 3,2 5
Total: 50
Calcule:
a) La Desviación Media
b) La Varianza Muestral
c) La Desviación Estándar Utilizando las fórmulas abreviadas.

51
PARTE II
PROBABILIDADES, DISTRIBUCIÓN DE PROBABILIDADES

5. CAPÍTULO V PROBABILIDAD, DISTRIBUCIÓN DE PROBABILIDADES

5.1. Experimento Aleatorio

Es un número real que expresa la confianza o incertidumbre de un suceso o evento, cuyo


resultado no se puede predecir con certeza.

5.2. Espacio muestral ()


Cada experimento aleatorio tiene varios resultados posibles y que podemos describir con
precisión el conjunto de estos resultados posibles.
Llamaremos espacio muestral asociado a un experimento aleatorio al conjunto de todos
los resultados posibles de dicho experimento

5.3. Evento
Hemos definido el espacio muestral como el conjunto de todos los resultados posibles de
un experimento aleatorio. Es decir, podemos concebir al espacio muestral como un
conjunto universal. Hablaremos, entonces en él, de subconjuntos y elementos. Se llama
Evento a cualquier Subconjunto del espacio muestral y lo denotaremos por A,B,C,D,E,F.
etc. Así, si A es un evento y llamaremos suceso a todo elemento de un del espacio muestral
y lo designaremos por w, x, y, etc. Esto es, si x es un suceso, entonces x Є Ω. Un evento
con un sólo elemento es un evento elemental, así A = {w} es un evento elemental.

5.3.1. Eventos mutuamente excluyentes


Dos o más eventos son mutuamente excluyentes si no tiene elementos comunes es decir, si
no pueden ocurrir al mismo tiempo. También, la ocurrencia de un evento automáticamente
impide la ocurrencia del otro(u otros). Por ejm: supongan que se consideren dos posibles
eventos “as” y “rey” con respecto a la extracción de una carta de una baraja (52 cartas).
Estos eventos son mutuamente excluyentes porque ninguna carta puede ser al mismo
tiempo as y rey, otro ejemplo sería obtener un as y un cinco al lanzar un dado.

5.3.2. Eventos no excluyentes


Dos o más eventos son no excluyentes cuando es posible que ocurran al mismo tiempo
Ejm:

52
Evento A: masculino
Evento B: menor de 30 años
No son mutuamente excluyentes porque una persona elegida al azar podría estar en ambas
categorías .
 En los dos eventos “as” y “oros”, estos eventos no son mutuamente excluyentes porque
una carta determinada puede ser al mismo tiempo as y oro, sin embargo, esto no indica
que todo as sea oro o todo oro sea as.
5.3.3. Eventos complementarios
Dos eventos A y B son complementarios si son mutuamente excluyentes y su unión es el
espacio muestral. Es decir si A  B =  y A  B =  A y B son eventos
complementarios, y se puede expresar que:

Ac
A =B
Bc = A
B

5.4. DEFINICIÓN CLÁSICA DE PROBABILIDAD


Es una fracción cuyo numerador es el No de casos favorables y cuyo denominador es el
número total de los casos posibles.
Fórmula:
N ( A)
P( A) 
N( S )

Donde P(A)= Probabilidad de Ocurrencia del Evento A


N(A)= N° de casos Favorables de ocurrencia del evento A.
N(S) = Todos los casos posibles en el evento A.

Ejemplo Nº 5.1.

En una cantidad de cartas bien barajadas que contiene 4 ases y 48 cartas de otras tipo, la
probabilidad de obtener 1 (as) en una sola extracción es:

N A
P(A) = = 4/52 = 1/13
N S 

Ejemplo Nº 5.2.

Aparte de los ejemplos dados tenemos:

Si se lanzan 3 monedas. Hallar:

a) El Espacio Muestral, b) P(A) = obtener exactamente 2 caras, c) Exactamente 2


sellos y d) Exactamente 3 caras.

53
Solución

a) El Espacio Muestral () = {CCC CCS CSC SCC CSS SCS SSC SSS}

1/8 cada uno.

b) Evento A: obtener exactamente 2 caras.

A= { CCS, CSC. SCC}

1/8 1/8 1/8

P(A) = 3/8

c) Exactamente 2 sellos?
3/8

d) Exactamente 3 caras
1/8
5.5. Propiedades de probabilidad
1. La Probabilidad de ocurrencia de cada Punto Muestral, debe estar entre 0 y 1.
0  P(A)  1
2. La Suma de las Probabilidades de todos los puntos Muestrales debe ser igual a 1.
3. P(A) + P(A’) = 1
Es decir en una observación o experimento dados, el evento debe ocurrir o No. Por ello la
suma de la probabilidad de ocurrencia + la Probabilidad de no ocurrencia siempre es igual a
1.

5.6. Reglas de probabilidad: suma ó adición de probabilidades

1. Para eventos mutuamente excluyentes es decir cuando no tiene elementos


comunes.

(AB = ):

A B  P(AB)=PA+PB

Ejemplo Nº 5.3.

Se extrae una carta de una baraja de 52, los eventos “as” (A) y “rey” (R) son mutuamente
excluyentes.

54
Hallar la probabilidad de extraer ya sea un as o un rey en una sola extracción.

Solución

De: P(A o R) = P(A) + P(R) = 4/52 + 4/52 = 8/52 = 2/13

2. Reglas de Adición para eventos que no son mutuamente excluyentes.

E7: Un cliente ingresa a una panadería. La Probabilidad de que compre (a) pan es 0,60,
b) Leche es 0,50 y c) Pan y leche es 0,30. ¿Cuál es la Probabilidad de que compre pan,
leche o ambos?.

Solución

P(P) = 0,60 P(PL) = P(P) + P(L) – P(PL)


P(L) = 0,50 P(PL) = 0,60 + 0,50 – 0,30
P(PL) = 0,30 P(PL) = 0,80

Ejemplo Nº 5.4.
Cuando se extrae una carta de un mazo de 52 cartas, los eventos “as” y una espada no son
mutuamente excluyentes.
Hallar la Probabilidad de obtener un AS (A) o una Espada (E) o ambos en una sola extracción.

Solución

P(AoE) = P(A) + P(E) – P(A y E)


= 4/52 + 13/52 – 1/52 = 16/52 = 4/13

5.7. Eventos dependientes e independientes

Dos eventos son independientes cuando la ocurrencia o no ocurrencia de uno, no tiene


ningún efecto sobre la probabilidad de ocurrencia del otro. Y son dependientes cuando la
ocurrencia o no ocurrencia de uno si afecta la probabilidad de ocurrencia del otro evento.

Ejemplo Nº 5.5.
El lanzamiento de una moneda por dos veces se considera eventos independientes, porque
el resultado del primer lanzamiento no tiene ningún efecto sobre las respectivas
probabilidades de que ocurra una cara o sello en el segundo lanzamiento.

Ejemplo Nº 5.6.
La extracción de dos cartas sin reemplazo de un mazo de barajas son eventos dependientes,
por que las probabilidades asociadas con la segunda extracción dependen del resultado de
la primera extracción. Específicamente si saliera un as en la primera extracción entonces la
probabilidad de que salga as en la segunda extracción, es la razón del número de ases que
sigue habiendo en las barajas con respecto al número total de cartas, o 3/51.

55
5.8. Probabilidad condicional

5.8.1. Definición de probabilidad condicional

Una medida de la probabilidad de que ocurra un evento particular, dado el hecho que otro
ya ha ocurrido o de que hay certeza de que ocurra, se llama probabilidad condicional.

Para dos eventos A y B, dicha probabilidad se denota, siempre por P (A/B) o P (B/A), lo
que se lee como “la probabilidad de A, dado B” o “la probabilidad de B, dada A” ya que la
línea vertical quiere decir “dada” ó “dado”.

Cuando dos eventos son dependientes usamos la siguiente fórmula de probabilidad


condicional.

P( AyB ) P( A  B)
P( B / A)  
P( A) P( A)
Donde:

P(B/A) = Probabilidad de que ocurra el evento B dado que ocurre el evento A.


<<B/A>> no es fracción.
P(AB) = Probabilidad conjunta de 2 eventos.
P(A) = Probabilidad simple no, condicional de un primer evento A.

5.8.2. Probabilidad conjunta:

Una Medida de la Probabilidad del acontecer simultáneo de dos o más eventos se llama
probabilidad conjunta. Para los eventos A y B, esta probabilidad se simboliza por P(AyB) o
P(AB).
Ejemplo Nº 5.7.
Solución

Consideramos los siguientes conjuntos.


 = 1, 2, 3, 4, 5, 6 espacio muestral.
A = 2, 4, 6 conjunto de resultados pares.
B = 4, 5, 6 conjunto de resultados mayores que 3.
AB =  4, 6 conjunto de resultados pares mayores que 3.
Como el dado es no cargado, asignamos a cada punto muestral una probabilidad de 1/6.

P(A) = 3/6, P(AB) = 2/6 = 1/3.

De la fórmula de Probabilidad Condicional podemos determinar la probabilidad de obtener


un número > que 3 dado que es par.

56
P A  B  2 / 6 2
P  B / A   
P A 3/ 6 3
Este resultado queda comprobado por el hecho que de los 3 resultados pares 2, 4, 6
sólo 2 son mayores que 3.
5.8.3. Regla de la multiplicación (ab) : para eventos independientes.

Los sucesos A y B se consideran independientes cuando la ocurrencia de uno no influye


sobre la probabilidad de ocurrencia del otro (Ejm. Lanzar dos veces una moneda al aire).
Esto significa de que lo que haya ocurrido en A, la probabilidad asignada a B es siempre la
misma. Por Tanto:
P(B/A) = P(B)
Obtenemos la Fórmula:
P(AB) = P(A) .P(B)

Ejemplo Nº 5.8.
Cuál es la probabilidad de que en una familia con 2 hijos ambos sean varones.

P(V1) = 0.5 P(V1V2) = P(V1) . P(V2)


P(V2) = 0.5 = (0.5) (0.5)
= 0.25 = 1/4
Ejemplo Nº 5.9.
Si se lanza dos veces una moneda la probabilidad de que ambos eventos sean cara es:
P(AyB) = P(AB) = P(A). P(B) = ½ x ½ = ¼

5.8.4. Uso de Diagramas de árbol para eventos Independientes.

Útiles para ilustrar los posibles eventos asociados con observaciones o ensayos
secuenciales, del ejemplo anterior obtenemos:

Resultado Resultado Evento Probabilidad


Primer Lanzamiento 2do.Lanz. Conjunto Del Evento Conjunto

C1 y C2 1/4
1/2 C2
C1
1/2
1/2
S2 C1 y S2 1/4
S1 y C2 1/4
1/2 C2
1/2
S1
1/2 1/4
S2 S1 y S2

4/4 = 1.00

5.8.5. Regla de la multiplicación: para eventos dependientes.

57
Esta dada por la fórmula:
P(AB) = P(A) P(B/A)
Probabilidad de ocurrencia .
de A y B.

En Palabras: Expresa que la probabilidad de que ocurra A y B es igual a la probabilidad de A


multiplicada por la probabilidad de que ocurra B, dado que A ha ocurrido.

5.8.6. Uso del Diagrama de Árbol para Eventos Dependientes.

Ejemplo Nº 5.10.

Una urna contiene 6 bolitas blancas y 4 negras, se extraen 2 bolitas sucesivamente y sin restitución.
a) ¿Cuál es la probabilidad de que ambas bolitas sean blancas?.
b) ¿Cuál es la probabilidad de que la primera sea blanca y la segunda negra?.
c) ¿Cuál es la probabilidad de que la primera sea negra y la segunda blanca?.
d) ¿Cuál es la probabilidad de que ambas sean negras?.

Solución

P(B1B2) = P(B1) . P(B2/B1)


= 6/10 . 5/9 = 30/90 = 1/3.

P(B1N2) = P(B1) . P(N2/B1)


= 6/10 . 4/9 = 24/90 = 4/15.

P(N1B2) = P(N1) . P(B2/N1)


= 4/10 . 6/9 = 24/90 = 4/15.

P(N1N2) = P(N1) . P(N2/N1)


= 4/10 . 3/9 = 12/90 = 2/15.
Resumen de Resultados:

Resultado Probabilidad Probabilidad Probabilidad


Posible Simple Condicional Conjunta
P(AB)=P(A).P(B/A)
P(A) P(B/A)
B1B2 P(B1)=6/10 P(B2/B1)=5/9 6/10.5/9=30/90
B1N2 P(B1)=6/10 P(N2/B1)=4/9 6/10.4/9=24/90
N1B2 P(N1)=4/10 P(B2/N1)=6/9 4/10.6/9=24/90
N1N2 P(N1)=4/10 P(N2/N1)=3/9 4/10.3/9=12/90
1,00

58
Estos mismos resultados lo expresamos en el diagrama de árbol siguiente.
Prob. Simple x Prob. Condicional = Prob. Conjunta

P(B2/B1)=5/9 B2 B1 y B2 (6/10 . 5/9) = 30/90


B1
B1 y N2 (6/10 . 4/9) = 24/90
P(B1)=6/10
P(N2/B1)=4/9
N2 N1 y B2 (4/10 . 6/9) = 24/90

P(B2/N1)=6/9 B2 N1 y N2 (4/10 . 3/9) = 12/90


P(N1)=4/10
N1
90/90 = 1,00
P(N2/N1)=3/9
N2

Práctica Nº 6 Cálculo de Probabilidades

1. Se lanza un dado:
a) Enumérese los elementos del espacio muestral.
b) Enumérese los elementos de  contenido en el suceso de que el resultado sea par.
c) Enumérese los elementos de  contenidos en el suceso de que el resultado sea, mayor que
4.

2. Un experimento consiste en lanzar dos monedas simultáneamente.


a) Enumérese los elementos del espacio muestral.
b) Enumérese los elementos de  contenidos en el suceso de que salga exactamente una
cara.
c) Enumérese los elementos de  contenidos en el suceso de que salga al menos una cara.

3. Se lanza un par de dados:


a) Enumérese los elementos del espacio muestral.
b) Enumérese los elementos contenidos en el suceso de que la suma de los puntajes sea 9.
c) Enumérese los elementos contenidos en el suceso de que la suma sea 4 ó 5.

4. Un experimento consiste en seleccionar tres piezas en un proceso manufacturero y observar


si son defectuosos D o no son defectuosos D’.
a) Enumérese todos los elementos del espacio muestral.
b) Enumérese los elementos contenidos en el suceso de que el número de piezas
defectuosas sea 1.
c) Enumérese los elementos contenidos en el suceso de que los números de piezas
defectuosas sea al menos 1.

59
5. Se lanza dos monedas. ¿ Cuál es la probabilidad de obtener.
a) Exactamente una cara?.
b) Por lo menos una cara?.
c) No obtener una cara?.

6. Se lanzan dos dados no cargados. ¿ Cuál es la probabilidad de obtener?.


a) 7?.
b) 7 u 11?.
c) Suma divisible por 3?.
d) No obtener 7?.

7. Se elige una carta de una baraja. ¿ Cuál es la probabilidad de que sea?.


a) Un as?.
b) Una espada?.
c) Un as o una espada?.
d) Un as o una carta roja?.
e) Una carta con una figura?.

8. La probabilidad de que llueva el 12 de octubre es 0,10; de que truene es 0,05 y de que llueva
y truene es 0,03. ¿Cuál es la probabilidad de que llueva o truene en ese día?.

9. En cierta zona de la ciudad, la probabilidad de que una persona tenga televisor es 0,80; una
máquina lavadora es 0,50 y que tenga ambos es 0,45. ¿Cuál es la probabilidad de que una
familia tengan televisor o máquina lavadora o ambas cosas?.

10. La probabilidad de que un vendedor de autos venda por lo menos 3 autos en un día es 0,20. ¿
Cuál es la probabilidad de que venda 0, 1 ó 2 autos en ese día?.

11. La probabilidad de que la señora hablantina reciba a lo más 5 llamadas telefónicas en un día
es 0,20; y por lo menos 9 llamadas telefónicas en un día es 0,50. ¿Cuál es la probabilidad de
que la señora hablantina reciba 6, 7 ú 8 llamadas en un día?.

12. Una caja contiene 100 tubos de televisor. La probabilidad de que haya al menos un tubo
defectuoso es 0,05 y de que tenga al menos dos tubos defectuosos es 0,01. ¿Cuál es la
probabilidad de que la caja contenga:
a) Ningún tubo defectuoso?.
b) Exactamente un tubo defectuoso?.
c) A lo más un tubo defectuoso?.
Cálculo de Probabilidades Regla de la Multiplicación

13. Dado que p(A) = 0,50 y p(AB) = 0,30, encontrar p(B/A) =

14. De los estudiantes de una universidad, el 35% son varones y el 8% son varones que
estudian contabilidad. Si se elige un estudiante al azar y éste resulta ser varón. ¿Cuál es la
probabilidad de que estudie contabilidad?.

60
15. Una urna contiene 7 bolas blancas y 5 negras, si se saca dos bolas. ¿Cuál es la
probabilidad de que las dos sean blancas si:
a) Se extrae sin restitución.
b) Se extrae con restitución.

16. La urna A contiene 5 bolitas blancas y 7 rojas y la urna B contiene 3 bolitas blancas y 6
rojas. Se saca una bolita de la urna A y una de la urna B. ¿Cuál es la probabilidad de que las
dos bolitas sean blancas?.

17. La urna A contiene 4 bolitas blancas y 6 rojas, la urna B contiene 3 bolitas blancas y 5
rojas y la urna C 7 blancas y 7 rojas. Se saca una bolita de cada urna. ¿Cuál es la
probabilidad de que sean las tres del mismo color?

18. Se sacan dos cartas , sin restitución, de una baraja de 52 cartas. ¿Cuál es la
probabilidad de que:
a) La primera carta sea un as y la segunda un 5?.
b) Se obtenga un as y un 5?.
c) Ninguna de las dos cartas sea as?.
d) Ninguna de las cartas sea as ni 5?.

19. Se sacan dos cartas sin restitución de una baraja de la cual se han eliminado
previamente las cartas con figuras. ¿Cuál es la probabilidad de que la suma de los
puntos de las cartas sea 19?.

20. Se sacan 5 cartas sin restitución de una baraja. ¿Cuál es la probabilidad de que:
a) Las primeras tres cartas sean reinas y las dos ultimas reyes?.
b) Sólo las tres primeras cartas sean reinas?.
c) Las tres primeras cartas sean reinas?.

21. Se extraen cartas sucesivas y sin restitución una baraja. ¿Cuál es la probabilidad de que:
a) La primera Reyna aparezca en la tercera extracción?.
b) Aparezca una Reyna en la tercera extracción?.

22. Se lanza un dado tres veces. ¿Cuál es la probabilidad de que:


a) La suma de los puntos sea 3 ó 4?.
b) La suma de los puntos obtenidos sea mayor que 4?.

6. CAPÍTULO VI DISTRIBUCIONES DE PROBABILIDADES

6.1. Esperanza matemática (valor esperado o promedio)

61
Así como en los conjuntos de datos muéstrales y poblacionales ya estudiados; es útil
también describir una variable aleatoria en términos de su media

El valor esperado es la Media (A Largo Plazo) de una variable aleatoria x y se denota


mediante E(x). Usado también para analizar juegos al azar, esperar una ganancia y otros.

Fórmula: E(x) = x P(x)

Donde: E(x) = Valor esperado de una variable aleatoria discreta.


xP(x) = Valor Ponderado

Ejemplo Nº 6.1.
Considerando el Nº de caras que puede resultar al lanzar 3 monedas simultáneamente. Los
ocho resultados posibles de este experimento aparecen a continuación en el lado izquierdo.

Resultado Nº de Caras Probabilidad


SSS 0 1/8
CSS 1 1/8
SCS 1 1/8
SSC 1 1/8
SCC 2 1/8
CSC 2 1/8
CCS 2 1/8
CCC 3 1/8

Designando cada número posible de caras por x y su probabilidad por P(x), enumeramos en
la tabla de la derecha todos los números posibles de caras con sus respectivas
probabilidades. Observamos que hay mayor posibilidad de obtener 1 o 2 caras que 0 y 3.
Supongamos ahora que las tres monedas se lanzan un número infinito de veces. Si bien en
este número infinito de ensayos esperamos obtener un promedio de 1,5 caras por
lanzamiento.

Este promedio “A largo plazo” de 1,5 caras por lanzamiento se llama esperanza
matemática.

X (número de caras) P(x) xP(x)


0 1/8 0
1 3/8 3/8
2 3/8 6/8
3 1/8 3/8
12
xP ( x) 
8

62
E(x) = xP(x)
= 12/8
= 1,5 caras.

E3: Con base en la tabla del 1er. ejemplo, hallar el valor esperado de la variable aleatoria.
(Promedio de alquiler diario de camionetas)

Solución

Cálculo del valor esperado para la demanda de camionetas.


Demanda Posible Probabilidad Valor Ponderado
X P(x) xP(x)
3 0,06 0,18
4 0,14 0,56
5 0,24 1,20
6 0,28 1,68
7 0,20 1,40
8 0,08 0,64
1,00 E(x) = 5,66
Se espera alquilar diariamente en promedio 5,66 camionetas.
Ejemplo Nº 6.2.
Una caja contiene 3 bolitas negras y 7 blancas. Se saca una bolita de la caja si ésta es negra
Ud. gana $2, pero si es blanca usted pierde $1. ¿Cuál es la esperanza matemática de este
juego?
Solución
Designamos por x toda posible ganancia o pérdida y por P(x) la probabilidad respectiva,
calculamos la esperanza matemática:

X(Cantidad de ganancia P(x) xP(x)


o pérdida)
+ $2 3 6
10 10
- $1 7 7

10 10
1

xP(x) = 10 = -0,1

Interpretación:

La esperanza matemática de este juego es una pérdida de $0,10.

63
Suponiendo que se haga este juego varios miles de veces. Cada vez se ganará $2 o perderá
$1. Sin embargo en esos miles de juegos se puede esperar una pérdida promedio de $0,10
por juego.

6.2. LA DISTRIBUCIÓN BINOMIAL

Es una distribución discreta de Probabilidad para aplicarla a diversos modelos de toma de


decisiones. Siempre y cuando se ajuste a un proceso Bernoulli

6.2.1. Fórmula de Distribución Binomial:

Para determinar la Probabilidad de un Nº determinado de éxitos x.


P(x/n,p) = n Cxpxqn-x

n!
p xqn x
= x!( n  x )!
Donde:
n!
nCx = C = Coeficiente Binomial = x!(n  x)!
n
x

(x) = Nº específico de éxitos


(n) = Nº de ensayos u observaciones
(p) = Probabilidad de éxito en c/u de los ensayos.
q = 1-p = Probabilidad de fracaso en cualquier ensayo.

El Símbolo n! Se lee “n factorial” donde 0! = 1 => 3! = 3x2x1

E5:La Probabilidad de que un gerente de compras elegido al azar realice una compra es de
0.20. Si un vendedor visita a 6 gerentes de compras, hallar la probabilidad de que realice
exactamente 4 ventas.
Solución
Datos:
P = 0.20 n=6
q = 1-0.20 = 0.80 x=4

P(x=4/n=6, p=0.20) = 6C4(0.20)4(0.80)6-4

6!
= (0.20) 4 (0.80)2
4!(6  4)!

6 x5 x 4 x3x 2
= (0.0016)(0.64)
(4 x3x 2)(2)

64
= 0.01536 0.015
Ejemplo Nº 6.3.
En relación con el ejemplo anterior, hallar la probabilidad de que el vendedor logre 4 o más
ventas.
Solución
P(x  4/n = 6, P = 0,20) = P(x = 4) + P(x =5) + P(x=6)
= 0,01536 + 0,001536 + 0,000064
= 0,016360  0,017
En donde:

P(x=4) = 0,01536 (Ejemplo anterior)

6!
P(x=5) = 6C5 (0,20)5 (0,80)1 = (0,20)5(0,80)
5! 1!
= 6(0,00032) (0,80) = 0,001536

6!
P(x=6) = 6C6(0,20)6(0,80)0 = (0,000064)(1)
6! 0!
= (1) (0,000064) = 0,000064

6.2.2. Uso de las Tablas de Probabilidades Binomiales

Como el uso de la fórmula binomial implica una cantidad considerable de cálculos


cuando la muestra es relativamente grande. Por tanto usamos las tablas de
probabilidades binomiales.
Ejemplo Nº 6.4.
Si la probabilidad de que un gerente de compras elegido al azar realice una compra es de
0,20.
Hallar la probabilidad de que un vendedor que visita a 15 gerentes realice menos de 3
ventas:
Solución

Sabemos:
P(x < 3, n = 15, p = 0,20) = P(x  2)
= P(x = 0) + P(x =1) + P(x = 2)
= 0,0352 + 0,1319 + 0,2309 (Ver Apéndice 2)
= 0,3980  0,40

Ejemplo de Aplicación 6.5:


Según una revista estudiantil, el 45% de los que terminaron los ciclos en la Universidad
trabajan durante el verano con el objeto de ganar dinero para pagar el importe de la
enseñanza del curso siguiente. Si se eligen al azar 30 estudiantes. ¿Cuál es la probabilidad
de que: a) 13 trabajan en el verano, b) ninguno trabaja, c) más de 23 trabajan.
Solución

65
a) Localizamos en la tabla el valor de n = 30, p = 0,45 y para x = 13 obtenemos un
valor de 0,1433, es decir existen 14,33% de probabilidad de que 13 de los 30
estudiantes trabajen en verano para ganarse el dinero de la enseñanza.
b) Con n=30 y p=0,45, la tabla indica de que la probabilidad de que no trabaje
ninguno es p(x=0) = 0,0000.
c) Se observa que la probabilidad de que más de 23 estudiantes trabajen es de P(x
>23) / n =30, p = 0,45 = 0000.

Interpretación: Es bastante imposible que no trabaje ninguno o trabajen todos los


estudiantes.

Ejemplo Nº 6.7.
Ejemplo caso en que p > 0,50

INSTALAR CIRCUITOS ELÉCTRICOS

Considérese un caso en el que la probabilidad de éxito en cualquier ensayo, p, es mayor de


0,50, que es el valor más alto del apéndice. Un trabajador instala correctamente circuitos
impresos con p = 0,95. Si se instalan 20 circuitos.

a) ¿Cuál es la probabilidad de que precisamente 16 se instalen en forma correcta?.

Solución
n  20 

x  16  no contiene valor para p  0,95
p  0,95
La respuesta deseada se puede encontrar si se modifica la pregunta en términos de fracaso
en lugar de éxito.
El trabajador no instala correctamente los circuitos el 5% del tiempo. Si ahora leemos p
como la probabilidad de fracaso en cualquier ensayo. Podemos hallar en la columna p =
0,05 una probabilidad de obtener precisamente cuatro circuitos defectuosos como 0,0133.
Esto implica también una probabilidad de obtener 16 circuitos perfectos.
Es decir:
n = 20
p( x=4/n=20, p=0,05) = 0,0133
x=4

Cuál es la probabilidad de obtener al menos cuatro circuitos instalados incorrectamente. ¿Y


la de obtener a lo sumo tres circuitos defectuosos?
Solución
Obtener al menos 4 circuitos defectuosos = P(x=4) + P(x=5) + ... + P(x=20) circuitos
defectuosos, ésto suma según tabla 0,0133 + 0,0022 + 0,0003 = 0,0158, del mismo modo.
P(a lo sumo 3 circuitos defectuosos), se encuentra como la suma de las probabilidades de
obtener 0, 1, 2 y 3 circuitos defectuosos, es decir 0,3583 + 0,3774 + 0,1887 + 0,0596 =
0,9842.

66
Observamos que la suma de ambas respuestas suman 1,00.
Es decir: P(x4/n=20, p=0,05) = 1–P(x3/n=20, p=0,05)

6.2.3. LA DISTRIBUCIÓN POISSON

La Distribución Poisson se utiliza para determinar la probabilidad de que ocurra un número


designado de eventos, cuando éstos ocurren en un continuo de tiempo o espacio. (Por
ejemplo en un intervalo de tiempo) en vez de ocurrir en ensayos u observaciones fijas como
en el proceso Bernulli.

Ejm. La entrada de llamadas en un conmutador telefónico.


Se consideran:
Los eventos son independientes
El proceso es estacionario (permanece constante de un ensayo a otro)

Sólo se requiere un valor para determinar la probabilidad de que ocurra un número


designado de eventos en un proceso de Poisson:
Este es el número promedio a largo plazo de eventos para el tiempo o dimensión específico
de interés. Esta media es  la letra griega “lambda”

La fórmula para determinar la probabilidad de un Nº determinado de éxitos N en una


distribución de Poisson es:
x 
P(x/) =  e
x!
Donde: e = constante = 2.7183 (base de los logaritmos naturales)
e- = Valores de la tabla
x = Nº especifico de éxitos.
Ejemplo Nº 6.8.
Un departamento de reparación de maquinaria recibe un promedio de cinco solicitudes de
servicio por hora. La probabilidad de que se reciban exactamente tres solicitudes en una
hora seleccionada al azar es:
Solución

53 e5 (125) (0.00674)


P(x=3/=5.0) =   0.1404
3! 3x 2 x1
Ejemplo Nº 6.9.
Puede determinarse la respuesta del ejemplo anterior utilizando el apéndice 4 de
probabilidades Poisson?.
Solución
P(x=3/=5.0) = 0.1404
Nota 1: Cuando lo que interesa es la probabilidad de “x o mas” o “x o menos”. Se aplica la
regla de adición para eventos mutuamente excluyentes.

67
Ejemplo Nº 6.10.
Si en un Dpto. de reparación de maquinaria se recibe un promedio de 5 solicitudes de
servicio por hora, hallar la probabilidad de que se reciban menos de 3 llamadas en una hora
elegida al azar.
Solución
P(x < 3/ = 5.0) = P(x  2) = P(x=0) + P(x=1) + P(x=2)
= 0.0067 + 0.0337 + 0.0842
= 0.1246 Respuesta.
Donde:
P(x=0/=5.0) = 0.0067
P(x=1/=5.0) = 0.0337 Apéndice 4
P(x=2/=5.0) = 0.0842
Como se supone que un proceso Poisson es estacionario, se concluye que la media del
Proceso es siempre proporcional a la longitud del continuo del tiempo o espacio.

Nota 2: Si se tiene disponible una media para una longitud de tiempo, puede determinarse
la media para cualquier otro periodo de tiempo que se requiere.
Esto es importante porque el valor de  que se utiliza debe aplicarse al periodo de tiempo
pertinente.

 = Promedio por periodo de tiempo o espacio.


Ejemplo Nº 6.11.
En promedio, 12 personas hacen preguntas cada hora a un consultor de decoración en una
tienda de telas. Calcular la probabilidad de que tres o más personas acudan a un periodo de
10 minutos (1/6 de hora).
Solución
Dado x = Nº de Personas
Promedio por horas = 12

 = promedio por 10 minutos = 12/6 = 2.0

P(x  3/=2) = P(x=3/=2.0)+P(x=4/=2.0) + P(x=5/=2.0) + ...


= 0.1804 + 0.902 + 0.0361 + 0.0120 +0.0034 +
0.0009 + 0.0002 = 0.3232.
En donde: Del apéndice 4 obtenemos:

P(x=3)/ = 2.0 = 0.1804


P(x=4)/ = 2.0 = 0.0902
P(x=5)/ = 2.0 = 0.0361
P(x=6)/ = 2.0 = 0.0120
P(x=7)/ = 2.0 = 0.0034
P(x=8)/  = 2.0 = 0.0009
P(x=9)/  = 2.0 = 0.0002
------------
0.3232

68
También se puede calcular así: más corto
P(x  3) = 1 – P(x < 3/=2.0)
= 1 – (P(x=2/=2.0)+ P(x=1/=2.0) + P(x=0/=2.0))
= 1 – (0.2707 + 0.2707 + 0.1353)
= 1 – (0.6767)
= 0.3233

PRÁCTICA Nº 7

DISTRIBUCIONES DE PROBABILIDADES

A. Valor Esperado

1. Se ha determinado que el número de camiones que llegan cada hora a un almacén tiene la
distribución de probabilidad que se muestra en la tabla dada.

Calcule: a) El número esperado de llagada x, por hora.

Número de Camiones 0 1 2 3 4 5 6

Probabilidad P(x) 0.05 0.10 0.15 0.25 0.30 0.10 0.05

2. Las ventas por hora de una máquina automática pueden se 20, 21 o 22 cajetillas de cigarrillos
con probabilidades de 0,3; 0,5; y 0,2 respectivamente. ¿Cuál es la venta por hora esperada para
esta máquina?

3. Una urna contiene 5 bolitas negras y 8 blancas. Se saca una bolita de la urna si esta es negra
usted gana 15 bolivianos, pero si es blanca usted pierde 13 bolivianos. ¿Cuál es el Valor
Esperado de este juego?.

B. Distribución Binomial

4. Dada la distribución binomial con p = 0,25 y n = 7, utilícese la fórmula y la tabla de


distribución binomial para determinar.

a) P(X  2) c) P(X  4)
b) P(X = 2) d) P(X = 4)

69
5. Dada la distribución binomial con p = 0,85 y n = 9, utilícese la tabla de distribución binomial
para determinar:

a) P(X  7) c) P(X  5)
b) P(X = 7) d) P(X = 5)

6. Dada la distribución binomial con p = 0,35 y n = 8, utilícese la formula y la tabla de distribución


binomial para determinar:

a) P(X = 0) c) P(X < 3)


b) P(X = 3) d) P(X  3)

7. Dada la distribución binomial con p = 0,70 y n = 20, utilícese la tabla de distribución binomial
para determinar:

a) P(X = 0) c) P(X > 3)


b) P(X = 12) d) P(X  3)

8. Debido a las elevadas tasas de interés, una empresa reporta que el 30% de sus cuentas por
cobrar de otras empresas están vencidas. Si un contador toma una muestra aleatoria de cinco de
esas cuentas.
Determine la probabilidad de cada uno de los siguientes eventos, utilizando la fórmula de la
probabilidad binomial:
a. Ninguna de las cuentas está vencida
b. Exactamente 2 cuentas están vencidas.
c. La mayor parte de las cuentas están vencidas.
d. Exactamente el 20% de las cuentas están vencidas.

C. Distribución Poisson

9. El número promedio de los homicidios en cierta metrópoli es de 2 por día. Utilizando la


distribución de Poisson, determínese la probabilidad de que en un día dado haya.
a. No más de 3 homicidios.
b. Exactamente 3 homicidios

10. El promedio anual de terremotos en Chile es de 0,5. Utilícese la distribución de Poisson para
determinar la probabilidad de que no haya terremotos en Chile en los 3 años.

11. El Promedio mensual de incendios grandes en una ciudad es de 1.5. Utilícese la distribución
de Poisson para determinar la probabilidad de que haya exactamente un incendio grande en un
periodo de dos meses.

12. La mesa conmutadora del Gran Hotel Emperador recibe un promedio de 10 llamadas
telefónicas por minuto. Utilícese la distribución de Poisson para determinar la probabilidad de
que lleguen exactamente 4 llamadas en un periodo de 30 segundos.

70
13. El número promedio de fallas en un rollo de un cierto tipo de papel mural es de 2.5. Utilícese
la distribución de Poisson para determinar la probabilidad de que un rollo tenga 4 o más fallas.

71
7. CAPÍTULO 7 DISTRIBUCIÓN NORMAL, DISTRIBUCIÓN DE LA MEDIA
MUESTRAL

7.1. Distribución de probabilidades para variables aleatorias continuas

7.1.1. Distribución Normal

Ejemplo Nº 7.1.
Para la distribución continua de probabilidad de la figura dada, la probabilidad de que un
embargue seleccionado al azar tenga un peso neto entre 6000 y 8000 kilogramos es igual a
la proporción del área total bajo la curva que se encuentre bajo el área sombreada. Es decir
se define que el área total bajo la función de densidad de probabilidad es igual a 1, y se
puede determinar la proporción de esta área que se encuentra entre dos puntos
determinados.
f(x)

Peso, Kg
2000 4000 6000 8000 10000 12000

Existen diversas distribuciones continuas de probabilidades comunes que son aplicables


como modelos a una amplia gama de variables continuas en determinadas circunstancias.
Existen tablas de Probabilidades para esas distribuciones estándar para determinar las áreas
bajo la curva de probabilidad para estas distribuciones (con la distribución normal).

7.1.2. La Distribución Normal de Probabilidad

Es una distribución continua de probabilidad que es al mismo tiempo, simétrica y


mesokúrtica definidas en él capitulo 3. Se describe a la curva de probabilidad que
representa a la distribución normal como una campana.
f(x)

72
7.1.3. Uso de las Tablas de Distribución Normales
Las tablas de las probabilidades normales se basan en una distribución específica: la
Distribución Normal Estándar.
Esta es una distribución normal en la que u = 0 y  = 1. Cualquier valor x de una población
con distribución normal estándar equivalente, z, mediante la fórmula.
xu
Z

En el apéndice 5 se obtienen las posiciones de área para diversos intervalos de valores para
la distribución normal estándar, en donde el límite inferior del intervalo es siempre la
media.
Aquí se transforman los valores designados de la variable x en valores normales estándar.
Ejemplo Nº 7.2.
Se ha ajustado el proceso de fabricación de un tornillo de precisión de manera que la
longitud promedio de los tornillos sea u = 13.0 cm.
Por supuesto, no todos los tornillos tienen una longitud exacta de 13 centímetros, debido a
fuentes aleatorias de variabilidad. La desviación estándar de la longitud de los tornillos es 
= 0,1 cm. y se sabe que la distribución de las longitudes tienen una forma normal.
Determine la probabilidad de que: un tornillo elegido al azar tenga una longitud de entre
13,0 y 13,2 cm., e ilustre la proporción del área bajo la curva normal asociada con este
valor de probabilidad.
De la figura (a)

Ejemplo Nº 7.3.
Del problema E16, ¿Cuál es la probabilidad de que la longitud de los tornillos se
encuentren entre 12, 8 y 13,1 cm.? Ilustre la proporción del área bajo la curva normal para
este caso.

Solución

u = 13,0
 = 0,1
P(12,8  x  13,1)

Si
xu
Z

De la figura: 12,8 13,0 13,1


X1 X2
X1  u
12,8  13,0
Z1     2,0
 0,1
X  u 13,1  13,0
Z2  2    1,0
 0,1

P(12,8  X  13,1) = P(-2,0  Z  +1,0) = 0,4772 + 0,3413 = 0,8185

73
Práctica Nº 8
1. La Distribución Normal de trabajadores de una Industria tiene u = 50 años y  = 5 años, 20 %
de los trabajadores están bajo una cierta edad. ¿Cuál es la edad?.
2. La estatura media de los soldados de un regimiento es de 170 cm., 10% de estos soldados
miden más de 175 cm. Si tiene una distribución Normal. ¿Cuál es ?
3. La estatura de los soldados de un regimiento está distribuida normalmente con una media de
69 pulgadas y una desviación estándar de 2 pulgadas.
a. ¿Cuál es la probabilidad de que un soldado mida mas de 72 pulgadas?
b. ¿Cuál es el porcentaje de soldados cuyas estaturas están entre 69 y 73 pulgadas?
c. Si para la realización de una cierta misión, un soldado debe estar en el 20% de los de mayor
estatura, ¿Cuál es la estatura mínima para participar en esta misión?.
4. Un rodamiento es considerado defectuoso y por lo tanto es rechazado si su diámetro es mayor
que 2.02 pulgadas o menor que 1,98 pulgadas. ¿Cuál es el número esperado de rodamientos
rechazados si los diámetros de una partida de 10,000 rodamientos están distribuidos,
normalmente con una media de 2 pulgadas y una desviación estándar de 0.01 pulgadas?.
5. Los puntajes finales en un curso de Psicología están distribuidos normalmente con una media
de 60 y una desviación estándar de 10.
a. Si el puntaje mínimo para aprobar es 48, ¿Cuál es el porcentaje de fracasos?
b. Si han de aprobar el 80% de los estudiantes, ¿Cuál debe ser el puntaje mínimo aprobatorio?
6. En una industria alimenticia se comercializa harina en paquetes de “PESO NETO 500 grs.”. El
proceso automático de llenado de los paquetes puede regularse de modo que la cantidad media
de harina por paquete puede ajustarse al nivel que se desee. Suponiendo que la cantidad de
harina por paquete se distribuye normalmente con una desviación estándar de 0,2 onzas.
a. ¿A qué nivel debe ajustarse el llenado medio de modo que solo el 0,001 de los paquetes tengan
un peso neto inferior a 12 onzas?
b. ¿A qué nivel debe ajustarse el llenado medio de modo que solo el 0,05 de los paquetes tengan
un peso neto superior a 12,4 onzas?.
7. El peso medio de una piña en una partida grande es de 5 libras. El 10% de las piñas pesan
menos de 4 libras. Suponiendo que los pesos están distribuidos normalmente. ¿Cuál es la
desviación estándar de la partida?.
8. Un estudio reporta los salarios iniciales anuales de los contadores recientemente egresados, y
los promediaba en 22500 bolivianos, con una desviación estándar de 2250 bolivianos. Si los
salarios siguen una distribución normal. ¿Cuál es la probabilidad y los porcentajes de que un
recién egresado gane:

a) más de 21,000 bolivianos


b) menos de 25000 bolivianos
c) entre 24000 y 26000 bolivianos
d) como mínimo 20000 bolivianos?

74
8. CAPÍTULO Nº 8 DISTRIBUCIÓN DE LA MEDIA MUESTRAL

Debido a factores como tiempo y costo, se estiman los parámetros poblacionales desconocidos por
ejemplo la media (u) examinando la información de la muestra ( x ) de la población, la cual debe
ser representativa de la población objeto del estudio.

Por ejemplo, si deseamos hallar el interés hacia el estudió por parte de los estudiantes
universitarios de un facultad; en este caso la población más importante es la recolección de
respuestas de los estudiantes de la facultad sobre el interés hacia el estudio.
Aquí tomaremos una parte de esta población (muestra), y la usaremos para normar el interés de los
estudiantes hacia el estudio.

Si nos basamos en las respuestas de miembros de otras fuentes u otras instituciones obtendremos
sobre todo respuestas sesgadas (visión distorsionada de las actitudes de las actitudes de los
estudiantes en conjunto) o desviadas a favor del estudio.

8.1. Consideraciones generales

Si obtenemos muestras aleatorias de una población, éstas por su naturaleza propia no se pueden
predecir, sólo se pueden hacer afirmaciones probabilísticas sobre una población cuándo se usan
muestras representativas de la misma.

Para cualquier tamaño de muestra n, tomado de una misma población con media (u), los valores de
la media muestral x , varían de una muestra a otra. Esta variabilidad sirve de base para la
distribución muestral.

Si estudiamos un estadístico como la media muestral ( x ), a partir de las medidas en muestras


aleatorias, tendremos que enlistar la distribución de los valores posibles de este estadístico
asociados a su probabilidad respectiva.

8.2. DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Ejemplo Nº 8.1.
Si tenemos una población de N=4, que indican los ingresos anuales de 4 analistas de sistemas 10,
20, 30 y 40 (en miles de bolivianos)
a.- Calcular la media de la población (u)
b.- La desviación estándar poblacional ()
c.- Si tomamos muestras aleatorias de tamaño n=2 hacer una lista de todos los pares posibles de
las diferentes muestras de la media.
Para cada uno de los pares identificados, calcule la media muestral x con su respectiva
probabilidad, y demuestre que la media de todas las medias muestrales posibles (u x ) es igual a la
media de la población (u) de donde se seleccionaron las muestras.

75
8.2.1. ERROR ESTÁNDAR MUESTRAL DE LA MEDIA ( x ) S x
La Distribución muestral de las medias Muestrales tiene una desviación estándar, a esta desviación
estándar de la distribución de todas las medias Muestrales también se le denomina error estándar
de la media el cual mide la dispersión de las observaciones individuales (medias muestrales) en
torno a la media de las medias muestrales u x = u, también indica la precisión de la media
muestral.

Fórmula del error estándar:

x x
2 2

x    

Ns  Ns 

donde:

 x = error estándar de la media


Como la fórmula dada requiere mucho cálculo aritmético también podemos hallar el error estándar
así; para una población tenemos:

x 
n
Error Estándar Estimado
S
Sx 
n

8.2.2. Muestras de poblaciones finitas – factor de corrección


Cuando se muestra a partir de una población finita (no infinita) se debe incluir un factor de
corrección en la fórmula para el error estándar de la media como regla general, la corrección es
despreciable y puede omitirse cuando n < 0,05 N es decir cuando el tamaño de la muestra es menos
del 5% del tamaño de la población.
Fórmula del error estándar de la media incluyendo el factor de corrección por población finita:

 N n
x 
n N 1
Ejemplo Nº 8.2.
Del primer ejemplo demostraremos que al utilizar las dos fórmulas del error estándar dadas, el
resultado es el mismo.
INTERPRETACIÓN: las 6 medias Muestrales posibles tienen una media = 25 = ux = u, las cuales
tienden apartarse de 25 en 6,45.

Ejemplo Nº 8.3.
Un contador toma una muestra aleatoria de tamaño n =16 de un conjunto de N = 100 cuentas por
cobrar. No se conoce la desviación estándar de los montos de las cuentas por cobrar para el total de

76
las 100 cuentas. Sin embargo, la desviación estándar de la muestra es S = $57.00. Hallar el error
estándar para la distribución muestral de la Media.

Solución

s N n 57 100  16 57 84
sx   
n N 1 16 100  1 4 99

 14,25 0,8484  14,25(0,9211)  13,13

En el ejemplo dado se estima el error estándar de la media con base en la desviación estándar
muestral, y se requiere utilizar el factor de corrección por población finita porque no es cierto que
n < 0,05 N, es decir 16 > 0,05(100)

El error estándar de la Media ofrece la base principal para la inferencia estadística con respecto a la
media de una población que se desconoce. En este capítulo un teorema de la estadística usado para
hallar la utilidad del error estándar de la media es:

TEOREMA DEL LIMITE CENTRAL – DISTRIBUCIÓN NORMAL EN DISTRIBUCIÓN


MUESTRAL DE LA MEDIA

Ejemplo Nº 8.4.
En un estudio para comparar la producción promedio mensual en miles de unidades producidas
por COCA-COLA y KOLA REAL se usará una muestra aleatoria de 20 y 25 trabajadores de c/u
de las empresas . Se sabe que la producción por trabajador siguen una distribución normal. El
promedio de la producción de todos los trabajadores de COCA_COLA es de 100 unidades y su
desviación estándar es de 14.142, mientras que el promedio de la producción de todos los
trabajadores KOLA REAL es de 85 unidades y su desviación estándar es de 12.247 unidades. Si
y representan el promedio muestral de la producción de los 20 y 25 trabajadores
respectivamente. Encuentre la probabilidad de que el promedio de las unidades producidas por los
20 trabajadores sea al menos 20 unidades más que el de los 25 trabajadores.
Solución:
Datos:
1 = 100 unidades; 2 = 85 unidades ; 1 = 14.142 unidades; 2 = 12.247

unidades ; n1 = 20 trabajadores; n2 = 25 trabajadores; =?

77
Por lo tanto, la probabilidad de que el promedio de las unidades producidas de la muestra de
trabajadores de COCA-COLA sea al menos 20 unidades más que el de la muestra de los
trabajadores de KOLAREAL es 0.1056.

8.3. DISTRIBUCIONES MUESTRALES DE PROPORCIONES

Las distribuciones Muestrales de proporciones son usadas en muchos casos, sobre todo cuando se
trata de hallar si una observación cumple o no una determinada característica.
Por ejemplo, los políticos no siempre desean saber cuantas personas votarán por ellos, sino que
porcentaje de la gente lo hará, es decir en lugar de medias Muestrales, nos encontramos con
proporciones Muestrales.

8.3.1. Calculo de una proporción muestral de éxitos – media de las proporciones


muestrales.
Utilizamos la siguiente fórmula:
S
p
n
dónde :
p = proporción muestral de éxitos.
S = número de éxitos en una muestra.
n = datos de la muestra.
E6: Un político entrevista a 500 sufragantes, si sólo 200 de ellos votaron por él, hallar la
proporción muestral de éxitos.
Solución
S 200
P   0,40
Sabemos: n 500
Nota: Tal como estudiamos en distribución muestral donde ux (media de todas las medias
Muestrales) = u(media de la población).
En este caso: P = 
Dónde:
P = media de las proporciones Muestrales.
 = proporción de la población.

8.3.2. CALCULO DEL ERROR ESTÁNDAR DE LA PROPORCIÓN


Utilizamos la siguiente fórmula:
 (1   )
P 
n

78
8.3.3. Teorema del límite central – distribución normal para proporciones muestrales

La distribución de proporciones Muestrales se aproximará a una Distribución Normal cumpliendo


el Teorema del Límite Central aplicado a la distribución de proporciones Muestrales. Aquí se debe
cumplir lo siguiente:
n> 50 y
Tanto n  como n(1-) son mayores que 5.

PARA UNA POBLACIÓN FINITA


Se debe cumplir que n > 0,10N, para utilizar el factor de corrección por población finita:

 (1   ) N  n
P 
n N 1

Ejemplo Nº 8.5.
Un médico administra un medicamento a N = 5 pacientes. Los resultados de cada paciente son
respectivamente muere, vive, vive, muere, muere. Hallar la media de todas las proporciones
Muestrales, si se toman muestras de tamaño n = 2. También hallar el error estándar de las
proporciones muestrales.
Solución
Las muestras posibles de tamaño n = 2 y la proporción de éxitos (vive), se indican en la tabla
siguiente.
Se cumple también 5C2 = 10. M = muere, Vive = V.
Ns = Nº de muestras posibles = 10

S
p
Sabemos: n
Donde:
p = proporción muestral de éxitos.
S = proporción de éxitos en una muestra.
n = 2.

Proporción de
Muestra
Éxitos P
M1 V2 0,5
M1 V3 0,5
M1 M4 0,0
M1 M5 0,0
V2 V3 1,0
V2 M4 0,5
V2 M5 0,5
V3 M4 0,5
V3 M5 0,5
M4 M5 0,0

79
P = 4,0

P
 P  4  0,40
Ns 10
donde:
p = proporciones.
p = media de todas las proporciones.
Ns = Nº de muestras posibles.
Es decir P (media de todas las proporciones ) es igual a u(media de la población) = 0,40.

Cálculo del error Estándar de las Proporciones Muestrales.

 (1   ) N  n (0,4)(0,6) 5  2
P    0,3
n N 1 2 5 1

E8: Con referencia al problema E7. Si él médico administra el medicamento a muchos pacientes,
de los cuales viven  = 45%. Si se elige una muestra de 80 pacientes. ¿Cuál es la probabilidad que
vivan más de 40?.

PRÁCTICA Nº 9
DISTRIBUCIONES MUESTRALES

1. Se sabe que la vida útil promedio de los focos de transparencias es  = 9000 horas, con una
desviación estándar de 500 horas. Determine el valor esperado y el valor estándar de la
distribución muestral de la media, con un tamaño de muestra de n = 25. Interprete el significado
de los valores calculados.

2. Para una población grande de saldos de cuentas que tienen distribución normal, se tiene un
saldo promedio de  = $ 150,000.00, con desviación estándar  = $ 35,000 cuál es la probabilidad
de que una cuenta muestrada al azar tenga un saldo que excede de $ 160,000.
3. Con referencia al problema anterior, ¿cuál es la probabilidad de que la media de una muestra
aleatoria de n = 40 cuentas exceda de $ 160,000?

4. De un estudio contable se toma alzar una muestra de 500 empleados de un número mayor a
ellos. Los trabajadores realizan labores a destajo y se encuentran que el producto medio de pago
por cliente es de 2000 nuevos Bolivianos, con una desviación estándar muestral S=200 Nuevos
Bolivianos. Hallar el pago promedio a destajo para todos los empleados de la empresa, con un
intervalo de confianza del 90%.

5. El banco de Crédito toma una muestra n = 600 de una población de 1200 clientes que
cuentan con tarjeta de crédito, el valor promedio de los créditos es de 3200 con una desviación
estándar poblacional de 600 Nuevos Bolivianos . Hallar la probabilidad de que la media muestral
sea superior a 3350 Nuevos Bolivianos.

80
6. Para ilustrar el significado de la distribución muestral de la media se hace referencia a una
población altamente simplificada. Suponga que una población consta solamente de cuatro valores:
3, 5, 7 y 8. Calcule (a) la media de la población , y (b) la desviación estándar de la población .

7.- Para la población que se describió en el problema anterior, suponga que se toma muestras
aleatorias simples de tamaño n = 2, de esa población. En cada una de las muestras, antes de elegir
el segundo elemento muestral, no se reemplaza el primer elemento escogido.
Hacer una lista de todos los pares posibles que puede constituir una muestra.
Para cada uno de los pares identificados en (a), calcule la media muestral X y demuestre que la
media de todas las medias muestrales posibles  x es igual a la media de la población de donde se
seleccionaron las muestras.

8. Para la situación de muestreo que se describió en los problemas anteriores, calcule el error
estándar de la media determinando la desviación estándar de las seis medias muestrales posibles
que se identificaron en el problema anterior, con respecto a la media poblacional . Después
calcule el error estándar de la media con base en la  que se conoce y, tratándose de un muestreo
en una población finita, utilice la fórmula apropiada y verifique que los dos valores del error
estándar sean iguales.
9. Uno de los principales fabricantes de televisores compra los tubos de rayos catódicos a dos
compañías. Los tubos de la compañía A tienen una vida media de 7.2 años con una desviación
estándar de 0.8 años, mientras que los de la B tienen una vida media de 6.7 años con una
desviación estándar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de
la compañía A tenga una vida promedio de al menos un año más que la de una muestra aleatoria de
40 tubos de la compañía B.

81
9. CAPÍTULO IX PRUEBA DE HIPÓTESIS

9.1. ¿Qué es una hipótesis?


- Hipótesis: enunciado acerca de una población elaborada con el propósito de ponerse a
prueba.
- Ejemplos de hipótesis acerca de un parámetro de población son:
 La media mensual de ingresos para contadores es $ 3625
 El 20 % de los delincuentes juveniles son capturados y sentenciados a prisión.

9.2. ¿Qué es una prueba de hipótesis?


Prueba de hipótesis: procedimiento basado en la evidencia muestral y en la teoría de
probabilidad que se emplea para determinar si la hipótesis es un enunciado razonable y no
debe rechazarse o si no es razonable y debe ser rechazado.

Prueba de Hipótesis.

Paso 1: Plantear la hipótesis nula y alterna

Paso 2 : Seleccionar un nivel de significancia

Paso 3: Identificar el valor estadístico de prueba

Paso: 4 Formular una regla de decisión

Paso 5 : Tomar una muestra, llegar a una decisión

No rechazar la hipótesis nula Rechazar la hipótesis nula y


aceptar la alterna

Prueba de significancia de una cola


Una prueba es de una cola cuando la hipótesis alterna, H1, establece una dirección, como:
H0: el ingreso medio de las mujeres es menor o igual al ingreso medio de los hombres.
H1: el ingreso medio de las mujeres es mayor que el de los hombres.

82
Prueba de significancia de dos colas:
Una prueba es de dos colas cuando no se establece una dirección específica de la hipótesis
alterna H1, como:
H0:el ingreso medio de las mujeres es igual al ingreso medio de los hombres
H1: el ingreso medio de las mujeres no es igual al ingreso medio de los hombres.

Ejemplo Nº 9.1.
Un Fabricante de “Crispy” un nuevo alimento para el desayuno, está preocupando por el peso
medio de cereales que se envasa en sus cajas. Estas anuncian un peso neto de 36 onzas. Si el
fabricante desea realizar la prueba de hipótesis aun nivel de significancia del 5%. Si se elige al azar
una muestra de x = 37,6 onzas y una desviación estándar de S = 3 onzas. Determinar el sistema de
hipótesis y realizar la prueba

Solución

u = 36 onzas
 = 5%
x = 37,6
S = 3 onzas
n = 100 95%
Ho: u = 36 Rechazo
H1: u  36 /2 = 0,025

Sabemos:
xCR  uH  ZSx 35,41 uH=36 36,59
= 36  (1,96)(0,3)
= 36  0,588
35,41 hasta 36,59

INTERPRETACIÓN.

Como la media muestral x = 37,6 la cual está sobre 36,59; entonces se rechaza la hipótesis nula. Es
improbable que u = 36, soló hay una probabilidad del 2,5% de que una muestra diera un media
mayor que 36,59.

Ejemplo Nº 9.2.
Un contador piensa que el número medio de días necesarios para realizar un trabajo debe ser u =
27. Si la media es menor que 27, el contador teme que el trabajo se ejecute con descuido de
calidad, mientras que una media por encima de 27 puede dar lugar a unos gastos innecesarios. Se
eligen al azar 50 trabajos con objeto de probar (contrastar esta afirmación).

83
Se encuentra que la media es x =25,3 días, con una desviación estándar S = 2,1 días. El contador
desea probar (contrastar) la hipótesis con nivel de significancia del 1% (99% de confianza).
Determinar el sistema de hipótesis y realizar la prueba. Si rechaza la Hipótesis nula, el contador
tendrá que volver a valorarel proceso de trabajo para garantizar que se siguen procedimientos
adecuados

Solución

u = 27
n = 50
x = 25,3
S = 2,1 Rech
 = 1% Ho:0,99 azo
Ho: u = 27 /2 = 0,005
0,4950
H1: u  27 26,23 uH=27 27,77

Z = 0,99:2 = 0,4950 = 2,58


E3. El Administrador de una comunidad informa a una empresa que para construir un centro
comercial el ingreso promedio por hogar es de $3000. si los ingresos siguen distribución normal
con S = $411.95, después de un previo estudio, se encuentra que el ingreso promedio por hogar
para una muestra aleatoria de 15 hogares es $2910.pruebe la hipótesis con alfa = 5%

Ejemplo Nº 9.3.
Si la vida útil de las focos de una marca específica es cuando menos 4200 hrs. La vida útil
promedio para una muestra aleatoria de n = 10 focos es x  4000 hrs. con desviación estándar
muestral S = 200hrs.
Si tiene vida útil D. normal – probar la hipótesis con alfa = 5%
Solución
n = 10 Ho:  4200 hrs.
H1: < 4200
tCRÍTICA (gl = 9, x = 0,05) = -1,833
S 200 200
Sx     63,3hrs.
n 10 3.16
x   0 4000  4200
 CAL    3,16
Sx 63.3

HO
Acepta
HI

84
tCAL = -3,16 t CRITICO = -1,833
Interpretación: Se rechaza Ho, se acepta H1 de que 1< 4200

9.3. La prueba estadística de ji – cuadrada pruebas para la independencia de dos


variables categóricas (pruebas para tablas de contingencias)

Las “pruebas de independencia” implican dos variables categóricas y lo que se prueba es la


suposición de que las variables son estadísticamente independientes. Pero el problema que nos
interesa es saber si las dos variables son estadísticamente dependientes o que están
relacionadas.
Como se trabaja con dos variables, se anotan las frecuencias observadas (fo) y esperadas (fe) en
una tabla de clasificación doble o Tabla de contingencias.

Mediante la expresión r x c se definen las dimensiones de este tipo de Tablas, en donde r indica el
número de renglones (filas) y c el número de columnas.

Pero la Ji – cuadrada nos permite también comparar dos atributos (variables) para determinar si
hay alguna relación entre ellos. Consideremos, por ejemplo, que un especialista en marketing
quisiera determinar si hay alguna conexión entre los niveles de renta de los consumidores y su
preferencia por el producto que él vende. Este procedimiento implicaría comparar dos atributos:
rentas y preferencias. La comparación de dos atributos para determinar si son independientes se
realiza analizando la diferencia entre frecuencias observadas reales y frecuencias esperadas.

El cálculo de la JI cuadrada (x2) para el análisis de una tabla de contingencia también es fácil de
hallarla e interpretarla usando el programa apropiado de alguno de los paquetes estadísticos como
el SAS, Minitab, SPSS y otros.

PRESENTACIÓN: EJEMPLO PARA SER APLICADO CON LA PRUEBA ESTADISTICA


DE JI-CUADRADA

EJEMPLO DEL TIPO 1: Este es un ejemplo del formato mas resumido de una tabla de
contingencia donde se consideran las dos variables, se trata de una tabla de contingencia de 2 x 2.

CUADRO 1

Jabón
Ingresos Total
B1 B2
A1 40 60 100
A2 110 90 200

85
Total 150 150 300
En el Cuadro 1
Observamos en los totales de las filas (renglones) y columnas que:
150 + 150 = 300 personas
100 + 200 = 300 Personas
100 tienen ingresos A1, y
200 tienen ingresos A2

También
150 usan jabón B1, y
150 usan jabón B2
Resultando:

CUADRO 2
Jabón
Ingresos Total
B1 B2
A1 100
A2 200
Total 150 150 300

Investigando (Por encuesta, entrevista)


Se encontró que 40 de los 100 tienen renta A1 y jabón B1, entonces sin necesidad de investigar se
halla automáticamente que 100 – 40 – 60
Del mismo modo se determina los valores de 110 y 90
frfc
Utilizando fe =
n
ygl = (r – 1 ) (c – 1)
Donde: fe = Frecuencia esperada
fr = Es la frecuencia total de una fila determinada
fe = Es la frecuencia total de una columna determinada
gl = Grados de libertad

frfc 100 x150


fe1 =   50
n 300

frfc 100 x150


fe2 =   50
n 300

frfc 200 x150


fe3 =   100
n 300

86
frfc 200 x150
fe4 =   100
n 300

Obtenemos:
CUADRO 3
Jabón
Ingresos Total
B1 B2
A1 40 (50) 60 (50) 100
A2 110 (100) 90 (100) 200
Total 150 150 300

Prueba de hipótesis nula de independencia para los datos de la tabla anterior utilizando un
nivel de significancia del 5 %

FORMULADE JI CUADRADA:
( f  fe )
X2 =  0
fe
Donde:
fe = Frecuencia esperada
f0 = Frecuencia observada
Hipótesis nula = H0 = No existe una relación estadísticamente significativa entre los ingresos
de una persona y la clase de jabón que usa. Por tanto son independientes.
Hipótesis alterna: HA = Existe una relación estadísticamente significativa entre los ingresos de
una persona y la clase de jabón que usa por tanto son dependientes.

gl = (r – 1) (c – 1) = (2 – 1 ) (2 – 1) = 1
( f  fe )
X2 =  0
fe

(40  50) 2 (60  50) 2 110  100) 2 (90  100) 2


X2 =    6
50 50 100 100

En la tabla de la Ji cuadrada (X2), y para un nivel de significancia de 5 por ciento hallamos 3.841
entonces como la estadística de prueba de 6 excede el valor crítico de 3.841. Por ello se rechaza la
hipótesis Nula de independencia y se concluye que existe una relación estadísticamente
significativa entre los ingresos de una persona y la clase de jabón que usa.

Práctica Nº 10
PRUEBA DE HIPÓTESIS
87
1. Un auditor desea probar el supuesto de que el valor promedio de toda las cuentas por cobrar
en una empresa determinada es 260 000 bolivianos, tomando una muestra de n = 36 y
calculando la media muestral, desea rechazar el valor supuesto de 260 000 bolivianos solo
si la media muestral lo contradice en forma clara, por lo que debe (darse el beneficio de la
duda) al valor hipotético en el procedimiento de prueba. Hallar las hipótesis nula y
alternativa para esta prueba.
2. Con referencia al problema 9, determinar los valores críticos de la media muestral para
probar la hipótesis con un nivel de significancia del 5%. Sabiendo que a la desviación
estándar de las cuentas por cobrar es  = 43 000.
3. Con referencia a los 2 problemas anteriores suponga que la x = 240 000.
Determine si se debe aceptar o rechazar la hipótesis nula.

4. 12 Con referencia a los problemas anteriores partimos de la hipótesis nula que la media de
todas las cuentas por cobrar es de cuando menos 260 000 bolivianos, probar la hipótesis
con un nivel de significancia del 5%.

88
APENDICES

89
APENDICE I: DISTRIBUCION BINOMIAL

90
APENDICE II: DISTRIBUCION BINOMIAL (CONT)

91
92
APENDICE II: DISTRIBUCION BINOMIAL (CONT)

93
APENDICE II: DISTRIBUCION BINOMIAL (CONT)

94
APENDICE II: DISTRIBUCION BINOMIAL (CONT)

95
APENDICE II: DISTRIBUCION BINOMIAL (CONT)

96
APENDICE III: DISTRIBUCION DE POISSON

97
APENDICE III: DISTRIBUCION DE POISSON

98
APENDICE III: DISTRIBUCION DE POISSON (CONT)

99
APENDICE III: DISTRIBUCION DE POISSON (CONT)

100
APENDICE III: DISTRIBUCION DE POISSON (CONT)

101
APENDICE III: DISTRIBUCION DE POISSON (CONT)

102
APENDICE IV: DISTRIBUCION NORMAL

103
APENDICE V DISTRIBUCION t DE STUDENT

104
BIBLIOGRAFIA
Básica
1. Anderson, D., Sweeney, D. y Willians, T. (2008). Estadística para administración y
economía (10a. ed.). México: Thomson Learning.
2. Berenson, M. y Levine. D. (1991). Estadística para administración y economía: conceptos y
aplicación. México: McGraw-Hill.
Complementaria
3. Spiegel, R. (2009).Estadística (4a. ed.). México: McGarw-Hill.
4. Moya Rufino Estadística Descriptiva
5. Levin, R. y Rubin, D. (2004). Estadística para administración y economía (7a. ed.) México:
Pearson Educación

105

También podría gustarte