2011 014
2011 014
2011 014
INDICE
INTRODUCCIN ............................................................................................................. 6 PROPSITO ................................................................................................................... 7 COMPETENCIAS A DESARROLLAR ................................................................................... 7 METODOLOGA DE TRABAJO ......................................................................................... 8 UNIDAD 1 DISTRIBUCIONES DE FRECUENCIA ................................................................. 9 1.1 RECOPILACIN DE DATOS ...................................................................................... 10 1.2 DISTRIBUCIN DE FRECUENCIAS HISTOGRAMAS, POLGONOS DE FRECUENCIA, Y OJIVAS ........................................................................................................................ 10 1.2.1 REPRESENTACIN GRAFICA DE LOS DATOS .......................................................... 12 HISTOGRAMA .............................................................................................................. 12 1.2.1 POLGONOS DE FRECUENCIA. .............................................................................. 16 1.3 MEDIDAS DE TENDENCIA CENTRAL Y DE VARIABILIDAD PARA UN CONJUNTO DE DATOS NO AGRUPADOS. ............................................................................................. 17 1.4 MEDIDAS DE DISPERSIN ....................................................................................... 18 MEDIDAS DE TENDENCIA CENTRAL Y DE VARIABILIDAD EN DATOS AGRUPADOS .......... 21 MEDIDAS DE TENDENCIA CENTRAL DATOS AGRUPADOS .............................................. 22 COEFICIENTE DE VARIACION. ....................................................................................... 23 COEFICIENTE DE VARIACIN PEARSON......................................................................... 26 UNIDAD 2 INTRODUCCIN A LA PROBABILIDAD .......................................................... 28 2.1 EVENTOS MUTUAMENTE EXCLUYENTES Y NO EXCLUYENTES................................... 29 2.2 REGLAS DE ADICIN........................................................................................... 29
2.3 EVENTOS INDEPENDIENTES, DEPENDIENTES, PROBABILIDAD CONDICIONAL ........... 30 2.3 PROBABILIDAD CONDICIONAL ............................................................................... 32 2.4 REGLAS DE MULTIPLICACIN ................................................................................. 33 2.5 DIAGRAMAS DE RBOL .......................................................................................... 33 2.6 COMBINACIONES Y PERMUTACIONES.................................................................... 39 2.6 COMBINACIONES .................................................................................................. 40
UNIDAD 3. TIPOS DE DISTRIBUCIONES VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS ................................................................................................................................... 42 3.1 DISTRIBUCIN BINOMIAL....................................................................................... 45 3.2 MODELO DE POISSON ............................................................................................ 47 3.3 DISTRIBUCIN HIPERGEOMTRICA DE PROBABILIDAD. .......................................... 50 3.5 MODELO NORMAL ................................................................................................. 51 UNIDAD 4. MUESTREO Y ESTIMACIONES ..................................................................... 55 4.1 DISTRIBUCIN MUESTRAL DE LA MEDIA................................................................. 56 4.2 DISTRIBUCIN MUESTRAL DE LA DIFERENCIA ENTRE DOS MEDIAS.......................... 59 4.3 DETERMINACIN DEL TAMAO DE LA MUESTRA DE LA POBLACIN ....................... 61 4.4 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON EL USO DE LA DISTRIBUCIN NORMAL Y T DE STUDENT. ....................................................................................... 64 4.5 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS, CON EL USO DE LA DISTRIBUCIN NORMAL Y t DE STUDENT. ....................................................... 66 4.6 UNA SOLA MUESTRA: ESTIMACIN DE LA PROPORCIN ......................................... 67 4.8 TAMAO DE LA MUESTRA COMO UNA ESTIMACIN DE P Y UN GRADO DE CONFIANZA (1 ) 100% ............................................................................................. 70 UNIDAD 5. PRUEBA DE HIPTESIS ............................................................................... 73 5.2 ERROR TIPO UNO I Y TIPO II EN PRUEBAS DE HIPTESIS ........................................ 76 5.3 PRUEBAS UNILATERALES Y BILATERALES ................................................................ 79 5.4. PRUEBA DE UNA HIPTESIS: REFERENTE A LA MEDIA CON VARIANZA DESCONOCIDA UTILIZANDO LA DISTRIBUCIN NORMAL Y t DE STUDENT. ........................................ 84 5.5. DOS MUESTRAS: PRUEBAS SOBRE MEDIAS UTILIZANDO LA DISTRIBUCIN NORMAL Y t DE STUDENT. ....................................................................................................... 86 5.6 UNA MUESTRA PRUEBA SOBRE UNA SOLA PROPORCIN ...................................... 89 5.7 DOS MUESTRAS: PRUEBA SOBRE DOS PROPORCIONES .......................................... 90 5.8. DOS MUESTRAS: PRUEBAS PAREADAS................................................................... 92
TEMARIO
I. DISTRIBUCIONES DE FRECUENCIA 1.1 1.2 1.3 Recopilacin de datos. Distribucin de frecuencia. 1.2.1 Histogramas, polgonos de frecuencia, ojivas. Medidas de tendencia central para un conjunto de datos no agrupados y datos agrupados. 1.3.1 Media. 1.3.2 Mediana. 1.3.3 Moda. Medidas de dispersin para un conjunto de datos agrupados y datos no agrupados. 1.4.1 Rango. 1.4.2 Varianza. 1.4.3 Desviacin estndar.
1.4
II.
INTRODUCCIN A LA PROBABILIDAD 2.1 Eventos mutuamente excluyentes y no excluyentes 2.2 Reglas de adicin 2.3 Eventos independientes, dependientes, probabilidad condicional 2.4 Reglas de multiplicacin 2.5 Diagrama de rbol 2.6 Combinaciones y permutaciones TIPOS DE DISTRIBUCIONES VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS 3.1 Binomial 3.2 Poisson 3.3 Hipergeomtrica 3.4 Propiedades: media, varianza y desviacin estndar 3.5 Normal MUESTREO Y ESTIMACIONES
III.
IV.
4.6 4.7
Distribucin muestral de la media Distribucin muestral de la diferencia entre dos medias Determinacin del tamao de la muestra de una poblacin. Intervalos de confianza para la media, con el uso de la distribucin Normal y t de student Intervalos de confianza para la diferencia entre dos medias 12 con 1 y 2, 1=2 pero conocidas, con el uso de la distribucin normal y la t de student. Una sola muestra: estimacin de la proporcin Tamao de la muestra como una estimacin de P y un grado de confianza (1-) 100%.
PRUEBA DE HIPTESIS Hiptesis estadsticas. Errores tipo I y II Pruebas unilaterales y bilaterales Prueba de una hiptesis: referente a la media con varianza desconocida utilizando la distribucin normal y t student. Dos muestras: pruebas sobre dos medias utilizando la distribucin normal y t student. Una muestra prueba sobre una sola proporcin. Dos muestras: prueba sobre dos proporciones. Dos muestras: pruebas pareadas se ha organizado su
Para facilitar el uso de este cuaderno de ejercicios contenido empleando los siguientes smbolos de apoyo:
Identificacin general del tema
Actividad, prctica o ejercicio sugerido: desarrollar la actividad indicada, realizar un procedimiento especfico seguir detalladamente una secuencia de pasos. Recomendacin para fortalecer el aprendizaje del tema o subtema, notas importantes o tips.
INTRODUCCIN
En un mundo cada vez ms globalizado en las reas comerciales, financieras, tecnolgicas y cientficas, y donde invariablemente el flujo de informacin es mayor a cada momento, se hace indispensable no slo la correcta descripcin de los datos sino tambin su anlisis e interpretacin. Es aqu donde la estadstica juega un papel importantsimo, al ser esta una de las reas del conocimiento que permite analizar la variabilidad que generalmente acompaa a los datos observados, y por ello se constituye como una herramienta que el Contador Pblico puede utilizar para la adecuada toma de decisiones. Estadstica Administrativa I tiene varios propsitos, pues pretende despertar en el estudiante de contadura el inters por la investigacin para la toma de decisiones, la solucin de problemas y el anlisis de situaciones y eventos relacionados con el entorno acadmico, profesional, personal y social, rigindose en todo momento por un cdigo de tica profesional y personal. Los propsitos de la asignatura en relacin a la carrera de Contador Pblico son que el estudiante: 1. Participe en el desarrollo de investigaciones y proyectos para la solucin de problemas relacionados con la administracin y contadura. 2. Adquiera la capacidad de lectura e interpretacin de tablas y grficos estadsticos para facilitar la realizacin de actividades administrativas. 3. Comprenda el papel que tiene de la estadstica en la toma de decisiones racional y el modo en que ha contribuido al desarrollo de la sociedad. 4. Identifique, dentro del contexto empresarial, la importancia y utilidad de los anlisis estadsticos para la toma de decisiones. 5. Manifieste una actitud crtica y analtica en la solucin de problemas. Esta asignatura pone especial nfasis en el enfoque prctico, tratando siempre de relacionar los conceptos, tcnicas y casos de estudio con el quehacer cotidiano de la administracin de una organizacin, esperando despertar en los estudiantes el deseo de adentrarse cada vez ms a la teora de la probabilidad y estadstica, al ver lo importante que resulta su utilizacin en el mbito contable y financiero. Este cuaderno de ejercicios tratar cinco temas fundamentales para que el alumno se introduzca al estudio bsico de la estadstica, en el primer captulo se abordan
ejercicios elementales de la estadstica descriptiva, en el segundo; ejemplos de probabilidad y valor esperado como una medida del riesgo frente a la incertidumbre en experimentos aleatorios; en la tercera parte se realizan ejercicios de los tipos de distribuciones aleatorias discretas y continuas; el captulo cuarto trata del muestreo y las estimaciones puntuales y por intervalo, finalmente en el captulo quinto se abordar la prueba de hiptesis que permitir al alumno llevar a cabo la toma de decisiones de forma racional.
PROPSITO
El cuaderno de ejercicios de estadstica administrativa I tiene como propsito introducir al estudiante con los conceptos y tcnicas bsicas de la estadstica aplicada a la administracin y economa. El cuadernillo tiene un nivel matemtico elemental, con la intencin de que el estudiante comprenda la metodologa y su aplicacin, y no tanto la teora matemtica detrs de ella.
COMPETENCIAS A DESARROLLAR
Competencia general: El estudiante analiza y aplica conceptos y tcnicas de la probabilidad y estadstica descriptiva e inferencial en la solucin de problemas en el rea de su competencia. Competencias especficas: Aplica las frmulas de tendencia central y de la variabilidad de datos para analizar informacin, relativos a datos agrupados y no agrupados y tomar decisiones. Aplica el concepto de valor esperado o esperanza matemtica para la toma de decisiones. Cita ejemplos de aplicacin de variables aleatorias discretas y continuas. Grafica una distribucin de probabilidad continua y discreta. Aplica los tipos de distribucin de variables aleatorias discretas como: binomial, Poisson, e hipergeomtrica para la solucin de Problemas relativos a la administracin. Aplica los tipos de distribucin de variables aleatorias continuas como: normal y aproximacin de la normal a la binomial, para la toma de decisiones. Consulta y explica los diferentes tipos de muestreo: aleatorio, sistematizado, estratificado y conglomerados. Aplica los mtodos de muestreo para recopilacin de la informacin que permita estimar las caractersticas poblacionales desconocidas,
examinando la informacin obtenida de una muestra, de una poblacin. Aplica las frmulas de tendencia central para la solucin de problemas en la toma de decisiones. Utiliza el teorema de lmite central para la solucin de problemas de una muestra y la diferencia entre dos muestras cuando 21 = 22 es conocida. Utiliza la distribucin z y t de student para hacer estimaciones de intervalo de la diferencia de dos muestras. Calcula intervalos de confianza para diferencia de proporciones y pruebas en aplicaciones que involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. Diferencia las variables aleatorias discretas y continuas. Realiza pruebas de hiptesis que conduzca a una decisin sobre una hiptesis en particular acerca de una poblacin.
METODOLOGA DE TRABAJO
Para el logro de los objetivos que persigue este cuaderno de prcticas y que permitirn al alumno alcanzar la competencia, es fundamental que los procedimientos presentados se ejerciten todo el tiempo, esperamos que los contenidos no slo se comprendan sino que se apliquen en la solucin de problemas que tengan que ver con situaciones que los estudiantes pueden enfrentar en su trayectoria acadmica y profesional. Por lo anterior, la estrategia metodolgica de enseanza-aprendizaje es, por un lado, el planteamiento de ejercicios y problemas, de los temas fundamentales para introducir al estudiante al estudio de la estadstica y que se abordan durante el curso, esto con el objeto de que los estudiantes se ejerciten en el uso, aplicacin y manejo de frmulas y contenidos procedimentales. Por otro lado, el docente de la asignatura tendr que orientar la aplicacin de cada uno de estos ejercicios a las reas especficas de inters de los estudiantes; es decir, el docente tendr que ejemplificar y presentar casos y situaciones aplicables a la contadura, que complementen los ejercicios que se estn planteando. El alumno en este esfuerzo, deber llevar a cabo estrategias de estudio que propicien un aprendizaje verdaderamente significativo, teniendo la comprensin del contenido y relacionando ste con sus conocimientos previos, as como con sus reas especficas de estudio, a travs del estudio casos y problemas relacionados con el quehacer cotidiano donde puedan aplicar y ejercitar lo aprendido.
INTRODUCCIN
La palabra estadstica a menudo se refiere a grficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografa, ingresos, deudas, crditos, etc. No obstante, para entender el anlisis estadstico como herramienta de anlisis, es necesario comprender qu representa cada concepto y la metodologa mediante la cual se obtiene un dato estadstico.
10
Existen dos grandes divisiones de la estadstica: la que se dedica a la recoleccin, presentacin y categorizacin de datos, llamada estadstica descriptiva, y la que se dedica a realizar inferencia en base a dichos datos, llamada estadstica inferencial. Para desarrollar la capacidad del razonamiento matemtico es recomendable utilizar las herramientas bsicas de la estadstica descriptiva para muestrear, procesar y comunicar informacin social y cientfica, para la toma de decisiones en la vida cotidiana, en un clima de colaboracin y respeto
Se pide distribuir y construir la tabla de frecuencias Paso 1. Calcular el rango: Para esto, se identifica el nmero mayor y el nmero menor en los datos. El rango es el resultado de la resta del valor mayor y el menor, esto es: R = 60 20 = 38 Paso 2. Determinar el nmero de intervalos que se desea tener: Siguiendo con la tabla del ejercicio vamos a construir 8 intervalos. Entonces decimos que K = 8
11
= Paso 4. Se forman los intervalos: Los intervalos se forman comenzando con el valor menor se le suma la amplitud: INTERVALOS: 20 a 25 26 a 31 32 a 37 38 a 43 44 a 49 50 a 55 56 a 61 62 a 67 (se cuenta 5 desde 20 hasta 25)
(20+25) 2
Paso7. Se suman las frecuencias absolutas acumuladas hasta llegar a 60 (10 + 19 = 29), (29 + 8 = 37) etc. Paso8. Se calcula la frecuencia relativa. Dividiendo cada frecuencia absoluta entre el total de datos, ejemplo: = 60 = .17 Se repite para todas las clases hasta llegar a 1 100% de los valores Paso9. Se busca la frecuencia relativa acumulada. Se acumulan las frecuencias relativas hasta llegar a 1 (100%). La tabla de frecuencias queda de la siguiente forma: 1
Intervalos de clase Lmite inferior 20 26 32 Lmite superior 25 31 37 Marca de clase 22.5 28.5 34.5 Frecuencia Frecuencia Frecuencia absoluta Frecuencia relativa absoluta acumulada relativa acumulada 10 10 0.17 0.17 19 29 0.32 0.48 8 37 0.13 0.62
10
12
Desviacin estndar 10.551247 Varianza de la muestra 111.328814 Curtosis -0.50964526 Coeficiente de asimetra 0.65175234 Rango 40 Mnimo 20 Mximo 60 Suma 2136 Cuenta 60
38 44 50 56 62
43 49 55 61 67
9 6 4 4 0 60
46 52 56 60
1.2.1 REPRESENTACIN GRAFICA DE LOS DATOS Histograma. Es la representacin grfica de una variable continua. Se elabora
en un sistema de coordenadas rectangulares. El eje horizontal se utiliza para representar a la variable independiente, es decir, a la escala de medicin o fronteras de clase. El eje vertical representa a la escala de frecuencias. Si los intervalos de clase tienen el mismo ancho, las alturas de las barras sern proporcionales a las frecuencias. El histograma tambin proporciona visualmente el aspecto de la distribucin y dispersin de las mediciones.
Histograma correspondiente al ejemplo de la empresa Casa S.A
Histograma
20 frecuencia absoluta 15 10 5 0 (20 - 25) (26 - 31 (32 - 37) (38 - 43) (44 - 49) (50 - 55) (56 - 61) (62 - 67)
Graficas de rea (pastel) Para trazar la grfica, se hace una distribucin proporcional de las frecuencias del problema anterior con respecto a la circunferencia determinando sectores circulares para cada categora. Siguiendo con el ejemplo de la empresa Casa S.A
13
(56 - 61) 7%
Paso 1. En una serie de nmeros, se cuenta el nmero de datos que contiene la muestra.
9.9 9.8 10.2 9.9 9.3 10.0 9.5 9.6 9.5 9.9 9.9 9.0 9.7 9.3 9.8 10.1 10.7 10.2 9.5 9.7 9.7 9.4 9.6 10.4 10.2 9.5 9.4 10.2 10.1 9.6 9.8 9.3 9.2 9.7 10.6 10.1 9.7 9.8 9.3 9.8 9.4 9.4 10.0 10.1 10.3 9.9 9.7 9.8 9.5 9.5 9.7 9.9 9.6 9.3 9.9 10.1 9.7 9.9 9.9 9.7 9.8 10.2 10.1 10.1 10.2 9.6 9.2 9.4 9.6 9.8 10.0 9.8 9.9 9.8 10.0 10.2 10.0 9.7 9.5 9.8 9.6 9.8 9.9 10.1 10.2 10.3 9.8 9.3 9.8 9.8 10.0 9.7 9.6 9.7 9.9 10.1 10.0 10.4 9.8 9.5 9.5 10.3 10.1 10.0 9.7 9.7 9.5 9.6 9.8 10.0 10.7 9.9 9.4 9.7 9.8 9.6 10.0 10.7 9.7 9.3 9.6
10.3
10.0
10.3
10.7
14
Esta muestra contiene 125 datos. Paso 2 Se determina el rango (R) En este caso, el nmero mayor es 10.7 y el menor es 9.0 por tanto, el rango es 1.7 Paso 3 Se determina el nmero de clase (k) a formar. Este nmero se selecciona de acuerdo con una tabla ya establecida que sirve de gua para determinar el nmero recomendado de clases. La tabla es la siguiente: Nmero de datos Menos de 50 50-99 100-250 Ms de 250 Nmeros de clases (k) 5-7 6-10 7-12 10-20
En este ejercicio, como los datos son 125 se establece considerar 10 clases.
CLASE LIMITE DE CLASE 1 2 3 4 5 6 7 8 9.00-9.19 9.20-9.39 9.40-9.59 9.60-9.79 9.80-9.99 10.0-10.19 10.20-10.39 10.40-10.59
FRECUENCIA
TOTAL
I IIIII IIII IIIII IIIII IIIII IIIII IIIII IIIII I IIIII IIIII II
1 9 16 27 31 23 12 2
IIIII IIIII IIIII IIIII IIIII IIIII I IIIII IIIII IIIII IIIII III II
IIIII IIIII II
15
9 10
10.60-10.79 10.88-10.99
IIII
4 0
Aplicando esta frmula a nuestro ejemplo, se tiene: En la mayora de los casos es conveniente redondear a un
nmero adecuado. En nuestro caso, 0.17 se redondea a 0.20 Paso 5 Se determina los lmites de clase. Para esto se toma la medicin individual menor del conjunto de datos. Este es el punto inferior del lmite de la primera clase. Se suma a este el nmero la amplitud de clase. El nmero que resulta para a ser el lmite inferior de la segunda clase y as sucesivamente. Paso 6. Se Construye la tabla de frecuencias con base en los valores obtenidos (nmero de clases, intervalo de clases y lmite de clases). La tabla de frecuencias que resulta es ya un histograma en forma tabular. Paso 7 se construye el histograma con base en la tabla de frecuencias. Estas se presentan en forma de barras. Las barras se elevan a partir de la lnea horizontal, en la que se indica los lmites de clase. Su altura se determina tomando en cuenta la frecuencia de datos incluidos dentro del lmite de clase. La lnea vertical del eje de coordenadas se grada para indicar precisamente dicha frecuencia. El histograma es una herramienta de diagnstico muy importante, ya que proporciona una vista panormica de la variacin en la distribucin de los datos. El histograma tiene que observarse semejante a este:
= .
16
17
=
=1
Mediana. Para cuando la cantidad de valores de la distribucin es impar: 1. Ordenamos los valores de menor a mayor. 2. Buscamos el valor del centro. Ordenamos: 0, 0, 1, ,1, 2, 4, 4, 6, 6, 7, 8, 8, 9 El dato que divide a la mitad es: 4, por lo tanto la Mediana = 4 Para cuando la cantidad de valores es par:
(2 + 4 + 0 + 8 + 6 + 4 + 7 + 1 + 1 + 0 + 8 + 6 + 9) = 13 = 4.31
1. Ordenamos los valores de menor a mayor. 2. Buscamos los valores del centro. 3. Promediamos los valores del centro. Agregamos un valor a los datos anteriores para ejemplificar 0, 0, 1,1, 2, 4, 4, 4, 6, 6, 7, 8, 8, 9
18
(2 4.31)2 + (4 4.31)2 + (0 4.31)2 + (8 4.31)2 + (6 4.31)2 + (4 4.31)2 + (7 4.31)2 + (1 4.31)2 + (1 4.31)2 + (0 4.31)2 + (8 4.31)2 + (6 4.31)2 + (2 + 4.31)2 2 = 13 1
=1
Desviacin tpica o estndar La desviacin tpica muestra qu tan alejado est un dato del valor de la media aritmtica, es decir, la diferencia que hay entre un dato y la media aritmtica. Se denota como s , segn se calcule en una muestra o en toda la poblacin, respectivamente. Se define como la raz cuadrada positiva de la varianza. Para el ejemplo anterior: = 2 = 10.56 = .
2 = 10.56
=1
= 10.56
Ejercicios. Calcule las medidas de tendencia central, as como las medidas de dispersin (media, moda, mediana, rango, varianza y desviacin estndar) de cada conjunto de datos. Analice resultados e indique observaciones. 1. La oficina de correos envi durante julio a diferentes estados de la repblica, el siguiente nmero de paquetes: 78, 38, 47,84, 49, 55, 42, 32, 66, 60,94, 67, 66, 68, 70. 2. Las tallas ms comunes de los vestidos que vendi una boutique durante julio son:
19
7, 10, 14, 9, 14, 9, 18, 9, 16, 12, 14, 11, 14. 3. En el departamento de control de calidad se tom una muestra al azar de 10 focos para determinar el nmero de horas de vida de cada uno obtenindose los siguientes datos. Nmero de muestra. 1 Nmero de horas 2 3 4 5 6 7 8 9 10
865 850 841 850 820 843 830 848 840 838
4. La produccin de tornillos elaborados por un empleado durante la semana que se toma de muestra es : Da de la semana Nmero de tornillos Lunes Martes Mircoles Jueves Viernes Sbado 240 225 215 208 295 230
5. La edad de las 10 finalistas de un concurso de belleza es: 18 aos, 19, 25,19, 20, 21, 20, 22, 18, y 18 6. De acuerdo con el informe sobre los pacientes atendidos en un hospital durante la primera semana de julio, se obtuvieron los siguientes datos: lunes 25, martes 24, mircoles 20, jueves 30, viernes 26, sbado 35 y domingo 29 7. Un gerente de personal entrevisto a 15 personas para su contratacin, el tiempo(en minutos) que dur la entrevista de cada aspirante fue: 37, 30, 23, 46,18, 40, 58, 43, 39, 55, 64, 42, 28, 20, 35 8. Al estibar varias cajas de jeringas en un almacn se detect que algunas de stas se haban roto, por lo que se tomaron 10 cajas al azar para su revisin habindose obtenido la siguiente informacin: De las primeras cajas dos jeringas rotas, de las siguientes: 3, 1, 0, 4, 2, 1, 3, 0, 2 ,3 9. Se tomaron 11 mediciones de dimetro de los anillos para los pistones del motor de un automvil. Los resultados en milmetros fueron: 74.001, 74.003, 74.025, 74.005, 74.000, 74. 015, 74.005, 74.002, 74.005, 74.002 , 74.004.
20
RESULTADO
1. 2. 3. 4. 5. 6. 7. 8. 9. Media Desv.Est. 61.07 17.38 Media Desv.Est. 12.077 3.226 Media Desv.Est. 842.50 12.20 Media Desv.Est. 235.5 31.2 Media Desv.Est. 20.000 2.211 Media Desv.Est. 27.00 4.83 Media Desv.Est. 38.53 13.61 Media Desv.Est. 1.900 1.370 Media Desv.Est. 74.006 0.00742 Varianza 302.21 Varianza 10.410 Varianza 148.94 Varianza 975.5 Varianza 4.889 Varianza 23.33 Varianza 185.27 Varianza 1.878 Varianza 0.00006 Mediana 66.00 Mediana 12.000 Mediana 842.00 Mediana 227.5 Mediana 19.500 Mediana 26.00 Mediana 39.00 Mediana 2.00 Mediana 74.004 Moda 66 Moda 14 Moda 850 Moda Moda 18 Moda Moda Moda 3 Moda 74.005
21
EN UNA POBLACIN =
=1
Donde:
Mc = Marca de clase en la isima clase fi = frecuencia absoluta en la isima clase n = Nmero total de frecuencias
Ejemplo. A partir de la siguiente lista de datos obtener la tabla de distribucin de frecuencias agrupadas, medidas de tendencia central (Media, Moda, Mediana), as como las medidas de dispersin (Desviacin estndar, varianza y rango). Los datos que se enlistan corresponden a los pesos en libras de los estudiantes de la secundaria. 138 164 150 132 144 125 149 157 146 158 152 144 168 126 138 176 163 119 154 165 135 153 140 135 161 145 135 142 150 156 147 173 128 136 142 148 147 140 146 145.
INTERVALOS DE CLASE LI 119 129 139 149 159 169 LS 128 138 148 158 168 178 123.5 133.5 143.5 153.5 163.5 173.5 4 7 13 9 5 2 40 4 11 24 33 38 40 0.1 0.175 0.325 0.225 0.125 0.05 1 10 17.5 32.5 22.5 12.5 5 100 MARCA DE CLASE FRECUE NCIA FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA FR. REL. %
22
= . + ( ) ) = .
Lie=138.5 = =
= 20
23
= = = = =
Varianza= = =
) (
(. ) + (. ) + (. ) + (. ) + (. ) + (. ) . = = .
Desviacin estndar= = = . = = .
= .
COEFICIENTE DE VARIACION.
. =. = .
Ejemplo 2. Los datos que a continuacin se enlistan corresponden a los dimetros interiores de inyectores. 424 430 433 435 436 437 426 431 433 435 436 438 428 431 434 435 437 438 429 432 434 436 437 438 430 432 434 436 437 438 430 432 434 436 437 439 442 439 444 440 443 440 444 441 446 MEDIA =
= =
24 ++++
= =
MEDIANA = = . + +
= +
= . =
= +
+
MODA= = +
()
= . =428.5 VARIANZA =
= + (. ) = . = 337.8
()
. =( ) + ( ) + ( ) + ( ) + ( )
= = .
COEFICIENTE DE VARIACION.
=. =.5
EJERCICIOS
1. El gerente de produccin de la imprenta x desea determinar el tiempo promedio que se necesita para fotografiar una placa de impresin; utilizando un cronometro y observando a los operadores registran los siguientes tiempos: 20.4, 22, 20, 24.07, 22.2, 25.7, 23.8, 24.9, 22.7, 25.1, 24.4, 21.2, 24.3, 22.4, 23.6, 22.8, 23.2, 24.3, 21
25
Construye una tabla de datos Construye una tabla de frecuencias Construye el histograma, polgonos de frecuencia u ojivas una grfica de lnea y una grfica de barras. Calcular media, moda, mediana, varianza y desviacin estndar para datos agrupados Encuentra en cada ejemplo el coeficiente de variacin
2. En un grupo de 30 estudiantes se pregunt cunto dinero llevaban en ese momento. Los resultados obtenidos, en pesos, fueron los siguientes: 45.00, 11.55, 25.00, 30.00, 17.50, 8.00, 2.50, 268.00, 60.50, 78.50, 159.50, 230.00, 500.00, 120.00, 10.00, 5.00, 18.00, 20.00, 67.50, 50.00, 37.50, 150.00, 20.50, 98-50, 18.50, 12.50, 31.50, 42.50, 56.00 y 110.00. Realiza lo siguiente: Organiza los datos en orden ascendente (del menor al mayor) Obtn el rango de los datos Realiza una tabla con 10 intervalos con las siguientes columnas: Intervalo Lmite inferior Lmite superior Marca de clase Frecuencia Frecuencia acumulada Frecuencia relativa Frecuencia relativa acumulada Obtn las medidas de tendencia central para datos agrupados por intervalos Obtn las medidas de dispersin para datos agrupados por intervalos Estadstica bsica 3. En una escuela se midi el peso de 21 alumnos en kilogramos y se obtuvieron los siguientes resultados: 58, 42, 51, 54, 40, 39, 49, 56, 58, 57, 59, 63, 58, 63, 70, 72, 71, 69, 70, 68, 64 Realiza lo siguiente: Organiza los datos en una tabla de datos Organiza los datos en una tabla de frecuencias Organiza los datos en una tabla que tenga 7 intervalos Calcula las medidas de tendencia central para cada una de las tablas Calcula las medidas de dispersin para cada una de las tablas 4. Una compaa que fabrica llantas investiga la duracin promedio de un nuevo compuesto de caucho. Para ello se probaron 30 llantas en una carretera hasta alcanzar la vida til de stas. Los resultados obtenidos, en kilmetros, fueron:
26
60, 613 60, 613 60, 222 59, 997 59, 784
59, 836 59, 784 60, 220 59, 997 60, 222
60, 135 60, 221 60, 545 69, 947 60, 554
60, 222 5 59, 997 60, 222 60, 135 60, 225
60, 252 50, 040 60, 000 60, 311 60, 523
Realiza lo siguiente: Organiza los datos en una tabla de datos Organiza los datos en una tabla de frecuencias Organiza los datos en una de intervalos que tenga 10 intervalos Saca la media, la mediana y la moda para cada una de las tablas Saca el rango, la varianza y la desviacin estndar para cada una de las tablas
Ejemplo. Tenemos dos grupos de mujeres de 11 y 25 aos con medias y desviaciones tpicas dadas por la tabla siguiente: Peso Medio ( ) 40 Kg. 50 Kg Desviacin Tpica (s) 2 kg 2 kg
11 aos 25 aos
Puede parecernos, al observar en ambos grupos una desviacin tpica igual, que ambos grupos de datos tienen la misma dispersin. No obstante, como parece lgico, no es lo mismo una variacin de dos kilos en un grupo de elefantes que en uno de conejos. El coeficiente de Variacin de Pearson elimina esa posible confusin al ser una medida de la variacin de los datos pero en relacin con su media. En el ejemplo anterior, al grupo de mujeres de 11 aos le corresponde un coeficiente de variacin de Pearson igual a = 2 . 100 = 5 40 2 . 100 = 4 50
27
Ejercicio 1. Se va a comparar la dispersin en los precios anuales de las acciones que se venden a menos de $10 (dlares) y la dispersin en los precios de aquellas que se venden por arriba de $60. El precio medio de las acciones que se venden a menos de $10 es $5.25 y la desviacin estndar es $1.52. El precio medio de las acciones que se negocian a ms de $60 es $92.50 y su desviacin estndar es $5.28. a) Porque debe utilizarse el coeficiente de variacin para comparar la dispersin de los precios? b) Calcule los coeficientes de variacin. Cul es su conclusin 2. Suponga que Usted trabaja en una compaa de ventas, que ofrece como premio de incentivo al mejor vendedor del trimestre anterior las entradas al palco empresarial en la serie final de bisbol de las grandes ligas en los Estados Unidos. De los registros de ventas se tienen los siguientes datos de ventas, expresados en porcentajes de cumplimiento de las metas fijadas mensualmente: Vendedor A 95 105 100 Vendedor B 100 90 110
El promedio trimestral de cumplimiento de las metas de ventas de ambos vendedores es igual y equivale al 100%, pero Ud. Slo le puede dar el premio de incentivo a uno de ellos. Cul usted escogera? En base a que criterio. Explique su respuesta. REFERENCIAS: 1. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica aplicadas a la ingeniera. McGraw-Hill, Mxico, cuarta edicin. 2. Walpole, Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias. Mxico: Pearson Educacin, octava edicin. 3. Intervalos de clase, consultado en: http://www.virtual.unal.edu.co/cursos/odontologia/2002890/lecciones/estadis ica_descriptiva_2/estadistica_descriptiva_2.htm 4. Censo y entrevista, en: http://www.indec.gov.ar/proyectos/censo2001/maestros/quees/masinfo.doc. http://www.tec.url.edu.gt/boletin/URL_03_BAS01.pdf 5. Medidas de tendencia central y dispersin, consultado en: http://bibliotecavirtual.lasalleurubamba.edu.pe/Estadistica/res/pdf/estadisticadescri ptivavariables2.pdf http://www.vitutor.com/estadistica.html
28
INTRODUCCIN La utilidad de la teora de la probabilidad en cualquier disciplina que se aplique, es que puede proporcionar un modelo matemtico adecuado para la descripcin de los fenmenos aleatorios con los que nos encontremos. Muy frecuentemente, estos fenmenos tienen un comportamiento similar al de modelos como Binomial, de Poisson y Normal. En esta unidad se abordarn algunos ejercicios bsicos de probabilidad. sta es una de las mejores herramientas que existen para el manejo del riesgo en las sociedades modernas, pues da a da se presentan mltiples situaciones en las que la toma de decisiones se debe realizar sin contar con que todas las variables estn bajo un perfecto control. De hecho esta situacin de control total rara vez (o nunca) se da. En estadstica la probabilidad nos ayudar a hacer inferencias con los resultados obtenidos a travs del manejo de los datos.
29
2.2
REGLAS DE ADICIN
( ) ( ) = () + () ( )
Un t a lle r sa b e qu e po r t rm in o med io a cu d en : p o r la m a a na t re s au t om vile s co n p rob lem a s e l ct rico s, o cho co n p rob lem a s me c n ico s y t re s co n p rob lem a s de ch a pa , y p o r la t a r d e d o s co n p ro b lem a s e l ct rico s, t res c o n p rob lem a s m ec n ico s y u n o co n p ro b lem a s d e ch a pa .
E l e c tr ic i da d
Me c ni ca
Cha pa
Ma a na s
14
Ta r de s
Tota l
11
20
30
En caso contrario, los eventos se dirn ser dependientes Ejemplo de eventos independientes. La experiencia indica que un determinado tipo de negociacin obrero patronal ha resultado en la firma de un convenio dentro de dos semanas de plticas el 50% de las veces. Tambin la experiencia indica que el fondo de soporte monetario para la huelga ha sido adecuado para soportar la huelga el 60% de las veces y que ambas de estas condiciones se han satisfecho el 30% de las veces. Cul es la probabilidad de que en una negociacin determinada se logre una firma de convenio dentro de dos semanas de plticas dado que se tiene un fondo adecuado para la huelga?Es la firma de convenio dentro de dos semanas dependiente de si se tiene o no un fondo adecuado para la huelga? Solucin Se definen primero dos eventos:
31
Evento A: se firma convenio dentro de dos semanas de plticas Evento B: el fondo de soporte para huelga es adecuado Se desea encontrar P (B|A), con base en P(A) = .50, P(B) = .60 P (AB) = .30 Se tiene: (| ) =
P (AB) P(B)
Para determinar si los eventos son o no independientes, observa (| ) = .50 Que por definicin indica que si son independientes EJEMPLO DE EVENTOS DEPENDIENTES. Cuando se recibe una entrega de un proveedor, el comprador usualmente inspecciona la calidad del envo. Un almacn de descuento ha recibido 100 aparatos de televisin del proveedor, de los cuales les es desconocido, que 10 estn defectuosos. Si se seleccionan al azar 2 aparatos para ser sometidos a una inspeccin muy minuciosa, cul es la probabilidad de que ambos estn defectuosos? Solucin Se definen primero dos eventos: Evento A: el primer aparato de TV est defectuoso Evento B: el segundo aparato de TV est defectuoso El evento de inters es el evento (AB), que ambos estn defectuosos, y ( ) = () (|) 9 P (A) = .10 ya que hay 10 defectuosos en el lote de 100. Sin embargo ( |) = ya 99 que tras haber seleccionado el primero que result defectuoso, habr 9 defectuosos restantes en el lote, ahora de 99 solamente.
.60 = .50
.30
( ) = () (|) =
99 = 110 100
10
32
( ) (|) = = = ()
() =
() =
( ) =
Det e rm in a r:
(|) =
() ()
) ) ( ( ( ) | ) = ( = = = = () () ()
( ) = () + () ( ) =
+ + =
|) = (
) ( () ( ) |) = ( = = = () ()
) ( ()
()() ()
33
De te rm ina r:
, () = ,
c ) ( ) =
d)
e)
34
a ) S e le ccio na r t re s n i o s.
( ) =
b ) S e le ccio na r e xa cta m en t e d o s n io s y u n a n i a.
( ) = + + = .
= . = . %
= . %
c) S e le ccio na r p o r lo m e no s un n i o .
( ) = ( ) = = .
d ) S e le ccio na r e xa cta m en t e d o s n ia s y u n n i o .
( ) =
= . = . %
+ +
35
Se
E J E RCI CI O S
() = + () + = . = . %
1 . E n un a u la h a y 1 0 0 a lum no s, de lo s cu a le s: 4 0 son h o mb re s, 3 0 a lumn o s u sa n le nt e s, y d e e ste gru p o 15 son va ro n e s y u sa n len t e s. S i se le ccio na m o s a l a za r u n a lu m no d e d ich o cu rso :
Con lentes
Sin Lentes
HOMBRES
15
25
40
MUJERES
15
45
60
30
70
100
36
a ) Cu l e s la p ro bab ilid a d de qu e se a m u je r y n o u se len t e s? b ) S i sa b emo s qu e e l a lum n o se le cciona d o n o u sa ga f a s, qu p ro b ab ilid a d h a y de qu e sea ho mb re? 2 . Disp o n em o s de d os u rn a s: la u rna A co n t ie ne 6 bo la s ro ja s y 4 b o la s b la n ca s, la u rna B co nt ie n e 4 b o la s ro ja s y 8 b o la s b la n ca s. S e la n za u n da do , si a p a re ce u n n m e ro m e no r qu e 3 ; n o s va m o s a la u rn a A; si e l re su lt a do es 3 m s, n o s va mo s a la u rn a B . A co n t in u a cin e xt ra em o s u na b o la . S e p id e : a ) P ro b ab ilid a d d e que la bo la sea ro ja y d e la u rn a B . b ) P ro b ab ilid a d d e que la bo la sea b la nca . 3 . Un e st u d ian t e cuen t a , pa ra u n e xa me n co n la a yu d a de un d e spe rt a do r, e l cua l co n sigu e d e spert a rlo e n u n 8 0 % de lo s c a so s. S i o ye e l de sp e rt ad o r, la p rob a b ilid ad de qu e re a liza e l e xa m en e s 0 . 9 y, e n ca so co n t ra rio, d e 0 . 5. a ) S i va a re a li za r e l e xa m e n , cu l e s la p ro b a b ilid ad d e qu e h a ya o d o e l d e sp e rt ad o r? b ) S i n o re a liza e l e xa m en , cu l e s la p ro b a b ilida d de qu e n o h a ya o d o e l d e sp e rt ad o r? 4 . E n u na e sta n te ra h a y 6 0 n o ve la s y 2 0 lib ro s d e p oe sa . Un a p e rson a A e lige u n lib ro a l a za r d e la e st an t e ra y se lo lle va . A co n t inu a ci n ot ra pe rso n a B e lige o t ro lib ro a l a za r. a ) Cu l e s la p rob ab ilid a d de qu e e l lib ro se le ccion a do p o r B se a u na no ve la ? b ) S i se sa b e que B e ligi u n a no ve la , cu l e s la p ro b ab ilid a d d e qu e e l lib ro s e le ccio n ad o p o r A se a d e p o e sa ? 5 . S e su po ne qu e 25 d e ca d a 1 0 0 ho m b re s y 6 0 0 d e ca da 1 0 00 m u je re s u sa n gaf a s. S i e l n me ro d e m u je re s e s c u a t ro ve ce s sup e rio r a l de ho m b re s, se p ide la p ro b ab ilid a d d e e nco n t ra rno s: a ) Co n un a pe rso na sin ga f a s. b ) Co n un a m u je r co n ga f a s. 6 . E n u na ca sa h a y t re s lla ve ro s A , B y C; e l p rim e ro co n c in co lla ve s, e l se gu n d o co n sie te y e l t e rce ro co n o cho , d e la s qu e s lo u n a de ca d a lla ve ro a b re la p u e rt a de l t ra st e ro. S e e sco ge a l a za r u n lla ve ro y, d e l u n a lla ve pa ra abrir e l t ra st e ro . S e p id e : a ) Cu l se r la p ro ba b ilid a d d e que se a cie rt e co n la lla ve ? b ) Cu l se r la p rob a b ilid ad de qu e e l lla ve ro e sco gid o sea e l t e rce ro y la lla ve n o a b ra?
37
c ) Y si la lla ve e sco gid a e s la co rre ct a , cu l se r p ro b ab ilid a d d e que p e rte n e zca a l p rim e r lla ve ro A ? 7 . S e a n A y B do s suce s o s a le a t o rio s co n : () = () = ( ) =
la
Ha lla r:
a ) ( ) = ) = b) ( ) = c ) ( ) = d) ( ) = e ) ( ) = f) ( 8 . S e sa ca n d o s bo las d e u na u rn a qu e se co mp on e d e un a b o la b lan ca , o t ra ro ja , o t ra ve rd e y ot ra n e gra . E scrib ir e l e sp a cio mu e st ra l cu a nd o : a ) L a p rim e ra bo la se d e vu e lve a la u rn a a n t e s de sa car la se gu n da . b ) L a p rim e ra b o la n o se de vu e lve . 9 . Un a u rn a t ie ne o ch o b o la s ro ja s, 5 am a rilla y si e t e ve rd e s. S i se e xt ra e u n a b o la a l a za r ca lcu la r la p ro b ab ilid a d d e : a ) S e a ro ja . b ) S e a ve rd e . c) S e a a ma rilla . d ) No se a ro ja . e ) No se a a ma rilla .
38
1 0 . Un a u rn a co n t ie n e t re s b o la s ro ja s y sie t e b lan ca s. Se e xt ra e n d o s b o la s a l a za r. E scrib ir e l e sp a cio mu e st ra l y h a lla r la p rob ab ilid a d de lo s su ce so s: a ) Co n re em p la zam ien t o . b ) S in re em p la za m ien t o . 1 1 . S e e xt ra e u n a bo la d e u na u rn a qu e co n t ien e 4 b o las ro ja s, 5 b lan ca s y 6 n e gra s, cu l es la p ro b ab ilid a d de qu e la b o la se a ro ja o b la n ca ? Cu l e s la p ro b a b ilid ad d e qu e n o se a b lan ca ? 1 2 . E n u na cla se h ay 1 0 a lu m na s rub ia s, 2 0 mo re n a s, cin co a lum no s ru bio s y 1 0 m o ren o s. Un d a a sist en 45 a lu mn o s, e n co n t rar la p ro ba b ilid a d de qu e un a lumn o : a ) S e a h om b re . b ) S e a m u je r m o re n a. c) S e a h om b re o m u je r. 1 3 . Un d a do e st t ru ca d o , d e f o rm a qu e la s p ro b ab ilid a de s d e ob t en e r la s d ist in t a s ca ra s so n p ro p o rcio na le s a los n me ro s de e st a s. Ha lla r: a ) L a p rob ab ilid a d d e o b te n e r e l 6 e n un la n za m ien t o. b ) L a p ro ba b ilid a d d e co n se gu ir u n n me ro im p a r e n un la n za m ie n to . 1 4 . S e la n za n d o s da do s a l a ire y se a n o t a la su ma d e los p u n to s ob t en id o s. S e p ide : a ) L a p rob ab ilid a d d e qu e sa lga e l 7. b ) L a p rob ab ilid a d d e qu e e l n me ro ob te n id o se a p a r. c) L a p ro b ab ilid a d d e qu e e l nm e ro o bt e n id o se a m lt ip lo d e t re s.
39
2.6
COMBINACIONES Y PERMUTACIONES
PERMUTACIONES EJEMPLO: 1.- De cuantas maneras posibles se pueden sentar 10 personas en una banca si solamente hay 4 puestos disponibles? SOLUCIN El primer puesto puede ocuparse de cualquiera de 10 maneras, luego el segundo puede ocuparse de 9 maneras, el tercero de 8 maneras diferentes y el cuarto de 7, por lo tanto: El numero de ordenaciones de 10 personas tomadas de 4 a la vez = 10 9 8 7 = 5040 2.- calcule a) 8 3
15 1
b) 6 4 c)
SOLUCIN: () 8 3 = 8 7 6 = 336 () 15 1 = 15
d) 3 3
() 6 4 = 6 5 4 3 = 360
() 3 3 = 3 2 1 = 6
EJERCICIOS. Se necesita sentar 5 hombres y 4 mujeres en fila, de manera que las mujeres ocupen los lugares pares, de cuantas maneras pueden sentarse?
Calcule: a) 8 4 c)
b) 5 2 d)
10 13 13 5
40
2.6 COMBINACIONES
EJEMPLO de cuantas maneras se pueden dividir 10 objetos en dos grupos que contengan 4 y 6 objetos respectivamente? SOLUCIN: En general, el nmero de selecciones de r de n objetos, llamados el nmero de combinaciones de n objetos tomados a la vez, se describe por y esta dado por:
Esto es lo mismo que el nmero de ordenaciones de 10 objetos, de los cuales 4 son semejantes entre si y los otros 6 tambin lo cual podemos determinar que: 10! 10 9 8 7 = = 210 4! 6! 4!
! (1) = = !()! =
( +1) !
2.- calcule a) 7 4 b) 6 5 c) 4 4
SOLUCIN: () ()
7 4
()
3.- de cuantas maneras se puede formar un comit de 5 personas a partir de un grupo de 9? SOLUCIN: 9! 98765 9 = = = 126 5 5! 4! 5!
4 4
6 5
= =
4! =1 4! 0!
5!1!
6 5 4 3 2 5!
=6
0! = 1
41
Anlisis combinatorio Estudia los diversos arreglos o selecciones que podemos formar con los elementos de un conjunto dado los cuales nos permite resolver muchos problemas prcticos. Principios fundamentales del anlisis combinatorio En la mayora de problemas de anlisis combinatorios se observa que una operacin o actividad aparece en forma repetitiva y es necesario conocer las formas o maneras de realizar dicha operacin
SOLUCION: son las combinaciones de 10 elementos agrupndolos en subgrupos de 4 elementos, 10! 10 4 = = 210 4! (10 4) EJERCICIOS: 1.-Con 3 personas: Antonio, Beto y Carlos cuntos grupos diferentes de dos se podrn formar?
2.- se tienen cinco personas A, B, C, D, y E y queremos formar grupos diferentes de tres personas lo cual podramos combinarlos de la siguiente manera: 3-Cuntas comisiones de tres alumnos se pueden formar con 4 varones y 5 mujeres. Fuentes de consulta 1. Douglas C. Montgomery, George C. Runger. Probabilidad y Estadstica aplicadas a la ingeniera. Primera Edicin, McGraw-Hill, Mxico, 1999. 2. Walpole Ronald E., Myers Raymond H. Probabilidad y Estadstica. Cuarta Edicin, Thomson, Mxico, 1999. http://www.vitutor.com/estadistica.html http://www.uaq.mx/matematicas/estadisticas/xu4.html http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm
42
Introduccin La utilidad de la teora de la probabilidad en cualquier disciplina que se aplique, es que puede proporcionar un modelo matemtico adecuado para la descripcin de los fenmenos aleatorios con los que nos encontremos. Y muy frecuentemente, estos fenmenos tienen un comportamiento similar al de modelos ya conocidos como binomial, de Poisson y Normal, que es lo que corresponde tratar en esta unidad. Una variable aleatoria continua es aquella que puede tomar valores infinitos. Una forma til de diferenciar este tipo de variables es que tpicamente las variables continuas representan datos medidos, tales como alturas, distancias, pesos, temperaturas, tiempo de vida, etc., Mientras que las variables discretas representan conteo de datos, tales como el nmero de productos defectuosos, el nmero de contagios de una enfermedad, etc. 1. El nmero de canicas escogidas aleatoriamente de un lote de produccin para la inspeccin de calidad DISCRETA 2. Cantidad de bebes nacidos en el hospital general de zona numero 197 en un da DISCRETA.
43
3. Estaturas de los alumnos del TESOEM comprendidas en 1.50m. al 1.90m. CONTINUA. 4. Nmero de tarjetas de debito dadas por un banco local en un cuatrimestre. DISCRETA. Ejemplo de distribucin, valor esperado, varianza y desviacin estndar en variables aleatorias discretas Ejemplo: obtener el valor esperado, varianza y desviacin estndar de los siguientes problemas. 1. En el siguiente cuadro se muestran la probabilidad de artculos de un producto que se esperan vender en un da normal. N De productos ( ) 0 10 20 30 40 Probabilidad ( ) 0.10 0.15 0.15 0.40 0.20 1.00 Solucin: Media = = () = ( ) ( ) Varianza:
2
E(X) ( ) ( )
= (0 24)2 (0.10) + (10 24.5)2 (0.15) + (20 24.5)2 (0.15) + (30 24.5)2 (0.40) + (40 24.5)2 (0.20) = 60.025+31.5375+3.0375+3.0375+12.1+48.05 =154.75 Desviacin estndar:
2 = 2 = =1[ ( )] ()
= [ ()]2 ()
=1
= 154.75 = 12.4399
44
En el siguiente cuadro se muestran la probabilidad de bebs que se esperan que nazcan en una semana. Encuentre la media, varianza y desviacin estndar en los datos discretos. N De bebs( ) 0 2 4 6 8 probabilidad ( ) 0.05 0.20 0.25 0.20 0.30 1.00 Varianza: 2 = [ ()]2 ()
=1
(0)(0.05) = 0
() ( )
= (0 5)2 (0.05) + (2 5)2 (0.20) + (4 5)2 (0.25) + (6 5)2 (0.20) + (8 5)2 (0.30)
Ejercicio. En el siguiente cuadro se muestran la probabilidad de pares de botas que se esperan vender en un mes. Encuentre la media, varianza y desviacin estndar en los datos discretos probabilidad ( ) 0.19 0.40 0.30 0.11 ( ) ()
= 6.2=2.489
45
En la siguiente distribucin de probabilidad nos muestra la cantidad de bolsas que se esperan vender en un da de una fbrica. Encuentre la media, varianza y desviacin estndar en los datos discretos No. De bolsas( ) 0 50 125 150 200 probabilidad ( ) 0.01 0.02 0.14 0.35 0.48 1.00 ( ) ()
1. El experimento consiste en una sucesin de n intentos o ensayos idnticos. 2. En cada intento o ensayo son posibles dos resultados. A uno lo llamaremos xito y a otro fracaso. 3. La probabilidad de un xito, representada por p, no cambia de un intento o ensayo a otro. En consecuencia, la probabilidad de un fracaso, representada por 1 , no cambia de un intento a otro. 4. Los intentos o ensayos son independientes. Media, varianza y desviacin estndar de la distribucin binomial
46
() =
() = 1 =0
( 1)! 1 ! ( 1 )!
!(1)! (1)!
! ! ( )!
=0
( 2)! 2 + ()2 ! ( 2 )! () = =
! ()2 ! ( )!
Refirmonos al caso de arrojar 3 monedas, n = 3 y p = obtenemos: = = (3)1212 = 34 = 0.75 = 0.87 Ejemplo 1: Si la probabilidad de que cualquier elector registrado (seleccionado al azar de las listas oficiales) vote en una eleccin determinada es 0.70 Cul es la probabilidad de que 2 de 5 electores registrados voten en la eleccin? Datos:
!()! !
47
5 ( = 2) = (0.70)2 (1 0.70)52 2 Ejemplo 2. Una mquina fabrica una determinada pieza y se sabe que produce 7 defectuosas de cada 1000 piezas. Hallar la probabilidad de que al examinar 50 piezas slo haya una defectuosa. Solucin: Se trata de una distribucin binomial de parmetros B (50, 0.007) y debemos calcular la probabilidad P (r =1). = 10(0.70)2 (0.30)3 = 0.132
= 2
= 5
5 = 10 2
donde:
p(x, ) = probabilidad de que ocurran x xitos, cuando el nmero promedio de ocurrencia de ellos es = media o promedio de xitos por unidad de tiempo, rea o producto e = 2.718 x = variable que nos denota el nmero de xitos que se desea que ocurra Ejemplo Si un banco recibe en promedio 6 cheques sin fondo por da, cules son las probabilidades de que reciba:
48
a) cuatro cheques sin fondo en un da dado, b) 10 cheques sin fondos en cualquiera de dos das consecutivos Solucin: a) X = variable que nos define el nmero de cheques sin fondo que llegan al banco en un da cualquiera = 0, 1, 2, 3,....., etc. = 6 cheques sin fondo por da = 2.718 b) X= variable que nos define el nmero de cheques sin fondo que llegan al banco en dos das consecutivos = 0, 1, 2, 3,......, etc., etc. = (6 x 2) = 12 cheques sin fondo en promedio que llegan al banco en dos das consecutivos. Nota: siempre debe de estar en funci n de x siempre o dicho de otra forma, debe hablar de lo mismo que x.
(12)10 (2.718)12 10! (6.191736)(0.000006151) 3628800
( = 4, = 6) =
(6)4 (2.718)6 4!
(1226)(0.00248) 24
= 0.13392
( = 10, = 12) =
Ejemplo. En la inspeccin de hojalata producida por un proceso continuo, se identifican 0.2 imperfecciones en promedio por minuto. Determine las probabilidades de identificar: a. una imperfeccin en 3 minutos, b. al menos dos imperfecciones en 5 minutos, c. cuando ms una imperfeccin en 15 minutos.
= 0.104953
Solucin: a) = variable que nos define el nmero de imperfecciones en la hojalata por cada 3 minutos = 0, 1, 2, 3,...., etc. (0.6)1 (2.718)0.6 (0.6)(0.548845) = = 0.329307 1! 1
b) = variable que nos define el nmero de imperfecciones en la hojalata por cada 5 minutos = 0, 1, 2, 3,...., etc.
49
= 0.2 x 5 =1 imperfecci n en promedio por cada 5 minutos en la hojalata ( = 2,3,4, = 1) = 1 ( = 0,1, = 1) (1)0 (2.718)1 (1)(2.718)1 = 1 + 0! 1!
= 0.2 x 15 = 3 imperfecciones en promedio por cada 15 minutos en la hojalata ( = 0,1, = 3) = ( = 0, = 3) + ( = 1, = 3) (3)0 (2.718)3 (3)1 (2.718)3 = + 0! 1! = 0.049800226 + 0.149408 = 0.1992106
c) = variable que nos define el nmero de imperfecciones en la hojalata por cada 15 minutos = 0, 1, 2, 3,....., etc.
EJERCICIO 1: Se sabe que el 2% de los libros que se encuadernan en un taller tienen una encuadernacin defectuosa. Use la aproximacin de Poisson para la distribucin binomial para encontrar la probabilidad de que 5 de 400 libros encuadernados en este taller tengan una encuadernacin defectuosa. La distribucin de Poisson tiene muchas aplicaciones importantes y no se relacionan en forma directa con la distribucin binomial. En este caso, np se sustituye por y calculamos la probabilidad de tener x triunfos por medio de la frmula. () = 1 !
Para x = 0, 1, 2, 3
EJERCICIO 2: Si un banco recibe en promedio = 6 cheques sin fondos por da. Cul es la probabilidad de que reciba cuatro cheques sin fondos en un da determinado?
50
HIPERGEOMTRICA
DE
La de de de
Con la distribucin hipergeomtrica los intentos no son independientes. notacin que se acostumbra al aplicar la distribucin hipergeomtrica probabilidad es que r representa la cantidad de elementos en la poblacin tamao N, que se identifican como xitos, y que representa la cantidad elementos en la poblacin que se identifican como fracasos.
La distribucin hipergeomtrica de probabilidad se usa para calcular la probabilidad de que, en una muestra aleatoria de n artculos, seleccionados sin remplazo, obtengamos x elementos identificados como xitos y identificados como fracasos. Para que suceda esto debemos obtener x xitos de los r en la poblacin, y fracasos de los de la poblacin. La siguiente funcin hipergeomtrica de probabilidad determinada (), la probabilidad de obtener x xito en una muestra de tamao n. Funcin de probabilidad hipergeomtrica: () = 0
En donde:
n= cantidad de intentos
N = la cantidad de elementos en la poblacin r = la cantidad de elementos identificados con xito en la poblacin Obsrvese que representa la cantidad de formas en la que se puede seleccionar una muestra de tamao n de una poblacin de tamaa N; que representa la cantidad de maneras que se pueden seleccionar x xitos de un total r xitos de la poblacin; y que representa la cantidad de maneras en que se pueden seleccionar n x fracasos de un total de N r fracasos en la poblacin.
51
EJEMPLO: Seleccionar dos miembros de comit, entre cinco, que asistan a una convencin en Las Vegas. Suponga que el comit de cinco miembros est formado por tres mujeres y dos hombres .para determinar la probabilidad de seleccionar dos mujeres al azar. Aplicando la ecuacin: () =
= 2 = 5 = 3 = 2
EJERCICIO: Una poblacin consiste en 10 artculos, cuatro de los cuales son defectuosos y los seis restantes son no defectuosos . Cul es la probabilidad de que una muestra aleatoria de tamao tres contenga dos artculos defectuosos? (En este caso podemos imaginar que un xito consiste en obtener un artculo defectuoso)
3 53 3 2 3! 2! 3 () = 2 2 2 = 2 0 = 2! 1! 2! 0! = = .30 5! 5 5 10 2! 3! 2 2
2. La curva es simtrica alrededor de 3. La curva tiene sus puntos de inflexin (puntos en que la curva cambia de cncava a convexa) en = 4. La curva se aproxima al eje horizontal de forma asinttica. 5. El rea total de la curva normal es igual a 1 (toda posible gama de posibilidades est contemplada p = [0,1])
52
Frmula para calcular distribucin normal La distribucin normal depende de 2 parmetros, la media y la deviaci n estndar . La frmula para la distribucin normal de una variable discreta es la siguiente:
()2 22
( ) =
Donde:
es la media es la desviacin estndar =3.14159 Ejemplo sobre cmo convertir una distribucin normal a una normal tipificada. El salario medio de los empleados de una empresa se distribuye segn una distribucin normal, con media 5 mil pesos y desviacin tpica 1 mil pesos. Calcular el porcentaje de empleados de la empresa con un sueldo inferior a 7 mil pesos. 1. Transformamos esa distribucin en una normal tipificada, para ello se crea una nueva variable (Z): 1. Sustituimos la frmula y la nueva variable sera: Z= 2. Esta nueva variable se distribuye como una normal tipificada. La variable Z que corresponde a una variable X de valor 7 es: Ya podemos consultar en la tabla Z la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de sueldos inferiores a 7 mil pesos). Esta probabilidad es 0.97725. Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 mil pesos es del 97.725%.
Z= 75 =2 1 Z= 5 1
53
Buscando en la tabla nos da un valor de P 1.34) (Z = 0.9099, es decir, tiene el 90.1% del rea total de la curva de probabilidad hasta Z = 1.34, como se muestra a continuacin.
Continuando con el ejemplo anterior, si quisiramos calcular la P (Z>1.34) entonces, sera ms conveniente calcularlo as:
54
58 Si quisiramos la probabilidad entre 2 valores, tendramos que realizar la resta de areas, por ejemplo: P (1.21 < Z 1.34) = P (Z1.34) P (Z1.21) = 0.9099 - 0.8869 = 0.023 Y su grfica se muestra a continuacin,
Ejercicios. Los resultados en el examen de admisin al TESOEM tienen una distribucin normal con media 75 y desviacin estndar 10. a. Qu fraccin de los resultados qued entre 80 y 90? b. Obtn la variable aleatoria normal estndar. 1. En una compaa refresquera se ajusta una mquina de refrescos de tal manera que llena las latas de refresco con un promedio de 300 mililitros. El nmero de mililitros por lata tiene una distribucin normal con una desviacin estndar de 10 mililitros. a) Cul debe ser la capacidad mnima de las latas para que se derrame cuando mucho el 1% de ellas? b) Obtn la variable aleatoria normal estndar. 2. El dimetro del agujero de las tuercas de una fbrica tienen una distribucin normal con una media de15.0 milmetros y una desviacin estndar de 0.1 milmetros. Los tornillos diseados aceptan tuercas de entre 14.888 y 5.112 a) Cul es la probabilidad de que una tuerca escogida al azar no sirva? b) Obtn la variable aleatoria normal estndar.
55
Introduccin Los estudios estadsticos normalmente se hacen con una parte de la poblacin, ya que realizarlos sobre la totalidad resultara demasiado complicado. Para que la informacin obtenida tenga validez es necesario que la muestra cumpla con ciertas condiciones especficas, relacionadas con el mtodo para determinar el tamao y caractersticas de la muestra y los individuos que la componen.
56
Los mtodos de muestreo se pueden clasificar en: Muestreo probabilstico: en l, todos los elementos de una poblacin y, por lo tanto, todas las muestras posibles tienen la misma posibilidad de ser elegidas. Las muestras obtenidas a travs de este tipo de muestreo son contables porque aseguran la condicin de representatividad que es muy importante para hacer generalizaciones. Muestreo no probabilstico: en este tipo de muestreo los elementos de la poblacin no comparten las mismas posibilidades de ser seleccionados. Las muestras obtenidas no cumplen con la condicin de representatividad, por lo que no es probable hacer generalizaciones a toda la poblacin. Metodologa del muestreo aleatorio simple Definir la poblacin de estudio y el parmetro a estudiar. Recordemos que la poblacin es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas comunes observables en un lugar y en un momento determinado. Por lo tanto: 1. 2. 3. Es determinar el que se va a estudiar. Enumerar a todas las unidades de anlisis que integran la poblacin, asignndoles un nmero de identidad o identificacin. Determinar el tamao de la poblacin, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar.
EJEMPLO
1. La media de la poblacin normal, es = 60 y la desviacin estndar poblacional es = 12. Se toma una muestra aleatoria de n = 9. Calcule la probabilidad de que la media muestral sea; a) Mayor que 63 b) Menor que 56 c) Entre 56 y 63.
Solucin:
> 63) a) P (
= 60
= 12
57
Z=
Z=
6360
12 9
3 4
= .75
El valor estandarizado se busca en tabla Z y se tiene que la probabilidad es .2734 27.34%, como se busca que sea mayor se resta de .5 la cantidad que no interesa para el estudio quedando: 1 - .7734 = 0.2266 = 22.66%
.5 - .2734 = .2266
< 56) b) P (
Z=
5660
12 9
4 4
c) Este entre 56 y 63
= 1
.5 - .3298 = .1702
< 63) .3298 + .2734 = 0.6032 X 100 = 60.32% P (56 < EJERCICIOS 1. Se sabe que la resistencia a la ruptura de cierto tipo de cuerda se distribuye normalmente con media de 2000 libras y una varianza de 25000 libras. Si se selecciona una muestra aleatoria de 100 cuerdas; determine la probabilidad de que en esa muestra: a) La resistencia media encontrada sea de por lo menos 1958 libras. b) La resistencia media se mayor de 2080 libras. 2. Como parte de un proyecto general de mejoramiento de la calidad, un fabricante textil decide controlar el nmero de imperfecciones encontradas en cada pieza de tela. Se estima que el nmero promedio de imperfecciones por cada pieza de tela es de 12, determine la probabilidad de que en la prxima pieza de tela fabricada se encuentren: a) Entre 10 y 12 imperfecciones. b) Menos de 9 y ms de 15 imperfecciones. 3. En una prueba de aptitud la puntuacin media de los estudiantes es de 72 puntos y la desviacin estndar es de 8 puntos. Cul es la probabilidad de que dos grupos de estudiantes, formados de 28 y 36 estudiantes, respectivamente, difieran en su puntuacin media en: a) 3 ms puntos. b) 6 ms puntos. c) Entre 2 y 5 puntos 4. Un especialista en gentica ha detectado que el 26% de los hombres y
58
el 24% de las mujeres de cierta regin del pas tiene un leve desorden sanguneo; si se toman muestras de 150 hombres y 150 mujeres, determine la probabilidad de que la diferencia muestral de proporciones que tienen ese leve desorden sanguneo sea de: a) Menos de 0.035 a favor de los hombres. b) Entre 0.01 y 0.04 a favor de los hombres. 5. Una urna contiene 80 bolas de las que 60% son rojas y 40% blancas. De un total de 50 muestras de 20 bolas cada una, sacadas de la urna con reemplazamiento, en cuntas cabe esperar a) Igual nmero de bolas rojas y blancas? b) 12 bolas rojas y 8 blancas? c) 8 bolas rojas y 12 blancas? d) 10 mas bolas blancas? 6. Los pesos de 1500 cojinetes de bolas se distribuyen normalmente con media de 2.40 onzas y desviacin estndar de 0.048 onzas. Si se extraen 300 muestras de tamao 36 de esta poblacin, determinar la media esperada y la desviacin estndar de la distribucin muestral de medias si el muestreo se hace: a) Con reemplazamiento b) Sin reemplazamiento 7. La vida media de una mquina para hacer pasta es de siete aos, con una desviacin estndar de un ao. Suponga que las vidas de estas mquinas siguen aproximadamente una distribucin normal, encuentre: a) La probabilidad de que la vida media de una muestra aleatoria de 9 de estas mquinas caiga entre 6.4 y 7.2 aos. b) El valor de la X a la derecha del cual caera el 15% de las medias calculadas de muestras aleatorias de tamao nueve.
8. Se llevan a cabo dos experimentos independientes en lo que se
comparan dos tipos diferentes de pintura. Se pintan 18 especmenes con el tipo A y en cada uno se registra el tiempo de secado en horas. Lo mismo se hace con el tipo B. Se sabe que las desviaciones estndar de la poblacin son ambas 1.0. Suponga que el tiempo medio de secado es igual para los dos tipos de pintura. Encuentre la probabilidad de que la diferencia de medias en el tiempo de secado sea mayor a uno a favor de la pintura A.
59
Ejemplo de cuando las varianzas son conocidas: En un estudio para comparar los pesos promedio de nios y nias de sexto grado en una escuela primaria se usar una muestra aleatoria de n1 = 20 nios y otra de n2 = 25 nias. Se sabe que tanto para nios como para nias los pesos siguen una distribucin normal. El promedio de los pesos de todos los nios de sexto grado de esa escuela es de 1 = 100 libras y su desviacin estndar es de 1 = 14.142, mientras que el promedio de los pesos de todas las nias del sexto grado de esa escuela es de 2 = 85 libras y su desviacin estndar es de 2 = 12.247 libras. Si 1 representa el promedio de los pesos de 20 nios y 2 es el promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms grande que el de las 25 nias. Solucin: Datos: 1 = 100 libras 1 = 20 nios x 1 x 2 = 20 2 = 85 libras 1 = 14.142 libras
2= 12.247 libras
2 = 25 nias
60
(x 1 x 2 ) (1 2 ) 2 1 1 + 2
2 2
2 2 (14.142) + (12.247) 20 25
20 (100 85)
= 1.25
Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de nios sea al menos 20 libras ms grande que el de la muestra de las nias es 0.1056.
EJEMPLO de cuando las varianzas poblacionales son conocidas e iguales. De una poblacin se toma una muestra de n1 = 40 observaciones. La media muestral es de x 1 = 102 y la desviacin estndar de 1 = 5. De otra poblacin se toma una muestra de n2 =50 observaciones y la media muestral es ahora x 2 = 99 y la desviacin estndar es 6. Calcule el valor estadstico de la prueba. Se debe suponer que las medias poblacionales son iguales. 1 = 102 2 = 99 1 = 5 2 = 6
(x 1 x 2 )(1 2 )
1+ 2 1 2 2 2
=
1+2 2
1 1
2
(10299)(0) 1.18
1.18
= 2.54 =
2739 88
2 =
2 +( 1) 2 (1)1 2 2
12 =
2 2
31.13 40
. 5 + .3810 = 0.119
31.13 50
40+502
88
= 31.13
61
EJERCICIOS: 1. Uno de los principales fabricantes de televisores compra los tubos de rayos catdicos a dos compaas. Los tubos de la compaa A tienen una vida media de 7.2 aos con una desviacin estndar de 0.8 aos, mientras que los de la B tienen una vida media de 6.7 aos con una desviacin estndar de 0.7. Determine la probabilidad de que una muestra aleatoria de 34 tubos de la compaa A tenga una vida promedio de al menos un ao ms que la de una muestra aleatoria de 40 tubos de la compaa B. 2. Se prueba el rendimiento en km/L de 2 tipos de gasolina, encontrndose una desviacin estndar de 1.23km/L para la primera gasolina y una desviacin estndar de 1.37km/L para la segunda gasolina; se prueba la primera gasolina en 35 autos y la segunda en 42 autos. a. Cul es la probabilidad de que la primera gasolina de un rendimiento promedio mayor de 0.45km/L que la segunda gasolina? b. Cul es la probabilidad de que la diferencia en rendimientos promedio se encuentre entre 0.65 y 0.83km/L a favor de la gasolina 1?.
La distribucin consiste en decidir que fraccin de la muestra total se debe asignar a cada estrato. Esta fraccin determina el tamao de la muestra aleatoria simple en cada estrato. Los factores que se consideran ms importantes en la asignacin son: 1. La cantidad de elementos en cada estrato 2. La varianza de los elementos dentro de cada estrato 3. El costo de seleccin de elementos dentro de cada estrato Las muestras ms grandes se deben asignar a los principales estratos y a los estratos con varianzas mayores. Al revs para obtenerla mxima informacin a
62
determinado costo, las muestras mas pequeas se deben asignar a los estratos en los que es mximo el costo por unidad muestreada. El costo de seleccin puede ser muy importante cuando se requiere de desplazamientos significativos del encuestador entre las unidades muestreadas en determinados estratos, pero no en otros, este caso se presenta ms cuando algunos de los estratos implican reas rurales y otras ciudades. Las siguientes frmulas presentan el costo total de muestreo para determinado nivel de precisin. El mtodo se conoce como asignacin de Neyman, y asigna total para los diversos estratos en la forma
siguiente:
Ecuacin 1:
Dado un nivel B de precisin, podemos usar las siguientes frmulas para elegir el tamao total de la muestra y as estimar la media de la poblacin y el total de la poblacin. Ecuacin 2: Tamao de la muestra para estimar la media de la poblacin
=1
= 2 2
Ecuacin 3:
+ =1 4
=1
= 2
Donde:
4
=1
+ =1
63
Ejemplo: Imaginemos el caso de un distribuidor Chevrolet, que desea encuestar a los clientes que le compraron un Corvette, un Corsa o un Cavalier, para obtener informacin que cree le ser til para elaborar sus promociones en el futuro. En especial supongamos que la agencia desea estimar la media del ingreso mensual para estos clientes con una cuota de 100 dlares en el error del muestreo. Los 600 clientes del distribuidor se han dividido en tres estratos: 100 dueos de Corvette, 200 de Corsa y 300 de Cavalier. Se hizo una encuesta de piloto para estimar la desviacin estndar en cada estrato, cuyos resultados fueron 1 = $1,300, 2 = $900, y 3 = $500, respectivamente, para los dueos de Corvette, Corsa y Cavalier. El primer paso para elegir un tamao de la muestra para esta encuesta es usar la ecuacin 2 y determinar el tamao de la muestra necesario para obtener una cuota de B = $100 en el estimado de la media de la poblacin. Primero se calcula: = 100(1300) + 200(900) + 300(500) = 460,000
=1 3
Sustituimos esos valores en la ecuacin 2, a fin de poder determinar el tamao total de la muestra necesario para obtener una cota de B = $100 en el error del muestreo. (460,000)2 = 162 = (600)2 (100)2 + 406,000,000 4 100(1300) = 46 460,000 300(500) = 53 460,000
=1
Con un tamao total de muestra igual a 162 se obtendr la precisin deseada. Para asignar la muestra total a los tres estratos usamos la ecuacin 1. = 162
2 = 162
3 = 162
64
4.4 INTERVALOS DE CONFIANZA PARA LA MEDIA, CON EL USO DE LA DISTRIBUCIN NORMAL Y T DE STUDENT.
Tamao de muestra pequea y varianza poblacional 2 desconocida Supngase que la varianza de la poblacin es desconocida. Qu sucede con la distribucin de esta estadstica si se reemplaza por s? La distribucin t proporciona la respuesta a esta pregunta. Frmula para muestras <30 Frmula para muestras >30
t =
= z
Ejemplo: El seor Juan Prez se dedica a hacer tarjetas postales y los vende en 50 papeleras; como el negocio no marcha como l espera, desea saber cmo esta el ausentismo entre sus trabajadores, y ver si esa es la causa de la baja en las ventas. A continuacin se da el nmero de das de ausencia durante una quincena en una muestra de 10 trabajadores 4,1, 2, 2, 1, 2, 2, 1, 0, 3 Determine la media y desviacin estndar de la muestra Cual la mejor estimacin de ese valor? Proporcione un intervalo de confianza de 95 % para la media poblacional Explique porque se usa la distribucin t como parte del intervalo de confianza Es razonable concluir que el trabajador promedio no falt ningn da durante una quincena? Media 1.8 Desviacin Estndar 1.135 Varianza 1.289
= =
65
= 2
S = 1.13
= t
= 1.8 + (2.262) (.35) = 2.612 Respuesta, la verdadera media poblacional de ausencia en una quincena va de los 0.988 a los 2.612 das. = 1.8 (2.262) (.35) = 0.988
Es razonable concluir que el trabajador promedio no falto ningn da durante una quincena? No, porque segn el resultado el intervalo est entre los valores (0.988, 2.612) y el 0 se encuentra fuera del intervalo, por lo tanto no es razonable pensar que hubo cero ausencias en la quincena. Ejemplo 2: Una cmara de comercio quiere determinar cunto tiempo necesitan los empleados para llegar a su trabajo. Los siguientes datos en minutos corresponden a una muestra de 15 empleados: 29, 39, 38, 33, 38, 21, 45, 34, 40, 37, 37, 42, 30, 29, 35. Determine un intervalo de confianza de 98% para la media poblacional, interprete el resultado. = 1-.98= .02/2= 0.01 con 14 grados libertad = En tabla t = 2.262 S = 6.06 = . n =15 =
6.06 15
= 1.56
(31.03, 39.24)
Lo que significa que un empleado tarda en promedio de 31 a 39 minutos aproximadamente para llegar a su trabajo.
66
4.5 INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS, CON EL USO DE LA DISTRIBUCIN NORMAL Y t DE STUDENT.
Una empresa comercial que procesa muchos de sus pedidos por telfono tiene 2 tipos de clientes: generales y comerciales. Se recogen los pedidos de tiempo telefnico por artculo requerido, por una muestra aleatoria de 12 llamadas de clientes generales y 10 llamadas de clientes comerciales. Se supone que las cantidades de tiempos para cada tipo de llamadas tiene una distribucin aproximadamente normal. Obtenga el Intervalo de Confianza de 95% para la diferencia de la cantidad media de tiempo por artculo requerida para cada llamada Clientes generales 48 66 106 84 146 139 154 150 177 156 122 121 1469 1 2 = 1560.44 1 = 39.50
1 = 12
Clientes Comerciales 81 137 107 110 107 40 154 142 34 165 1077 2 = 107.7 2 = 2021.78 2 = 44.96
2 = 10
2
1 = 122.42
2 =
2 = 2 =
1 + 2 2
(121)39.50 +(101)44.96
10+122
+437500 20
.05 2
= .025 = = 2.086
797,500 16
35,355.36 20
2 = 1,767.76
67
1767.76 1767.76
1 2
20
10
12
= 147.31 + 176.77
12
= 324.08 = 18.00
(-22.83, 52.27)
Interpretacin: como el cero se encuentra incluido en el intervalo, se puede decir con un 95% de confianza que no hay diferencia en el tiempo medio de cada llamada requerida para cada artculo.
P = .80
= =
= .775 = .225
.775 .80
P p
= 2.67
= 2000
68
= 212
= 0.16
(.16)(.84)
= 0.025
212
= =
Conclusin. La proporcin de la poblacin que prefiere los pantalones corte bota va del 11% al 20% de la poblacin.
PROBLEMAS
Use la informacin sobre cada una de las siguientes muestras para calcular el intervalo de confianza para estimar la proporcin de la poblacin. a) b) c) d) n= 44 n= 300 n= 1,150 n= 95 = .51 ; calcule un intervalo de confianza del 99% = .82 ; calcule un intervalo de confianza del 95% = .48 ; calcule un intervalo de confianza del 90% = .32 ; calcule un intervalo de confianza del 88%
69
Muchas aplicaciones involucran poblaciones de datos cualitativos que deben compararse utilizando proporciones o porcentajes. A continuacin se citan algunos ejemplos:
Educacin.- Es mayor la proporcin de los estudiantes que aprueban matemticas que las de los que aprueban ingls? Medicina.- Es menor el porcentaje de los usuarios del medicamento A que presentan una reaccin adversa que el de los usuarios del frmaco B que tambin presentan una reaccin de ese tipo? Administracin.- Hay diferencia entre los porcentajes de hombres y mujeres en posiciones gerenciales? Ingeniera.- Existe diferencia entre la proporcin de artculos defectuosos que genera la mquina A los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones mustrales, la distribucin muestral de diferencia de proporciones es aproximadamente normal para tamaos de muestra grande (n1p1 5, n1q1 5, n2p2 5 y n2q2 5). Entonces p1 y p2 tienen distribuciones mustrales aproximadamente normales, as que su diferencia p1-p2 tambin tiene una distribucin muestral aproximadamente normal. Formula: = (p1 p2 ) (p1 p2 ) 2 1 1 + 2 1 2
Ejemplo: Los hombres y mujeres adultos radicados en una ciudad grande del norte difieren en sus opiniones sobre la promulgacin de la pena de muerte para personas culpables de asesinato. Se cree que el 12% de los hombres adultos estn a favor de la pena de muerte, mientras que slo 10% de las mujeres adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y 100 mujeres su opinin sobre la promulgacin de la pena de muerte, determine la probabilidad de que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres. Solucin: Datos: = 0.12
= 0.10 = 100
70
( )
Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una distribucin binomial y se est utilizando la distribucin normal. = (p 1 p 2 ) (1 2 ) 0.025 (0.12 0.10) = = 0.11 (0.12)(0.88) (0.10)(0.90) 11 2 2 + + 100 100 1 2 pH PM = 0.03
0.03
100 0.5
0.03
Se concluye que la probabilidad de que el porcentaje de hombres a favor de la pena de muerte, al menos 3% mayor que el de mujeres es de 0.4562.
pH PM = 0.02
= 0.025
En esta ecuacin z es el valor para el intervalo de confianza especificado, es una estimacin inicial de la proporcin poblacional y E es el error del muestreo es mas y en menos tolerado por el intervalo (siempre un medio de todo intervalo de confianza) Si no es posible hacer una estimacin inicial de , entonces se debe estimar que es .50. Esta estimacin es conservadora ya que es el valor para el que se requiere mayor tamao para la muestra. Bajo esta suposicin la formula general para el tamao de la muestra se simplifica como sigue: = 2 2
Cuando se calcula el tamao de la muestra cualquier resultado fraccionario se redondea siempre hacia arriba.
71
Adems cualquier tamao de muestra menor que 100 que se obtenga con los clculos debe incrementarse a 100 debido a que las formulas se basan en el uso de la distribucin normal. Ejemplo: Suponga que se especifica que la estimacin mediante un intervalo de 95% debe ser .05 y que no se hace ninguna suposicin previa acerca del posible valor de . El tamao mnimo de la muestra que debe tomarse es: 2 1.96 2 = = = = (19.6)2 = 384.16 = 385 2 . 10
Adems de estimar la proporcin poblacional, tambin se puede estimar el nmero total en una categora de la poblacin.
EJERCICIOS
1. Se prob una muestra aleatoria de 400 pantallas planas de computadora y se encontraron 40 defectuosas. Estime el intervalo que contiene, con un coeficiente de confianza de 90%, a la verdadera fraccin de elementos defectuosos. 2. Se planea realizar un estudio de tiempos para estimar el tiempo medio de un trabajo, exacto dentro de 4 segundos y con una probabilidad de 0.90, para terminar un trabajo de montaje. Si la experiencia previa sugiere que =16 segundos mide la variacin en el tiempo de montaje entre un trabajador y otro al realizar una sola operacin de montaje, cuntos operarios habr que incluir en la muestra? 3. El decano registr debidamente el porcentaje de calificaciones 6 y 7 otorgadas a los estudiantes por dos profesores universitarios de estadstica. El profesor I alcanz un 32%, contra un 21% para el profesor II, con 200 y 180 estudiantes, respectivamente. Estime la diferencia entre los porcentajes de calificaciones 6 y 7 otorgadas por los dos profesores. Utilice un nivel de confianza del 95% e interprete los resultados. 4. Suponga que se quiere estimar la produccin media por hora, en un proceso que produce antibitico. Se observa el proceso durante 100 perodos de una hora, seleccionados al azar y se obtiene una media de 34 onzas por hora con una desviacin estndar de 3 onzas por hora. Estime la produccin media por hora para el proceso, utilizando un nivel de confianza del 95%. 5. Un ingeniero de control de calidad quiere estimar la fraccin de elementos defectuosos en un gran lote de lmparas. Por la experiencia, cree que la fraccin real de defectuosos tendra que andar alrededor de 0.2. Qu tan
72
6.
7.
8.
9.
grande tendra que seleccionar la muestra si se quiere estimar la fraccin real, exacta dentro de 0.01, utilizando un nivel de confianza fe 95%? Se seleccionaron dos muestras de 400 tubos electrnicos, de cada una de dos lneas de produccin, A y B. De la lnea A se obtuvieron 40 tubos defectuosos y de la B 80. Estime la diferencia real en las fracciones de defectuosos para las dos lneas, con un coeficiente de confianza de 0.90 e interprete los resultados. Se tienen que seleccionar muestras aleatorias independientes de n1=n2=n observaciones de cada una de dos poblaciones binomiales, 1 y 2. Si se desea estimar la diferencia entre los dos parmetros binomiales, exacta dentro de 0.05, con una probabilidad de 0.98. qu tan grande tendra que ser n? No se tiene informacin anterior acerca de los valores P1 y P2, pero se quiere estar seguro de tener un nmero adecuado de observaciones en la muestra. Se llevan a cabo pruebas de resistencia a la tensin sobre dos diferentes clases de largueros de aluminio utilizados en la fabricacin de alas de aeroplanos comerciales. De la experiencia pasada con el proceso de fabricacin se supone que las desviaciones estndar de las resistencias a la tensin son conocidas. La desviacin estndar del larguero 1 es de 1.0 Kg/mm2 y la del larguero 2 es de 1.5 Kg/mm2. Se sabe que el comportamiento de las resistencias a la tensin de las dos clases de largueros son aproximadamente normal. Se toma una muestra de 10 largueros del tipo 1 obtenindose una media de 87.6 Kg/mm2, y otra de tamao 12 para el larguero 2 obtenindose una media de 74.5 Kg/mm2. Estime un intervalo de confianza del 90% para la diferencia en la resistencia a la tensin promedio. Se quiere estudiar la tasa de combustin de dos propelentes slidos utilizados en los sistemas de escape de emergencia de aeroplanos. Se sabe que la tasa de combustin de los dos propelentes tiene aproximadamente la misma desviacin estndar; esto es 1 = 2 = 3 cm/s. Qu tamao de muestra debe utilizarse en cada poblacin si se desea que el error en la estimacin de la diferencia entre las medias de las tasas de combustin sea menor que 4 cm/s con una confianza del 99%?
Respuesta a los Problemas propuestos 1. 2. 3. 4. 5. 6. 7. 8. 9. 0.07532 0.1246 = 44 0.0222 1 2 0.1978 33.412 34.588 = 6147 0.059 0.141 = 1086 12.22 1 2 13.98 = 8
73
Introduccin Al intentar alcanzar una decisin, es til hacer hiptesis (o conjeturas) sobre la poblacin aplicada. Tales hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas. Son, en general, enunciados acerca de las distribuciones de probabilidad de las poblaciones. En muchos casos formulamos una hiptesis estadstica con el nico propsito de rechazarla o invalidarla. Analgicamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos la hiptesis de que no hay diferencia entre ellos (o sea. Que cualquier diferencia observada se debe simplemente a fluctuaciones en el muestreo de la misma poblacin). Tales hiptesis se suelen llamar hiptesis nula y se denotan por H0. Al responder a un problema, es muy conveniente proponer otras hiptesis en que aparezcan variables independientes distintas de las primeras que formulamos. Por tanto, para no perder tiempo en bsquedas intiles, es necesario hallar diferentes hiptesis alternativas como respuesta a un mismo problema y elegir entre ellas cules y en qu orden vamos a tratar su comprobacin
INICIO
Usar la prueba de hiptesis para determinar si del anlisis de una muestra es razonable concluir que toda la poblacin posee cierta propiedad.
74
Hacer una enunciacin formal de 0 y 1 la hiptesis alternativa acerca del valor del parmetro de la poblacin.
Escoger el nivel deseado de significancia, , y determinar si una prueba de una o dos extremos es apropiado.
Reunir datos de la muestra y calcular el estadstico muestral apropiado: tambin de la muestra proporcin de la muestra diferencia de la muestra 1 2 diferencias de las proporciones 1 2 Seleccionar la distribucin correcta ( ) y emplear la tabla correspondiente del apndice para determinar el lmite (o lmites) de la regin de aceptacin.
NO
SI
Rechazar 0
Aceptar 0
FIN
75
HIPTESIS ESTADSTICAS
Para todo tipo de investigacin en la que tenemos dos ms grupos, se establecer una hiptesis nula. La hiptesis nula es aquella que nos dice que no existen diferencias significativas entre los grupos. Por ejemplo, supongamos que un investigador cree que si un grupo de jvenes se somete a un entrenamiento intensivo de natacin, stos sern mejores nadadores que aquellos que no recibieron entrenamiento. Para demostrar su hiptesis toma al azar una muestra de jvenes, y tambin al azar los distribuye en dos grupos: uno que llamaremos experimental, el cual recibir entrenamiento, y otro que no recibir entrenamiento alguno, al que llamaremos control. La hiptesis nula sealar que no hay diferencia en el desempeo de la natacin entre el grupo de jvenes que recibi el entrenamiento y el que no lo recibi. Una hiptesis nula es importante por varias razones: Es una hiptesis que se acepta o se rechaza segn el resultado de la investigacin. El hecho de contar con una hiptesis nula ayuda a determinar si existe una diferencia entre los grupos, si esta diferencia es significativa, y si no se debi al azar. No toda investigacin precisa de formular hiptesis nula. Recordemos que la hiptesis nula es aquella por la cual indicamos que la informacin a obtener es contraria a la hiptesis de trabajo. Al formular esta hiptesis, se pretende negar la variable independiente. Es decir, se enuncia que la causa determinada como origen del problema flucta, por tanto, debe rechazarse como tal.
HIPTESIS ALTERNATIVA.
Toda hiptesis que difiere de una dada se llamar una hiptesis alternativa. Por ejemplo: Si una hiptesis es p = 0.5, la hiptesis alternativa podran ser p = 0,7 p<,5 p > 0,5. Una hiptesis alternativa a la hiptesis nula se denotar por H1. Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o distribucin bajo estudio, proposiciones sobre la muestra. Por lo general, el valor del parmetro de la poblacin especificado en la hiptesis nula se determina en una de tres maneras diferentes: 1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del parmetro.
76
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo 3. Cuando el valor del parmetro proviene de consideraciones externas tales como las especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin, el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las especificaciones. Los procedimientos de prueba de hiptesis dependen del empleo de la informacin contenida en la muestra aleatoria de la poblacin de inters.
77
2.
Donde: =
3.- La probabilidad mxima de error tipo I es igual a 0.05 (el nivel de significancia que se usa para probar la hiptesis nula) 4.- La probabilidad del error tipo II es la probabilidad de que la media de la muestra aleatoria sea mayor o igual que $284.21, dado que la media de todas las cuentas en realidad es $240.
= 1 248.21 240 8.21 = = = 1.15 7.17 7.17
36
43
43 6
= 7.17
Manteniendo constantes el nivel de significancia y el tamao de la muestra, la probabilidad de error tipo II disminuye a medida que el valor alternativo para la media se elige ms alejado de la hiptesis nula y aumenta a medida que este valor alternativo se elige ms cerca del valor de la hiptesis nula.
()
REGION DE RECHAZO
Regin de aceptacion
0.05
248.21
200
0.13
200 248.21
78
Ejemplo. Suponga que el desarrollador considerara discrepancia grave el hecho de que el ingreso domstico promedio fuera de inferior a $43,500, en lugar del nivel de ingreso propuesto, que es $45,000. Determine: a) la probabilidad del error tipo I, b) la probabilidad del error tipo II. c) La potencia asociada con esta prueba de la cola inferior Solucin: a) P (error tipo I) = 0.05 (nivel , nivel de significancia) sea sobrepasado dado que b) P (error tipo II) = P (el valor critico = $,
1 = 43000 =
43 = $516.80 3.87
, . , . = = = . . . P (error tipo II) = ( +1.26) = 0.500 0.3962 = 0.1038 = 0.10 c) Potencia = 1 P (error tipo II) = 1 - .10 = .90
79
PRUEBAS UNILATERALES
Ejemplo. Suponga que el auditor parte de la hiptesis alternativa de que el valor medio de todas las cuentas por cobrar es menor que $260. Dado que la media muestral es $240, a continuacin se prueba esta hiptesis con un 5% como nivel de significancia mediante los procedimientos siguientes. Determinando el valor critico para la media muestral, cuando H0 : = $260.00
H1 : < $260.00)
= 240 este valor se encuentra en la regin de rechazo. Por tanto se Como rechaza la hiptesis nula y se acepta la hiptesis alternativa < $260. Determinando el valor crtico en trminos de Z, donde z critico
80
( = 0.05) = 1.645: =
Como Z = 2.7, esta regin de rechazo a la izquierda del valor critico -1.64, la hiptesis nula se rechaza. Y esto se representa en la grafica siguiente. = 240
()
REGION DE RECHAZO
Regin de Aceptacin
248.21
260.00
PRUEBAS BILATERALES PASOS BSICOS EN LAS PRUEBAS DE HIPTESIS USANDO EL MTODO DE VALOR CRTICO
Ejemplo 1: Un auditor toma una muestra de = 36 y calcula la media muestral, desea probar la suposicin de que el valor medio de todas las cuentas por cobrar en una determinada empresa sea $260.00. El auditor desea rechazar este valor supuesto de $260.00 solo si la media muestral lo contradice claramente, y as, en este procedimiento de prueba, al valor hipottico deber otorgrsele el beneficio de la duda. Paso 1. Formular la hiptesis nula y la hiptesis alternativa. La hiptesis nula H0 es valor paramtrico hipottico que se compara con el resultado muestral. La hiptesis nula se rechaza solo si es poco probable que el resultado muestral se d siendo la hiptesis correcta. La hiptesis alternativa H1 se acepta solo si la hiptesis nula se rechaza. Las hiptesis nulas y alternativa en esta prueba son: H1 : $260.00. H0 : = $260.00
81
Paso 2. Especificar el nivel de significancia que habr de usarse. El nivel de significancia es el criterio estadstico que se establece para rechazar la hiptesis nula. Si se establece = 5% como nivel de significancia, entonces la hiptesis nula se rechaza solo si el resultado muestral es tan diferente del valor hipottico que la probabilidad de que una diferencia de esa magnitud o mayor se d por casualidad es de por casualidad es de 0.05 o menos. Observe que si se usa como nivel de significancia 5%, existe una probabilidad de 0.05 de rechazar la hiptesis nula aun cuando sea verdadera. A esto se le conoce como error tipo I. La probabilidad de un error de tipo I es siempre igual al nivel de significancia que se utiliza como criterio para rechazar la hiptesis nula; al error tipo I se le designa mediante la letra griega minscula alfa y entonces tambin designa el nivel de significancia. Un error de tipo II ocurre cuando no se rechaza la hiptesis nula, y por lo tanto se acepta, siendo falsa. Situaciones posibles. Hiptesis nula verdadera Aceptar la Aceptacin correcta hiptesis nula Rechazar la Error tipo I hiptesis nula Hiptesis nula falsa Error tipo II
Rechazo correcto
Paso 3. Elegir el estadstico de prueba. El estadstico de prueba es el estadstico muestral o una versin estandarizada del estadstico muestral. Por ejemplo, con objeto de probar un valor hipottico de la media poblacional, como estadstico de prueba puede emplearse la media de una muestra aleatoria tomada de esa poblacin. Sin embargo, si la distribucin de muestreo para la media tiene distribucin normal, entonces es comn que el valor de la media muestral se convierta a un valor Z el cual sirve entonces como estadstico de prueba. Paso 4. Establecer el valor o los valores crticos del estadstico de prueba. Una vez especificados la hiptesis nula, el nivel de significancia y el estadstico de prueba que se usaran, se establecen los valores crticos del estadstico de prueba. Puede haber uno o dos de estos valores, dependiendo de si se trata de una prueba unilateral o bilateral. En cualquiera de los dos casos un valor crtico establece el valor del estadstico de prueba que se requiere para rechazar la hiptesis nula.
82
Paso 5. Determinar el valor del estadstico de prueba. Por ejemplo, al probar un valor hipottico para la media poblacional se toma una muestra aleatoria y se determina el valor de la media muestral. Si el valor crtico se fijo como un valor Z, entonces la media muestral se convierte a un valor Z. Paso 6. Tomar la decisin. El valor del estadstico muestral obtenido se compara con los valores crticos del estadstico de prueba. A continuacin la hiptesis nula se acepta o se rechaza. Si se rechaza la hiptesis nula, se acepta la alternativa. La distribucin de probabilidad normal se puede usar para probar un valor hipottico para la media poblacional siempre que 30, debido al teorema del lmite central, cuando < 30 pero la poblacin tiene distribucin y se conoce . Frmula para calcular valores crticos Dada la hiptesis nula formulada anteriormente, determine los valores crticos para la media muestral si se quiere probar la hiptesis con un nivel de significancia = 5%. Dado que se sabe que la desviacin estndar de los montos de las cuentas por cobrar es = $43.00 los valores crticos son: = 260 1.96 (7.17) = 260 14.05 = $245.95 $274.05 = 0 = 260 1.96
= 0
= 260 1.96
36
43
Por tanto, para rechazar la hiptesis nula la media muestral debe tener un valor menor que $245.95 o mayor que $274.05. As, en el caso de una prueba bilateral hay dos regiones de rechazo. Los valores 1.96 se usan para establecer los valores crticos, debido a que en la distribucin normal estndar en las dos colas queda una proporcin de 0.05 del rea, lo que corresponde al valor = 0.05 que se fij.
REGION DE
) (
REGION DE RECHAZO
RECHAZO
Regin de aceptacin
245.95
0 = 260.00
274.05
83
En las pruebas de hiptesis los valores crticos suelen especificarse en trminos de valores de Z en lugar de establecer en trminos de la media muestral. Por ejemplo, los valores crticos Z para el nivel de significancia de 5%en la prueba bilateral son -1.96 y +1.96. Cuando se determina el valor de la media muestral, este se convierte a un valor Z de modo que este valor pueda compararse con los valores crticos Z. La formula de conversin, de acuerdo con si se conoce o no , es:
si se desconoce 2 se utilizar 2
En el mismo problema de la prueba de hiptesis, suponga que la media muestral = $240. Para determinar si se debe rechazar la hiptesis nula, esta media se es convierte a un valor Z y se compara con los valores crticos 1.96 como sigue: = 7.17 = 0 240 260 20 = = = 2.79 7.17 7.17
En el modelo para las pruebas de hiptesis, este valor de Z se encuentra en la regin de rechazo de la cola izquierda. As la hiptesis nula se rechaza y se acepta la hiptesis alternativa : $. . Ejercicio. El representante de un grupo comunitario le informa al posible desarrollador de un centro comercial al sur de la ciudad, el ingreso promedio por hogar en la zona es de $45,000. Supongamos que puede asumirse que, para el tipo de zona del que se trata, el ingreso hogar tiene una distribucin aproximadamente normal y que puede aceptarse que la desviacin estndar es igual a $2,000, con base a un estudio anterior. A partir de una muestra aleatoria de 15 hogares se determina que el ingreso domestico medio es = $44,000. Pruebe la hiptesis nula = $45,000 estableciendo los limites crticos de la media muestral en trminos de pesos y con un nivel de significancia del 5%. Pruebe la hiptesis del problema con la variable normal estndar Z como estadstico de prueba
84
5.4. PRUEBA DE UNA HIPTESIS: REFERENTE A LA MEDIA CON VARIANZA DESCONOCIDA UTILIZANDO LA DISTRIBUCIN NORMAL Y t DE STUDENT.
Ejemplo: La Comisin Federal deElectricidad publica cifras del nmero anual de Kilowatt-hora que gastan varios aparatos electrodomsticos. Se afirma que una aspiradora gasta un promedio de 46 kilowatt-hora al ao. Si una muestra aleatoria de 12 hogares que se incluye en un estudio planeado indica que las aspiradoras gastan un promedio de 42 kilowatt-hora al ao con una desviacin estndar de11.9 kilowatt-hora, esto sugiere con un nivel de significancia de 0.05 que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora anualmente? Suponga que la poblacin de kilowatt-hora es normal.
1 : < 46
0 : = 46
= 1 =
= 12 1 = 11
Formula: = =
0
. 05 = .025 = 1.796 2
4246
11.9 12
= 3.43 = 1.16
-1.796
-1.16
0 : 46
85
Ejemplo 2: Una revista de negocios desea clasificar los aeropuertos internacionales de acuerdo con una evaluacin hecha por la poblacin de viajeros de negocios. Se usa una escala de valuacin que va desde un mnimo de 0 hasta un mximo de 10, y aquellos aeropuertos que obtengan una media mayor que 7 sern considerados como aeropuertos de servicio superior. Para obtener datos de evaluacin, el personal de la revista entrevista una muestra de 60 viajeros de negocios de cada aeropuerto. En la muestra tomada en el aeropuerto Heathrow de Londres la media muestral es = 7.25 y la desviacin estndar es s=1.052. De acuerdo con estos datos mustrales. Deber ser designado el aeropuerto de Londres como un aeropuerto de servicio superior? 0 : = 7 1 : > 7 En esta prueba se usa como nivel de significancia = .05 = 1 = 60 1 = 59 = 7.25, =
= 1.052,
= 60,
= 7
= =
86
5.5. DOS MUESTRAS: PRUEBAS SOBRE MEDIAS UTILIZANDO LA DISTRIBUCIN NORMAL Y t DE STUDENT.
EJEMPLO DE DIFERENCIA DE DOS MUESTRAS UTILIZANDO LA DISTRIBUCIN NORMAL. El salario anual para una muestra de n1=50 empleados de una empresa comercial del estado de Mxico es de x 1 = $190 000, con desviacin estndar muestral de 1 = $10 000. En otra empresa grande del estado de colima, una muestra aleatoria de n2 = 30 empleados tiene un salario anual promedio de x 2 = $170 000, con una desviacin estndar muestral de 2 = $14 000. Se prueba la hiptesis nula de que no existe diferencia entre los salarios promedio anuales de las dos empresas, utilizando un nivel de significancia del 5% de la siguiente manera: H0 : (1 2 ) = 0 H1 : (1 2 ) 0 n1 = 50 n2 = 30
z=
Donde x 1 =
10000 50
10000 7.10
= $1,408.45 x 2 =
n2
14000 30
14000 5.477
= $2,556.14
+6.85 que sali de la distribucin normal z, se encuentra en la regin de rechazo de la hiptesis, que se encuentra en la grfica presentada en la parte superior. Por ello se rechaza la hiptesis nula y se acepta la hiptesis alternativa de que el salario promedio anual de las dos empresas es diferente con un nivel de significancia del 5%.
= 8,509,141.4 = 2917.1
87
EJEMPLO DE DIFERENCIA DE DOS MUESTRAS UTILIZANDO LA DISTRIBUCIN t DE STUDENT. En una muestra aleatoria de n1=10 1 = 4000 horas, con una focos el promedio de vida de los focos es desviacin de S1=200 horas. Para otra marca de focos de cuya vida til tambin se presume que sigue una distribucin normal, una muestra aleatoria de n2= 8 2 = 4300 horas y una desviacin estndar focos tiene una media muestral de muestral de S2 = 250, pruebe la hiptesis de que no existe ninguna diferencia entre el ciclo medio de vida til de las 2 marcas de focos con un nivel de significancia del 1% 1 = 10 1 = 4000 1 = 200 2 = 8 2 = 4300 2 = 250 S=
1 + 2 2 1 1
t= =
(101)200 +(81)250
(x1 x2 )(1 2 ) 1 2
2
= 49,843.75
1 2 =
49,843.75 10
16
360000+437500 16
797,500 16
= =
(40004300)(0) 105.90
2 2
49,843.75 8
=105.90
105.90 300
=.01/2 =0.005
= 2.83
= 10 + 8 2 = 16 = 2.921
% ,
88
EJERCICIOS
1. Un desarrollador considera dos ubicaciones alternativas para un centro comercial regional dado que el ingreso domestico de la comunidad es una consideracin importante en la seleccin del sitio, l desea probar la hiptesis nula de que no existe ninguna diferencia entre los montos de ingreso domestico medio de las dos comunidades. Se supone que la desviacin estndar del ingreso domestico tambin es igual en las dos comunidades. En una muestra de 1 = 30 hogares de la primera comunidad el ingreso anual promedio es de 1 = 45,500 con una desviacin estndar 1 = 1,800. En una muestra de 2 = 40 hogares de la segunda comunidad 2 = 44,600 y 2 = 2,400. Pruebe la hiptesis nula al nivel de significancia de 5%. 2. Una muestra aleatoria de 1 = 12 estudiantes de Contadura tiene un promedio de calificacin media de 2.70 (donde A=4) con una desviacin estndar de .40 en el caso de los estudiantes de ingeniera en sistemas una muestra aleatoria de n2 = 10 estudiantes tiene un promedio de calificacin media de 2.90 con una desviacin estndar de .30 se supone que los valores de calificacin sigue una distribucin normal ,pruebe la hiptesis nula de que el promedio de calificacin de las 2 categoras de estimacin no es diferente con un nivel de significancia de 5% 3. El salario medio diario de una muestra de n1=30 empleados de una gran 1=280, por una distribucin estndar de 14 empresa manufacturera es pesos. En otra gran empresa una muestra aleatoria n2=40 empleados tiene 2 =270 pesos, con una desviacin estndar de 10 un salario medio de pesos. Pruebe la hiptesis de que no existe diferencia entre los montos salariales semanales medio de las dos empresas con un nivel de significancia del 5%. 4. La altura promedio de 50 palmas que tomaron parte de un ensayo es de 78 cm. con una desviacin estndar de 2.5 cm.; mientras que otras 50 palmas que no forman parte tienen media y desviacin estndar igual a 77.3 y desviacin estndar poblacional de2.8 cm. Se desea probar la hiptesis de que las palmas que participan en el ensayo son ms altas que las otras. 5. Para una muestra aleatoria de n1 = 10 lmparas de gas, se encuentra que la vida promedio es x 1 = 6000 horas con s1 = 200. Para otra marca de lmparas, para los cuales se supone tambin que tiene una vida til con distribucin normal, una muestra aleatoria de n2 = 15 lmparas de gas tiene una media muestral de x 2 = 5600 horas y una desviacin estndar muestral de s2 = 250. Pruebe la hiptesis de que no existe diferencia entre la vida til promedio de las dos marcas de lmparas de gas, utilizando un nivel de significancia del 1%.
89
Z critica (=0.05)=+1.645
(0.05)(0.95) 0 (1 0 ) 0.0475 = = = = 0.0002375 = 0.015 200 200 = 0.05 0 0.10 0.05 = = = 3.33 0.015 0.015
El valor calculado de z de 3.33 es mayor que el valor critico de 1.645 para esta prueba del extremo superior. Por lo tanto, como se encuentran 30 refacciones defectuosas en el lote de 200, se rechaza la hiptesis de que la proporcin de artculos defectuosos en la poblacin es de 5% o menor, utilizando el nivel de significancia al 5% en la prueba. Ejemplo 2: Se plantea la hiptesis de que no ms del 5% de las refacciones que se fabrican en proceso de manufactura tienen defectos. Para una muestra aleatoria de = 100 refacciones, se encuentran que 10 estn defectuosas. Prueba la hiptesis nula al 5% del nivel de significancia. 0 : 0.05 1 : > 0.05 ( = 0.05) = +1.645
(0.05)(0.95) 0 (1 0 ) 0.0475 = = = = 0.000475 = 0.022 100 100 0 0.10 0.05 0.05 = = = +2.27 0.022 0.022
90
El valor calculado de z de + 2.27 es mayor que el valor critico de + 1.645 para esta prueba del extremo superior. Por lo tanto, como se encuentran 10 refacciones defectuosas en el lote de 100, se rechaza la hiptesis de que la proporcin de artculos defectuosos en la poblacin es de 0.05 o menor, utilizando el nivel de significancia el 5% en la prueba. El administrador estipula que la probabilidad de tener el proceso para ajustarlo, cuando de hecho no es necesario, debe ser a un nivel de solo el 1%, mientras la probabilidad de no detener el proceso cuando la proporcin verdadera de defectuosos es de = 0.10 puede fijarse en el 5%. Qu tamao de muestra debe obtenerse, como mnimo para satisfacer esos objetivos de prueba? 0 0 (1 0) 1 1 (1 1) = 1 0
2 2
= 402
Se trata de una muestra un tanto grande para efectos de muestreo industrial, por lo que el administrador podr reconsiderar los objetivos de la prueba con respecto a la P (error tpico 1) de 0.01 y la P (error tipo 2) de 0.05
PRUEBA
SOBRE
DOS
Prueba para la diferencia entre dos proporciones poblacionales Ejemplo: Un fabricante est evaluando dos tipos de equipo para fabricar un artculo. Se obtiene una muestra aleatoria de n1 = 50 para la primera marca de equipo y se encuentra que 5 de ellos tiene defectos. Se obtiene una muestra aleatoria de n2 = 80 para la segunda marca y se encuentra que 6 de ellos tienen defectos. La tasa de fabricacin es la misma para las dos marcas. Sin embargo, como la primera cuesta bastante menos, el fabricante le otorga a esa marca el beneficio de la duda y plantea la hiptesis H0: 1 2 . Pruebe la hiptesis en el nivel de significancia del 5%.
91
Datos n1 = 50 n2 = 80
p 1 p 2 = = z=
El valor calculado de z de 0.49 no es mayor que 1.645 para esta prueba del extremo superior. Por ello, no puede rechazarse la hiptesis nula en el nivel de significancia del 5%.
(0.085)(0.915) (0.085)(0.915) (1 + ) (1 + ) + = + 50 n1 n2 80
Ejemplo 2: Se desea saber si existe una diferencia de proporciones entre los alumnos que reprobaron la materia de fsica de las escuelas Ignacio Ramrez Y Venustiano Carranza la encuesta se realiza a 70 alumnos de la primera escuela de los cuales el 58% dijo haber reprobado y a 60 alumnos de la segunda escuela y de estos el 70% reprob. a) Establecer la hiptesis nula y alternativa. b) Establecer se rechaza o se acepta la hiptesis con un nivel de significancia del 5%. Datos n1 = 70 n2 = 60
1 = .58
2 = .70
92
H1 : (1 2 ) 0 Operaciones =
p 1 p 2 = = z=
Se acepta la hiptesis nula de que no hay deferencia en el nivel de reprobados de las dos escuelas.
En el caso de observaciones apareadas, el mtodo apropiado para probar la diferencia entre las medias de dos muestra consiste en determinar primero la diferencia entre cada par de valores, para despues probar la hiptesis nula de que la poblacional media es .Asi, desde el punto de vista de los clculos de la prueba se aplica a muestra de valores , : =
93
La media y desviacin estndar es la muestra de valores se obtiene por medio de la aplicacin de las frmulas bsicas, excepto que es sustituida por . La diferencia media de un conjunto de diferencias entre observaciones apareadas es: =
La frmula de desviaciones y la frmula de clculo para la desviacin estndar de las diferencias entre observaciones apareadas son, respectivamente: =
El error estndar de la diferencia media entre observaciones apareadas se obtiene por medio de la formula. Para el error estndar de la media, excepto que es sustituida de nueva cuenta por : =
Dado que el error estndar de la diferencia media calcula con base en la desviacin estndar de la muestra de diferencias ( )y por lo general puede suponerse que los valores de siguen una distribucin normal. La estadstica de prueba empleada para probar la hiptesis de que no existe diferencia entre las medias de un conjunto de las medias de un conjunto de observaciones apareadas es: =
Ejemplo: un fabricante de automviles recolecta datos sobre millaje de = autos de diversas categoras de peso usando gasolina de calidad estndar con y sin cierto aditivo. Por supuesto, los motores
94
fueron ajustados a las mismas especificaciones antes de cada corrida, y los mismos conductores sirvieron para los dos casos de gasolina (aunque no se les hizo saber que gasolina se usaba en una corrida en particular). Dados los datos de millaje en la tabla, probamos la hiptesis de que no existe diferencia entre el millaje medio obtenido con y sin el aditivo, empleando el nivel de significancia del 5% y se resuelve de la siguiente manera: = . = .
= =
. = .
( = , = . ) = . = . = = . . (. 7) . (. ) = =
= . = 0.337 = = = . = . = . .
. = = +. .
95
Automvil 1 2 3 4 5 6 7 8 10 9
Millaje aditivo 36.7 35.8 31.9 29.3 28.4 25.7 24.2 22.6 21.9 276.8 20.3
con Millaje aditivo 36.2 35.7 32.3 29.6 28.1 25.8 23.9 22.0 21.5 275.1 20.0
sin
0.5 0.4 0.3 0.1 0.3 0.6 0.4 +1.7 0.3 0.3 0.1
0.25 0.01 0.16 0.09 0.09 0.01 0.09 0.36 0.16 0.09 1.31
Ejercicio. El director de la capacitacin de una compaa desea comparar un nuevo mtodo de capacitacin tcnica, que supone la combinacin de diskettes instructivos de cmputo y resolucin de problemas en el laboratorio con el mtodo tradicional de imparticin de clases. Se asocian as doce pares de aprendices de acuerdo con sus antecedentes y desempeo acadmico, en tanto que uno de los miembros de cada par asignado al curso tradicional y el otro al nuevo mtodo. Al final del curso se determina el nivel de aprendizaje por medio de un examen sobre informacin bsica y la capacidad de aplicarla. Dado que el director de capacitacin desea conceder el beneficio de la duda ala sistema de instruccin establecido, se formula la hiptesis nula de que el desempeo medio del sistema establecido es igual o mayor que el nivel medio de desempeo del nuevo sistema. Pruebe esta hiptesis al nivel de significancia de 5%. Los datos mustrales de desempeo se presentan en las tres primeras columnas de la siguiente tabla:
96
Nuevo mtodo d ( )
94 91 68 88 75 66 94 88 96 88 95 87 1030
0 = 0 REFERENCIAS: Borrego, Silvia (2008). Estadstica descriptiva e inferencial. Revista digital innovacin y experiencias educativas 13. Recuperado el 10 de marzo de 2010 desde: http://www.csi-csif. Castillo Manrique, Isabel (2006). Estadstica descriptiva y clculo de probabilidades. Mxico: Pearson Educacin. Galbiati Riesco, Jorge M. Conceptos Bsicos de Estadstica (Versin electrnica). Pontificia Universidad Catlica de Valparaso, Instituto de Estadstica. Recuperado el 1 de marzo de 2010 desde: http://www.jorgegalbiati.cl/ejercicios_4/ConceptosBasicos.pdf 1 < 0
97
Jordi Casal, Enric Mateu. (2003). Tipos de muestreo (versin electrnica). Rev. Epidem.Med.Prev. (2003), 1: 3-7. Recuperado el 1 de marzo de 2010 en http://minnie.uab.es/~veteri/21216/TiposMuestreo1.pdf Larios Osorio, Vctor (1999). Unidad 5. Teora de muestreo. Recuperado el 12 de marzo de 2010 desde: http://www.uaq.mx/matematicas/estadisticas/xu5.html Lind, Douglas, William Marchal y Samuel Wathen (2008). Estadstica aplicada a los negocios y la economa decimotercera edicin. Mxico: McGraw-Hill. Montgomery, Douglas C. y George C. Runger (1996). Probabilidad y Estadstica aplicadas a la ingeniera. Cuarta edicin. McGraw-Hill, Mxico. Ritchey, Ferris (2008). Estadstica para las ciencias sociales. Segunda edicin. Mxico: McGraw-Hill. Ruiz Muoz, David (2004). Manual de estadstica (versin electrnica). Recuperado el 9 de marzo de 2010 desde: http://www.eumed.net/cursecon/libreria/drm/ped-drm-est.htm Wackerly, Dennis D., William Mendenhall III y Richard L. Scheaffer (2010). Estadstica Matemtica con Aplicaciones. Sptima edicin. Mxico: Cengage Learning. Walpole Ronald E., Raymond H. Myers et al. (2007). Probabilidad y Estadstica para Ingeniera y ciencias. Octava Edicin. Mxico: Pearson Educacin. Bibliografa complementaria: Wackerly Dennis D., Mendenhall William III, Scheaffer, Richard L. Estadstica Matemtica con Aplicaciones. Sptima Edicin, Cengage Learning, Mxico, 2010. Ferris Ritchey. Estadstica aplicada a las ciencias sociales. Segunda Edicin. Mc Graw Hill, 2008. Douglas L., William M., Samuel W. Decimotercera Edicin, Estadstica aplicada a los negocios y la economa, Mc Graw Hill, 2008. Isabel Castillo Manrique, Estadstica descriptiva y clculo de probabilidades, Primera Edicin, Pearson Mxico, 2006.