Apunte 2
Apunte 2
Apunte 2
ESTADISTICA
DESCRIPTIVA
CONTENIDO
2 ESTADISTICA DESCRIPTIVA................................................................................... 11
2.1 DISTRIBUCIONES DE FRECUENCIAS Y GRAFICOS 11
2.1.1 DATOS CORRESPONDIENTES A UN ATRIBUTO 11
2.1.2 DATOS CORRESPONDIENTES A UNA VARIABLE DISCRETA 14
2.1.3 DATOS CORRESPONDIENTES A UNA VARIABLE CONTINUA 16
2.1.4GRAFICAS DE SERIE DE TIEMPO 22
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 11
2 ESTADISTICA DESCRIPTIVA
Una vez fijado el objetivo de estudio y en consecuencia definida la o las poblaciones asociadas,
se procede a la recolección de los datos (censo o muestra).
Considerando que el conjunto de datos constituye una muestra, en este capítulo se estudian
algunas de las técnicas más usadas para:
Ejemplo :
Los siguientes datos representan la condición en Matemática Discreta de los alumnos de la ca-
rrera de Ingeniería en Sistemas de Información de la U.T.N., Reg. Rosario, inscriptos en la
asignatura Probabilidad y Estadística, en el año 2002
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 12
Es muy frecuente expresar a las frecuencias relativas como porcentaje; así en el ejemplo
diremos que sólo el 24 % de los alumnos que cursaron Probabilidad y Estadística en el 2002,
tenían aprobada la asignatura Matemática Discreta.
REPRESENTACION GRAFICA
Sin cursar
Cursando
0%
9%
Aprobada
Cursada
24%
3%
Regular
64%
0,70
0,60
0,50
frec. relativa
0,40
0,30
0,20
0,10
0,00
Aprobada Regular Cursada Cursando Sin cursar
Condición
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 13
DIAGRAMA DE PARETO
Es un caso especial del diagrama de barras, que se usa con frecuencia en control de calidad.
Las barras se grafican en orden descendente. Puede también incluir una segunda escala (del
0 al 100), encima de las barras de las clases, que muestre los porcentajes acumulados.
Este tipo de diagrama lleva el nombre del economista italiano V. Pareto y en general
representa la “ ley de Pareto”, esto es: la mayor parte de los defectos aparece sólo en unas
pocas categorías.
Ejemplo :
Un analista de redes registró las causas principales que propiciaron fallas en los sistemas
durante los últimos seis meses, obteniendo el siguiente resultado:
Razón de la falla
60
Percent
100
50
40
30
50
28
20
14
10
Count
8
0 4 0
Soft servidor Falla eléctrica Ancho de banda
Sin memoria Hardware Conexión física
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 14
Ejemplo :
Un distribuidor de aspiradoras registra el número de unidades vendidas por día durante un
período de 50 días. Los resultados obtenidos fueron:
84 88 87 89 88 89 88 91 87 85
88 89 90 88 87 91 86 89 85 88
86 90 89 84 91 92 89 88 94 90
87 89 91 86 90 89 91 92 89 88
85 88 87 88 91 87 92 90 85 87
DISTRIBUCION DE FRECUENCIAS
Frecuencia Frecuencia
Valor de la Frecuencia Frecuencia
Cómputo de absoluta relativa
variable absoluta relativa
Frecuencias acumulada acumulada
xk nk fk Nk Fk
84 // 2 0,04 2 0,04
85 //// 4 0,08 6 0,12
86 /// 3 0,06 9 0,18
87 //// // 7 0,14 16 0,32
88 //// //// 10 0,20 26 0,52
89 //// //// 9 0,18 35 0,70
90 //// 5 0,10 40 0,80
91 //// / 6 0,12 46 0,92
92 /// 3 0,06 49 0,98
93 0 0,00 49 0,98
94 / 1 0,02 50 1,00
Total 50 1,00
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 15
REPRESENTACION GRAFICA
0,25
0,2
frecuencia relativa
0,15
0,1
0,05
0
83 84 85 86 87 88 89 90 91 92 93 94
número de aspiradoras
GRAFICO ESCALONADO
0,8
Frec. rel. acumulada
0,6
0,4
0,2
0
83 84 85 86 87 88 89 90 91 92 93 94 95
Número de aspiradoras
1
Ver pasos a seguir para su utilización en el punto 2.7: Complemento para el uso de Excel, pag 45.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 16
DIAGRAMA DE PUNTOS
•
• •
• • • • • • •
84 85 86 87 88 89 90 91
número de aspiradoras
Ejemplo:
Con el propósito de adecuar los objetivos curriculares de una escuela, se decide analizar la
realidad socioeconómica de la familia a la cual pertenecen los alumnos ingresantes en un
año determinado. A tal fin se registran para cada uno de ellos (entre otros datos) la superfi-
cie cubierta de la vivienda que habita la familia del alumno ingresante. Los resultados obteni-
dos para 30 alumnos ingresantes seleccionados al azar fueron:
85 - 117 - 92 - 120 - 94 - 110 - 151 - 90 - 80 - 116 - 95 - 102 - 100 - 113 - 118 - 140 - 133 -
108 - 115 - 148 - 110 - 130 - 100 - 120 - 108 - 125 - 105 - 130 - 112 - 150
DIAGRAMA DE TALLO-HOJA
Es conveniente presentar a los dígitos hoja ordenados en forma creciente para facilitar la
posterior utilización del diagrama tallo-hoja, tanto en forma gráfica como tabular.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 17
8 05
9 0245
10 002588
11 00235678
12 005
13 003
14 08
15 01
DISTRIBUCION DE FRECUENCIAS
Otra forma de organizar la información es individualizando entre los datos, el valor mínimo (80
m2) y el máximo (151 m2) que asume la variable.
La diferencia entre ambos valores (en este caso 71 m2) se llama rango.
Los 28 valores restantes pertenecen al intervalo [ 80, 151].
Para poder realizar el respectivo cómputo de frecuencias, dicho intervalo se particiona en
subintervalos de igual amplitud. Cada uno de ellos identifica a una clase y recibe el nombre de
intervalo de clase .
Cuando se agrupan datos a través de intervalos de clase, se produce una pérdida de
información por la no conservación de los valores individuales. Demasiados intervalos provoca
pérdida de efectividad como medio de resumir datos; en cambio, pocos intervalos condensan
tanto la información que arrojan poca luz sobre el comportamiento de la característica.
La elección del número de subintervalos está estrechamente relacionada con la cantidad de
datos que se consideran. Es común usar entre 5 y 20 subintervalos.
Suele aplicarse una regla práctica que indica que el número de subintervalos es
aproximadamente igual a la raíz cuadrada del número de observaciones.
Para el ejemplo dado, se tomarán 6 subintervalos, dado que 30 = 5,4772
Deben ser semiabiertos para que cada valor de la variable pertenezca a uno y sólo
uno de los intervalos.
En el ejemplo : 79 < x ≤ 91 ó ( 79 , 91]
El punto medio de cada intervalo de clase debe ser un posible valor de la variable (de
acuerdo a las restricciones con las que se expresan los valores de las observaciones).
En el ejemplo los puntos medios deben ser valores enteros a pesar de que la variable
es continua.
Es preferible, por facilidad en el análisis, que los intervalos posean igual amplitud.
La tabla siguiente muestra la distribución de frecuencias del ejemplo :
2
PHStat es un complemento estadístico para Microsoft Excel incluido en el CD que acompaña al libro Estadística para Adminis-
tración (2da edición) de Berenson, M; Levine , D. y Krehbiel,T.; editorial Pearson Educación, México, 2001.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 18
Frecuencia Frecuencia
Frecuencia Frecuencia
Intervalo de clase Punto medio absoluta relativa
absoluta relativa
acumulada acumulada
79 < x ≤ 91 85 3 0,10 3 0,10
91 < x ≤ 103 97 6 0,20 9 0,30
103 < x ≤ 115 109 8 0,27 17 0,57
115 < x ≤ 127 121 6 0,20 23 0,77
127 < x ≤ 139 133 3 0,10 26 0,87
139 < x ≤ 151 145 4 0,13 30 1,00
30 1,00
REPRESENTACION GRAFICA
HISTOGRAMA
• Las bases de las barras tienen la longitud igual a la amplitud del intervalo de clase que
representan y se ubican sobre el eje de la abscisa.
• Si los intervalos de clase son de igual amplitud, las alturas de las barras resultan
proporcionales a las frecuencias de las clases. En caso de amplitudes diferentes, las
alturas deben ser calculadas para que se verifique la condición anterior.
3
Ver pasos a seguir para su utilización en el punto 2.7: Complemento para el uso de Excel, pag 45
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 19
0,3
0,25
0,2
Frecuencia
0,15
0,1
0,05
0
79 91 103 115 127 139 151 163
Superficie cubierta (en m2)
Los histogramas son más fáciles de interpretar si los intervalos de clase tienen la misma
amplitud.
El histograma, al igual que el diagrama de tallo-hoja, proporciona una impresión visual del
aspecto que tiene la distribución de las observaciones, así como información sobre la
dispersión de los datos.
Al pasar de los datos originales o del diagrama de tallo-hoja a la distribución de frecuencias y al
histograma, se pierde parte de la información debido a que ya no se tienen las observaciones
originales. Sin embargo, esta pérdida en la información a menudo es pequeña si se le compara
con la facilidad de interpretación ganada al utilizar la distribución de frecuencias y el
histograma.
Para conjuntos de datos pequeños, los histogramas pueden cambiar claramente de apariencia
si el número de clases o el ancho de éstas cambia. Los histogramas son más estables si el
número de observaciones es grande.
POLIGONO DE FRECUENCIAS
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 20
Para el ejemplo:
0,3
0,25
frecuencia relativa
0,2
0,15
0,1
0,05
0
73 85 97 109 121 133 145 157
sup. cubierta (en m2)
1
0,9
Frec. relativa acumulada
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
67 79 91 103 115 127 139 151 163
Sup. cubierta (en m2)
4
Se presenta a continuación otro ejemplo sobre variable continua :
4
Ejemplo extraído de “Probabilidad y Estadística aplicada a la Ingeniería” de Montgomery Douglas, Runger Geor-
ge.- Mc Graw Hill – México, 1996. pag. 5
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 21
Los datos de la siguiente tabla representan la resistencia a la tensión, en libras por pulgada
cuadrada (psi), de 80 muestras de una nueva aleación de aluminio y litio, que está siendo
evaluada como posible material para la fabricación de elementos estructurales de aeronaves.
Los datos fueron registrados conforme se realizaba la prueba y en este formato no conllevan
mucha información con respecto a la resistencia a la tensión. No es fácil responder a preguntas
tales como “¿Qué porcentaje de las muestras fallaron debajo de los 120 psi?”.
Dado que se tienen muchas observaciones, la construcción de un diagrama de puntos para
estos datos es ineficiente; existen presentaciones visuales más eficaces para conjuntos
grandes de datos. Una de ellas es el ya visto diagrama de tallo y hoja:
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 22
Las gráficas consideradas hasta el momento (histogramas, diagramas de tallo y hoja) son
métodos visuales muy útiles para mostrar la variabilidad presente en los datos. Sin embargo,
con frecuencia el tiempo es un factor importante que contribuye a la variabilidad observada en
los datos, y los métodos anteriores no lo toman en cuenta. Una serie de tiempo, o secuencia de
tiempo, es un conjunto de datos en los que las observaciones se registran en el orden en que
ocurren. La gráfica de una serie de tiempo es un diagrama en el que el eje vertical denota el
valor observado (por ejemplo x), mientras que el eje horizontal denota el tiempo (que puede ser
minutos, días, años, etc.). Cuando se grafican las mediciones como una serie de tiempo, a
menudo se observan tendencias, ciclos u otras características importantes de los datos que, de
otra forma, pasarían inadvertidas.
Por ejemplo, considérese la figura 1-18 a, la cual presenta la gráfica de una serie de tiempo de
las ventas anuales de una compañía durante los últimos diez años. La impresión general que
ofrece esta gráfica es que las ventas tienen una tendencia a crecer. Existe cierta variabilidad
en esta tendencia, donde, las ventas en algunos años aumentaron con respecto a las del año
anterior, mientras que las ventas de otros años disminuyeron. La figura 1-18 b presenta las
ventas de los tres últimos años notificadas por trimestre. Esta gráfica muestra de manera clara
que las ventas anuales de la empresa exhiben una variabilidad cíclica por trimestre, donde las
ventas en los dos primeros trimestres son mayores que en los dos últimos.
5
Extraído de “Probabilidad y Estadística aplicada a la Ingeniería” de Montgomery Douglas, Runger George.- Mc
Graw Hill – México, 1996. pag. 33
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 23
a)
b)
Algunas veces puede ser útil combinar las gráficas de serie de tiempo con alguno de los tipos
de presentación gráfica considerados hasta el momento, por ejemplo con los diagramas de ta-
llo y hoja, para formar un diagrama de dígitos y líneas.
La figura 1.19 presenta un diagrama de dígitos y líneas para las observaciones de resistencia
a la tensión del ejemplo de la página 23, que como se dijo, fueron registradas en el orden en
que ocurrieron.
Esta gráfica indica de manera eficaz la variabilidad total de los datos de resistencia a la tensión
y, de manera simultánea, presenta la variabilidad en las mediciones con el paso del tiempo. La
impresión general es que la resistencia cambia alrededor del valor medio de 162,67, y no hay
ningún patrón obvio sobre esta variabilidad con respecto al tiempo.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 24
El diagrama de dígitos y líneas de la figura 1.20 presenta una situación diferente. Esta gráfica
resume 30 observaciones sobre la concentración de un producto obtenido mediante un proceso
químico, donde las observaciones se registraron a intervalos de una hora. La gráfica indica
que, durante las primeras 20 horas de operación, el proceso produjo concentraciones en
general por encima de 85 g/l, pero después de la muestra 20 algo ocurrió con el proceso, que
dio como resultado concentraciones más bajas. Si esta variabilidad en la concentración del
producto puede reducirse, entonces es posible mejorar la operación del proceso.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 25
Las medidas que resumen la información de una distribución de frecuencias reciben el nombre
de:
ESTADISTICOS
de acuerdo a
pueden ser de
POSICION DISPERSION
Media
Media Mediana Moda Fractilas Rango Varianza Desvío Desvío Inter-
estándar cuartílico
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 26
Ellas son :
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 27
r r
1
x=
n
∑
i= 1
xi ni = ∑
i= 1
xi fi (2)
• Es una medida de posición útil para comparar dos o más distribuciones, sólo si éstas
tienen forma semejante.
Moda
Características de la moda:
Mediana
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 28
Característica de la mediana:
Fractilas
Ejercicios
si las observaciones se encuentran clasificadas en clases (ej. apartado 2.1.2, pag. 16)
2. Los últimos diez días de junio, el tren “ Costa Especial ” llegó tarde a su destino en los
siguientes números de minutos ( un número negativo significa que el tren llegó con anti-
cipación):
3 , 6 , 4 , 10 , - 4 , 124 , 2 , - 1 , 4 , 1
Media
Mediana
Moda
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 29
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 30
Es el promedio, aproximado, de
los cuadrados de las diferencias
Varianza muestral entre los valores de las observacio-
s2n-1
nes y su correspondiente media
aritmética
Rango
r = xM - x m
Proporciona una primera información sobre la dispersión de los valores pero basta que al
menos uno de los dos valores que intervienen en su cálculo esté excesivamente alejado
para que pierda importancia la información que brinda.
Varianza muestral
Es el promedio, aproximado, de los cuadrados de los desvíos de las observaciones con res-
pecto a su media aritmética.
1 r
∑ ( xi − x ) ni
2
s n2− 1 =
n − 1 i= 1
Si el denominador hubiese sido n en lugar de n-1, se hubiera obtenido el promedio de los
cuadrados de los desvíos de las observaciones con respecto al promedio de las mismas. Sin
embargo, n-1 se usa aquí debido a ciertas propiedades deseables del estadístico s2 que lo
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 31
La varianza está expresada en unidades al cuadrado, lo que representa una desventaja para
su interpretación.
s = s n2− 1
Recorrido intercuartílico
riq = q3 - q1
Se darán a continuación las medidas características calculadas para los dos ejemplos
trabajados con variable discreta y con variable continua. Las mismas fueron obtenidas en Excel
con Análisis de datos, en la opción Estadística Descriptiva :
Número de Aspiradoras
Media 88,44
Error típico 0,32
Mediana 88,00
Moda 88,00
Desviación estándar 2,23
Varianza de la muestra 4,99
Curtosis -0,22
Coeficiente de asimetría 0,05
Rango 10
Mínimo 84
Máximo 94
Suma 4422
Cuenta 50
Con respecto al ejemplo del apartado 2.1.3 correspondiente a la superficie cubierta de las
viviendas de los alumnos ingresantes a una escuela las mismas resultaron :
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 32
s
c.v. = . 100
x
Es el desvío estándar expresado como porcentaje de la media aritmética, por lo tanto no viene
expresado en unidades.
Es útil para la comparación de la variabilidad relativa entre distribuciones que no están
expresadas en la misma unidad de medida o bien, entre distribuciones que si bien están
expresadas en la misma unidad, poseen promedios muy dispares.
Ejemplo :
En febrero del año pasado, los datos de préstamos personales de una mutual mostraron
un promedio de $650 y una desviación estándar de $300. Recientemente se calculó la
media y la desviación estándar correspondiente a los préstamos personales de febrero
del presente año resultando las mismas $ 900 y $ 350 respectivamente.
¿En cuál de los dos años los préstamos personales presentaron menor dispersión
relativa?
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 33
Es posible que dos conjuntos de datos distintos tengan el mismo rango pero difieran
considerablemente en el grado de variación de los datos. En consecuencia, el rango es una
medida relativamente insensible de la variación de los datos. La varianza tiene importancia
teórica, pero es difícil de interpretar porque las unidades de medición de la variable de interés
están elevadas al cuadrado. En cambio, las unidades de medición de la desviación estándar
son las unidades de la variable. Si la desviación estándar se combina con la media del conjunto
de datos, resulta fácil interpretarla. Una regla práctica útil es la que se conoce como regla
empírica, a saber:
Casi todas las observaciones quedan a tres desviaciones estándar de su media (es decir,
dentro del intervalo x ± 3 s )
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 34
Con respecto al ejemplo del apartado 2.1.3 correspondiente a la superficie cubierta de las
viviendas de los alumnos ingresantes a una escuela, la media es 113,8 m2 y la desviación
estándar 18,267 m2.
Las proporciones del número total de observaciones que se esperaría encontrar en
los intervalos x ± s , x ± 2 s y x ± 3 s según la regla empírica, así como las
proporciones reales, se presentan en la siguiente tabla:
Representa los tres cuartiles junto con los dos valores extremos de las observaciones.
Los diagramas de caja que se presentan a continuación ( confeccionados con PHStat ),
corresponden a los datos observados para las características “número de aspiradoras
vendidas” y “superficie cubierta de la vivienda” analizadas anteriormente en el desarrollo de las
distribuciones de frecuencias de las variables discretas y continuas, respectivamente.
Nº Aspiradoras
96
94
92
90
88
86
84 Nº Aspiradoras
82
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 35
Superficie cubierta
150
130
110
90
Superficie
70
El lado inferior de las cajas corresponde al primer cuartil, el lado superior al tercer cuartil y el
segmento que divide a las cajas al segundo cuartil. Un segmento de recta une el lado inferior
de las cajas con el mínimo valor observado y otro segmento une el lado superior de las cajas
con el máximo valor observado.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 36
x -x
Valor z =
s
Estos valores por lo general son atribuibles a una de las siguientes causas:
Supongamos una variable “x” con media aritmética ( x ) y varianza ( s2x ) y una variable “y”
de la forma:
y = a+bx
2 2 2
• sy = b sx ( varianza de la variable y )
En el caso b = 1, lo único que se hace es sumar una constante (a). La media aritmética de la
nueva variable quedará incrementada en un valor igual al de la constante (a) y el desvío
estándar, que es una medida de dispersión, permanece igual.
En cambio, si la variable es multiplicada por una constante b ≠ 1, esto produce una contracción
o una dilatación de la distribución (según sea b menor o mayor que 1) lo que se refleja en la
varianza.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 37
Ejemplo :
Sea la variable x : número de días completos trabajados en un año por operario de una fá-
brica.
Se conoce que el promedio de la variable x es 290,1 días con una desviación de 2,2 días.
Cada día no trabajado ocasiona a la fábrica una pérdida de $ 150.
Calcule la pérdida anual promedio por operario y su desvío estándar (considere 300 días la-
borables en el año).
yi = ( 300 - xi ) 150
de donde :
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 38
a ) El siguiente gráfico representa una reducción ( en el año 1990 con respecto al año
anterior ) del 50% en el número de barriles de petróleo extranjero utilizado en el proceso
de manufactura de productos de películas por una empresa.
120,000
Barriles
60,000
1989 1990
b)
Liderazgo
2% 2%
3%
COLDWELL BANKER
11%
E.R.A.
32% GALLERY
CENTURY
otros
6
Los gráficos fueron realizados por Diego Martínez Viademonte, alumno que cursó la asignatura en el año 2003
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 39
c)
98
Porcentaje
97
96
95
CHEVY FORD TOYOTA NISSAN
Camión
Más del 98% de los camiones Chevy vendidos durante los últimos 10 años siguen en el camino.
100
90
80
70
Porcentaje
60
50
40
30
20
10
0
CHEVY FORD TOYOTA NISSAN
Camión
Más del 98% de los camiones Chevy vendidos durante los últimos 10 años siguen en el camino.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 40
2.- En una editorial se clasificaron las publicaciones del año anterior según su carácter y se
obtuvo que el 45% de las publicaciones eran científicas, el 17% técnicas, 16% literarias,
12% artísticas y 10% de otro carácter.
Presente un informe respecto a las publicaciones de la editorial.
3.- Una fábrica de estéreos desea estudiar la relación entre el número de piezas defectuosas y
el momento de la jornada de trabajo en que se producen las mismas. Se fijaron tres
períodos de la jornada : 6 – 7 horas ; 10 – 11 horas y 13 – 14 horas y en cada uno de ellos
se observó durante treinta días el número de defectuosos. Los resultados obtenidos fueron:
4 1 4 3 5 10 4 8 10 3 7 6 6 5 9
1° período
8 10 6 4 6 5 7 6 6 9 7 5 6 7 5
6 2 4 5 7 8 5 6 4 6 5 7 4 6 5
2° período
3 6 6 5 9 8 6 7 6 4 7 6 6 5 7
4 5 6 9 8 10 12 11 12 10 9 9 10 8 7
3° período
11 12 9 14 12 9 11 13 12 11 13 14 12 10 13
4.- Los siguientes datos corresponden a los tiempos de duración (en segundos) de 100 temas
de rock. Realiza un análisis descriptivo completo de la información:
Tiempo Frecuencia
135 ≤ t < 145 8
145 ≤ t < 155 9
155 ≤ t < 165 18
165 ≤ t < 175 20
175 ≤ t < 185 35
185 ≤ t < 195 10
5.- A los efectos de organizar las compras de gaseosas para la fiesta de fin de curso de un
instituto, se le preguntó a cada uno de los 200 integrantes de la comunidad educativa la
gaseosa preferida.
♦ el porcentaje de alumnos que prefieren pomelo es igual al de los docentes que prefieren
la misma gaseosa
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 41
Integrante
s
Docentes No docentes Alumnos Totales
Gaseosa
Cola
Pomelo 4
Naranja
Totales 40 10
6.- Una compañía de seguros registró entre sus asegurados el número de accidentes del año
2003, obteniendo la siguiente información:
1 84 50 41 66 60
2 41 15 12 16 25
más de 2 10 9 5 5 8
Totales
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 42
a) Calcule las medidas descriptivas que crea conveniente para representar los datos e
interprete sus resultados.
b) El sueldo promedio de los 1000 operarios de esa industria es de $ 490. Obtenga el
sueldo promedio para el conjunto de ambas categorías de empleados.
c) Si conociera la mediana y la moda para la categoría de los operarios, ¿podría calcular
esas medidas para el conjunto de todos los trabajadores de la industria?
d) Si se aumentara en un 10 % el sueldo de cada empleado, calcule sueldo promedio y
varianza.
e) Si a cada empleado se le aumenta el sueldo en 50 $, calcule sueldo promedio y varian-
za.
8.- Los siguientes datos son mediciones de viscosidad de un producto químico tomadas cada
hora (de arriba abajo y de izquierda a derecha).
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 43
Se seleccionan al azar 160 latas a las cuáles se les mide el diámetro y se obtiene la
siguiente distribución de frecuencias:
Construya un gráfico de cajas para cada uno de los tres diseños y presente un informe
con sus conclusiones.
G.Carnevali-E.Franchelli-G.Gervasoni
ESTADÍSTICA DESCRIPTIVA 44
G.Carnevali-E.Franchelli-G.Gervasoni