02 Manejo de Datos
02 Manejo de Datos
02 Manejo de Datos
MANEJO DE DATOS
Aunque el término estadística trae a la mente tan sólo una lista de hechos y números, lo
cierto es que el interés básico no son los conjuntos de datos, sino más bien el empleo de
la información que contienen esos conjuntos para llevar a cabo decisiones inteligentes.
Por lo tanto en este capítulo se presentará la idea fundamental de utilizar una muestra de
datos para inferir determinada propiedad para un conjunto mayor de datos de donde se
tomó la muestra.
Aunque los métodos de la estadística descriptiva son importantes para presentar y carac-
terizar los datos, éstos han sido la base de los métodos de la estadística inferencial y ser-
vido para mejorar la teoría de la probabilidad que en la actualidad ha hecho posible aplicar
la estadística a todos los campos de la investigación.
ESTADÍSTICA INFERENCIAL. Son aquellos métodos que hacen posible la estimación de una
característica de una población o la toma de una decisión referente a una población, ba-
sándose sólo en los resultados de la muestra. Esto es, la estadística inferencial quiere
decir que se utilizan los datos para hacer afirmaciones rigurosas e inteligentes, las infe-
rencias, acerca de un fenómeno mucho mayor del cual se seleccionaron los datos.
Cualquier problema de estadística tiene, como punto de partida, una población de interés.
PARÁMETRO. Es una medida de resumen que se calcula para describir una característica
de toda una población. Los parámetros suelen representarse por medio de letras griegas.
ESTADÍSTICO. Es una medida de resumen que se calcula para describir una característica
de una sola muestra de la población.
1
El uso de métodos estadísticos inferenciales se deriva de la necesidad del muestreo. A
medida que una población crece, por lo general resulta demasiado costoso, tardado e
incómodo obtener la información deseada de toda la población. Por lo tanto, la determina-
ción de las características de la población tiene que basarse en la información contenida
en una muestra de esa población. La teoría de probabilidad proporciona el enlace al ave-
riguar la probabilidad que los resultados de la muestra reflejen los resultados de la pobla-
ción.
Para elaborar la metodología formal del proceso de inferencia se debe partir de un modelo
del fenómeno que se estudia. Un modelo se puede imaginar como una explicación teórica
y en general muy simplificada de un sistema complejo. Existen dos clases de modelos:
MODELOS DETERMINISTAS. Son los modelos más usados en la física e ingeniería. Tienen
la característica de que se pueden predecir los resultados específicos de los experimentos
que se llevan a cabo con ellos. Tales modelos toman en general la forma de una ecuación
matemática.
MODELOS PROBABILÍSTICOS. Son los modelos que surgen en las investigaciones estadísti-
cas. Se caracterizan por el hecho de que aunque no se pueden predecir con exactitud los
resultados específicos de un experimento, sí se pueden predecir frecuencias relativas de
diversos resultados posibles.
Los modelos deterministas no dan lugar a inferencia estadística; los modelos probabilísti-
cos son los cimientos sobre los que se apoya toda teoría de adopción de inferencias.
No hay una regla general que indique cuál modelo es el más adecuado, ya que sin duda
esto depende del uso al que se destine el modelo. Sin embargo, se puede decir que la
actitud adecuada será usar un modelo probabilístico siempre que haya algo más que va-
riación insignificante entre los resultados de un experimento.
DATOS. Son la información numérica necesaria para poder tomar una decisión con más
bases en una situación particular. Para que un análisis estadístico sea útil en el proceso
de toma de decisiones, los datos de entrada deben ser apropiados.
Existen muchos métodos mediante los cuales se pueden obtener los datos necesarios. En
primer lugar, se pueden buscar datos ya publicados por fuentes gubernamentales, indus-
triales o individuales. En segundo lugar, se puede diseñar un experimento para obtener
los datos necesarios; en un experimento se ejerce un control estricto sobre el tratamiento
dado a los participantes. En tercer lugar, se puede aplicar una encuesta; aquí no se ejerce
ningún control sobre el comportamiento de la gente encuestada, simplemente se formulan
preguntas respecto a sus opiniones, actitudes, comportamiento y otras características, y
después sus respuestas se editan, codifican y tabulan para su análisis. En cuarto lugar, se
2
pueden hacer observaciones del comportamiento, actitudes u opiniones de los individuos
en los que se está interesado.
Los fenómenos o características en estudio se llaman variables aleatorias. Los datos que
son los resultados observados de estas variables aleatorias, pueden diferir de respuesta a
respuesta. Existen básicamente dos tipos de variables aleatorias que producen dos tipos
de datos: categóricas y numéricas. En el caso de las variables aleatorias numéricas, los
datos obtenidos pueden considerarse como discretos o continuos:
Sin importar si se trata con una muestra o con una población, como regla general cuando
una serie de datos que se han reunido contiene más de 20 observaciones, la mejor forma
de examinar tales datos masivos es presentarlos en forma de resumen construyendo ta-
blas y diagramas apropiados. Entonces se pueden extraer las características importantes
de los datos de estas tablas y diagramas.
Cuando se recolecta una serie de datos, generalmente se hace en forma sin procesar, es
decir, las observaciones numéricas no están dispuestas en ningún orden o secuencia par-
ticular. Al crecer el número de observaciones, se hace más difícil centrarse en las princi-
pales características de un conjunto de datos y se necesitan métodos que ayuden a orga-
nizar las observaciones de tal manera que se entienda mejor la información que transmite
la serie de datos. Uno de los métodos más comúnmente usados es la clasificación orde-
nada.
CLASIFICACIÓN ORDENADA. Consiste en disponer los datos sin procesar en orden crecien-
te de magnitud, lo cual facilita la evaluación de sus principales características, seleccionar
los extremos, los valores típicos y las concentraciones de valores, aunque este método se
vuelve muy pesado mientras mayor sea el número de observaciones presentes en una
serie de datos.
Así, tal vez el investigador puede desear acomodar los datos en agrupamientos de clase
de acuerdo con divisiones establecidas convenientemente del alcance de las observacio-
nes. Tal acomodo de los datos en forma tabular se conoce como una distribución de fre-
cuencia, y los datos, ya ordenados y resumidos, se llaman datos agrupados.
3
DISTRIBUCIÓN DE FRECUENCIA. Es una tabla de resumen en la que los datos se disponen
en agrupamientos o categorías convenientemente establecidas de clases apropiadas,
mostrando también el número de elementos en cada clase.
La tabla sacrifica parte de la información contenida en los datos pero, por otra parte,
cuando las observaciones se agrupan o condensan en tablas de distribución de frecuen-
cia, el proceso de análisis e interpretación de los datos se hace mucho más manejable y
significativo.
Si los datos se agrupan según su magnitud numérica, la tabla resultante recibe el nombre
de distribución numérica o cuantitativa. En contraste, si los datos se agrupan en catego-
rías que difieren en tipo y no en grado, la tabla resultante se denomina distribución cate-
górica o cualitativa.
Establecer los límites de cada agrupamiento de clase para evitar los traslapes. Es de-
cir, siempre debe asegurarse de que cada medición u observación quede sólo en una
clase, que ninguno de los valores llegue a quedar en interespacios entre clases suce-
sivas y que las clases sucesivas no se encimen y contengan algunos valores en co-
mún. Siempre que sea posible, los límites deben elegirse para que faciliten la lectura e
interpretación de los datos.
FRONTERAS DE CLASE O LÍMITES REALES DE CLASE. Son los puntos medios situados entre
los límites de clase respectivos. Desde luego, estos valores deben ser, por su naturaleza,
valores “imposibles” que no pueden ocurrir entre los datos que se están agrupando. Para
asegurar esto solamente se tiene que observar hasta dónde se redondean los datos para
que las fronteras de clase tengan un decimal más. Las fronteras de clase se utilizan para
evitar ambigüedades. En la práctica se emplean las fronteras de clase y no los límites de
clase originales, principalmente cuando se quiere recalcar que se están manejando medi-
ciones de tipo continuo. Los límites reales de clase se obtienen fácilmente sumando al
límite superior de un intervalo de clase el límite inferior del intervalo de clase contiguo su-
perior y dividiendo por 2. Así, los límites reales de la i-ésima clase están dados por
4
Ls i 1 Li i Ls i Li i 1
Lri i = y Lrs i = (1.1)
2 2
MARCA DE CLASE. Es el punto medio entre los límites de cada clase y es representativo
de los datos de esa clase. Se obtiene sumando los límites inferior y superior de una clase
(o sus fronteras superior e inferior) y dividiendo por 2. La marca de clase de la i-ésima
clase se representa por xi. Así,
Li Ls Lrs Lri
xi = o xi = (1.2)
2 2
Para construir una distribución de frecuencia es recomendable seguir las siguientes re-
glas:
1. Determinar el mayor y el menor entre los datos registrados y encontrar el rango, me-
diante la fórmula
R = Vmayor − Vmenor
rango
Tamaño del intervalo (c) =
número de clases
4. Establecer los límites y las fronteras de cada clase para evitar superposición.
5
Para ampliar el análisis de los datos, casi siempre es deseable formar la distribución de
frecuencia relativa (fr) o la distribución del porcentaje, dependiendo de si se prefieren
proporciones o porcentajes. La distribución de frecuencia relativa se forma dividiendo las
frecuencias de cada clase entre el número total de observaciones. De aquí puede formar-
se una distribución porcentual multiplicando cada frecuencia relativa o proporción por
100. La suma de las frecuencias relativas de todas las clases es obviamente 1 ó 100%.
fi fi
fri = × 100 = × 100 (1.3)
f n
FRECUENCIA ACUMULADA. Es la frecuencia total de todos los valores menores que el límite
real superior de clase de un intervalo de clase dado.
La siguiente tabla proporciona el porcentaje de algodón de una tela que se usa para fabri-
car camisas de hombre. Construir una distribución de frecuencias utilizando intervalos de
clase adecuados.
6
rango 5.8
Tamaño del intervalo = = = 0.96
número de clases 6
Como se dijo antes, por conveniencia y facilidad de lectura, el ancho de cada agrupamien-
to de clase se redondea hacia arriba. Por lo tanto,
c = 1.0
7
POLÍGONO DE FRECUENCIA. Es un gráfico de línea trazado sobre las marcas de clase y
puede obtenerse uniendo los puntos medios de los techos de los rectángulos en el histo-
grama, esto es, se grafican los puntos ( x i , f i ) donde x i es la marca de clase de la i-
ésima clase y f i es la frecuencia correspondiente, y los puntos sucesivos se unen por
medio de líneas rectas. Puesto que el área bajo la distribución de porcentaje (curva ente-
ra) debe ser 100%, es necesario conectar el primero y el último punto con el eje horizontal
para rodear el área de la distribución observada. Esto se hace conectado el primer punto
medio observado con el punto medio de una clase “precedente ficticia” con frecuencia
cero y conectando el último punto medio observado con el punto medio de una clase “su-
cesora ficticia” también con frecuencia cero. Es decir, el polígono se abre en Lri I − c / 2 y
se cierra en Lrsu + c / 2.
40
N° de estudiantes
30
20
10
0
58 61 64 67 70 73 76
estatura (pulgadas)
POLÍGONO DE FRECUENCIA ACUMULADA U OJIVA. Sirve para presentar gráficamente las dis-
tribuciones acumuladas. Son similares a los polígonos de frecuencia, excepto en que se
grafican las frecuencias acumuladas sobre las fronteras de clase en lugar de graficar las
frecuencias ordinarias sobre las marcas de clase. Los puntos así determinados se unen
otra vez mediante segmentos rectilíneos. Los diagramas de frecuencia acumulada son un
modo adecuado de descubrir corrimientos en las distribuciones de datos. A medida que
los tamaños de muestra se hacen más y más grandes, las gráficas de frecuencia acumu-
lada se pueden acercar más y más a curvas continuas.
8
b) La distribución de frecuencia relativa es:
30
25
20
frecuencia
15
10
0
31.45 32.45 33.45 34.45 35.45 36.45 37.45 38.45
porcentaje de algodón
Frecuencia
Intervalo acumulada
(fa)
menor que 31.95 0
menor que 32.95 9
menor que 33.95 21
menor que 34.95 46
menor que 35.95 63
menor que 36.95 72
menor que 37.95 80
y la ojiva es
9
90
80
70
frecuencia acumulada
60
50
40
30
20
10
0
31.95 32.95 33.95 34.95 35.95 36.95 37.95
porcentaje de algodón
EJERCICIOS 1.1
1. Los pesos de ciertas muestras minerales, dados a la décima de onza más cercana,
están agrupados en una tabla que tiene las clases 10.5 – 11.4, 11.5 – 12.4, 12.5 –
13.4 y 13.5 – 14.4. Calcúlese:
a) Las marcas de clase
b) El tamaño del intervalo de clase
4. Los diámetros interiores de las arandelas producidas por una compañía pueden me-
dirse con aproximación de milésimas de pulgada. Si las marcas de clase de una distri-
bución de frecuencias de estos diámetros vienen dadas en pulgadas por los números
0.321, 0.324, 0.327, 0.330, 0.333 y 0.336, hallar:
a) El tamaño del intervalo de clase
b) Los límites de clase
En los ejercicios 5 – 10, agrupar los datos dados en una tabla con un número apropiado
de clases iguales y construir: (a) una distribución de frecuencia, (b) un histograma y un
polígono de frecuencia.
10
5. Mediciones de la resistencia a la ruptura (en onzas) de una muestra de 60 hilos de
cáñamo.
32.5 15.2 35.4 21.3 28.4 26.9 34.6 29.3 24.5 31.0
21.2 28.3 27.1 25.0 32.7 29.5 30.2 23.9 23.0 26.4
27.3 33.7 29.4 21.9 29.3 17.3 29.0 36.8 29.2 23.5
20.6 29.5 21.8 37.5 33.5 29.6 26.8 28.7 34.8 18.6
25.4 34.1 27.5 29.6 22.2 22.7 31.3 33.2 37.0 28.3
36.9 24.6 28.9 24.8 28.1 25.4 34.5 23.6 38.4 24.0
15.8 26.4 17.3 11.2 23.9 24.8 18.7 13.9 9.0 13.2
22.7 9.8 6.2 14.7 17.5 26.1 12.8 28.6 17.6 23.7
26.8 22.7 18.0 20.5 11.0 20.9 15.5 19.4 16.7 10.7
19.1 15.2 22.9 26.6 20.4 21.4 19.2 21.6 16.9 19.0
18.5 23.0 24.6 20.1 16.2 18.0 7.7 13.5 23.5 14.5
14.4 29.6 19.4 17.0 20.8 24.3 22.5 24.6 18.4 18.1
8.3 21.9 12.3 22.3 13.3 11.8 19.3 20.0 25.7 31.8
25.9 10.5 15.9 27.5 18.1 17.9 9.4 24.1 20.1 28.5
66.4 67.7 68.0 68.0 68.3 68.4 68.6 68.8 68.9 69.0
69.1 69.2 69.3 69.3 69.5 69.5 69.6 69.7 69.8 69.8
69.9 70.0 70.0 70.1 70.2 70.3 70.3 70.4 70.5 70.6
70.6 70.8 70.9 71.0 71.1 71.2 71.3 71.3 71.5 71.6
71.6 71.7 71.8 71.8 71.9 72.1 72.2 72.3 72.3 72.6
72.7 72.9 73.1 73.3 73.5 74.2 74.5 75.3
65 36 49 84 79 56 28 43 67 36
43 78 37 40 68 72 55 62 22 82
88 50 60 56 57 46 39 57 73 65
59 48 76 74 70 51 40 75 56 45
35 62 52 63 32 80 64 53 74 34
76 60 48 55 51 54 45 44 35 51
21 35 61 45 33 61 77 60 85 68
45 53 34 67 42 69 52 68 52 47
62 65 55 61 73 50 53 59 41 54
41 74 82 58 26 35 47 50 38 70
11
9. Resistencia al estallamiento, en libras por pulgada cuadrada (lpc), de 100 botellas de
vidrio con capacidad para un litro.
265 197 346 280 265 200 221 265 261 278
205 286 317 242 254 235 176 262 248 250
263 274 242 260 281 246 248 271 260 265
307 243 258 321 294 328 263 245 274 270
220 231 276 228 223 296 231 301 337 298
268 267 300 250 260 276 334 280 250 257
260 281 208 299 308 264 280 274 278 210
234 265 187 258 235 269 265 253 254 280
299 214 264 267 283 235 272 287 274 269
215 318 271 293 277 290 283 258 275 251
78.2 76.1 79.2 82.4 90.4 79.1 77.2 78.3 81.6 90.2
83.5 81.8 75.9 80.6 81.2 84.4 82.9 74.8 85.9 83.4
88.4 74.2 76.2 84.6 72.7 87.5 73.1 77.3 83.8 74.7
86.2 83.4 82.4 83.1 81.1 85.3 82.3 81.3 82.1 80.6
78.9 70.5 81.8 82.5 83.4 79.0 71.6 82.9 84.6 84.7
81.4 88.1 80.1 87.7 87.5 80.3 89.2 81.3 89.7 85.3
70.1 85.3 70.2 84.1 84.9 71.2 84.4 71.4 83.5 86.9
82.4 85.7 80.7 81.1 79.0 83.3 86.6 82.8 80.3 89.0
Las tres mejores propiedades que describen una serie numérica de datos son su posición,
su variación y su forma.
Aunque existen diversos tipos de “promedios” que se utilizan algunas veces para fines
especiales, en este libro nos limitaremos al estudio de los tres tipos de promedios que
describen de alguna manera el centro o mitad de un conjunto de datos, es decir las medi-
das de tendencia central. Las medidas de tendencia central que se usan más a menudo
son la media aritmética, la mediana y la moda.
12
MEDIA ARITMÉTICA. Es el promedio o medición de tendencia central de uso más común.
En el lenguaje ordinario este valor se conoce a menudo como “promedio”, pero como en
estadística existen otros “promedios”, no es correcto llamarla así, pues se corre el peligro
de ser ambiguos. La media aritmética de una muestra de n elementos se denota por x ,
mientras que la media aritmética de una población de N elementos se denota con la letra
griega μ (mu).
La media aritmética de una muestra se calcula sumando todas las observaciones de una
serie de datos y luego dividiendo el total entre el número de elementos involucrados. Por
lo tanto, para una muestra que contiene una serie de n observaciones x1, x2, ..., xn, la me-
dia aritmética x puede escribirse como
x1 x 2 x n
xi
i 1
x = = (1.4)
n n
Los siguientes datos representan el número de interrupciones por día de trabajo debidas a
fallas mecánicas en una planta procesadora de alimentos. Calcular la media aritmética.
2, 3, 0, 4, 5, 3, 1, 3, 5, 2
La media aritmética es
10
xi
i 1 2 3 2
x = = = 2.8 ≈ 3
10 10
Esto quiere decir que habrá un promedio de 3 interrupciones diarias (o que el número de
interrupciones diarias está alrededor de 3). ∎
13
res en la escritura de los datos o en las operaciones, desperfectos del equipo de me-
dición, etc.
Un conjunto de datos numéricos tiene una y sólo una media, de modo que siempre es
única.
Dado que cualquier valor extremo en un conjunto de datos distorsiona en gran medida la
media aritmética y en algunos casos se puede identificar su origen, estos valores pueden
simplemente eliminarse de los datos antes de promediarlos. Pero si no es posible hacer
esto, lo mejor es utilizar otra medida de posición llamada mediana para referirse al “cen-
tro” de los datos, la cual, a diferencia de la media, no es afectada fácilmente por los valo-
res extremos.
MEDIANA. Es el valor del elemento del centro de un conjunto de datos que están dispues-
tos en orden de magnitud creciente o decreciente. La mediana se representa por ~
x.
La mediana es un valor figurativo (central o promedio) en el sentido de que divide los da-
tos en dos partes, de modo que los valores de una mitad de los elementos son menores o
iguales que ella y los valores de la otra mitad son mayores o iguales que la mediana. Al
igual que la media, la mediana siempre existe y es única en relación con cualquier conjun-
to de datos. También se puede utilizar para definir el término medio de un número de ob-
jetos, propiedades, o cualidades que no son realmente cuantitativas por naturaleza.
n 1
(1.5)
2
para encontrar el lugar del arreglo ordenado que corresponde al valor de la mediana. Se
sigue una de dos reglas:
14
está representada por la observación correspondiente al promedio de los valores nu-
méricos de estas dos observaciones medias, o sea los valores de las observaciones
n n2
que aparecen en los lugares y .
2 2
Sucursal A B C D E
N° de lavadoras vendidas 5 3 6 5 1
Para obtener la venta mediana de lavadoras en esa semana para las cinco sucursales, los
datos en bruto se funden en un arreglo ordenado, como sigue:
1 3 5 5 6
mediana
Como el número de datos es impar, el valor mediano es el punto medio en el arreglo or-
denado, es decir está representado por la
n 1 51
= = 3ª observación ordenada
2 2
Este valor significa que la mitad de las sucursales vendieron cuando mucho cinco lavado-
ras y la otra mitad vendieron por lo menos 5 lavadoras. ■
Número de interrupciones: 2, 3, 0, 4, 5, 3, 1, 3, 5, 2
15
Nuevamente, para obtener el número mediano de interrupciones por día de trabajo, los
datos en bruto se ordenan de acuerdo con su magnitud creciente:
0 1 2 2 3 3 3 4 5 5
mediana
Como el número de datos es par, el valor mediano es el punto medio de las observacio-
n n2
nes y :
2 2
n 10 n2 10 2
= =5 = =6
2 2 2 2
Esto es, la mediana es el punto medio de las observaciones quinta y sexta. Por lo tanto se
estima que la mediana es
~ 33
x = = 3 interrupciones por día
2
Esto significa que la mitad de los días hubo cuando mucho tres interrupciones y la otra
mitad hubo por lo menos 3 interrupciones. ∎
Sin embargo, aunque la media y la mediana proporcionan un número simple que repre-
senta un conjunto completo de datos, en los problemas de estimación y de inferencia es-
tadística se utiliza la media aritmética como medida de tendencia central, debido a que la
mediana no emplea toda la información contenida en las observaciones, además de que
generalmente está sujeta a mayores fluctuaciones, esto es, está propensa a variar más de
muestra en muestra.
MODA. Es el valor de una serie de datos que aparece con la más alta frecuencia mayor
que 1. Sus dos ventajas principales son que no requiere operaciones de cálculo, sólo con-
tar, y que se puede determinar en relación con datos cualitativos y también cuantitativos.
Además, a diferencia de la media aritmética, la moda no se ve afectada por la ocurrencia
de cualesquiera valores extremos. La moda se representa por x̂ .
La moda se usa solamente para propósitos descriptivos porque es más variable de mues-
tra a muestra que otras mediciones de tendencia central. Pero además del hecho de que
la moda es una medida de posición en extremo insuficiente en la inferencia estadística,
también tiene la desventaja de que, en algunos conjuntos de datos, es posible que no
exista y, en otros, tal vez no sea única. Un conjunto que tiene una sola moda se llama
16
unimodal, y cuando hay dos o más modas en un conjunto de datos, éstos son llamados
bimodales o multimodales, respectivamente. El hecho de que un conjunto de datos tenga
más de una moda es a veces indicativo de una falta de homogeneidad en los datos.
La moda para datos no agrupados de unos pocos valores puede ser obtenida por inspec-
ción.
Una medida de tendencia central sola no proporciona generalmente una descripción satis-
factoria de un conjunto de datos. Quienes están interesados en los datos desean con fre-
cuencia tener también una medida de la manera en que los valores individuales se des-
vían del “promedio”. Las medidas estadísticas que proporcionan la información acerca del
grado en que los datos se dispersan o se diseminan se les conoce como medidas de va-
riación o de dispersión.
Se dice que la variación de un conjunto de datos es pequeña si los valores están acota-
dos muy cerca alrededor de su media, y es grande si los valores están dispersos con am-
plitud alrededor de su media. Por lo tanto, parecería razonable medir la variación de un
conjunto de datos en términos de las cantidades por las que se desvían de su promedio.
Las medidas de variación más utilizadas son el rango, la desviación media, la varianza y
la desviación estándar.
RANGO. Es la medida de dispersión más simple, pero también aporta información sobre la
cantidad de variabilidad presente en un conjunto de datos. Se define como la diferencia
entre la mayor y la menor observación en una serie de datos, y mide la propagación total
en ésta. Sin embargo, su clara debilidad es que no logra tomar en cuenta la forma en que
los datos se distribuyen realmente entre el menor y el mayor valor. Por lo tanto, es impro-
pio usar el rango como una medición de variación cuando uno o ambos componentes son
observaciones extremas, ya que una sola observación grande o pequeña puede inflar
mucho su valor.
Cuando se manejan datos no agrupados, su rango se puede determinar con facilidad a
partir de un arreglo ordenado. Para una muestra de tamaño n, el rango es la diferencia
entre las observaciones más grande y más pequeña, es decir
R = x n − x1
17
Con datos agrupados en una distribución de frecuencia, se puede tener una aproximación
al rango como la diferencia entre el límite superior de la última clase y el límite inferior de
la primera clase.
6
xi
i 1 0.6 1.2 0.9 1.0 0.6 0.8
x = = = 0.85
6 6
xi xi x xi x
0.6 − 0.25 0.25
1.2 0.35 0.35
0.9 0.05 0.05
1.0 0.15 0.15
0.6 − 0.25 0.25
0.8 − 0.05 0.05
1.10
n
xi x
i 1 1.10
Por tanto, d.m = = = 0.18
n 6
18
Este resultado quiere decir que las observaciones tienen, en promedio, una variación de
0.18 minutos con respecto al tiempo de preparación promedio de 0.85 minutos. ∎
Dos mediciones de variación comúnmente usadas que sí toman en cuenta cómo se distri-
buyen todos los valores en los datos son la varianza y su raíz cuadrada, la desviación
estándar. Estas mediciones evalúan la forma en que los valores fluctúan alrededor de la
media.
Si un conjunto de datos x1, x2, ..., xn tiene media x , entonces las diferencias x 1 − x ,
x 2 − x , ..., x i − x se llaman desviaciones de la media. Esto sugiere que se debería usar
el promedio de estas desviaciones como medida de la variación en el conjunto de datos;
sin embargo, la suma de todas las desviaciones con respecto a la media siempre es cero,
esto es, i 1 x i x = 0, de modo que el promedio de las desviaciones siempre es
n
cero:
i 1 ( x i x ) = ( x 1 −
n
x ) + ( x 2 − x ) + ... + ( x n − x )
= x 1 + x 2 + ... + x n − n x
x1 x 2 x n
= x 1 + x 2 + ... + x n − n
n
= x 1 + x 2 + ... + x n − ( x 1 + x 2 + ... + x n ) = 0
Por lo tanto, una forma alternativa es trabajar con los cuadrados de las desviaciones con
respecto al promedio.
(x1 x) 2 (x 2 x) 2 (x n x) 2
(x i x) 2
i 1
s2 = = (1.7)
n 1 n 1
19
rencia. Si el tamaño de muestra es grande, la división entre n o n − 1 realmente no hace
mucha diferencia.
Sin embargo, la fórmula de la ecuación anterior no es práctica, pues para situaciones rea-
listas es improbable que las observaciones y la media sean enteros. Por lo tanto se pre-
senta la siguiente fórmula computacional de la varianza, para uso práctico:
n
x i2 n x 2
i 1
s2 = (1.8)
n 1
n
donde: x i2 = sumatoria de los cuadrados de las observaciones individuales
i 1
Pero s 2 da como resultado unidades al cuadrado, y éstas no tienen sentido. Por lo tanto,
la varianza en realidad no es más que un artificio matemático para poder medir la desvia-
ción estándar y para que no se pierdan las diferencias.
n
(x i x) 2
i 1
s= (1.9)
n 1
Al igual que en la varianza, también existe una fórmula computacional para calcular la
desviación estándar:
n
x i2 n x 2
i 1
s= (1.10)
n 1
Nótese que puesto que en las ecuaciones dadas para s 2 y para s se elevaron al cuadra-
do las diferencias, ni la varianza ni la desviación estándar pueden ser negativas. Además,
la única vez en que s 2 y s podrían ser ceros sería cuando no haya variación alguna en
los datos, es decir cuando cada observación de la muestra fuera exactamente igual. Pero
este es un caso inusual, ya que los datos numéricos son inherentemente variables, no
constantes. Cualquier fenómeno de interés aleatorio que se pueda imaginar generalmente
20
toma una variedad de valores. Debido a que los datos numéricos varían de manera inhe-
rente resulta tan importante estudiar no sólo las mediciones de tendencia central que re-
sumen los datos, sino también las mediciones de variación que reflejan cómo están dis-
persos los datos numéricos, ya que tanto la varianza como la desviación estándar miden
la dispersión “promedio” en torno a la media; es decir, cómo fluctúan las observaciones
mayores por encima de ella y cómo se distribuyen las observaciones menores por debajo
de ella.
n
(x i x) 2
i 1 0.2750
Por tanto, s= = = 0.23
n 1 5
n
x i2 n x 2
i 1 4.61 (6) (0.85) 2 0.2750
O bien s= = = = 0.23
n 1 5 5
Este resultado significa que existe una variación promedio de 0.23 minutos en torno a la
media; esto es, el tiempo de preparación fluctúa en 0.23 minutos por encima y por debajo
de la media de 0.85 minutos. ∎
21
La desviación estándar y la varianza son medidas de variación absoluta, esto es, miden la
cantidad real de variación presente en un conjunto de datos y dependen de la escala de
medición. Para comparar la variación en diferentes conjuntos de datos es preferible valer-
se de una medida de variación relativa. Una medida de este efecto se define como
variación absoluta
variación relativa =
promedio
s
CV = × 100% (1.11)
x
Las mediciones realizadas con un micrómetro del diámetro de un cojinete de bolas tiene
una media de 3.92 mm y una desviación estándar de 0.015 mm; en cambio, las medicio-
nes realizadas con otro micrómetro de la longitud original de un resorte tienen una media
de 1.54 cm y una desviación estándar de 0.008 cm. ¿Cuál de los dos instrumentos es
relativamente más preciso?
s 0.015
CV = × 100 = × 100 = 0.38%
x 3.92
s 0.008
CV = × 100 = × 100 = 0.52%
x 1.54
Por tanto, las mediciones realizadas con el primer micrómetro son relativamente más pre-
cisas. ∎
22
Ejemplo 1.9. Coeficiente de variación
s 8.0
CV = × 100 = × 100 = 10.26%
x 78
s 7.6
CV = × 100 = × 100 = 10.41%
x 73
Por tanto, en el examen de álgebra hubo mayor dispersión relativa mientras que en el
examen de estadística hubo mayor dispersión absoluta. ∎
EJERCICIOS 1.2
1. Diez medidas del diámetro de un cilindro fueron registradas como 3.88, 4.09, 3.92,
4.02, 3.95, 4.03, 3.92, 3.98, 3.90 y 4.06 pulgadas. Calcular la media aritmética de es-
tas medidas.
5. Los salarios horarios de cinco empleados de una oficina son $2.52, $3.96, $3.28, $9.20
y $3.75. Calcular la media aritmética y la desviación estándar del salario horario.
6. Cuatro grupos de estudiantes, formados por 15, 20, 10 y 18 individuos registran una
media de pesos de 162, 148, 153 y 140 libras. Hallar el peso medio de todos los estu-
diantes.
7. Las calificaciones de un estudiante en cinco asignaturas fueron 85, 76, 93, 82 y 96.
Calcular la media aritmética y la desviación media de dichas calificaciones.
23
8. Una serie de números está formada por seis 6, siete 7, ocho 8, nueve 9 y diez 10.
¿Cuál es su media aritmética, su mediana y su moda?
9. Los siguientes datos son el número de torsiones requerido para 12 barras de cierta
aleación: 33, 24, 39, 48, 26, 35, 38, 54, 23, 34, 29 y 37. Calcular la media aritmética y la
desviación estándar.
10. Si el salario medio anual pagado a los ejecutivos de tres empresas de ingeniería es de
$125 000, ¿puede alguno de ellos ganar $400 000?
11. Por un error un profesor borró la calificación que obtuvo uno de sus diez alumnos. Si
los otros nueve consiguieron las calificaciones de 43, 66, 74, 90, 40, 52, 70, 78 y 92 y si
la media de los diez estudiantes es de 67, ¿qué calificación borró el profesor?
12. Los siguientes datos son el número de minutos que en 15 días laborales una persona
tiene que esperar el autobús que la llevará a su trabajo: 10, 1, 13, 9, 5, 9, 2, 10, 3, 8, 6,
17, 2, 10 y 15. Calcular la media aritmética y la desviación estándar.
13. Los siguientes datos provienen de la producción diaria de un pozo petrolero (en barri-
les): 214, 203, 226, 198, 243, 225, 207, 203, 208, 200, 217, 202, 208, 212, 205 y 220.
Calcular la media aritmética de la producción diaria de un pozo de petróleo.
14. Los siguientes datos provienen de las lecturas del flujo máximo anual de un río en
m3/s: 405, 335, 419, 267, 370, 391, 612, 383, 434, 462, 288, 317, 540, 295 y 508. Cal-
cular la desviación estándar del flujo máximo anual del río.
15. Calcular la media aritmética y la desviación estándar de las siguientes millas por galón
obtenidas en 20 recorridos, en un perímetro citadino con un automóvil de tamaño in-
termedio.
16. Los siguientes datos son 12 lecturas de temperatura en varios puntos de un gran
horno (en grados Fahrenheit): 415, 475, 500, 460, 425, 460, 410, 470, 475, 460, 510 y
450. Calcular la media aritmética y la desviación estándar.
17. El salario promedio anual pagado a ejecutivos de alto nivel en tres compañías es de
$84 000, $92 000 y $89 000. Si el número respectivo de ejecutivos de alto nivel es de 4,
15 y 11, calcúlese el salario promedio anual que perciben estos 30 ejecutivos.
18. En una clase de ingeniería nuclear hay 22 estudiantes de penúltimo año, 18 de último
año y 10 graduados. Si los estudiantes de penúltimo año promediaron 71 en un examen
parcial, los de último año promediaron 78 y los graduados 89, ¿cuál es la media para la
clase completa?
19. El salario medio anual pagado a todos los empleados de una compañía fue de $5000.
Los salarios medios anuales pagados a hombres y mujeres de la compañía fueron
24
$5200 y $4200, respectivamente. Determinar el porcentaje de hombres y mujeres em-
pleados en la compañía.
20. En tres años recientes, el precio del cobre fue de 69.6, 66.8 y de 66.3 centavos por
libra, y el precio del carbón bituminoso fue de 19.43, 19.82 y de 22.40 dólares por tone-
lada corta. ¿Cuál de estos dos conjuntos de precios es relativamente más variable?
Una buena razón para agrupar datos y construir distribuciones de frecuencia de la manera
como se explicó anteriormente en este capítulo consiste en que se puede facilitar enor-
memente el cálculo de las diferentes medidas descriptivas.
MEDIA ARITMÉTICA. Cuando los datos se presentan mediante una distribución de frecuen-
cia, todos los valores caen dentro de unos intervalos de clase dados que se consideran
coincidentes con las marcas de clase. Por lo tanto, la media aritmética para datos agrupa-
dos se puede calcular como
k k
f 1 x1 f 2 x 2 f n x n
f i xi f i xi
i 1 i 1
x = = = (1.12)
f1 f 2 f n k
n
fi
i 1
Sin embargo, pueden hacer falta muchas operaciones aritméticas para determinar la me-
dia de una distribución de frecuencia. Este trabajo se puede simplificar al codificar las
marcas de clase de manera que se tengan números menores para trabajar. Siempre y
cuando la distribución tenga intervalos de clase de igual tamaño c, el cálculo de x se faci-
lita si primero se selecciona una de las marcas de clase (de preferencia la clase del centro
de la distribución o cerca de él) como el origen x0 arbitrario y se le asigna un valor codifi-
cado de cero y luego se sustituyen todas las demás marcas de clase x i con una sucesión
de valores ui enteros consecutivos en torno al origen arbitrario. Así, la fórmula de la media
de una distribución de datos de muestra se convierte en
k
f i ui
i 1
x = x0 + ×c (1.13)
n
25
donde x 0 = marca de clase de la escala original a la que se le asigna el valor de cero
en la nueva escala
c = tamaño del intervalo de clase
u i = entero asignado a la i-ésima marca de clase
f i = número de observaciones de la i-ésima clase
n = número de observaciones en la muestra
k = número de clases en la distribución de frecuencia
Con los datos del ejemplo 1.1 y usando las fórmulas para datos agrupados, calcular la
media aritmética de los porcentajes de algodón.
x =
fx =
2 785
= 34.8 porciento de algodón
n 80
Intervalo f xi ui f i ui f i u i2
32.0 – 32.9 9 32.45 −2 − 18 36
33.0 – 33.9 12 33.45 −1 − 12 12
34.0 – 34.9 25 34.45 → x0 0 0 0
35.0 – 35.9 17 35.45 1 17 17
36.0 – 36.9 9 36.45 2 18 36
37.0 – 37.9 8 37.45 3 24 72
Total 80 29 173
De donde tenemos
26
x = x0 +
fu × c = 34.45 +
29
× 1 = 34.45 + 0.3625 = 34.8 porciento de algodón
n 80
Esto quiere decir que, en promedio, las camisas tienen alrededor de 34.8 porciento de
algodón. ∎
n
2 f 1
~
x = L1 + ×c (1.14)
f med
N° de em- Frecuencia
Salarios
pleados acumulada
$5000 — $7000 1 1
8000 — 10000 4 5
11000 — 13000 9 14 Clase mediana
14000 — 16000 6 20
17000 — 19000 2 22
20000 — 22000 3 25
Total 25
n 1 25 1
En la tabla anterior se ve que la observación ordenada = = 13 es una de
2 2
las nueve observaciones contenidas en el tercer intervalo de clase, es decir la observa-
27
ción número 13 está en este intervalo, razón por la cual éste es el intervalo de clase me-
diana. Además, de la misma tabla se pueden obtener los siguientes datos:
10000 11000
L1 = = $10 500
2
n = 25
f 1 = 5
f med = 9
c = $3 000
La mediana es entonces
n 25
2 f 1 5
~
x = L1 + × c = 10 500 + 2 × 3 000 = $13 000
f med 9
mediana
10
n° de empleados
8
6
4
2
0
00 00 00 00 00 00 00 00
30 60 90 12 0 15 0 18 0 21 0 24 0
salarios
Este valor quiere decir que, al estar ordenados los salarios en orden creciente de magni-
tud, habrá exactamente doce salarios menores o iguales a la mediana y doce salarios
mayores o iguales a ella; en otras palabras, quiere decir que la mitad de los obreros gana
cuando mucho $13 000 y la otra mitad gana al menos $13 000. ■
1
x̂ = L 1 + ×c (1.15)
1 2
28
donde: L 1 = límite real inferior de la clase modal (la clase con mayor frecuencia)
1 = exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior
2 = exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior
c = tamaño del intervalo de clase
DESVIACIÓN MEDIA. El procedimiento para calcular la desviación media para datos agru-
pados se basa en la fórmula
k
fi x i x
i 1
d.m = (1.16)
n
Frecuencia Marca de
Duración
(miles de Km.)
(N° de llantas) clase fx f xx
(f) (x)
37.2 – 40.7 7 38.95 272.65 38.808
40.8 – 44.3 17 42.55 723.35 33.048
44.4 – 47.9 18 46.15 830.70 29.808
48.0 – 51.5 8 49.75 398.00 42.048
Total 50 2224.70 143.712
x =
fx
=
2224.7
= 44.494 miles de kilómetros
n 50
d. m = f xx
=
143.712
= 2.874 miles de kilómetros
n 50
Este resultado quiere decir que las observaciones tienen, en promedio, una variación de
2.874 miles de kilómetros con respecto a la duración promedio de 44.494 miles de kilóme-
tros. ∎
29
VARIANZA. Para calcular la varianza con datos agrupados, se puede desarrollar una fór-
mula definicional análoga a la fórmula para datos no agrupados. Dado que la varianza
“como que” mide el promedio de las diferencias al cuadrado entre cada observación y la
media, y puesto que los puntos medios de cada clase de una distribución de frecuencia se
utilizan para representar las observaciones en las clases, se puede tener una aproxima-
ción de la varianza de una distribución de frecuencia mediante la fórmula
k
f i (x i x) 2
i 1
s2 = (1.17)
n 1
Sin embargo, en este caso el cálculo también puede ser laborioso y pesado. Por ello, se
puede utilizar una fórmula más práctica para distribuciones que tienen intervalos de clase
del mismo tamaño:
2
k k
n f i u i2 f i ui
i 1
s 2
=
i 1 × c2 (1.18)
n (n 1)
k
f i (x i x) 2
i 1
s= (1.19)
n 1
pero también se cuenta con una fórmula más práctica de cálculo codificado para distribu-
ciones que tienen intervalos de clase del mismo tamaño:
30
2
k k
n f i u i2 f i ui
i 1
s=
i 1 ×c (1.20)
n (n 1)
Con los datos del ejemplo 1.1 y usando las fórmulas para datos agrupados, calcular la
desviación estándar de los porcentajes de algodón.
Intervalo f xi ui fi ui f i u i2
32.0 – 32.9 9 32.45 −2 − 18 36
33.0 – 33.9 12 33.45 −1 − 12 12
34.0 – 34.9 25 34.45 → x0 0 0 0
35.0 – 35.9 17 35.45 1 17 17
36.0 – 36.9 9 36.45 2 18 36
37.0 – 37.9 8 37.45 3 24 72
Total 80 29 173
La varianza es
n f u 2 ( f u ) 2 80 (173) (29) 2
s2 = × c2 = × (1) 2 = 2.0568
n (n 1) 80 79
Este resultado significa que existe una variación promedio de 1.4 de algodón en torno a la
media; esto es, el porcentaje de algodón en las camisas fluctúa en 1.4 por encima y por
debajo de la media de 34.8 porciento. ■
31
MEDIDAS DESCRIPTIVAS
DATOS NO AGRUPADOS:
n n
x1 x 2 x n
xi xi x
i 1 i 1
x = = d.m =
n n n
n n
(x i x) 2 x i2 n x 2
i 1 i 1
s2 = o bien s 2 =
n 1 n 1
DATOS AGRUPADOS:
k k
n
f i xi f i ui
2 ( f ) 1
x = L1 + ×c
i 1 i 1 ~
x = o bien x = x0 + ×c
n n f med
2
k k k
f i (x i x) 2 n f i u i2 f i ui
i 1
s 2
=
i 1
o bien s 2
=
i 1 × c2
n 1 n (n 1)
EJERCICIOS 1.3
Salarios No. de
(dólares) empleados
$ 50.00 — $ 59.99 8
60.00 — 69.99 10
70.00 — 79.99 16
80.00 — 89.99 14
90.00 — 99.99 10
100.00 — 109.99 5
110.00 — 119.99 2
Calcular: (a) El salario medio semanal, (b) la mediana y (c) la desviación estándar.
32
3. Utilícese la distribución obtenida en el problema 6 de los ejercicios 1.1 para determinar
el coeficiente de variación.
Duración Número
(horas) de tubos
300 — 399 14
400 — 499 46
500 — 599 58
600 — 699 76
700 — 799 68
800 — 899 62
900 — 999 48
1 000 — 1 099 22
1 100 — 1 199 6
33
El sesgo positivo ocurre cuando la media se incrementa en algunos valores inusualmente
altos; el sesgo negativo ocurre cuando la media se reduce en algunos valores extrema-
damente bajos. Los datos son simétricos cuando no existen valores extremos reales en
una dirección particular de forma tal que los valores bajos y altos se compensan entre sí.
x = ~
x = x̂
Fig. 1.5. Distribución simétrica ( x = ~
x = x̂ )
x ~
x x̂
Fig. 1.6. Distribución sesgada a la izquierda ( x < ~
x < x̂ )
34
x̂ ~
x x
Fig. 1.7. Distribución sesgada a la derecha ( x > ~
x > x̂ )
3 media mediana
Sk = (1.22)
desviación estándar
35
68.27%
x −s x x +s
(a)
95.45%
x − 2s x x + 2s
(b)
99.73%
x − 3s x x + 3s
(c)
4
desviación media = (desviación estándar) (1.23)
5
Esta es consecuencia del hecho de que para distribuciones normales se tiene que la des-
viación media es igual a 0.7979 veces la desviación estándar.
36
EJERCICIOS DE REPASO DEL CAPÍTULO 1
1. De un total de 100 números, veinte eran 4, cuarenta eran 5, treinta eran 6 y el resto
eran 7. Hallar la media aritmética de los números,
2. Los siguientes datos son las cantidades de ácido ascórbico (μg / ml) en diez soluciones:
1.0, 1.5, 3.0, 2.5, 3.5, 3.6, 4.0, 2.5, 6.0, 5.0
3. Los siguientes datos muestran el consumo diario de calorías de 11 jóvenes. Los datos
originales se dividieron por 1 000 y se redondearon a la décima más próxima.
2.5, 2.3, 2.4, 2.3, 2.3, 2.5, 2.7, 2.5, 2.6, 2.6, 2.7
4. Los siguientes datos son el aumento de peso (en libras) de diez terneros a los que se
les suministró una dieta suplementaria:
121, 101, 110, 108, 107, 95, 89, 120, 109, 117
1, 8, 2, 2, 3, 9, 2, 3, 5, 2, 4, 7, 9, 8, 5
6. Las distancias (medidas en cuadras) a que viven diez empleados de una empresa res-
pecto de su lugar de trabajo son:
7. En una fábrica industrial se contaron durante diez horas sucesivas los artículos defec-
tuosos que se producían cada hora. Los resultados fueron los siguientes:
5, 5, 6, 5, 6, 10, 5, 4, 4, 3
37
8. En unas pruebas hechas a doce empleados de una compañía de seguros para medir
su satisfacción en el trabajo se obtuvieron los siguientes puntajes:
3, 8, 2, 6, 8, 3, 3, 9, 4, 4, 3, 7
9. El número de niños por familia correspondientes a 15 familias que viven en una urbani-
zación de renta baja son:
2, 5, 7, 6, 5, 3, 3, 4, 4, 8, 4, 2, 6, 4, 7
10. Una muestra de diez empresas de acarreos indicó el volumen de actividades durante
el último año, medido en miles de toneladas transportadas. Los resultados fueron:
11. Los datos siguientes son los niveles de glucosa, medidos en ayunas, de diez niños:
12. La tabla siguiente muestra las calificaciones de 80 estudiantes en una clase de esta-
dística:
90 85 70 75 30 55 80 43 70 40
80 99 95 55 78 70 95 80 60 30
68 85 25 60 48 60 62 45 50 23
71 95 75 70 85 53 65 95 70 75
63 30 90 82 80 78 65 75 90 85
75 75 25 72 60 88 73 74 75 52
55 75 35 76 79 77 74 78 76 73
75 43 38 75 80 78 50 85 63 35
38
13. La vida media (en horas) de una película fotográfica de alta velocidad está siendo in-
vestigada por un fabricante. Se dispone de los siguientes datos:
126 129 134 141 127 128 133 140 125 148
131 132 136 145 132 131 135 146 133 119
116 128 130 162 117 127 129 163 131 125
125 126 134 129 126 126 133 130 130 128
134 127 120 127 135 121 119 128 136 120
120 122 129 133 121 110 128 148 111 132
125 111 147 129 126 147 146 130 147 162
150 148 126 140 151 121 125 141 126 132
130 120 117 131 131 116 116 132 133 147
149 117 143 133 150 147 142 134 135 112
15. Los sueldos de inicio de una muestra aleatoria de 100 estudiantes de computación o
de sistemas de cómputo que recibieron sus grados de bachillerato durante 2014 fueron
los siguientes:
24.2 29.9 23.4 23.0 25.5 22.0 33.9 20.4 26.6 24.0
28.9 22.5 18.7 32.6 26.1 26.2 26.7 20.4 22.2 24.7
18.6 18.5 19.6 24.4 24.8 27.8 27.6 27.2 20.8 22.1
19.7 25.3 28.2 34.2 32.5 30.8 26.8 20.6 21.2 20.7
25.2 25.7 32.2 28.8 24.7 18.7 20.5 25.5 19.1 25.5
22.1 27.5 25.8 25.2 25.6 25.2 25.2 27.9 18.9 37.3
29.9 23.2 19.8 20.8 29.5 27.6 21.2 38.7 21.3 24.8
32.3 20.1 26.8 25.4 26.3 21.2 19.5 22.8 21.7 25.3
32.3 28.1 27.5 25.3 19.3 27.4 26.4 20.9 34.5 25.9
31.4 27.4 27.3 20.6 31.8 25.8 25.2 21.9 26.8 26.5
39
16. El gobierno de un estado realiza un programa de concientización sobre el uso racional
del agua, en una colonia de clase media. Para conocer la efectividad de dicho progra-
ma, se realizó un muestreo a familias de cuatro integrantes y se observó la reducción
de consumo de agua. El número de familias encuestadas fue de 80 y se obtuvieron los
datos en m 3 . Las observaciones se muestran en la tabla siguiente:
2.2 3.1 3.3 3.9 3.9 2.1 3.2 3.2 4.0 3.8
3.4 3.8 3.6 3.7 1.9 3.5 3.7 3.7 3.6 2.0
2.5 3.5 4.4 3.1 4.2 2.4 3.6 4.3 3.2 4.1
3.3 3.1 2.6 3.3 2.6 3.2 3.0 2.7 3.2 2.7
4.7 3.4 3.2 4.1 3.7 4.8 3.5 3.1 4.2 3.6
4.1 3.7 3.8 3.0 3.1 4.0 3.6 3.9 2.9 3.2
1.6 3.2 2.0 3.0 3.4 1.7 3.3 2.1 3.1 3.3
4.3 4.5 3.2 4.7 3.5 4.2 4.4 3.3 4.6 3.6
18. Las lecturas de la presión sanguínea sistólica que se hicieron a 100 adultos que se
presentaron para un examen físico antes del empleo se muestran en la siguiente tabla:
104 120 134 106 132 123 101 125 120 116
126 122 139 120 113 120 130 105 135 113
116 111 118 122 115 106 115 121 125 122
105 122 117 114 138 123 106 123 133 123
114 128 121 132 112 123 129 111 120 129
124 115 108 116 107 113 122 116 120 143
124 129 111 124 112 116 123 103 119 117
112 146 131 102 122 120 111 110 121 115
126 116 118 112 118 107 116 124 104 123
114 121 117 123 106 107 118 124 142 117
40
19. La tabla siguiente muestra los diámetros en pulgadas de una muestra de 60 tornillos
fabricados por una compañía.
0.737 0.738 0.729 0.743 0.740 0.736 0.741 0.735 0.731 0.726
0.728 0.737 0.736 0.735 0.724 0.733 0.742 0.736 0.739 0.735
0.745 0.736 0.742 0.740 0.728 0.738 0.725 0.733 0.734 0.732
0.733 0.730 0.732 0.730 0.739 0.734 0.738 0.739 0.729 0.735
0.735 0.732 0.735 0.727 0.734 0.732 0.736 0.741 0.736 0.744
0.732 0.737 0.731 0.746 0.735 0.735 0.729 0.734 0.730 0.740
41