Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

¿Recuerdas Qué Es ?: Intervalo

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 20

¿Recuerdas qué es…?

Intervalo
El intervalo semiabierto por la
derecha [a, b) es el conjunto de
todos los números reales mayores
o iguales que a y menores que b.
[a, b) = {x R| a ≤ x < b}

Sector circular y ángulo


central
Un sector circular es la porción
de círculo comprendido entre
dos radios, y queda determinado
por el ángulo que forman estos
radios. Este ángulo se llama
central.

Estudio estadístico
y variable estadística
Se hace un estudio estadístico
cuando se quiere obtener
información sobre algún tema
relacionado con un grupo de
elementos similares.
La información se obtiene a partir
de una pregunta llamada
variable estadística.

Parámetros estadísticos
Son valores que sintetizan la
información contenida en una
variable estadística. Algunos
de ellos son la media, la mediana,
la moda, la desviación típica,
etcétera.
11
TÍTULAR (PUEDE SER
DE DOS LÍNEAS)
ESTADÍSTICA

La Estadística, o «ciencia del Estado», se


Texto deen
empleó introducción
su origen para (ajustar la manchade
la descripción de
color alResulta
datos. texto). lógico
Un libro delos
que recetas de quieran
Estados cocina
indica que,
estudiar para lacaracterísticas
distintas elaboración dedeuna lastarta
de manzana ypara
poblaciones sus 4 personas se necesitan
recursos.
los siguientes ingredientes: 200 g de masa,
6 manzanas
El reineta,
primer objetivo de150 g de azúcar,
la Estadística es3hallar
cu-
charadas de mermelada
procedimientos de albaricoque
para representar y
y sintetizar
200
la g de cremaproporcionada
información pastelera. Si lopor
queciertos
se desea
es hacer
datos. Launa
rama tarta para 8 personas,
denominada es lógico
Estadística
suponer quese
descriptiva laencarga
cantidaddenecesaria de cada
este objetivo.
uno de los ingredientes es el doble de la indi-
cada para una tarta
Posteriormente, de 4 personas.
la Estadística abordóPerounsi se
quiere que
objetivo la tarta
mucho mássea de cinco, realizar
ambicioso: seis o siete
raciones, ¿cuál
predicciones seríasobre
fiables la cantidad necesaria
la población
departir
a cada de
ingrediente?
una muestra extraída. De ello se
encarga la llamada Estadística inferencial.
En esta Unidad, vas a ver cómo puedes cal-
cular
El la cantidad
desarrollo detécnicas
de las cada uno dede los ingre-
análisis
dientes
de para permite
muestras hacer una tarta convariables
relacionar las raciones
que desees
físicas a partir
y sociales, de la receta
incluso dada.
antes de encontrar
el principio que explica su relación.

Los objetivos
(Objetivos o contenidos)
de esta Unidad son:
Los objetivos de esta Unidad son:
• Dominar los conceptos elementales
©deQue
la Estadística
aprendas a descriptiva.
determinar la constante
de proporcionalidad.
• Aplicar las técnicas y cálculos estadísticos
a un conjunto de datos.
00. La Tierra
A. Los movimientos de la Tierra
11 1 NOCIONES DE ESTADÍSTICA
Supón, a modo de ejemplo, que deseamos estimar el tiempo que puede so-
brevivir una determinada especie vegetal sin ser regada. No parece razonable
dejar sin agua a todas las plantas de esa especie, pero sí se puede seleccionar
un grupo de éstas y someterlas a esta prueba. Pues bien, el conjunto de todas
las plantas de esa especie se denomina población, y el grupo de plantas que
se somete a la prueba se denomina muestra. Del estudio de la muestra se
pretende obtener conclusiones referidas al total de la población.

Población es un conjunto de elementos que, por un motivo u otro, estamos


interesados en estudiar.
Individuo es cada uno de los elementos de la población.
Muestra es una parte de la población.
La Estadística es la ciencia que, mediante el uso de modelos matemáticos,
organiza datos asociados a una cierta población y permite obtener conclu-
siones a partir de muestras.

Reflexiona En una población determinada se pueden estudiar distintos aspectos. Así, en


Otros aspectos asociados el ejemplo que abre esta sección, el aspecto que estudiamos es «tiempo de
a distintas poblaciones son, vida de una planta sin ser regada».
por ejemplo, «el número
de horas que entrenan unos
deportistas» o «la profesión de
los integrantes de un club Los distintos aspectos o rasgos de una población se llaman caracteres
de ajedrez». estadísticos, o simplemente caracteres.

Ten en cuenta Un carácter es cualitativo si toma valores no numéricos. Por ejemplo, el


En la práctica, los términos
«lugar de nacimiento» es un carácter cualitativo, pues los valores que toma,
carácter y variable se emplean Madrid, Segovia, Badajoz…, no son numéricos. Los valores que toma un ca-
como si fueran equivalentes. rácter cualitativo reciben el nombre particular de modalidades.
Así, hablamos de variables
cualitativas y cuantitativas. Un carácter es cuantitativo si toma valores numéricos. Así, «la edad de una
persona» que toma valores como 5 años, 6 años, 30 años…, es un carácter
cuantitativo.
WEB

http://descartes.cnice.mec. El conjunto de valores que toma un carácter estadístico se denomina va-


es/materiales_didacticos/ riable estadística, o, si no hay confusión, variable.
iniciacion_estadististica_
fjgarcia/01VariablesEstadisticas.
htm Una variable cuantitativa es discreta si los valores que toma son aislados. Por
En esta página de F. J.
García aparecen distintos ejemplo, «el número de hermanos» o «el número de páginas de un libro». Si
tipos de variables que hay la variable puede tomar todos los valores de un intervalo, se denomina con-
que identificar, pudiéndose tinua. Son variables continuas «la talla», «el peso» o «el tiempo que tarda un
comprobar la respuesta.
corredor en concluir una maratón».

Ejercicios

1 Pon dos ejemplos de carácter estadístico cua- 3 Pon dos ejemplos de variable discreta, e in-
litativo y dos de carácter estadístico cuantitativo. dica los valores aislados que pueden tomar.
2 A unos alumnos se les pregunta por el depor- 4 Piensa en dos ejemplos de variable continua,
te que practican. ¿Es un carácter cuantitativo? e indica los valores que pueden tomar.
202
2 TABLAS DE FRECUENCIAS
El primer problema de la Estadística es la ordenación y tabulación de los da- Definición
tos obtenidos en ciertas observaciones para extraer conclusiones sobre las El conjunto de datos obtenidos
características de una población. Las tablas de frecuencia de una variable en un estudio estadístico se
estadística permiten ordenar los datos estadísticos y proporcionar una lectura llama distribución de datos.
clara de los mismos. Distinguiremos dos tipos de tablas.

A VARIABLES DISCRETAS Definición


El símbolo , que no es más
Supongamos una variable discreta que toma los valores x1, x2, ..., xi, ... Asocia- que la letra griega sigma, en
dos a estos datos, definimos: matemáticas se llama sumatorio
y sirve para escribir de manera
— Frecuencia absoluta del valor xi: es el número de veces que se repite el abreviada sumas. Así, la
expresión x1 + x2 + ... + x n se
valor xi. Se representa como fi. n n

abrevia como fi .
— Tamaño de la población: es N = f1 + f2 + ... + fn = fi . i=1
i=1

— Frecuencia relativa hi del valor xi: es el cociente entre la frecuencia


f
absoluta y el tamaño de la población o de la muestra, esto es, hi = i . Ten en cuenta
N
— Porcentaje del valor xi es el tanto por ciento de aparición del valor xi. Se En el Ejemplo 1, el dato 0
aparece 2 veces, por lo que su
representa como pi, y se calcula con la expresión pi = 100 · hi. frecuencia es f1 = 2. Igualmente
con el resto de datos.
Con lo anterior, se construye la denominada tabla de frecuencias.

Ejemplo 1

A un grupo de 20 socios de una biblioteca se les ha preguntado sobre el número de libros que
han leído el mes pasado. Las respuestas son las siguientes:
4, 2, 1, 0, 3, 1, 4, 2, 0, 2, 1, 1, 2, 1, 2, 4, 3, 4, 1, 2.
El tamaño de la población es N = 20, y la tabla de frecuencias queda así:
xi fi hi pi
0 2 2/20 = 0,1 10%
1 6 6/20 = 0,3 30%
2 6 6/20 = 0,3 30%
3 2 2/20 = 0,1 10%
4 4 4/20 = 0,2 20%
Total N = 20 1 100%

Ejercicios

5 Construye la tabla de frecuencias de las si- 6 Copia en tu xi fi hi pi


guientes distribuciones de datos, señalando situa- cuaderno y com- 9 0,15
ciones reales a las que se puedan asociar: pleta la tabla de
frecuencias de 10 9
a) 4, 3, 2, 2, 0, 1, 4, 1, 1, 3, 0, 0, 0, 4, 5. 11 40 %
las edades de los
b) 18, 23, 22, 19, 23, 23, 24, 21, 23, 19, 18, 23, 23, miembros de un Total 20
24, 23, 22, 23, 21. club de ajedrez:
203
11 B VARIABLES CONTINUAS
Si la variable es continua, o el número de valores distintos de la variable es
muy elevado, conviene elaborar una tabla de frecuencias agrupando los datos
en intervalos o clases.

Ten en cuenta El punto medio de cada clase se denomina marca de clase y se designa
Los intervalos suelen ser como xi.
del mismo tamaño, aunque
no siempre es así.
Una vez distribuidos los datos en intervalos y calculadas las marcas de clase,
el modo de proceder es análogo al de las variables discretas, sustituyendo la
totalidad del intervalo por su marca de clase.

Ten en cuenta Ejemplo 2


A modo de ejemplo, la marca
de clase de [10,15) es: Una fábrica elabora varillas de hierro de diferentes longitudes.
10+15 La longitud, en milímetros, de 30 de ellas es la siguiente:
= 12,5
2
15 12 11 14 24 17 10 6 10 23
10 15 17 18 19 16 12 23 12 19
24 18 12 13 24 8 21 15 11 14
WEB
http://descartes.cnice.mec.
es/materiales_didacticos/ Se trata de una distribución de variable continua. El dato menor
Recuento_y_agrupacion_datos/ es 6 mm y el mayor es 24 mm, por lo que podemos formar estas
organizacion_datos.htm
Página de J.A. González que
cuatro clases: [5, 10), [10, 15), [15, 20) y [20, 25). Efectuando el
permite la visualización de recuento de los datos y agrupándolos en estas clases, se elabora
la construcción paso a paso la tabla de frecuencias:
de una tabla de frecuencias
finalizando con el cálculo Marca de
de la media. Clases fi hi pi
clase x1
http://descartes.cnice.
mec.es/materiales_ [5, 10) 7,5 2 2/30 6,66 %
didacticos/iniciacion_ [10, 15) 12,5 12 12/30 40 %
estadististica_fjgarcia/
02TablasDeFrecuencias.htm [15, 20) 17,5 10 10/30 33,33 %
Esta página de F. J. García
permite construir tablas de [20, 25) 22,5 6 6/30 20 %
frecuencia de variable discreta
controlando el tamaño de los Total N = 30 1 100 %
intervalos.

Ejercicios

7 El número de personas que acudieron a un 8 Copia y completa en tu cuaderno la siguiente


servicio médico a lo largo del último mes es: tabla de frecuencias:
24 26 30 29 31
23 35 43 27 35 Marca
Clases f1 h1 pi
x1
28 32 27 21 32
[0, 10) 10 0,20
41 22 28 40 38 [10, 15) 30 %
22 25 41 24 43 [15, 20) 5
22 26 34 29 40 [20, 25)
Agrupa los datos anteriores en intervalos de am- [25, 30) 2 4%
plitud 5 y elabora la tabla de frecuencias de esta Total N = 50
distribución.
204
3 PARÁMETROS ESTADÍSTICOS
Los parámetros estadísticos son un pequeño número de valores que resu- Vocabulario
men la información de una variable estadística. Se dividen en parámetros de Parámetros de centralización:
centralización (los datos se agrupan en torno a éstos) y parámetros de disper- Media, moda, mediana,
sión (informan sobre la intensidad con que se agrupan los datos en torno a cuartiles, percentiles…
los valores centrales). Parámetros de dispersión:
Varianza, desviación típica y
coeficiente de variación.

A MEDIA, VARIANZA Y DESVIACIÓN TÍPICA


Considera una variable estadística X, de tamaño N, con la tabla de frecuencias xi fi
del margen. Los valores x1, x2, xi, ... xn son los valores de la variable, si ésta es x1 f1
discreta, o las marcas de clase, si es continua.
x2 f2
· ·
La media aritmética de X es:
n n · ·
fi xi fi xi xn fn
f x + f x + … + fnxn
x– = 1 1 2 2
i=1 i=1
= n = Total N
f1 + f2 + … + fn fi N
i=1
CD
En la pestaña Actividades/
La media aritmética (o por simplicidad, la media) es un valor en torno al cual Unidad 11, encontrarás la
se concentra la distribución, y se mide en las mismas unidades que los datos. actividad Relación 2 unidad 11,
para calcular la media.

Ejemplo 3
xi fi fi xi
En la distribución del margen se ha añadido una columna con 0 2 0
los valores de los productos fixi, lo que facilita el cálculo de la
n 26 1 5 5
media. Como N = 15 y fi xi = 26, la media es x– = 1,73... 2 5 10
i=1 15
3 1 3
4 2 8
n n Total N = 15 26
–2
fi (xi – x) fi xi2
La varianza de X es Var = 2
= = i=1 i=1
– x– 2 ≥ 0
N N
La desviación típica de X es = Var ≥ 0.

La varianza se mide en unidades cuadradas, mientras que la desviación típica


lo hace en las mismas unidades que los datos.

Ejemplo 4 xi fi fi xi fi xi2
0 2 0 0
A partir de la distribución del ejemplo 3, multiplicando la columna
1 5 5 5
xi por la columna fixi obtenemos fi xi2, lo que nos permite calcular:
n
2 5 10 20
f i xi 2 2
3 1 3 9
66 26
– x– 2 =
i=1
Var = – 1,3955... 4 2 8 32
N 15 15
Total N = 15 26 66
= Var = 1,3955... = 1,1813...

205
11
Ten en cuenta
B COEFICIENTE DE VARIACIÓN
La desviación típica representa una medida de la dispersión de los datos
respecto a la media. Ahora bien, como media y desviación típica tienen uni-
dades, el que la desviación sea «grande» o «pequeña» es poco relevante si
se desconoce lo «grande» o «pequeña» que es la media. En particular, la des-
El coeficiente de variación viación típica por sí sola no permite comparar grados de dispersión de dos
es una magnitud sin unidades distribuciones de datos. Para resolver este problema, se define el coeficiente
y representa una medida de variación (o de dispersión).
relativa de la dispersión.

El coeficiente de variación CV de una variable X es el cociente entre la


desviación típica y la media. Es decir, CV = – .
x

Ejemplo 5

Dos vendedores de enciclopedias efectúan, durante la úl- Ventas Vendedor A


tima semana, las ventas siguientes: xi fi fi xi fi xi2
Vendedor A 4, 3, 8, 0, 4, 6, 8 0 1 0 0
Vendedor B 4, 6, 4, 2, 1, 6, 6 3 1 3 9
4 2 8 32
Para decidir cuál de los dos es más regular en las ventas
se calculan los respectivos coeficientes de variación. La 6 1 6 36
media, la desviación típica y el coeficiente de variación 8 2 16 128
de A son: Total N=7 33 205
2
33 205 33
x–A = , A = – 2,66
7 7 7
2,66
CVA = –A 0,56 = 56 %
xA 4,714
La media, la desviación típica y el coeficiente de variación de B son:
29 145 29 2 Ventas Vendedor B
x–B = , –
B = 1,88 xi
7 7 7 fi fi xi fi xi2
1,88 1 1 1 1
CVB = –B 0,45 = 45 %
xB 4,14 2 1 2 4
Como el coeficiente de variación CVB es menor que CVA , 4 2 8 32
se puede concluir que el vendedor B es más regular que 6 3 18 108
el vendedor A en la venta de enciclopedias. Total N=7 29 145

Ejercicios

9 Calcula la media, la varianza, la desviación 11 Halla la media, la desviación típica y el coefi-


típica y el coeficiente de variación de las distribu- ciente de variación de estas distribuciones:
ciones asociadas a los ejercicios 7 y 8.
a) 27, 22, 29, 30, 21, 22, 27, 18, 23, 26, 33, 35, 20,
10 Estudia la variable estadística continua 26, 29.
«talla en centímetros», aplicada a dos grupos
b) 26, 21, 27, 31, 19, 24, 26, 19, 20, 24, 31, 32, 18,
distintos de tu clase, y calcula la media, la va-
23, 30.
rianza, la desviación típica y el coeficiente de
variación. Decide en cuál de los dos grupos es ¿Cuál de las dos distribuciones tiene mayor grado
mayor la dispersión en la talla. de dispersión?
206
C MEDIANA Y MODA
Estudiamos en esta sección la mediana y la moda. Para definir y calcular la
mediana es necesario el concepto de frecuencia absoluta acumulada.

En una tabla de frecuencias, la frecuencia acumulada asociada a xi, repre- Ten en cuenta
sentada como Fi, es la suma Fi = f1 + f2 + … + fi. El valor de Fi es la suma de Fn = N
las frecuencias absolutas de x1, x2, … y xi.

Ejemplo 6

Consideremos la siguiente tabla de frecuencias a la que se aña-


de la columna de frecuencias absolutas acumuladas:
xi fi Fi
0 3 3
1 2 3+2=5
2 3 5+3=8
3 1 8+1=9
4 1 9 + 1 = 10
Reflexiona
Para definir la mediana, es
Podemos abordar ya la definición de mediana de una distribución de datos. imprescindible que los datos
de la distribución aparezcan
Supongamos que el número de datos es pequeño. Tras ordenar los datos en ordenados. Hecho esto, la
orden creciente, la mediana Me es el dato que ocupa la posición central. En mediana deja el 50 % de la
el caso en que el número de datos sea par, la mediana Me es la media de los población antes de ella, y
detrás, el otro 50 %.
dos valores centrales.

Ejemplo 7

La distribución (ordenada) 1, 3, 5, 7, 10 tiene 5 datos. La mediana es el dato que ocupa la posi-


ción tercera. Esto es, Me = 5.
La distribución 9, 10, 12, 15, 15, 16, 19, 24, 30, 45 consta de 10 datos. Los datos centrales, en
las posiciones quinta y sexta, son 15 y 16. Por tanto, la mediana es:
15 + 16
Me = = 15,5
2

Ejemplo 8

En la tabla de frecuencias del margen, el número de datos es xi fi Fi


N = 22, que es un número par. Como la mitad del tamaño de la 0 9 9
N 1 7 9 + 7 = 16
población es = 11, las posiciones centrales son la 11.ª y 12.ª, y
2 2 4 16 + 4 = 20
como ambas están asociadas al valor xi = 1, la mediana es: 3 1 20 + 1 = 21
1+1 4 1 21 + 1 = 22
Me = =1
2

Ejercicios

12 Calcula la mediana de las distribuciones del 13 Halla la media, la mediana y la desviación


ejercicio 11. típica de la distribución: 3, 5, 2, 4, 6, 6, 4, 3, 5, 7, 4.
207
11Ten en cuenta
De este mismo modo, se
Supongamos ahora que los datos se agrupan en intervalos. Denominamos
clase mediana al primer intervalo cuya frecuencia absoluta acumulada es
mayor o igual que la mitad del tamaño de la población. Designamos Fi a esta
frecuencia absoluta acumulada, y xi a la marca de la clase mediana. Existen
dos posibilidades:
puede calcular la mediana N
de una distribución de — Si Fi > , entonces la mediana es Me = xi.
variable discreta con los datos
2
presentados en una tabla N x +x
de frecuencias. — Si Fi = , entonces la mediana es Me = i i + 1 .
2 2

Altura xi fi Fi Ejemplo 9
[0, 20) 10 12 12
La tabla del margen proporciona la altura, en centímetros, de las
[20, 40) 30 16 28
plantas de un invernadero.
[40, 60) 50 20 48
N
[60, 80) 70 4 52 La mitad de la población es = 26, por lo que la clase mediana
2
N
es [20, 40), con Fi = 28 > .
2
La mediana es la marca de clase de [20, 40), esto es, Me = 30 cm.

Otro parámetro que puede calcularse es la moda. A la vista de la tabla del


ejemplo anterior, se observa que la clase con mayor frecuencia absoluta es
[40, 60). Esta clase se denomina clase modal. La marca de la clase modal
se denomina moda. Así pues, la moda de esta distribución de alturas es
M0 = 50 cm.
Si la distribución de datos no necesita agrupación por intervalos (variables
discretas con pocos valores), la moda M0 es el valor (o valores) de la variable
con mayor frecuencia absoluta.

Ejemplo 10
xi fi Fi
0 3 3 Consideramos la distribución: 0, 1, 3, 0, 2, 1, 0, 2, 4, 2. Al elaborar
1 2 5 la tabla de frecuencias, situada al margen, se observa que los va-
lores 0 y 2 tienen frecuencia 3, que es la mayor de todas. Por tanto,
2 3 8 la distribución tiene dos modas: M0 = 0 y M0 = 2.
3 1 9 N
4 1 10 Respecto a la mediana, teniendo en cuenta que = 5 coincide
2
N = 10 con la frecuencia absoluta acumulada F2 de x2 = 1, se sigue que:
x2 + x3 1+2
Me = = = 1,5
2 2

Ejercicios

14 Halla la mediana y la moda de las distribucio- 16 Halla la mediana y la moda de las distribucio-
nes de los ejercicios 7 y 8. nes A y B asociadas al ejemplo 5.
15 Calcula la media, la mediana y la moda de la 17 Inventa una distribución de datos con media-
distribución: 3, 7, 5, 4, 3, 3, 6, 8, 10, 9. na 2 y moda 3.
208
D CUARTILES Y CENTILES
Anteriormente se ha comentado que, tras ordenar los datos, la mediana divide
éstos es dos partes iguales, dejando a su izquierda la mitad de los datos. Si
en vez de dividir la distribución en dos partes iguales, lo hacemos en cuatro
partes iguales, los tres puntos de separación asociados se denominan cuar-
tiles y se representan por Q1, Q2 y Q3.
— El primer cuartil, Q1, deja a su izquierda la cuarta parte de la distribución,
es decir, el 25 %.
— El segundo cuartil, Q2, deja a su izquierda la mitad de la distribución y, por
tanto, coincide con la mediana, es decir, Q2 = Me.
— El tercer cuartil, Q3, deja a su izquierda tres cuartas partes de la distribución,
es decir, el 75 %.
De la misma forma, si deseamos dividir una distribución en 100 partes iguales,
aparecen 99 puntos de separación denominados centiles o percentiles. El
percentil de orden k, representado como pk, deja a su izquierda k centésimas
partes de la distribución.
Se verifica: p25 = Q1, p50 = Q2 = Me y p75 = Q3.
Clase fi Fi
Ejemplo 11 1 1 1
2 2 3
Consideramos la distribución definida por la tabla del margen. 3 5 8
Vamos a calcular Q1, Q 2, Q 3 y P 7, 4 10 18
31 5 4 22
La cuarta parte de los datos es = 7,75. 6 6 28
4
El primer valor cuya frecuencia absoluta acumulada supera la 7 3 31
cuarta parte de los datos es 3. Luego Q1 = 3. Total 31
La mitad de los datos es 15,5, de donde se desprende que la
mediana es Me = Q 2 = 4.
31
Por último, las tres cuartas partes de los datos son 3 · = 23,25, Ten en cuenta
4
por lo que se tiene Q 3 = 6. En realidad, los cuartiles y
percentiles así calculados son
Veamos ahora cómo calcular, a modo de muestra, el percentil sólo aproximados. El cálculo
p7. Siete centésimas partes de los datos son 7 % de 31 = 2,17. El exacto es algo más complejo.
primer valor cuya frecuencia absoluta acumulada supera 2,17
es 2. Por tanto, p7 = 2.

WEB
En el caso de las distribuciones con datos agrupados en intervalos, los cuartiles
se calculan de modo totalmente análogo a como se hace con la mediana. http://www.aulademate.com/
contentid-255.html
Por ejemplo, para calcular Q1 se busca el primer intervalo cuya frecuencia Página interactiva, al introducir
los valores de la variable y
absoluta acumulada supera la cuarta parte de los datos. Hallado éste, se iden- sus frecuencias, el programa
tifica Q1 con su marca de clase. Análogamente, se repite el mismo proceso construye una tabla y calcula
para Q3. los parámetros estadísticos.

Ejercicios

18 Halla los cuartiles Q1 y Q3 para las distribucio- 19 Halla los percentiles p65 y p93 para la distribu-
nes de los ejercicios 7 y 8. ción del ejemplo 11.
209
11 4 GRÁFICOS ESTADÍSTICOS
Los gráficos son formas sencillas de representar las frecuencias absolutas y
relativas de una distribución de datos asociada a cierto estudio estadístico.
Según sea la variable que vamos a estudiar, se emplea uno u otro tipo de
gráficos.

A DIAGRAMA DE BARRAS
Los diagramas de barras se emplean, generalmente, para variables cuanti-
tativas con pocos valores diferentes. En unos ejes de coordenadas, señalamos
los valores de la variable en el eje de abscisas. Tras esto, sobre cada valor de la
variable se levanta una barra cuya altura sea la frecuencia (absoluta o relativa,
Frecuencia
11 según proceda) correspondiente.
10
9 Ejemplo 12
8
Hemos preguntado a 36 parejas el número de veces que salen
7
a comer o cenar fuera mensualmente. Los datos aparecen re-
6
cogidos en la tabla:
5
4 N.º de veces que salen 1 2 3 4 5 6
3
N.º de parejas 3 9 2 8 10 4
2
1 El diagrama de barras asociado a esta distribución es el del
0 margen.
1 2 3 4 5 6 Valor

B POLÍGONO DE FRECUENCIAS
Frecuencia Al igual que los diagramas de barras, los polígonos de frecuencias se asocian
11
a variables de pocos valores. En unos ejes de coordenadas se representa un
10
punto por cada valor de la variable. La abscisa de cada punto representa el
9 valor de la variable, mientras que la ordenada representa la frecuencia. Unien-
8 do estos puntos mediante segmentos rectilíneos se obtiene el denominado
7 polígono de frecuencias.
6
Es bastante habitual la representación conjunta del diagrama de barras y el
5
polígono de frecuencias.
4
3
Ejemplo 13
2
1 El gráfico del margen es el polígono de frecuencias de la dis-
0 tribución del ejemplo 12.
1 2 3 4 5 6 Valor

Ejercicios

20 La distribución siguiente corresponde al nú- 21 Construye en tu cuaderno el diagrama de ba-


mero de hermanos que tiene cada alumno de una rras y el polígono de frecuencias de la distribución
clase. Construye en tu cuaderno el diagrama de siguiente:
barras y el polígono de frecuencias asociados.
Valor 1 2 3 4 5
Hermanos 0 1 2 3 4 Frecuencia 2 5 9 0 7
Frecuencia 6 9 7 4 1
210
C DIAGRAMA DE SECTORES Ten en cuenta
A un valor x i de frecuencia
El diagrama de sectores se emplea habitualmente con variables asocia- relativa h i le corresponde un
sector circular con ángulo
das a caracteres cualitativos, aunque también es posible su uso con caracte- central de i = 360 · h i grados
res cuantitativos. En este gráfico, se descompone un círculo en tantos sectores sexagesimales.
circulares como valores tome la variable. El ángulo central de cada sector
es proporcional a la frecuencia del valor correspondiente. En este tipo de
gráficos se suele indicar el porcentaje asociado a cada sector.

Ejemplo 14

Los 500 empleados de una oficina acuden al trabajo en distintos medios de transporte.

Transporte fi hi pi Grados i = 360 · hi


20 %
Coche 200 0,40 40 % 144º Coche
Metro 150 0,30 30 % 108º 4% 40 % Metro
Autobús
Autobús 30 0,06 6% 21,6º 6%
Bicicleta
Bicicleta 20 0,04 4% 14,4º
A pie
A pie 100 0,20 20 % 72º 30 %
Total 500 1 100 % 360º

D HISTOGRAMA
El histograma se emplea con variables cuantitativas de datos agrupados en
intervalos. Asumiendo que éstos son de igual longitud, sobre cada uno se
levanta un rectángulo cuya altura es la frecuencia del intervalo correspon-
diente.

Ejemplo 15
Pedro ha hecho un recuento del número de personas que viven en cada una de las calles de
un barrio de su pueblo. Los resultados aparecen agrupados en la tabla, y el histograma es:
Frecuencia
6
Personas fi
5
[50, 55) 3 4
[55, 60) 2 3
[60, 65) 5 2
1
[65, 70) 4 0
Total 14 50 55 60 65 70
Número de personas por calle

Ejercicios

22 Dibuja un diagrama de sectores que represen- 23 Construye el histograma asociado a la


te las preferencias literarias de 100 lectores: distribución siguiente:
5, 8, 13, 23, 4, 16, 7, 24, 21, 1, 0, 4, 15, 11, 9, 2,
Género Policiaco Aventuras Terror 4, 11, 22, 21, 7, 6, 2, 1, 0, 4, 9, 14, 12, 22, 25, 0
Frecuencia 50 20 30

211
11 EJERCICIOS RESUELTOS
1 Un jardinero revisa los rosales de su invernadero y anota las alturas
de los mismos, representando los datos obtenidos en este histograma.
Halla la media, la desviación típica, la mediana y la moda de la distribu-
ción de alturas.
Frecuencia absoluta
12
11
10
9
8
7
6
5
4
3
2
1
0
20 40 60 80 100 120
Altura de los rosales en cm

Para calcular los parámetros estadísticos pedidos, es necesario elaborar la


tabla de frecuencias ampliada con las columnas adecuadas.

Altura xi fi fi xi fi xi2 Fi
[20, 40) 30 10 300 9 000 10
[40, 60) 50 8 400 20 000 18
[60, 80) 70 12 840 58 800 30
[80, 100) 90 5 450 40 500 35
[100, 120) 110 7 770 84 700 42
Total N = 42 2 760 213 000

La clase modal es [60, 80), con frecuencia fi = 12. Por tanto, la moda, que es la
marca de clase de [60, 80), es M0 = 70 cm.
N
Respecto a la mediana, observa que la mitad de la población es = 21. La
N 2
primera clase que supera = 21 es también [60, 80), por lo que Me = 70 cm.
2
n
fi xi
2 760
Por último, la media es x–
i=1
= = 65,71 cm, y la varianza es:
N 42
n
2
fi xi 2
213 000 2 760
– x–2 =
2 i=1
– 753,623 cm2, por lo que se tiene que
N 42 42
la desviación típica es:
2
= 753,623 27,452 cm.
Venta de lavadoras
2 7 8 10 9 2 Los datos del margen corresponden a la venta de lavadoras de un
17 13 5 14 16 establecimiento cada día del último mes.
12 20 14 9 10 a) Calcula el número medio de lavadoras vendidas en este periodo.
19 4 6 16 15
18 12 17 22 0 b) Halla la moda.
212 22 0 24 13 7 c) Halla la mediana, así como el primer y el tercer cuartiles.
Lavadoras xi fi fi xi Fi
vendidas por día
[0, 5) 2,5 4 10 4
[5, 10) 7,5 7 52,5 11
[10, 15) 12,5 8 100 19
[15, 20) 17,5 7 122,5 26
[20, 25) 22,5 4 90 30
Total 375

a) Puesto que los datos varían entre 0 y 24, para elaborar la tabla de frecuencias
parece razonable distribuirlos en las clases [0, 5), [5, 10), [10, 15), [15, 20) y
[20, 25). A la vista de la tabla de frecuencias, la venta media de lavadoras es:
n
fi xi
375
x– =
i=1
= = 12,5
N 30
b) La clase modal es [10, 15), con frecuencia 8. Por tanto, la moda es
M0 = 12,5.
c) El número de datos es 30, y su mitad es 15. La clase mediana es [10, 15), ya
que su frecuencia absoluta acumulada excede por primera vez la mitad
de los datos. Tomamos como aproximación de la mediana la marca de
esta clase, Me = 12,5.
La cuarta parte de los datos es 7,5. La clase que contiene el primer cuartil
es [5, 10), ya que su frecuencia absoluta acumulada excede por vez primera
la cuarta parte de los datos. Luego el primer cuartil es la marca de [5, 10),
es decir, Q1 = 7,5. Análogamente se halla Q3 = 17,5.

3 A una proyección cinematográfica asisten 50 niños, 75 jóvenes,


60 adultos y 40 ancianos. Representa estos datos en un diagrama de
sectores.
Primero se elabora la tabla de frecuencias, incluyendo los grados:

Categoría fi pi Grados
Ancianos Niños
Niños 50 22 % 79,2º 18 % 22 %
Jóvenes 75 33 % 118,8º
Adultos 60 27 % 97,2º Adultos
27 % Jóvenes
Ancianos 40 18 % 64,8º 33 %
Total 225 100 % 360º

Para calcular los grados se puede emplear una regla de tres.


100 % 360º
22 %
7 920
Así, al 22 % se le asocia el ángulo = = 79,2º, y procedemos de igual
modo con el resto 100
213
11 EJERCICIOS PROPUESTOS
Nociones de Estadística 7 El número de hijos de los empleados de una
oficina es el siguiente:
1 A los empleados de una oficina se les pregunta
por los aspectos siguientes: 0 2 1 1 2 3 2 1 4 0
2 0 3 1 4 2 1 1 2 1
• Estado civil.
• Número de libros que leen al mes. Elabora la tabla de frecuencias de esta distribución de
datos.
• Preferencias cinematográficas.
• Color de pelo.
• Años de antigüedad en la empresa.
• Distancia entre la oficina y su vivienda.
a) Indica si los caracteres anteriores son cualitativos o
cuantitativos.
b) Señala modalidades posibles de los caracteres cua-
litativos.
c) Señala posibles valores de la variable estadística en
el caso de los caracteres cuantitativos.
8 Las calificaciones de matemáticas de los 20
2 Determina, para cada uno de los estudios esta- alumnos de una clase son:
dísticos siguientes, el individuo, la población, la variable
estadística, y si ésta es continua o discreta: 0 2 4 5 5
a) ¿Cuántos alumnos aprueban matemáticas en tu clase? 1 7 5 2 8
7 5 1 1 3
b) ¿Cuántos libros lee cada uno de los habitantes del
barrio en que vives? 8 4 4 3 0
c) ¿Cuál es el gasto mensual en comestibles de cada Construye en tu cuaderno la tabla de frecuencias de esta
uno de los vecinos de un bloque de pisos? distribución de datos.

9 La tabla siguiente corresponde al número de


3 Diseña un estudio estadístico relativo al uso de cigarrillos que un grupo de fumadores (que intentan
medios de transporte. Describe una variable estadística dejar de fumar) consume al día:
relacionada con este estudio y la población estudiada.
N.º de cigarrillos xi fi hi pi
2 1
4 Inventa una variable estadística discreta y una 3 5 0,2
variable estadística continua, señalando los posibles va-
4 24 %
lores que pueden tomar.
5
6 16 %
5 Señala un carácter que pueda adoptar una for- 7 2
ma cualitativa y cuantitativa. 8 o más 4 0,16
Total N = 25
Tablas estadísticas Copia en tu cuaderno completando esta tabla y respon-
de a las cuestiones:
6 Construye la tabla de frecuencias para la si-
a) ¿Cuántos fuman más de 5 cigarrillos?
guiente distribución de datos:
b) ¿Qué porcentaje de fumadores fuma menos de 6 ci-
214 0 0 0 1 1 2 3 2 1 4 0 garrillos?
10 Copia en tu cuaderno y calcula las marcas de 14 El empleado de un videoclub selecciona una
clase asociadas a esta tabla: muestra de sus clientes y anota el número de películas
que cada uno de ellos ha sacado durante el último tri-
Clase Marca de clase mestre. Los datos que ha obtenido son:
[0, 5)
[5, 13) 12 14 11 20 24 19
[13, 19) 16 21 17 25 29 28
[19, 30) 23 24 29 21 20 13
15 15 24 23 26 24
11 Al final de una semana, una zapatería hace ba-
lance de sus ventas. La tabla siguiente refleja las ventas Agrupa los datos de cinco en cinco y construye la tabla
según el precio: de frecuencias.

Clase Marca de clase


[40, 50) 60 Parámetros estadísticos
[50, 60) 40
[60, 70) 65 15 Calcula la media y la desviación típica de las
siguientes distribuciones:
[70, 80) 82
[80, 90) 120 a) 7, 3, 4, 5, 6, 9, 0, 3, 4, 2, 1
[90, 100) 95 b) 2, 1, 8, 6, 5, 3, 3, 2, 10, 3, 7
[100, 500) 54
Elabora la tabla de frecuencias, sin olvidar las marcas Decide cuál de las dos distribuciones tiene un mayor
de clase. grado de dispersión.

12 En el estudio de una variable continua X se ha 16 Calcula la mediana, los cuartiles y la moda de


obtenido la siguiente tabla de frecuencias que, por des- las distribuciones del ejercicio anterior.
gracia, está incompleta. ¿Serías capaz de completarla en
tu cuaderno?
17 Calcula la media, la desviación típica, el coefi-
Clases Marca xi fi hi pi ciente de variación y los cuartiles de las distribuciones
[0, 10) 0,20 de los ejercicios 6, 7 y 8.
[10, ) 12,5 30 %
[15, 20) 18 Escribe en tu cuaderno una distribución cuya
Total N = 50 media sea 5.

13 En el reconocimiento médico al que se somete 19 Escribe en tu cuaderno una distribución de me-


a los profesores de un pequeño colegio, se han medido diana 4.
sus alturas. Éstos son los resultados obtenidos (en cen-
tímetros): 20 Escribe en tu cuaderno una distribución de me-
dia 0 y mediana 3.
150 152 153 170 172 168
174 171 172 167 163 155
21 Calcula los parámetros estadísticos de la si-
169 175 178 180 174 181 guiente distribución:
Agrupa los datos en intervalos y construye la tabla de
xi 1 2 3 4 5 6 7
frecuencias, que debe incluir marcas de clase, frecuen-
cias absolutas y relativas, y porcentajes. fi 10 5 6 9 4 7 2 215
11
22
EJERCICIOS PROPUESTOS
Calcula la media, la desviación típica, el coefi- 30 El tiempo, en minutos, que un grupo de socios
ciente de variación, la mediana, los cuartiles y la moda de una biblioteca dedica cada día a leer es:
de las distribuciones de los ejercicios 13 y 14.
30 45 11 90 123 67
52 56 60 69 29 89
23 El número de faltas de ortografía cometidas por
un grupo de alumnos en una redacción aparece refleja- 23 145 96 100 126 34
do en la tabla:
a) Agrupa y construye la tabla de frecuencias.

N.º de faltas 0 1 2 3 4 5 b) Halla la media, la desviación típica y el coeficiente de


variación.
N.º de alumnos 3 7 8 7 9 6
c) Halla la mediana y la moda.
a) Halla la media, la desviación típica y el coeficiente de d) Halla el primer y tercer cuartiles.
variación. e) ¿Cuál es el percentil de una persona que dedica
b) Halla la mediana y la moda. 60 minutos a leer?
f) Calcula un percentil que no coincida con ninguno de
c) Halla los cuartiles.
los cuartiles.

24 Dada la distribución 2, 4, 5, 8, 2, 1, 0, calcula su


media. A continuación, suma un valor constante a todos
los datos de la distribución anterior y calcula la media de
estos nuevos datos. ¿Qué observas?
lio
Ju rne
Ve
25 Sea x– la media de una distribución de datos.
Prueba que si a cada uno de los datos de esta distribu-
ción le sumamos una constante k, la media de la nueva
distribución es x– + k.

26 Halla los cuartiles y los percentiles p10 y p30 para


la distribución del ejercicio 11.
31 El peso medio de los corredores de fondo de
un club de atletismo es 55 kg, y su desviación típica es
27 Copia en tu cuaderno y completa la tabla sa- 2,5 kg. Por otra parte, el peso medio de las corredoras
biendo que x– = 1,75. es 49 kg y la desviación típica es 2,1 kg. Compara la dis-
persión de los pesos de ambos grupos.
xi 0 1 2 3 4
fi 2 3 1 2

28 Calcula la media, la mediana y la moda de la


distribución del ejercicio 11.

29 Halla la media, la desviación típica, la mediana


y la moda de la siguiente distribución:

Intervalos [0 ,2) [2, 4) [4, 6)


216 Frecuencia 10 5 6
Gráficos estadísticos 35 Una clínica médica que ofrece consultas de
distintas especialidades, anota el número de perso -
32 En una población de 30 familias se ha estudiado nas que acude a cada una de ellas una mañana concre-
el número de móviles de cada una de ellas. Los datos ta.
recopilados son los siguientes:

2 3 0 4 1 Especialidad N.º de personas


5 1 2 2 3 Medicina general 30
3 4 6 3 2
Neumología 15
3 2 1 2 5
Neurología 14
2 2 0 1 3
6 2 1 2 6 Ginecología 18
a) Construye en tu cuaderno la tabla de frecuencias de Medicina interna 7
esta distribución.
Radiología 20
b) Traza el diagrama de barras.
c) Elabora el polígono de frecuencias.
d) Calcula la media y la desviación típica. a) Confecciona un diagrama de sectores para esta dis-
tribución.
e) Halla la mediana y la moda.
b) ¿Qué tanto por ciento de personas acuden a Medici-
f) Calcula los cuartiles Q1 y Q3. na general o a Radiología?

33 Hemos preguntado a un grupo de personas 36 Representa en tu cuaderno las distribuciones


cuánto tiempo dedican semanalmente a la práctica de de los ejercicios 13 y 14.
algún tipo de ejercicio físico. Éstos son los resultados
obtenidos:
37 Analiza el histograma siguiente:
N.º de horas N.º de personas
[0, 1) 6 Frecuencia
[1, 2) 13 20
[2, 3) 20 18
16
[3, 4) 18
14
[4, 5) 120 12
[5, 8) 9 10
8
a) Construye en tu cuaderno la tabla de frecuencias 6
correspondiente. 4
b) Dibuja el histograma asociado. 2
0
c) Halla la media y la desviación típica. 10 20 30 40 50 60

d) Halla la mediana y la moda.


e) ¿Qué porcentaje dedica menos de dos horas al ejer- a) Elabora la tabla de frecuencias asociada a este histo-
cicio físico? grama.
b) Calcula la media y la desviación típica. ¿Cuál es el
coeficiente de variación?
34 Construye en tu cuaderno el histograma aso-
ciado a los datos de los ejercicios 29 y 30. c) Halla los cuartiles Q1 y Q3. 217
11 PARA REPASAR
EN GRUPO
Elabora con tu grupo de trabajo un esquema con los siguientes conceptos
de la Unidad y pon un ejemplo de cada uno de ellos.

CONCEPTO DEFINICIÓN
Población Conjunto de individuos sometidos a estudio.
Muestra Es una parte de la población.
Carácter estadístico Rasgo de una población que nos interesa estudiar.
Conjunto de valores que toma un carácter. Se dividen en
Variable estadística
cuantitativas y cualitativas.
Frecuencia absoluta Número de veces que se repite un valor determinado.

Marca de clase Valor central de cada intervalo de valores.


n
fi xi
Media aritmética
x– = i=1

N
n n
fi (xi – x–)2 fi xi2
Varianza Var = σ =
2 i=1
= i=1

CD – –x2 N N
En la pestaña Actividades/ Desviación típica σ = Var ≥ 0
Unidad 11, encontrarás la
actividad Relación 1 unidad 11,
Coeficiente σ
para repasar los conceptos más Es el cociente CV = – .
importantes de la unidad. de variación x

Si la variable es discreta, es el valor con mayor frecuencia. Si


CD Moda la variable es continua, es la marca de clase del intervalo de
En la pestaña Mapa del CD/ mayor frecuencia.
Unidad 11, encontrarás el Test
de autoevaluación. La mediana es el valor que divide los datos de una
Mediana distribución en dos partes iguales.
CD Son formas sencillas de representar las frecuencias de
En la pestaña Mapa del Gráficos una variable estadística. Algunos tipos de gráficos son
CD/Juegos matemáticos, estadísticos los diagramas de barras, los polígonos de frecuencias, los
encontrarás la Animación de
Estadística. diagramas de sectores y los histogramas.

218
CURIOSIDADES,
JUEGOS Y DESAFÍOS
El desconocimiento de la teoría estadística conduce, en muchas ocasiones, Sabías que...
a que amplios sectores de la población den por buenas conclusiones que, Edward H. Simpson, Karl
aunque a simple vista parecen correctas, son erróneas. Pearson, Udny Yule, además
de otros, describieron este
Un buen ejemplo lo encontramos en un fenómeno denominado la paradoja fenómeno.
de Simpson, también conocido como efecto Yule-Simpson. Este fenómeno apa-
rece con frecuencia en estudios estadísticos de la Medicina, la Sociología, etc.
Un caso real, y muy conocido, que ilustra la paradoja de Simpson tuvo lugar
cuando una prestigiosa universidad estadounidense fue demandada por
discriminación contra las mujeres que solicitaban ingreso. Las cifras sobre
admisión en el otoño de 1973 mostraban que el porcentaje de admisión era
favorable a los hombres y, siendo la diferencia notable, se juzgó que no se
debía al azar.

N.º de solicitantes % admitidos


Hombres 8 442 44 %
Mujeres 4 321 35 %

Sin embargo, al examinar las solicitudes distinguiendo los distintos depar-


tamentos, se observaba que ninguno discriminaba significativamente a las
mujeres y que, de hecho, la mayor parte de los departamentos favorecía,
en todo caso, a las mujeres.

Hombres Mujeres
Departamentos Solicitantes % admitidos Solicitantes % admitidos
A 825 62 % 108 82 %
B 560 63 % 25 68 %
C 325 37 % 593 34 %
D 417 33 % 375 35 %
E 191 28 % 393 24 %
F 272 6% 341 7%

La explicación resulta ser que las mujeres tendían a presentar solicitudes


en departamentos con bajos porcentajes de admisión, mientras que la ten-
dencia de los hombres era la contraria.
Al dividir los datos en especialidades, hemos introducido unas variables
(lurking variables, en la literatura científica) que, si son omitidas, pueden
conducirnos a una conclusión errónea.
La paradoja de Simpson pone de manifiesto que debemos ser precavidos
cuando hagamos deducciones basándonos en la asociación de dos varia-
bles. Es imprescindible tener en cuenta las lurking variables si se pretende
establecer relaciones de causa y efecto.

DESAFÍO MATEMÁTICO
Trata de encontrar una situación real que ponga de manifiesto la paradoja de
Simpson. Si lo necesitas, pide ayuda a tu profesor. 219

También podría gustarte