¿Recuerdas Qué Es ?: Intervalo
¿Recuerdas Qué Es ?: Intervalo
¿Recuerdas Qué Es ?: Intervalo
Intervalo
El intervalo semiabierto por la
derecha [a, b) es el conjunto de
todos los números reales mayores
o iguales que a y menores que b.
[a, b) = {x R| a ≤ x < b}
Estudio estadístico
y variable estadística
Se hace un estudio estadístico
cuando se quiere obtener
información sobre algún tema
relacionado con un grupo de
elementos similares.
La información se obtiene a partir
de una pregunta llamada
variable estadística.
Parámetros estadísticos
Son valores que sintetizan la
información contenida en una
variable estadística. Algunos
de ellos son la media, la mediana,
la moda, la desviación típica,
etcétera.
11
TÍTULAR (PUEDE SER
DE DOS LÍNEAS)
ESTADÍSTICA
Los objetivos
(Objetivos o contenidos)
de esta Unidad son:
Los objetivos de esta Unidad son:
• Dominar los conceptos elementales
©deQue
la Estadística
aprendas a descriptiva.
determinar la constante
de proporcionalidad.
• Aplicar las técnicas y cálculos estadísticos
a un conjunto de datos.
00. La Tierra
A. Los movimientos de la Tierra
11 1 NOCIONES DE ESTADÍSTICA
Supón, a modo de ejemplo, que deseamos estimar el tiempo que puede so-
brevivir una determinada especie vegetal sin ser regada. No parece razonable
dejar sin agua a todas las plantas de esa especie, pero sí se puede seleccionar
un grupo de éstas y someterlas a esta prueba. Pues bien, el conjunto de todas
las plantas de esa especie se denomina población, y el grupo de plantas que
se somete a la prueba se denomina muestra. Del estudio de la muestra se
pretende obtener conclusiones referidas al total de la población.
Ejercicios
1 Pon dos ejemplos de carácter estadístico cua- 3 Pon dos ejemplos de variable discreta, e in-
litativo y dos de carácter estadístico cuantitativo. dica los valores aislados que pueden tomar.
2 A unos alumnos se les pregunta por el depor- 4 Piensa en dos ejemplos de variable continua,
te que practican. ¿Es un carácter cuantitativo? e indica los valores que pueden tomar.
202
2 TABLAS DE FRECUENCIAS
El primer problema de la Estadística es la ordenación y tabulación de los da- Definición
tos obtenidos en ciertas observaciones para extraer conclusiones sobre las El conjunto de datos obtenidos
características de una población. Las tablas de frecuencia de una variable en un estudio estadístico se
estadística permiten ordenar los datos estadísticos y proporcionar una lectura llama distribución de datos.
clara de los mismos. Distinguiremos dos tipos de tablas.
abrevia como fi .
— Tamaño de la población: es N = f1 + f2 + ... + fn = fi . i=1
i=1
Ejemplo 1
A un grupo de 20 socios de una biblioteca se les ha preguntado sobre el número de libros que
han leído el mes pasado. Las respuestas son las siguientes:
4, 2, 1, 0, 3, 1, 4, 2, 0, 2, 1, 1, 2, 1, 2, 4, 3, 4, 1, 2.
El tamaño de la población es N = 20, y la tabla de frecuencias queda así:
xi fi hi pi
0 2 2/20 = 0,1 10%
1 6 6/20 = 0,3 30%
2 6 6/20 = 0,3 30%
3 2 2/20 = 0,1 10%
4 4 4/20 = 0,2 20%
Total N = 20 1 100%
Ejercicios
Ten en cuenta El punto medio de cada clase se denomina marca de clase y se designa
Los intervalos suelen ser como xi.
del mismo tamaño, aunque
no siempre es así.
Una vez distribuidos los datos en intervalos y calculadas las marcas de clase,
el modo de proceder es análogo al de las variables discretas, sustituyendo la
totalidad del intervalo por su marca de clase.
Ejercicios
Ejemplo 3
xi fi fi xi
En la distribución del margen se ha añadido una columna con 0 2 0
los valores de los productos fixi, lo que facilita el cálculo de la
n 26 1 5 5
media. Como N = 15 y fi xi = 26, la media es x– = 1,73... 2 5 10
i=1 15
3 1 3
4 2 8
n n Total N = 15 26
–2
fi (xi – x) fi xi2
La varianza de X es Var = 2
= = i=1 i=1
– x– 2 ≥ 0
N N
La desviación típica de X es = Var ≥ 0.
Ejemplo 4 xi fi fi xi fi xi2
0 2 0 0
A partir de la distribución del ejemplo 3, multiplicando la columna
1 5 5 5
xi por la columna fixi obtenemos fi xi2, lo que nos permite calcular:
n
2 5 10 20
f i xi 2 2
3 1 3 9
66 26
– x– 2 =
i=1
Var = – 1,3955... 4 2 8 32
N 15 15
Total N = 15 26 66
= Var = 1,3955... = 1,1813...
205
11
Ten en cuenta
B COEFICIENTE DE VARIACIÓN
La desviación típica representa una medida de la dispersión de los datos
respecto a la media. Ahora bien, como media y desviación típica tienen uni-
dades, el que la desviación sea «grande» o «pequeña» es poco relevante si
se desconoce lo «grande» o «pequeña» que es la media. En particular, la des-
El coeficiente de variación viación típica por sí sola no permite comparar grados de dispersión de dos
es una magnitud sin unidades distribuciones de datos. Para resolver este problema, se define el coeficiente
y representa una medida de variación (o de dispersión).
relativa de la dispersión.
Ejemplo 5
Ejercicios
En una tabla de frecuencias, la frecuencia acumulada asociada a xi, repre- Ten en cuenta
sentada como Fi, es la suma Fi = f1 + f2 + … + fi. El valor de Fi es la suma de Fn = N
las frecuencias absolutas de x1, x2, … y xi.
Ejemplo 6
Ejemplo 7
Ejemplo 8
Ejercicios
Altura xi fi Fi Ejemplo 9
[0, 20) 10 12 12
La tabla del margen proporciona la altura, en centímetros, de las
[20, 40) 30 16 28
plantas de un invernadero.
[40, 60) 50 20 48
N
[60, 80) 70 4 52 La mitad de la población es = 26, por lo que la clase mediana
2
N
es [20, 40), con Fi = 28 > .
2
La mediana es la marca de clase de [20, 40), esto es, Me = 30 cm.
Ejemplo 10
xi fi Fi
0 3 3 Consideramos la distribución: 0, 1, 3, 0, 2, 1, 0, 2, 4, 2. Al elaborar
1 2 5 la tabla de frecuencias, situada al margen, se observa que los va-
lores 0 y 2 tienen frecuencia 3, que es la mayor de todas. Por tanto,
2 3 8 la distribución tiene dos modas: M0 = 0 y M0 = 2.
3 1 9 N
4 1 10 Respecto a la mediana, teniendo en cuenta que = 5 coincide
2
N = 10 con la frecuencia absoluta acumulada F2 de x2 = 1, se sigue que:
x2 + x3 1+2
Me = = = 1,5
2 2
Ejercicios
14 Halla la mediana y la moda de las distribucio- 16 Halla la mediana y la moda de las distribucio-
nes de los ejercicios 7 y 8. nes A y B asociadas al ejemplo 5.
15 Calcula la media, la mediana y la moda de la 17 Inventa una distribución de datos con media-
distribución: 3, 7, 5, 4, 3, 3, 6, 8, 10, 9. na 2 y moda 3.
208
D CUARTILES Y CENTILES
Anteriormente se ha comentado que, tras ordenar los datos, la mediana divide
éstos es dos partes iguales, dejando a su izquierda la mitad de los datos. Si
en vez de dividir la distribución en dos partes iguales, lo hacemos en cuatro
partes iguales, los tres puntos de separación asociados se denominan cuar-
tiles y se representan por Q1, Q2 y Q3.
— El primer cuartil, Q1, deja a su izquierda la cuarta parte de la distribución,
es decir, el 25 %.
— El segundo cuartil, Q2, deja a su izquierda la mitad de la distribución y, por
tanto, coincide con la mediana, es decir, Q2 = Me.
— El tercer cuartil, Q3, deja a su izquierda tres cuartas partes de la distribución,
es decir, el 75 %.
De la misma forma, si deseamos dividir una distribución en 100 partes iguales,
aparecen 99 puntos de separación denominados centiles o percentiles. El
percentil de orden k, representado como pk, deja a su izquierda k centésimas
partes de la distribución.
Se verifica: p25 = Q1, p50 = Q2 = Me y p75 = Q3.
Clase fi Fi
Ejemplo 11 1 1 1
2 2 3
Consideramos la distribución definida por la tabla del margen. 3 5 8
Vamos a calcular Q1, Q 2, Q 3 y P 7, 4 10 18
31 5 4 22
La cuarta parte de los datos es = 7,75. 6 6 28
4
El primer valor cuya frecuencia absoluta acumulada supera la 7 3 31
cuarta parte de los datos es 3. Luego Q1 = 3. Total 31
La mitad de los datos es 15,5, de donde se desprende que la
mediana es Me = Q 2 = 4.
31
Por último, las tres cuartas partes de los datos son 3 · = 23,25, Ten en cuenta
4
por lo que se tiene Q 3 = 6. En realidad, los cuartiles y
percentiles así calculados son
Veamos ahora cómo calcular, a modo de muestra, el percentil sólo aproximados. El cálculo
p7. Siete centésimas partes de los datos son 7 % de 31 = 2,17. El exacto es algo más complejo.
primer valor cuya frecuencia absoluta acumulada supera 2,17
es 2. Por tanto, p7 = 2.
WEB
En el caso de las distribuciones con datos agrupados en intervalos, los cuartiles
se calculan de modo totalmente análogo a como se hace con la mediana. http://www.aulademate.com/
contentid-255.html
Por ejemplo, para calcular Q1 se busca el primer intervalo cuya frecuencia Página interactiva, al introducir
los valores de la variable y
absoluta acumulada supera la cuarta parte de los datos. Hallado éste, se iden- sus frecuencias, el programa
tifica Q1 con su marca de clase. Análogamente, se repite el mismo proceso construye una tabla y calcula
para Q3. los parámetros estadísticos.
Ejercicios
18 Halla los cuartiles Q1 y Q3 para las distribucio- 19 Halla los percentiles p65 y p93 para la distribu-
nes de los ejercicios 7 y 8. ción del ejemplo 11.
209
11 4 GRÁFICOS ESTADÍSTICOS
Los gráficos son formas sencillas de representar las frecuencias absolutas y
relativas de una distribución de datos asociada a cierto estudio estadístico.
Según sea la variable que vamos a estudiar, se emplea uno u otro tipo de
gráficos.
A DIAGRAMA DE BARRAS
Los diagramas de barras se emplean, generalmente, para variables cuanti-
tativas con pocos valores diferentes. En unos ejes de coordenadas, señalamos
los valores de la variable en el eje de abscisas. Tras esto, sobre cada valor de la
variable se levanta una barra cuya altura sea la frecuencia (absoluta o relativa,
Frecuencia
11 según proceda) correspondiente.
10
9 Ejemplo 12
8
Hemos preguntado a 36 parejas el número de veces que salen
7
a comer o cenar fuera mensualmente. Los datos aparecen re-
6
cogidos en la tabla:
5
4 N.º de veces que salen 1 2 3 4 5 6
3
N.º de parejas 3 9 2 8 10 4
2
1 El diagrama de barras asociado a esta distribución es el del
0 margen.
1 2 3 4 5 6 Valor
B POLÍGONO DE FRECUENCIAS
Frecuencia Al igual que los diagramas de barras, los polígonos de frecuencias se asocian
11
a variables de pocos valores. En unos ejes de coordenadas se representa un
10
punto por cada valor de la variable. La abscisa de cada punto representa el
9 valor de la variable, mientras que la ordenada representa la frecuencia. Unien-
8 do estos puntos mediante segmentos rectilíneos se obtiene el denominado
7 polígono de frecuencias.
6
Es bastante habitual la representación conjunta del diagrama de barras y el
5
polígono de frecuencias.
4
3
Ejemplo 13
2
1 El gráfico del margen es el polígono de frecuencias de la dis-
0 tribución del ejemplo 12.
1 2 3 4 5 6 Valor
Ejercicios
Ejemplo 14
Los 500 empleados de una oficina acuden al trabajo en distintos medios de transporte.
D HISTOGRAMA
El histograma se emplea con variables cuantitativas de datos agrupados en
intervalos. Asumiendo que éstos son de igual longitud, sobre cada uno se
levanta un rectángulo cuya altura es la frecuencia del intervalo correspon-
diente.
Ejemplo 15
Pedro ha hecho un recuento del número de personas que viven en cada una de las calles de
un barrio de su pueblo. Los resultados aparecen agrupados en la tabla, y el histograma es:
Frecuencia
6
Personas fi
5
[50, 55) 3 4
[55, 60) 2 3
[60, 65) 5 2
1
[65, 70) 4 0
Total 14 50 55 60 65 70
Número de personas por calle
Ejercicios
211
11 EJERCICIOS RESUELTOS
1 Un jardinero revisa los rosales de su invernadero y anota las alturas
de los mismos, representando los datos obtenidos en este histograma.
Halla la media, la desviación típica, la mediana y la moda de la distribu-
ción de alturas.
Frecuencia absoluta
12
11
10
9
8
7
6
5
4
3
2
1
0
20 40 60 80 100 120
Altura de los rosales en cm
Altura xi fi fi xi fi xi2 Fi
[20, 40) 30 10 300 9 000 10
[40, 60) 50 8 400 20 000 18
[60, 80) 70 12 840 58 800 30
[80, 100) 90 5 450 40 500 35
[100, 120) 110 7 770 84 700 42
Total N = 42 2 760 213 000
La clase modal es [60, 80), con frecuencia fi = 12. Por tanto, la moda, que es la
marca de clase de [60, 80), es M0 = 70 cm.
N
Respecto a la mediana, observa que la mitad de la población es = 21. La
N 2
primera clase que supera = 21 es también [60, 80), por lo que Me = 70 cm.
2
n
fi xi
2 760
Por último, la media es x–
i=1
= = 65,71 cm, y la varianza es:
N 42
n
2
fi xi 2
213 000 2 760
– x–2 =
2 i=1
– 753,623 cm2, por lo que se tiene que
N 42 42
la desviación típica es:
2
= 753,623 27,452 cm.
Venta de lavadoras
2 7 8 10 9 2 Los datos del margen corresponden a la venta de lavadoras de un
17 13 5 14 16 establecimiento cada día del último mes.
12 20 14 9 10 a) Calcula el número medio de lavadoras vendidas en este periodo.
19 4 6 16 15
18 12 17 22 0 b) Halla la moda.
212 22 0 24 13 7 c) Halla la mediana, así como el primer y el tercer cuartiles.
Lavadoras xi fi fi xi Fi
vendidas por día
[0, 5) 2,5 4 10 4
[5, 10) 7,5 7 52,5 11
[10, 15) 12,5 8 100 19
[15, 20) 17,5 7 122,5 26
[20, 25) 22,5 4 90 30
Total 375
a) Puesto que los datos varían entre 0 y 24, para elaborar la tabla de frecuencias
parece razonable distribuirlos en las clases [0, 5), [5, 10), [10, 15), [15, 20) y
[20, 25). A la vista de la tabla de frecuencias, la venta media de lavadoras es:
n
fi xi
375
x– =
i=1
= = 12,5
N 30
b) La clase modal es [10, 15), con frecuencia 8. Por tanto, la moda es
M0 = 12,5.
c) El número de datos es 30, y su mitad es 15. La clase mediana es [10, 15), ya
que su frecuencia absoluta acumulada excede por primera vez la mitad
de los datos. Tomamos como aproximación de la mediana la marca de
esta clase, Me = 12,5.
La cuarta parte de los datos es 7,5. La clase que contiene el primer cuartil
es [5, 10), ya que su frecuencia absoluta acumulada excede por vez primera
la cuarta parte de los datos. Luego el primer cuartil es la marca de [5, 10),
es decir, Q1 = 7,5. Análogamente se halla Q3 = 17,5.
Categoría fi pi Grados
Ancianos Niños
Niños 50 22 % 79,2º 18 % 22 %
Jóvenes 75 33 % 118,8º
Adultos 60 27 % 97,2º Adultos
27 % Jóvenes
Ancianos 40 18 % 64,8º 33 %
Total 225 100 % 360º
CONCEPTO DEFINICIÓN
Población Conjunto de individuos sometidos a estudio.
Muestra Es una parte de la población.
Carácter estadístico Rasgo de una población que nos interesa estudiar.
Conjunto de valores que toma un carácter. Se dividen en
Variable estadística
cuantitativas y cualitativas.
Frecuencia absoluta Número de veces que se repite un valor determinado.
N
n n
fi (xi – x–)2 fi xi2
Varianza Var = σ =
2 i=1
= i=1
CD – –x2 N N
En la pestaña Actividades/ Desviación típica σ = Var ≥ 0
Unidad 11, encontrarás la
actividad Relación 1 unidad 11,
Coeficiente σ
para repasar los conceptos más Es el cociente CV = – .
importantes de la unidad. de variación x
218
CURIOSIDADES,
JUEGOS Y DESAFÍOS
El desconocimiento de la teoría estadística conduce, en muchas ocasiones, Sabías que...
a que amplios sectores de la población den por buenas conclusiones que, Edward H. Simpson, Karl
aunque a simple vista parecen correctas, son erróneas. Pearson, Udny Yule, además
de otros, describieron este
Un buen ejemplo lo encontramos en un fenómeno denominado la paradoja fenómeno.
de Simpson, también conocido como efecto Yule-Simpson. Este fenómeno apa-
rece con frecuencia en estudios estadísticos de la Medicina, la Sociología, etc.
Un caso real, y muy conocido, que ilustra la paradoja de Simpson tuvo lugar
cuando una prestigiosa universidad estadounidense fue demandada por
discriminación contra las mujeres que solicitaban ingreso. Las cifras sobre
admisión en el otoño de 1973 mostraban que el porcentaje de admisión era
favorable a los hombres y, siendo la diferencia notable, se juzgó que no se
debía al azar.
Hombres Mujeres
Departamentos Solicitantes % admitidos Solicitantes % admitidos
A 825 62 % 108 82 %
B 560 63 % 25 68 %
C 325 37 % 593 34 %
D 417 33 % 375 35 %
E 191 28 % 393 24 %
F 272 6% 341 7%
DESAFÍO MATEMÁTICO
Trata de encontrar una situación real que ponga de manifiesto la paradoja de
Simpson. Si lo necesitas, pide ayuda a tu profesor. 219