Índice: T2. Distribuciones Unidimensionales
Índice: T2. Distribuciones Unidimensionales
Índice: T2. Distribuciones Unidimensionales
ÍNDICE
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
2.2. Definiciones
Frecuencia absoluta ni : es es el nº de veces que se presenta un valor (si es una variable) o un carácter o
modalidad (si es un atributo) en la población analizada. Siendo ∑ ni = N.
Frecuencia total o total de datos N : es la suma de todas las frecuencias absolutas, el nº de datos que tenemos
en la distribución.
Frecuencia absoluta acumulada Ni : es la frecuencia absoluta de dicho valor más la suma de las frecuencias
absolutas de todos los valores anteriores, es necesario que la distribución este previamente ordenada.
Frecuencia relativa acumulada Fi : la suma de las frecuencias relativas f i de dicho valor y de los valores
inferiores a él.
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
A partir de aquí construiremos la tabla, colocando en la misma la variable “X” con sus respectivos valores “x1, x2,…”.
¡OJO!: en la tabla representamos los valores de la variable, no los datos u observaciones. En nuestro caso, tenemos
5 valores diferentes de la variable.
X = altura. ni fi Ni Fi
x1 = 1’65 n1 = 2 f1 = 2/6 2 2/6
x2 = 1’75 n2 = 1 f2 = 1/6 3 3/6
x3 = 1’77 n3 = 1 f3 = 1/6 4 4/6
x4 = 1’82 n4 = 1 f4 = 1/6 5 5/6
x5 = 1’84 n5 = 1 f5 = 1/6 6 6/6 = 1
∑ni = n = 6 ∑fi = 1
• Tipo II: cada valor de la característica medida se repite un determinado número de veces.
• Tipo III: cuando trabajamos con variables continuas o con variables discretas que presentan una gran
cantidad de valores, resulta conveniente agrupar estos valores en intervalos o clases.
xi ni Ni fi Fi
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
Hemos de tener en cuenta que en algunas ocasiones será necesario construir la tabla de frecuencias agrupando los
posibles valores de la variable en intervalos. Esto sucederá cuando nos encontremos con variables continuas.
La información presentada de esta manera se conoce como información agrupada o intervalos de clase, y
presenta diferentes problemas: elegir el nº de intervalos, decidir y calcular la amplitud de cada intervalo…
Definiciones:
Límite inferior de clase es el valor numérico más pequeño que puede formar parte de aquella clase definida por
un intervalo. Se representa como Li-1.
Límite superior de clase : por el valor más grande. Se representa por Li.
Marca de clase: es el punto medio del intervalo de clase, es decir, su centro. Se representa por xi o mi
Xi = mi = (Li-1+ Li)/2.
Amplitud de clase (o amplitud de intervalo): es la diferencia entre el límite superior y el inferior. Se representa
por Ci . Ci = Li- Li-1.
Para cada intervalo la frecuencia absoluta acumulada consiste en contar las unidades que hay en la categoría y
sumar las que hay en categorías inferiores. La definición es análoga para frecuencia relativa.
Densidad de frecuencia del intervalo es la frecuencia absoluta dividida por la amplitud. Se representa por di.
di = ni/ Ci.
Los intervalos pueden ser abiertos y cerrados por algunos de sus extremos o por ambos.
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
EJEMPLO:
Li-1 -Li Ci Xi ni fi Ni Fi di
145-150 150-145 = 5 147’5 20 0.2 20 0.2 4
150-160 160-150 = 10 155 40 0.4 60 0.6 4
160-180 180-160 = 20 170 40 0.4 100 1 2
100 1
¡OJO! En el anterior ejemplo observamos que la frecuencia absoluta puede llevarnos a interpretaciones
erróneas, esto es debido a que en el intervalo tenemos muchas más observaciones. La densidad de
frecuencia (di) se encarga de recoger los posibles errores derivados de la existencia de intervalos de
diferente amplitud.
Se construye colocando las distintas modalidades de la variable cualitativa sobre el eje de abscisas y sobre cada
una de ellas se levanta un rectángulo de igual base y altura igual a su frecuencia (absoluta o relativa).
ni ó Fi n
9
8
7
6
5
4
3
2
1
0 Xi
1 2 3 4 5
10
8
6
ni
4
2
0
1 2 3 4 5
Xi
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
• Histogramas. Son un tipo especial de grafico de barras que suele utilizarse para ver los datos agrupados. Cada
rectángulo representa una clase, la base será igual a la amplitud del intervalo y el área del rectángulo será la
frecuencia de cada clase.
Se construye representando sobre las abscisas cada uno de los intervalos asociados a la variable y sobre cada
uno de esos intervalos se levanta con área igual (proporcional) a la frecuencia de dicho intervalo.
hi = altura de Ii en el histograma
Salarios ni
Ar = b×alt.
Ni = ai × hi ( 0, 10] 13
ni f (10,20] 15
hi = ; hi = i (20,30] 20
ai ai
(30,40] 8
(40,50] 4
25
20
15
10
5
0
(0, 10] (10, 20] (20, 30] (30, 40] (40, 50]
• Polígono de frecuencias. Se utilizan para representar tablas de frecuencia asociadas a las distribuciones de
datos cuantitativos de Tipo II. Se formara uniendo los puntos que representan las frecuencias mediante
segmentos de tal manera que el punto con mayor altura representa la mayor frecuencia, el área bajo la curva
representara el 100% de los datos. En las distribuciones de Tipo III los puntos en el eje de abscisas
corresponderán a las marcas de clase de los intervalos.
1º Se construye el histograma.
2º Sobre este se unen los puntos medios de la base superior del rectángulo y uniéndolos mediante una
poligonal
25
20
15
10
5
0
(0, 10] (10, 20] (20, 30] (30, 40] (40, 50]
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
Se construye marcando los extremos de los intervalos en el eje de abscisas y las frecuencias acumuladas
(relativas o absolutas) con la marca en el eje y.
Ni ó Fi
Fk
F3
F2
F1
xi
e1 e2 e3 .....ek-1 ek
• Gráficos de sectores. Se utilizan para mostrar las contribuciones relativas de cada punto de los datos al total de
la serie. solo se representa una serie. El área de cada sector es proporcional a las frecuencias absolutas de cada
modalidad.
Sirve para variables cualitativas no agrupadas. Se construye repartiendo el área del círculo en sectores de
tamaño proporcional a la frecuencia de cada modalidad. Hay tantos sectores como valores de la variable y los
ángulos se calculan de forma proporcional a las frecuencias relativas de cada sector:
α = fi ⋅ 360º
Color de pelo
Moreno
60%
Otros Rubio
15% 25%
• Gráficos de series temporales: se representan los valores ordenados según la secuencia temporal, la cual
figura en el eje de abscisas y los valores obtenidos en el eje de coordenadas.
WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871
• Diagrama de Pareto. Está basado en el principio de Pareto, aplicado a la mala distribución de la riqueza. El
objetivo de la representación grafica es permitir visualizar de forma rápida los problemas o datos más
significativos, que quedan a la izquierda de la grafica, a medida que se avanza hacia la derecha se van situando
los de menor interés. Se realiza mediante dos pasos:
Representa los valores de la variable en el eje de abscisas y las frecuencias absolutas en el de ordenadas.
• Diagrama de tallos y hojas. Su utilización será adecuada si el número de datos a representar no es muy
elevado.
Se debe al estadístico TUKEY. Nos permiten ver la simetría, dispersión, así como datos extraños (outlier). Para el
caso de variables discretas procederemos así:
• Pictogramas: Consiste en que se emplean figuras relacionadas con el fenómeno que se está estudiando de
forma que su tamaño (tipo 1) o número (tipo 2) nos indique la frecuencia asociada a cada modalidad. Las figuras
tienen un tamaño proporcional a la frecuencia en el tipo 1.
Tipo de viviendas ni
Casas 200
Apartamentos 400
Pisos 600
Casas: (200)
Apartamentos: (400)
Pisos: (600)
WWW.ADEFACIL.COM