Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Índice: T2. Distribuciones Unidimensionales

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 8

T2.

DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS


671 227 871

ÍNDICE

T2. DISTRIBUCIONES UNIDIMENSIONALES ........................................................... 2


2.1. Distribución o distribución de frecuencias ......................................................... 2
2.2. Definiciones ........................................................................................................ 2
2.3. Tipos de distribuciones de frecuencias .............................................................. 3
2.4. Elaboración de tablas de frecuencias en distribuciones de tipo II ..................... 3
2.5. Elaboración de tablas de frecuencias no unitarias en distribuciones de
frecuencias unidimensionales con datos agrupados en intervalos .......................... 4
2.6. Representación grafica de las distribuciones .................................................... 5

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

T2. DISTRIBUCIONES UNIDIMENSIONALES

2.1. Distribución o distribución de frecuencias


Se denomina distribución o distribución de frecuencias al conjunto de valores que toma una variable, adecuadamente
ordenados (de menor a mayor o viceversa) y acompañado de sus frecuencias absolutas. La anotación más habitual
es:

X (mayúscula): la variable o característica objeto de estudio.


xi (minúscula): el valor que toma la variable o característica X para el individuo i.
r: el número de valores distintos que toma una variable, se utiliza también el símbolo “k”
ni: el nº de veces o frecuencia con la que aparece un determinado valor xi.
N: el nº de unidades en las cuales efectuamos la medición o disponemos de datos.
n: el total de datos referidos a una muestra de dicha población.

2.2. Definiciones
Frecuencia absoluta ni : es es el nº de veces que se presenta un valor (si es una variable) o un carácter o
modalidad (si es un atributo) en la población analizada. Siendo ∑ ni = N.
Frecuencia total o total de datos N : es la suma de todas las frecuencias absolutas, el nº de datos que tenemos
en la distribución.

Frecuencia relativa fi : es la frecuencia absoluta dividida por el tamaño muestral.


Se representa por fi, siendo la suma de todas las frecuencias relativas siempre 1.
∑ fi = 1 y fi = ni /n

Porcentaje (de la modalidad xi). Viene dada por el producto pi = fi ·100.

Frecuencia absoluta acumulada Ni : es la frecuencia absoluta de dicho valor más la suma de las frecuencias
absolutas de todos los valores anteriores, es necesario que la distribución este previamente ordenada.

Frecuencia relativa acumulada Fi : la suma de las frecuencias relativas f i de dicho valor y de los valores
inferiores a él.

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

EJEMPLO: Variable de estudio la estatura.


Consideraremos una población de 150 alumnos de estadística. Extraemos de la misma una muestra de 6 alumnos
que llamaremos “n” (siendo n el tamaño muestral). Como n=6, tenemos 6 observaciones (o 6 datos) de nuestra
variable. Que son los siguientes: (1’77, 1’65, 1’65, 1’84, 1’82, 1’75).

A partir de aquí construiremos la tabla, colocando en la misma la variable “X” con sus respectivos valores “x1, x2,…”.
¡OJO!: en la tabla representamos los valores de la variable, no los datos u observaciones. En nuestro caso, tenemos
5 valores diferentes de la variable.

La tabla del ejemplo sería:

X = altura. ni fi Ni Fi
x1 = 1’65 n1 = 2 f1 = 2/6 2 2/6
x2 = 1’75 n2 = 1 f2 = 1/6 3 3/6
x3 = 1’77 n3 = 1 f3 = 1/6 4 4/6
x4 = 1’82 n4 = 1 f4 = 1/6 5 5/6
x5 = 1’84 n5 = 1 f5 = 1/6 6 6/6 = 1
∑ni = n = 6 ∑fi = 1

2.3. Tipos de distribuciones de frecuencias


• Tipo I o distribuciones unitarias: los valores no se repiten en ningún caso. Se denominan distribuciones

• Tipo II: cada valor de la característica medida se repite un determinado número de veces.

• Tipo III: cuando trabajamos con variables continuas o con variables discretas que presentan una gran
cantidad de valores, resulta conveniente agrupar estos valores en intervalos o clases.

2.4. Elaboración de tablas de frecuencias en distribuciones de tipo II


• Ordenación de los datos: de menor a mayor o de mayor a menor en el caso de ser valores y en orden
alfabético o el que se considere más adecuado en el caso de modalidades ( excelente, bueno, regular…)
• Recuento de las frecuencias absolutas.
• Construcción de una tabla estadística de frecuencias.

xi ni Ni fi Fi

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

2.5. Elaboración de tablas de frecuencias no unitarias en


distribuciones de frecuencias unidimensionales con datos
agrupados en intervalos

Hemos de tener en cuenta que en algunas ocasiones será necesario construir la tabla de frecuencias agrupando los
posibles valores de la variable en intervalos. Esto sucederá cuando nos encontremos con variables continuas.

La información presentada de esta manera se conoce como información agrupada o intervalos de clase, y
presenta diferentes problemas: elegir el nº de intervalos, decidir y calcular la amplitud de cada intervalo…

Definiciones:

Límite inferior de clase es el valor numérico más pequeño que puede formar parte de aquella clase definida por
un intervalo. Se representa como Li-1.
Límite superior de clase : por el valor más grande. Se representa por Li.

Marca de clase: es el punto medio del intervalo de clase, es decir, su centro. Se representa por xi o mi
Xi = mi = (Li-1+ Li)/2.

Amplitud de clase (o amplitud de intervalo): es la diferencia entre el límite superior y el inferior. Se representa
por Ci . Ci = Li- Li-1.

Para cada intervalo la frecuencia absoluta acumulada consiste en contar las unidades que hay en la categoría y
sumar las que hay en categorías inferiores. La definición es análoga para frecuencia relativa.

Densidad de frecuencia del intervalo es la frecuencia absoluta dividida por la amplitud. Se representa por di.
di = ni/ Ci.

Li: límite superior del intervalo


Li-1: límite inferior del intervalo
Ci: amplitud del intervalo = Li – Li-1
Xi = mi : marca de clase del intervalo
c
m i
= x i
= L i −1
+
2
i

Los intervalos pueden ser abiertos y cerrados por algunos de sus extremos o por ambos.

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

EJEMPLO:

Li-1 -Li Ci Xi ni fi Ni Fi di
145-150 150-145 = 5 147’5 20 0.2 20 0.2 4
150-160 160-150 = 10 155 40 0.4 60 0.6 4
160-180 180-160 = 20 170 40 0.4 100 1 2
100 1

¡OJO! En el anterior ejemplo observamos que la frecuencia absoluta puede llevarnos a interpretaciones
erróneas, esto es debido a que en el intervalo tenemos muchas más observaciones. La densidad de
frecuencia (di) se encarga de recoger los posibles errores derivados de la existencia de intervalos de
diferente amplitud.

2.6. Representación grafica de las distribuciones


• Gráficos de barras. Se emplean para variables discretas en distribuciones de frecuencias con datos sin agrupar.
Los valores de las variables en el eje de abscisas y en el de ordenadas la frecuencia absoluta o relativa. También
se conocen como diagramas de rectángulos, todas las barras tienen la misma base y sus áreas son
proporcionales a las frecuencias absolutas ni.

Se construye colocando las distintas modalidades de la variable cualitativa sobre el eje de abscisas y sobre cada
una de ellas se levanta un rectángulo de igual base y altura igual a su frecuencia (absoluta o relativa).

ni ó Fi n
9
8
7
6
5
4
3
2
1
0 Xi
1 2 3 4 5

10
8
6
ni

4
2
0
1 2 3 4 5
Xi

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

• Histogramas. Son un tipo especial de grafico de barras que suele utilizarse para ver los datos agrupados. Cada
rectángulo representa una clase, la base será igual a la amplitud del intervalo y el área del rectángulo será la
frecuencia de cada clase.

Se construye representando sobre las abscisas cada uno de los intervalos asociados a la variable y sobre cada
uno de esos intervalos se levanta con área igual (proporcional) a la frecuencia de dicho intervalo.

hi = altura de Ii en el histograma
Salarios ni
Ar = b×alt.
Ni = ai × hi ( 0, 10] 13
ni f (10,20] 15
hi = ; hi = i (20,30] 20
ai ai
(30,40] 8
(40,50] 4

25
20
15
10
5
0
(0, 10] (10, 20] (20, 30] (30, 40] (40, 50]

• Polígono de frecuencias. Se utilizan para representar tablas de frecuencia asociadas a las distribuciones de
datos cuantitativos de Tipo II. Se formara uniendo los puntos que representan las frecuencias mediante
segmentos de tal manera que el punto con mayor altura representa la mayor frecuencia, el área bajo la curva
representara el 100% de los datos. En las distribuciones de Tipo III los puntos en el eje de abscisas
corresponderán a las marcas de clase de los intervalos.

o Caso agrupado en intervalos y frecuencias no acumuladas

1º Se construye el histograma.
2º Sobre este se unen los puntos medios de la base superior del rectángulo y uniéndolos mediante una
poligonal

Para variables continuas:

25
20
15
10
5
0
(0, 10] (10, 20] (20, 30] (30, 40] (40, 50]

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

o Caso agrupado en intervalos y frecuencias acumuladas

Se construye marcando los extremos de los intervalos en el eje de abscisas y las frecuencias acumuladas
(relativas o absolutas) con la marca en el eje y.

Ni ó Fi

Fk

F3
F2

F1
xi
e1 e2 e3 .....ek-1 ek

• Gráficos de sectores. Se utilizan para mostrar las contribuciones relativas de cada punto de los datos al total de
la serie. solo se representa una serie. El área de cada sector es proporcional a las frecuencias absolutas de cada
modalidad.

Sirve para variables cualitativas no agrupadas. Se construye repartiendo el área del círculo en sectores de
tamaño proporcional a la frecuencia de cada modalidad. Hay tantos sectores como valores de la variable y los
ángulos se calculan de forma proporcional a las frecuencias relativas de cada sector:
α = fi ⋅ 360º

Color de pelo
Moreno
60%
Otros Rubio
15% 25%

• Gráficos de series temporales: se representan los valores ordenados según la secuencia temporal, la cual
figura en el eje de abscisas y los valores obtenidos en el eje de coordenadas.

WWW.ADEFACIL.COM
T2. DISTRIBUCIONES UNIDIMENSIONALES ELENA GONZALO NOGUÉS
671 227 871

• Diagrama de Pareto. Está basado en el principio de Pareto, aplicado a la mala distribución de la riqueza. El
objetivo de la representación grafica es permitir visualizar de forma rápida los problemas o datos más
significativos, que quedan a la izquierda de la grafica, a medida que se avanza hacia la derecha se van situando
los de menor interés. Se realiza mediante dos pasos:

- Se ordenan las clases o categorías según la frecuencia relativa de su aparición.


- Cada clase se representa por un rectángulo con una altura igual a la frecuencia relativa.

Representa los valores de la variable en el eje de abscisas y las frecuencias absolutas en el de ordenadas.

• Diagrama de tallos y hojas. Su utilización será adecuada si el número de datos a representar no es muy
elevado.

Se debe al estadístico TUKEY. Nos permiten ver la simetría, dispersión, así como datos extraños (outlier). Para el
caso de variables discretas procederemos así:

• Pictogramas: Consiste en que se emplean figuras relacionadas con el fenómeno que se está estudiando de
forma que su tamaño (tipo 1) o número (tipo 2) nos indique la frecuencia asociada a cada modalidad. Las figuras
tienen un tamaño proporcional a la frecuencia en el tipo 1.
Tipo de viviendas ni
Casas 200
Apartamentos 400
Pisos 600

Casas Apartamentos Pisos

El segundo tipo de pictograma sería el siguiente:

Casas: (200)

Apartamentos: (400)

Pisos: (600)

WWW.ADEFACIL.COM

También podría gustarte