Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tema 4 Estadígrafos de Dispersión Def para Enviar

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 15

TEMA No.

4
ESTADÍGRAFOS DE DISPERSIÓN

ESTADÍGRAFOS DE DISPERSIÓN

L1
DISTRIBUCIÓN DE DATOS
L1:Es mas eficiente que L2
L2:Es mas dispersa que L1
L2
CENTRO MITAD “PROMEDIOS”
Los estadígrafos de dispersión son complementarios a los
estadígrafos de posición vistos a en el tema anterior

Los estadígrafos de dispersión son complementarios a los estadígrafos de


posición vistos en el tema anterior. Los estadígrafos de dispersión más utilizados
son:
1) Rango o recorrido de la variable
2) Recorrido intercuartílico
3) Desviación media
4) Varianza
5) Desviación típica o estándar
6) Coeficiente de variabilidad

1) Rango o recorrido de la variable. Este primer estadígrafos son da una idea


inicial del grado de dispersión existente. No es mas que la diferencia entre el
valor máximo y el valor mínimo. Sin embargo tiene una limitación solo toma en
cuenta los dos valores extremos y no nos dice nada acerca del grado de
dispersión de los valores intermedios. Se simboliza por R y se define como:

𝑅 = 𝑌´𝑚 − 𝑌0´
Donde: 𝑌𝑚´ =valor máximo
𝑌0´ =valor mínimo
2) Recorrido Intercuartílico. Este estadígrafo nos muestra la diferencia
existente entre el primer y tercer cuartil. Tiene la ventaja de considerar dos
posiciones intermedios, se simbolizará por DQ y se define como:
𝐷𝑄 = 𝑄3 − 𝑄1
Donde: Q3 = Tercer cuartil (75%)
Q1 = Primer cuartil (25%)

3) Desviación media. Este estadígrafo tiene la ventaja de tomar en cuenta todos


los valores de la variable, sin embargo aún persiste una limitación dado que
trabaja con valores absolutos, ellos significa que no toma en cuenta el signo de
los valores de la variable, se simbolizará por MD y se define como: ∑

𝑖=1
𝑛
∑ |𝑋𝑖− 𝑋|
𝑀𝐷 = 𝑛

4) Varianza. Este estadígrafo supera al anterior dado que presenta suma de


desvíos al cuadrado, ello significa que se toma en cuenta el signo de cada valor
de la variable, no existiendo posibilidad de compensación de valores:

Sin embargo, presenta un nuevo inconveniente, los valores de la variable están


elevados al cuadrado, es decir la varianza es a dimensional y por lo tanto carece
de interpretación.

Z ( X i − X )2
En símbolos, es: 2 = i =1
para datos no agrupados
n

Z (Y − Y ) ni
2
i
2 = i =1
para datos agrupados
n
Ejemplo: 𝜎2 = 7200𝐵𝑠 2 Es a dimensional y carece de
Interpretación

5) Desviación típica o estándar. Es la raíz cuadrada de la varianza. Este


estadígrafo se expresa en la misma unidad que la variable en estudio por lo tanto
puede ser interpretado. Sin embargo, surge un nuevo inconveniente ya que solo
toma en cuenta el grado de dispersión y no nos dice nada acerca de la posición
de la distribución. Se simbolizará por 𝜎 y se define como:

𝜎 = √𝜎 2
6) Coeficiente de variabilidad. Este estadígrafo supera a los anteriores, ya que
combina una medida de posición (media aritmética) con una medida de
dispersión (desviación típica). Se expresa en términos relativos o porcentuales y
es de extrema utilidad sobre todo para comparar dos o mas distribuciones,
mientras más pequeño sea su valor significa que los datos son mas
homogéneos.
𝜎
CV = % Para datos no agrupados
𝑋

𝜎
CV = % Para datos agrupados
𝑌

Ejercicios

Ventas ($us.) Empresas


1000 – 2000 5
2000 – 4000 10
4000 – 6000 14
6000 – 8000 7
8000 - 10000 6
En base al cuadrado anterior se le pide estimar:
a) Media Aritmética
b) Mediana
c) Moda
d) Rango o Recorrido de la variable
e) Primer y tercer cuartil
f) Recorrido Intercuartílico
g) Varianza
h) Desviación típica
i) Coeficiente de variabilidad

a) 𝑌 = 5011.9$𝑢𝑠.
b) 𝑀𝑒 = 4.857,14$𝑢𝑠.
c) 𝑀𝑑4.823,53$𝑢𝑠.
Ventas ($us) Empresas Marca de Clase Media Aritmética Frec. Absoluta Varianza
𝒀´𝒊=𝟏 − 𝒀´ 𝒏𝒊 Y𝒊 m
Acumulada m

Z Yni Z (Y i −1 Y ) 2 ni
Y= i =1 Ni = ∑n𝒊 2 = i =1

n n
1000 – 2000 5 1500 1500(5) 5 (1500 – 5011.9)2*5
2000 – 4000 n𝑘 − 1 =10 3000 3000(10) 15 (3000 – 5011.9)2*10
4000 – 6000 n𝑘 = 14 5000 5000(14) 29 (5000 – 5011.9)2*14
6000 – 8000 n𝑘+1 =7 7000 7000(7) 36 (7000 – 5011.9)2*7
8000 – 10000 6 9000 9000(6) 42 (9000 – 5011.9)2*6

∑𝑛𝑖 = 𝑛 = 42 ∑𝑌𝑖𝑛𝑖 = 210500 ∑(𝑌𝑖 − 𝑌)2 𝑛𝑖 = 225´244.047.6


Cálculo de la Marca de Clase:

´
𝑦𝑖−1 +𝑦 ´
Y𝑖 = 2
1000+2000
Y𝑖 = 2

Y𝑖 = 1500

Z Yini
a) y= i =1

n
210500
𝑦= 42

𝑦 = 5011.9$𝑢𝑠.

Se estima que el nivel de ventas promedio de las empresas asciende a 5011.9 $us.

𝑛
( −𝑁𝑘−1 )
´ 2
b) Me = 𝑌𝑘−1 + 𝑐𝑘 𝑛𝑘
𝑛 42
|2 = 23 = 21 se toma en cuenta el valor

Inmediatamente superior en (Ni)


42
( −15)
2
Me = 4000 + 2000
14

Me = 4 857,14 $us.

Se estima que el nivel de ventas promedio de las empresas es de 4.857.14 $us. Quitando
la influencia de valores extremos.

´ 𝐶𝑘 ∗𝑛𝑘−1
c) Md = 𝑌𝑘−1 +𝑛
𝑘−1 +𝑛𝑘+1

2000(7)
Md = 4000 + 10+7

Md = 4.823.53 $us.
Se estima que los más común es que el nivel de ventas de las empresas gire alrededor
de 4.823,53 $us.
d) Cálculo del Rango o Recorrido de la Variable
𝑅 = 𝑌´𝑚 − 𝑌0´
R= 10000 - 1000 = 9000 Sus.
Se estima que la diferencia entre el valor máximo y el valor mínimo es de 9000 Sus.
𝑛
( −𝑁𝑘−1 )
´ 4
e) Q1 = 𝑌𝑘−1 + 𝑐𝑘 𝑛𝑘
42
( −5)
4
Q1 = 2000 + 2000
10
42
= 10.5
4

Q1 = 3100 $us.
Se estima que el 25% de las empresas tiene un nivel de ventas hasta 3100$us.

3𝑛
− 𝑁𝑘−1
4
𝑄3 = 𝑌′𝑘−1 + 𝐶𝑘
𝑛𝑘
3(42)
= 31.5
4
3(42)
( − 29)
4
𝑄3 = 6000 + 2000
7

Q3=6714,29$us.

Se estima que el 75% de las empresas tienen un nivel de ventas hasta 6.714,29$us.
f) Cálculo del Recorrido Intercuartílico:

𝐷𝑄 = 𝑄3 − 𝑄1
Donde: Q3 = Tercer cuartil (75%)
Q1 = Primer cuartil (25%)

𝐷𝑄 = 6714,29 – 3100 = 3614,29 $us.


Se estima que la diferencia entre el 75% de los datos y el 25% de ellos es de 3614,29
$us.

g) Cálculo de la Varianza:
∑(𝑌𝑖 − 𝑌)2 𝑛𝑖
𝛿2 =
𝑛
225´244.047,6
𝛿2 =
42
𝛿 2 = 5´362.953,51
Carece de Interpretación, es adimensional.

h) Cálculo de la desviación estándar o desviación típica

𝜎 = √𝜎 2

𝜎 = 2315,8 $us

Se estima que el nivel promedio de ventas de las empresas es de 5011,9$us.con un


error en dicha estimación de 2315,8 $us. hacia un límite inferior o un límite superior.

i) Cálculo del Coeficiente de Variación o Coeficiente de Variabilidad (Dispersión Relativa)

𝜎 2315,8
𝐶𝑉 = =
𝑌 5011,9
(Deseable trabajar al menos con redondeo a cuatro decimales, para mayor precisión)

𝐶𝑉 = 0,4621 ∗ 100
𝐶𝑉 = 46,21%

Se estima que el Coeficiente de Variación es de 46,21%.


Mientras más pequeño sea el valor o dato obtenido, significa que los datos son más
homogéneos.
Resumen de los estadígrafos de dispersión:
R= 9000 Sus.
𝐷𝑄 = 3614,29 $us.
𝛿 2 = 5´362.953,51
𝜎 = 2315,8 $us
𝑦 = 5011.9$𝑢𝑠.
𝐶𝑉 = 46,21%

Ejercicio N°1

Utilidades Empresas
(Bs)

500-6500 12
6500-7400 22
7400-9000 30
9000-14000 14
14000-16000 6

-En base al cuadro anterior se le pide estimar:

a) Media aritmética
b) Mediana
c) Moda
d) Primer y tercer cuartel Varianza
e) Varianza Desviación típica
f) Desviación típica
g) Coeficiente de varianza
Utilidades (Bs) Empresas Marca de Media Frecuencia Varianza
𝑌𝑖−1 − 𝑌𝑖 ´ 𝑛𝑖 clase Aritmética Absoluta 𝛿2
𝑌𝑖 ∑𝑚
𝑖=1 𝑌𝑖𝑛𝑖 Acumulado ∑(𝑌𝑖 − 𝑌)2 𝑛𝑖
𝑌= =
𝑛 𝑁𝑖=∑ 𝑛𝑖 𝑛

(5750 − 8558,33)2 .12=


5000-6500 12 5750 5750(12) 12
(6950 − 8558,33)2 .22=
6500-7400 22 6950 6950(22) 34 (8200 − 8558,33)2 .30=
7400-9000 30 8200 8200(30) 64 (11500 − 8558,33)2 .14=
(15000 − 8558,33)2 .6=
9000-14000 14 11500 11500(14) 78
14000-16000 6 15000 15000(6) 84

∑ 𝑛𝑖 = 𝑛 = 84 ∑ 𝑌𝑖𝑛𝑖 = 718900 ∑(𝑌𝑖 − 𝑌)𝑛𝑖 = 525´519.166,7



𝑌 𝑖−1 + 𝑌′𝑖
𝑌𝑖 =
2
5000 + 6500
𝑌𝑖 =
2
𝑌𝑖 = 5750
a)
∑𝑚𝑖=1 𝑌𝑖𝑛𝑖
𝑌=
𝑛
718900
𝑌= =
84
𝑌 = 8558,33𝐵𝑠
Se estima que el nivel de utilidades promedio de las empresas asciende a 8558,33Bs
b)
𝑛
− 𝑁𝑘−1
2
𝑀𝑒 = 𝑌′𝑘+1 + 𝐶𝑘
𝑛𝑘
(42 − 34)
𝑀𝑒 = 7400 + 1600
30
𝑀𝑒 = 7826,67 𝐵𝑠
Se estima que el nivel de utilidad promedio de las empresas es de 7.826,67Bs.,
quitando la influencia de valores extremos.
𝐶𝐾.𝑛𝑘+1
c) 𝑀𝑑 = 𝑌𝐾−1 +
𝑛𝑘−1 +𝑛𝑘+1

1600(14)
𝑀𝑑 = 7400 +
22 + 14

𝑀𝑑 = 8.022,22𝐵𝑠

Se estima que lo más común en utilidades de las empresas gira alrededor de


8.022,22Bs

𝑚

(𝑌𝑖−𝑌))2𝑛𝑖
d) 𝛿 2 = 𝑖=1
𝑛

525′ 519 166,7


2
𝛿 =
84

𝛿 2 = 6256 180,56

Carece de interpretación

e) 𝛿 = √6256 180,56

𝛿 = 2501,23

Se estima que el nivel promedio de utilidad de la empresa es de 8558,33 Bs., con un


error en dicha estimación de 2501,33 Bs., hacia un límite inferior o un límite superior.

𝜎
f) CV =
𝑌

𝐶𝑉 = 2501,33 / 8558,33
𝐶𝑉 = 0,2933 𝑥 100
𝐶𝑉 = 29,33%
Ejercicio No. 2

Notas Alumnos
10-20 15
20-40 30
40-60 55
60-80 40
80-100 12

En base al cuadro anterior se le pide estimar.


a) Media Aritmética
b) Mediana
c) Moda
d) Primer y tercer cuartil Varianza
e) Varianza
f) Desviación típica
g) Coeficiente de variabilidad
Notas Alumnos Marca de clase Media Aritmética Frec. Absoluta Varianza
𝒎
ni Yi Acumulada
𝒀= ∑ Yini m
𝒊=𝟏 Ni=∑ni
𝑌𝑖−1 − 𝑌𝑖 ´ Z (Y i −1 Y ) 2 ni
2 = i =1

10-20 15 15 15(15) 15 (15-51.02)2.15


20-40 30 30 30(30) 45 (30-51.02)2.30
40-60 55 50 50(55) 100 (50-51.02)2.55
60-80 40 70 70(40) 140 (70-51.02)2.40
80-100 12 90 90(12) 152 (90-51.02)2.12
∑𝑛𝑖 = 𝑛 = 152 ∑𝑌𝑖𝑛𝑖 = 7755 ∑(𝑌𝑖 − 𝑌)2𝑛𝑖 = 65359,74
𝑌´𝑖−1 − 𝑌𝑖 ´
𝑌𝑖 =
2

10 + 20
𝑌𝑖 =
2

𝑌𝑖 = 15

a)
∑𝑚
𝑖=1 𝑌𝑖𝑛𝑖
𝑌=
𝑛

7755
𝑌=
152

51,02𝑝𝑡𝑠

Se estima que el nivel de notas promedio de los alumnos es de 51,02 pts.


𝑛
( −𝑁𝑘−1)
b) 𝑀𝑒 = 𝑌1 𝐾 − 1 + 𝐶𝑘 2
𝑁𝑘

𝑛 152
= = 76
2 2

(76−45)
𝑀𝑒 = 40 + 20 55

𝑀𝑒 = 51,27

Se estima que el nivel de notas promedio de los alumnos es de 51,27 quitando


la influencia de valores extremos.
𝑐𝑘.𝑛𝑘+1
c) 𝑀𝑑 = 𝑌′ 𝑘 − 1 +
𝑛𝑘−1+𝑛𝑘+1

20(40)
𝑀𝑑 = 40 +
30+40

𝑀𝑑 = 51,43
𝑛
( −𝑁𝑘−1 )
´ 4
d) Q1 = y´ 𝑘−1 + 𝑐𝑘 𝑛𝑘
(38−15)
Q1 = 20+ 30 30

Q1 =35,33 pts
Se estima que el 25% de los alumnos tienen un nivel de notas hasta 35,33 pts.
3𝑛
− 𝑁𝑘−1
4
𝑄3 = 𝑌′𝑘−1 + 𝐶𝑘
𝑛𝑘

(114 − 100)
𝑄3 = 60 + 20
40
Q3=67 pts
Se estima que el 75% de los alumnos tienen una nota hasta 67 pts.

𝑚
𝑍 (𝑌𝑖−𝑌 ))2 𝑛𝑖
e) 𝛿2 = 𝑖=1
𝑛

65359,74
𝛿2 = 152

𝛿 2 = 429,99

Carece de interpretación, es adimensional.

f) 𝛿 = √429,99

𝛿 = 20,74

Se estima que el nivel promedio de notas de los alumnos es de 51,02 puntos


con un error en dicha estimación de 20, 74 puntos, hacia un límite inferior o un
límite superior.

𝜎
g) cv= 𝑌 %

20,74
𝐶𝑉 = 51,02

𝐶𝑉 = 0,4065 𝑥 100
𝐶𝑉 = 40,65%

También podría gustarte