Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Curtosis Ii 22-08-2020

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 25

1.

Dispersión
1.2 Rango o Recorrido Total
1.3 Desviación media
1.4 Varianza
1.5 Desviación Estándar

1.6 Coeficiente de Variación


1.7 Medidas de dispersión para datos sin agrupar
1.8 medidas de dispersión para datos agrupados en clase
2. Asimetría o sesgo
2.1 Primer coeficiente de Pearson
2.2 Segundo coeficiente de Pearson
2.3 Coeficiente de sesgo con base en el momento central de
3er. Orden y la desviación estándar
3. Apuntamiento, curtosis o agudeza.
c) Cuando a cada valor de los datos originales se les aumenta o
disminuye un valor constante la desviación estándar no cambia.
Ejemplo:

x X-X x = ∑X/n
(X-X)=2 20/4 = 5
3 -2 4 Estándar
Desviación
8 3 9
5 0 S= ∑√(x-x)
0 2

4 -1 1n
S= √ 14
20 0 14
4
S= 1.87
c) Cuando a cada valor de los datos originales se les aumenta o
disminuye un valor constante la desviación estándar no cambia.
Ejemplo: Restándole 4
Nueva media restar constante 4

x X-4 x = ∑X-4/n
X-X (X-X)2= 4/4 = 1
3 -1 -2 4 Estándar
Desviación
8 4 3 9
5 1 0 ∑√(x-x)
S= 0 2

4 0 -1 n1
S= √ 14
20 4 0 14
4
S= 1.87

Observamos que el valor no cambia.


d) Cuando a cada valor de la variable original se multiplica por un
valor constante la desviación estándar cambia, quedando
multiplicada por la constante.

Ejemplo: siguiendo con el ejemplo anterior multiplicarla por la


constante 4.

Desviación estándar = 1.87 * 4 = 7.48

Comprobación Nueva media X = 80/4 = 20

x X*4 X-X (X-X) 2


S = √∑(X-X ) 2
n
3 12 -8 64
Desviación Estándar
8 32 12 144
5 20 S=0∑√224 0 n 4
4 16 S=-47.48 16
Observamos
20 80que la desviación
0 224estándar original solo se multiplica
por la constante y el resultados es el mismo.
1.6 Coeficiente de Variación

Mide la variación en términos relativos o porcentuales, es de


mucha utilidad para comparar grupos diferentes de datos.
Se identifica como «CV»

Ejemplo: Se analizan salarios de 3 departamentos y su dispersión


relativa es la siguiente:

Departamento Dispersión CV = S * 100


(CV) X

A 0
CV = Coeficiente de Variación
B 10 2 S = Desviación Estándar
C 60 X = Media aritmética

A) Todos los salarios son iguales, no existe ninguna dispersión


alrededor de su promedio
B) Los salarios son bastante homogéneos, en virtud de tener el 10% de
dispersión.
C) Los salarios son dispersos, en un orden del 60%.
1.7 Ejemplos de medidas de dispersión para datos sin agrupar
Se cuenta con los siguientes datos: 3,5,8,10,11. Se pide:

a) Determinar la desviación media


b) Determinar la varianza
c) Determinar la desviación estándar
d) Determinar el coeficiencia de variación

a) Desviación media

1. Se encuentra la media aritmética


2. Se encuentra la desviación de cada valor X con respecto a la
media aritmética. X-X
3. Se suma las desviaciones 2
4. La suma se divide por el numero de valores «n».
X X-X (X-X) 2
3 -4.4 19.36 X = 37 = 7.4
5 -2.4 5.76 5
8 0.6 0.36
10 2.6 6.76
11 3.6 12.96
Total 0 45.20
DM = ∑/(X-X)/
n
/(X-X)/= se omiten los signos

DM /13.6/= 2.72
5
2.72 representa el promedio de desviaciones con respecto a la media

b) Varianza y desviación Estándar

1) Determinar media aritmética


2) Determinar las desviaciones de cada valor X con respecto a la
media aritmética, X – X 2
3) Cada desviación elevarla al cuadrado
4) Calcular la suma de las desviaciones al cuadrado y
2
5) Determinar la varianza, dividiendo la suma de las desviaciones
por el número de casos (n)
2
S 2 = ∑ (X-X)2 = 45.2/ 5 = S = 9.04 Varianza
n

S = √ ∑ (X-X) 2 = √ 45.20 S = 3.00 Desviación


n 5
c) Coeficiente de Variación

Bastara relacionar la desviación estándar con la media aritmética y el


resultado multiplicarlo por 100%.

CV = S * 100 CV = 3 * 100 CV = 40.54 %


X 7.4

ANALISIS:

Los datos demuestran una dispersión en un orden de 40.54% si otros


datos tuvieran una dispersión de 20.0% se dirá que la distribución
analizada tiene más dispersos los
2 datos.

2
Ejemplo para datos agrupados en clases

Ventas en Miles Q. No. de tiendas

2–6 2

7 – 11 10

12 – 16 16

17 – 21 6
Se pide:
a) Determinar la desviación media
22 – 26 4 b) Determinar la varianza
c) Determinar la desviación estándar
Total 38 d) Determinar el coeficiencia de
variación.
a) Desviación media

1. Determinar las marcas de clase, determinar los puntos medios y


multiplicarlos por f (columnas 3 y 4).
2. Determinar la media aritmética
3. Encontrar las desviaciones de cada valor x con respecto a la x
4. Multiplicar cada desviación por cada frecuencia absoluta f(x-x )
5. Dividir la suma en términos absolutos entre n, o sea la sumatoria de
f.

2
1 2 3 4 5 6 7 8 9

(X-X) f(X-X) f(X-X) 2 f(X-X)3 f(X-X) 4


Ventas en miles f x fx

2–6 2 4 8 -10 -20 200 -2000 20,000

7 – 11 10 9 90 -5 -50 250 -1250 250

12 – 16 16 14 224 0 0 0 0 0

17 – 21 6 19 114 5 30 150 750 3750

22 – 26 4 24 96 10 40 400 4,000 40000

Total 38 xxx 532 Xxx 0 1,000 1,500 70,000

/140/
2
X= Ls+li = 6 + 2 = 8/ 4 = 4
2
2

X = ∑fX = 532/ 38 = 14
n
2 2
f(x-x) = 2 * (-10) = 2 * 100 = 200
3 3
f(x-x) = 2 * (-10) = 2 * 1000 = -2000
DM = ∑ f/x-x)/ DM = 140 = 3.68
n 38

R/ En promedio Q. 3.68 miles, se desvían los valores X de la


media aritmética.

b) Varianza

El procedimiento para el cálculo de la varianza, para datos


agrupados en clases requiere:

a) Determinar los valores de X, determinar los puntos medios y


multiplicarlos por f, columnas 3 y 4
b) Encontrar las desviaciones de cada valor x respecto de la x,
comuna 5.
c) Multiplicar las frecuencias por las desviaciones columna 6
2
d) Elevar las desviaciones al cuadrado y multiplicarlas por las
frecuencias columna 7.
e) Sumar las desviaciones al cuadrado por las frecuencias
columna 7
f) Dividir la sumatoria entre el número de casos.
2
S = ∑f( x-x ) 2 = 1,000 = 26.32
n 38
c) Desviación Estándar

Una vez obtenida la varianza, bastará extraerle su raíz


cuadrada.
S= √ S2 = √ 26.32 S= 5.13

d) Coeficiente de Variación o dispersión relativa

Relacionamos la desviación estándar con la media aritmética y


el resultado se multiplica por 100 para expresarlo en
porcentaje.

CV = S *100 CV = 5.13 * 100 CV = 36.64 %


X 14

2
e) Propiedades de la desviación estándar

Si la información en análisis tiene un comportamiento


simétrico, (Aproximado a la curva normal), aplicando las
características de la desviación estándar se tiene:

e.1) Los límites de las ventas en donde aproximadamente se


agrupa el 66.26% de los casos:

x + S = 14 + 5.13 14 – 5.13 = 8.87


14 + 5.13 = 19.13

R. Q. 8.87 y Q. 19.13

e.2) Limites para el 95.46% de los casos


2
x + S = 14 + 2(5.13) 14 – 10.26 = 3.74
14 + 10.26 = 24.26

R. Q. 3.74 y Q. 24.26 miles


e.3) Límites para el 99.72%

x + S = 14 + 3(5.13) 14 – 15.39 = -1.39


14 + 15.39 = 29.39

R. Q. -1.39 y Q. 29.39 miles

2
2. ASIMETRIA O SESGO

En una distribución de frecuencias, se puede usar un promedio


para analizar la tendencia central de la variable o una medida
de dispersión para mostrar la variación de los valores de la
variable. La asimetría muestra la dirección de la distribución,
ya sea asimétrica hacia los valores más bajos al lado izquierdo
del eje X (asimétrica negativa), o hacia los valeros altos al lado
derecho (asimetría positiva) o bien simétrica.

Distribución Simétrica

2
Media = Mediana = Moda

 
 
Distribución de asimétrica negativa

Área de Asimetría

 
 
Distribución de asimétrica positiva

Área de Asimetría

Para conocer la dirección de la asimetría o si es simétrica existen varios


coeficientes, si el resultado es cero la distribución es simétrica, si el
resultado es negativo será Asimetría a la izquierda, y si es positivo será
asimetría a la derecha.
2.1 Primer coeficiente de Pearson
A= Asimetría
A = X – Mo Mo = Moda
S S= Desviación estándar
X = Media aritmética

Para encontrar el sesgo, se sigue el siguiente procedimiento

a) Determinación de la media aritmética


b) Determinación de la moda
c) Determinación de la desviación estándar

Mo = Lri + 1 i 1 = Fa de la clase modal menos frecuencia


1 + 2 absoluta de clase modal anterior
= Fa de la clase
2 modal, menos frecuencia
absolutas2 de clase siguiente a la modal
= intervalo de la clase modal.
Mo = 11.5 + 6 5
6 + 10

Mo = 11.5 + 1.875 = 13.375

A= X –Mo = 14 – 13.375 A= 0.12 la distribución es ligeramente


S 5.13 positiva, resultado cercano a 0.
2.2 Segundo coeficiente de Pearson

A= 3 (X-Me)
S Ventas en miles f F
2–6 2 2
7 – 11 10 12
12 – 16 16 28
17 – 21 6 34
22 – 26 4 38
Total 38 xxx

Me= 11.5 + 19 – 12 5 = 13.6875 Me = Lri + n/2 – Fa i


5.13 f

A= 3 (14 – 13.6875 ) = 0.18 A= f(X - Mo)


5.13 2 S

Interpretación: La distribución es ligeramente asimétrica positiva


porque el resultado 0.18 es cercano a 0.
2.3 Coeficiente de sesgo con base en el momento central de 3er.
Orden y la desviación estándar

A= m3 A = Asimetría o sesgo
3
S m = Momento
3 de orden 3.
S = Desviación estándar

Procedimiento

a) Determinar m3 las desviaciones se elevan al cubo y cada una se


multiplica por la frecuencia
b) Se suman algebraicamente estas desviaciones ya elevadas al
cubo por sus frecuencias.
c) Se dividen esta suma entre el numero de casos o sumatoria de
frecuencias.
d) Se determina la desviación estándar y ésta se eleva al cubo
e) Finalmente m3 se divide por2 la desviación estándar al cubo.
3
m 3 = ∑ f(X-X) m = 1500 3 = 39.47
n 38

A = 39.47 A= 39.47 = 0.29 Ligeramente asimetría


(5.13)3 135.00 positiva es cercana a 0
Coeficiente Resultado
Primero de Pearson 0.12
Segundo de Pearson 0.18
Utilizando momento 3er orden 0.29

Los tres resultados demuestran una ligera asimetría positiva, sin


embargo no dan lo mismo, cuando se usa un coeficiente para
comparar con otra distribución de frecuencias debe utilizarse la
misma formula.

3. Apuntamiento, curtosis o agudeza

La medida de apuntamiento o agudeza muestra el grado de


concentración de los valores alrededor de la x, así se dan tres tipos
de gráficos: 2
2
LEPTOCÚRTICA > 3
Concentración de los valores al rededor de la media
MESOCÚRTICA = 3
Distribución normal

PLATICÚRTICA < 3
Mayor dispersión alredodor de la media
La curtosis es la agudeza del gráfico, el cual se mide por medio del
coeficiente utilizando momento de 4°. Orden. Análisis del coeficiente

Resultado Tipo de curva e interpretación


>3 Leptocúrtica, concentración de los valores alrededor de la media
=3 Mesocúrtica, Distribución normal
<3 Platicúrtica, dispersión de los valores alredodor de la media

4
C = m4 m = ∑ 4f(X-X)
S4 n

C = Curtosis, apuntamiento o agudeza


m 4 = Momento orden 4
S = Desviación estándar
f = Frecuencias absolutas de cada
2 clase
X = Marcas de clase
X = Media aritmética
n = Número de elementos
m4 = 70,000/38 = 1,842.10

C = 1,842.10 = 1,842.10 = 2.66 < 3


(5.13)4 692.58

El coeficiente demuestra que la distribución es achatada, sus valores X se


encuentran ligeramente alejados de la media aritmética, por lo que se le
denomina Platicúrtica.

Poligono de frecuencias de la distribución analizada

18

16

14

12 2

10

0
4 9 14 19 24

También podría gustarte