Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Curso Estadistica I

Descargar como pptx, pdf o txt
Descargar como pptx, pdf o txt
Está en la página 1de 37

Clase Modulo 1

Curso de Estadística
Programa de Administración de Empresas

Andrés Palacios
Introducción a la Estadística

El término Estadística proviene del término alemán Statistik, “ciencia del


estado”, pues originalmente los gobiernos, en su necesidad de conocer las
características de su población para gestionar el pago de impuestos, el
reparto de tierras o bienes, la prestación de servicios públicos etc. debía
registrar información relevante sobre sus ciudadanos.

Registros de nacimiento Censos Inventario de recursos

Registros de defunción Catastro


Introducción a la Estadística

Es una ciencia con base en las matemáticas que consiste en la recolección,


presentación, análisis, interpretación y uso de los datos para la toma de
decisiones, mejora de procesos, pruebas de hipótesis y solución de problemas
sociales, científicos e industriales, más aún donde prevalecen condiciones de
riesgo, incertidumbre y variación.

Estadística Descriptiva Estadística Inferencial


Estadística Descriptiva

Se usan los métodos estadísticos descriptivos cuando las conclusiones que se


obtienen de los datos tienen como objetivo fundamental su presentación y
análisis como paso previo a procesos inferenciales.

Piramide poblacional Colombia

Fuente: DANE, Censo General 2005 y Censo Nacional de Población y Vivienda 2018
Estadística Inferencial

Se usan los métodos estadísticos inductivos o inferenciales cuando las


conclusiones que se obtienen de los datos en estudio tienen como objetivo
realizar generalizaciones acerca de una población. Las principales
herramientas para hacer estas inferencias son las muestras, diseño de
experimentos, la estimación de parámetros y el cálculo de probabilidades.
Estadística Aplicada a la
Administración
PRODUCCION
Diseño y Mejora de Procesos – Control de Calidad
MARKETING https://www.youtube.com/watch?v=i1QZHcJG2EQ

Investigación de Mercados – Análisis de Gustos y Preferencias


Análisis de Clientes – Inteligencia de Negocios
FINANZAS
Análisis de Rendimientos – Análisis de Riesgos
RECURSOS HUMANOS
Selección de Personal – Evaluación de Personal
BIG DATA
Toma de decisiones con base en grandes cantidades de información
Conceptos

Parámetro : un valor que resume


una característica de interés
Muestra sobre una población de estudio
Población
Estadística : un valor que resulta
a partir de una muestra y sirve
como estimador del parámetro de
la población

Población: conjunto de unidades sobre las Muestra: subconjunto de


cuales estamos interesados en estudiar individuos de la población
características y obtener conclusiones. Por seleccionados mediante
lo general no es posible o es muy costoso alguna técnica de
contar con todos los individuos recolección
Conceptos

Variable: una característica o cualidad que es medible y que toma distintos


valores para cada individuo de la población o de la muestra.

Variable Cuantitativa Variable Cualitativa


Aquellas características o cualidades Aquellas características o cualidades
que se pueden expresar a través de que no tienen un valor numérico sino
un carácter numérico se clasifican de manera textual

Discreta Continua Nominal Ordinal


Valores Valores No sigue un Orden o jerarquía
enteros decimales orden específico establecido
Ej: número de Ej: peso en Ej: Colores Ej: estrato
hijos kg socioeconómico
Estadística Descriptiva

Métodos para recolectar, organizar y presentar información de manera


compacta mediantes gráficos, mapas y tablas con medidas resumen

Curso de Estadística
Estadística Descriptiva

Para datos no agrupados:

Variable Frecuencia Absoluta Frecuencia Relativa Frecuencia Frecuencia


Acumulada Acumulada Relativa
Observación 1
Observación 2
Observación 3 … …
… ... ...
Observación m 100%
Total 100%
𝑚 𝑝 𝑝
𝑛= ∑ 𝑛 𝑗 𝑁𝑝= ∑ 𝑛 𝑗 𝐻 𝑝 =∑ h 𝑗
𝑛𝑖
h𝑖 =
𝑛
𝑗=1 𝑗=1 𝑗=1

Datos No agrupados: ej. casos de COVID19 en Colombia por mes

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data
Ejemplo I: Frecuencias

Casos COVID19 Frecuencia Absoluta Tabla


FRECUENCIAS Marzo 798
Abril 5413
de
 Absolutas Frecuencias
Mayo 22025
Conteo sobre el total de Junio 66807
Julio 145752
observaciones
Total 240795
 Relativas
Frecuencia Absoluta
Proporción respecto al 160000
145752
140000
total de observaciones
120000

 Acumuladas 100000 Diagrama


80000
66807 de
Propiedades o 60000

40000
barras
comportamientos 22025
20000
798 5413
regularizados 0
Marzo Abril Mayo Junio Julio
Casos COVID19 en Colombia

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Ejemplo I: Frecuencias

Casos COVID19 Frecuencia Absoluta Frecuencia Relativa


FRECUENCIAS Marzo 798 0.33%
 Absolutas Abril 5413 2.25%
Mayo 22025 9.15%
Conteo sobre el total de Junio 66807 27.74%
Julio 145752 60.53%
observaciones
Total 240795 100%
 Relativas Frecuencia Relativa

Proporción respecto al 0.33% 2.25%

total de observaciones 9.15%

Marzo
 Acumuladas Abril Diagrama
Mayo de
Propiedades o Junio
27.74%
Julio
pastel
comportamientos 60.53%

regularizados

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Ejemplo I: Frecuencias

Frecuencia
FRECUENCIAS Casos Frecuencia Frecuencia Frecuencia Acumulada
COVID19 Absoluta Relativa Acumulada
Relativa
 Absolutas
Marzo 798 0.33% 798 0.33%
Conteo sobre el total de Abril 5413 2.25% 6211 2.58%
Mayo 22025 9.15% 28236 11.73%
observaciones Junio 66807 27.74% 95043 39.47%
 Relativas Julio 145752 60.53% 240795 100.00%
Total 240795 100%
Proporción respecto al Frecuencia Acumulada
total de observaciones 300000
260000
240795
 Acumuladas
250000
Diagrama
200000
de
Propiedades o 150000
líneas
95043
comportamientos 100000

50000
regularizados 6211
28236
798
0
Marzo Abril Mayo Junio Julio Agosto?
Casos COVID19 en Colombia

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Estadística Descriptiva
Para datos agrupados:
Frecuencia
Intervalo Marca de Frecuencia Frecuencia Frecuencia Acumulada
clase Absoluta Relativa Acumulada
Relativa
Intervalo 1
Intervalo 2

Intervalo i
… …
… ... ... ...
Intervalo m
100%
Total 100%

𝐿𝑖 + 𝐿 𝑖+1 𝑚 𝑝 𝑝
𝑛= ∑ 𝑛 𝑗 𝑁𝑝= ∑ 𝑛 𝑗 𝐻 𝑝 =∑ h 𝑗
𝐶𝑖= 𝑛𝑖
2 h𝑖 =
𝑛
𝑗=1 𝑗=1 𝑗=1

Datos agrupados: ej. Alturas de arqueros en la Copa Mundial 2018


Fuente: Datos de los jugadores Copa Mundial de Futbol de 2018, julio 26 de 2020
Ejemplo II: Datos agrupados

DATOS DESAGRUPADOS
186 - 189 - 192 - 184 - 193 - 187 -
197 - 193 - 199 - 188 - 193 - 195 - 1. DATOS DESAGRUPADOS ORDENADOS
183 - 185 - 180 - 179 - 178 - 185 - 178 - 178 - 179 - 180 - 181 - 182 - 182 - 182 -
188 - 191 - 201 - 190 - 195 - 190 -
183 - 183 - 183 - 183 - 184 - 184 - 184 - 184 -
191 - 190 - 193 - 185 - 191 - 196 -
188 - 187 - 195 - 187 - 189 - 193 -
184 - 184 - 185 - 185 - 185 - 185 - 185 - 185 -
186 - 193 - 198 - 186 - 192 - 194 - 185 - 186 - 186 - 186 - 186 - 186 - 186 - 186 -
184 - 185 - 184 - 189 - 187 - 193 - 187 - 187 - 187 - 187 - 187 - 187 - 187 - 187 -
185 - 182 - 188 - 186 - 190 - 190 - 187 - 188 - 188 - 188 - 188 - 188 - 188 - 189 -
181 - 196 - 187 - 183 - 197 - 187 - 189 - 189 - 189 - 189 - 189 - 189 - 189 - 190 -
184 - 189 - 182 - 194 - 190 - 195 - 190 - 190 - 190 - 190 - 190 - 190 - 190 - 190 -
183 - 184 - 189 - 189 - 190 - 185 - 190 - 191 - 191 - 191 - 191 - 192 - 192 - 192 -
187 - 186 - 178 - 189 - 185 - 196 -
193 - 193 - 193 - 193 - 193 - 193 - 193 - 194 -
191 - 194 - 195 - 190 - 189 - 188 -
187 - 190 - 198 - 183 - 188 - 186 -
194 - 194 - 195 - 195 - 195 - 195 - 195 - 196 -
186 - 182 - 192 - 190 - 184 - 187 196 - 196 - 197 - 197 - 198 - 198 - 199 - 201

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Ejemplo II: Datos agrupados

1. DATOS DESAGRUPADOS ORDENADOS 2. DETERMINACIÓN DE LOS INTERVALOS


178 - 178 - 179 - 180 - 181 - 182 -  observaciones
182 - 182 - 183 - 183 - 183 - 183 -
184 - 184 - 184 - 184 - 184 - 184 - =CONTAR(celdas)
185 - 185 - 185 - 185 - 185 - 185 -
185 - 186 - 186 - 186 - 186 - 186 -  Mínimo =MIN(celdas)
186 - 186 - 187 - 187 - 187 - 187 - El MENOR de los elementos de un
187 - 187 - 187 - 187 - 187 - 188 - conjunto de datos = 178
188 - 188 - 188 - 188 - 188 - 189 -
189 - 189 - 189 - 189 - 189 - 189 -  Máximo =MAX(celdas)
189 - 190 - 190 - 190 - 190 - 190 - El MAYOR de los elementos de un
190 - 190 - 190 - 190 - 190 - 191 - conjunto de datos = 201
191 - 191 - 191 - 192 - 192 - 192 -
193 - 193 - 193 - 193 - 193 - 193 -  Rango =MAX(celdas) – MIN(celdas)
193 - 194 - 194 - 194 - 195 - 195 - El valor máximo menos el valor
195 - 195 - 195 - 196 - 196 - 196 - mínimo = 201-178 = 23
197 - 197 - 198 - 198 - 199 - 201

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Ejemplo II: Datos agrupados
2. DETERMINACIÓN DE LOS INTERVALOS
 observaciones  Intervalos de clase
1. Mín + ancho de clase
 Rango
2. Intervalo 1 + ancho de clase
El valor máximo menos el valor
mínimo = 201-178 = 23 3. Limite superior Intervalo 1 +
ancho de clase
 Número de clases
Sturges: Intervalo Límite inferior Límite superior
1 178.00 180.88
2 180.88 183.75
3 183.75 186.63
=MULTIPLO.SUPERIOR.MAT() 4 186.63 189.50
5 189.50 192.38
 Ancho de clase 6 192.38 195.25
7 195.25 198.13
8 198.13 201.00

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Ejemplo II: Datos agrupados
178 - 178 - 179 - 180 - 181 - 182 - 182 - 182 - 183 - 183 - 183 - 183 - 184 - 184 -
184 - 184 - 184 - 184 - 185 - 185 - 185 - 185 - 185 - 185 - 185 - 186 - 186 - 186 -
186 - 186 - 186 - 186 - 187 - 187 - 187 - 187 - 187 - 187 - 187 - 187 - 187 - 188 -
188 - 188 - 188 - 188 - 188 - 189 - 189 - 189 - 189 - 189 - 189 - 189 - 189 - 190 -
190 - 190 - 190 - 190 - 190 - 190 - 190 - 190 - 190 - 191 - 191 - 191 - 191 - 192 -
192 - 192 - 193 - 193 - 193 - 193 - 193 - 193 - 193 - 194 - 194 - 194 - 195 - 195 -
195 - 195 - 195 - 196 - 196 - 196 - 197 - 197 - 198 - 198 - 199 - 201
=CONTAR.SI.CONJUNTO($B$12:$B$56;">="&L12;$B$12:$B$56;"<"&M12)
Intervalo Intervalo Marca de clase Frecuencia absoluta Frecuencia relativa
1 [178.00-180.88) 179.44 4 4.17%
2 [180.88-183.75) 182.31 8 8.33%
3 [183.75-186.63) 185.19 20 20.83%
4 [186.63-189.50) 188.06 23 23.96%
5 [189.50-192.38) 190.94 17 17.71%
6 [192.38-195.25) 193.81 15 15.63%
7 [195.25-198.13) 196.69 7 7.29%
8 [198.13-201.00] 199.56 2 2.08%
Total 96 100%
Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020
Ejemplo II: Datos agrupados
Intervalo Intervalo Marca de clase Frecuencia absoluta Frecuencia relativa
1 [178.00-180.88) 179.44 4 4.17%
2 [180.88-183.75) 182.31 8 8.33%
3 [183.75-186.63) 185.19 20 20.83%
4 [186.63-189.50) 188.06 23 23.96%
5 [189.50-192.38) 190.94 17 17.71%
6 [192.38-195.25) 193.81 15 15.63%
7 [195.25-198.13) 196.69 7 7.29%
8 [198.13-201.00] 199.56 2 2.08%
Total 96 100%

Histograma de frecuencias
25 23
20
20
17
15
15

10 8 7
5 4
2
0
[178-180.875) [180.875- [183.75- [186.625- [189.5- [192.375- [195.25- [198.125-201]
183.75) 186.625) 189.5) 192.375) 195.25) 198.125)

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


Estadística Descriptiva
25
23
Aspectos a estudiar
20
20

17

15
15
Centralidad
10
8
Posición
7

5 4 Dispersión
2

0
Forma
[198.125-201]
[178-180.875)

[180.875-183.75)

[183.75-186.625)

[186.625-189.5)

[189.5-192.375)

[192.375-195.25)

[195.25-198.125)

Fuente: https://github.com/owid/covid-19-data/tree/master/public/data, julio 26 de 2020


MEDIDAS DE CENTRALIDAD

=PROMEDIO(celdas)
 Media Valores alrededor de los cuales se agrupan la mayoría
de los datos de la variable.

datos no agrupados Conocida como promedio o esperanza matemática, consiste


en la suma de todos los valores dentro del conjunto de datos
datos agrupados dividido por el número total de observaciones.

 Mediana Interpretación:
• En promedio, los pedidos del producto Z se demoran
 Moda días en ser entregados.
• Se espera que el número de días para que el
producto Z sea entregado es de días.
• representa la media de la población.

La media aritmética es sensible ante la


presencia de datos extremos o atípicos
MEDIDAS DE CENTRALIDAD

 Media =MEDIA.GEOM(celdas)

Variaciones de la media: MEDIA GEOMÉTRICA


 Mediana
 Moda Es útil para encontrar el promedio de porcentajes, razones,
índices o tasas de crecimiento.

Ej.: proporción de mujeres por departamento de una


empresa, crecimiento de las ventas de un negocio en los
últimos 10 años

Es menos sensible a los valores atípicos, pero no se puede


usar si algún valor es cero. Cuando hay valores negativos,
el resultados puede ser un número imaginario.
MEDIDAS DE CENTRALIDAD

 Media =SUMAPRODUCTO(números,ponderador)/SUMA(ponderador)

Variaciones de la media: MEDIA PONDERADA


 Mediana
 Moda donde es el peso de cada observación

Cuando el peso o la importancia de cada observación dentro


del conjunto de datos no es la misma.

Ej.: número de créditos por asignatura, importancia por


relevancia de las empresas en un proceso de licitación, costos
de venta según inventario de productos y precio unitario
según proveedor.
MEDIDAS DE CENTRALIDAD

 Media =MEDIANA() Valores alrededor de los cuales se agrupan la mayoría


=CUARTIL.INC( … ;2) de los datos de la variable.
 Mediana
Corresponde al dato que se encuentra en el centro de
todas las observaciones.
Si de menor a mayor. La mediana es el valor por
debajo del cual se encuentra el 50% de la información, y
 Moda por encima, el otro 50% de la información.

5 7 10 12 15 18 20 21 34 𝒏𝒆𝒔 𝒊𝒎𝒑𝒂𝒓
5 7 10 12 15 18 20 21 34 50 𝒏𝒆𝒔 𝒑𝒂𝒓
15+ 18
=𝟏𝟔 . 𝟓
2
La mediana NO es sensible ante la presencia
de atípicos por lo que ES MUY BUENA
alternativa a la media como medida resumen
MEDIDAS DE CENTRALIDAD

 Media Valores alrededor de los cuales se agrupan la mayoría


de los datos de la variable.
 Mediana En datos agrupados:
𝐴
𝑀𝑒= 𝐿𝑚𝑒 +
h𝑚𝑒
( 0.5 − 𝐻 𝑚𝑒 −1 )
donde:
Límite inferior de la clase de la mediana
 Moda Amplitud de clase
Frecuencia relativa de la clase de la mediana
Frecuencia relativa acumulada de la clase anterior a la mediana

Del Ejemplo II:

Marca de Frecuencia Frecuencia Frecuencia


Intervalo Intervalo clase absoluta relativa relativa acum.
1 [178.00-180.88) 179.44 4 4.17% 4.17%
2 [180.88-183.75) 182.31 8 8.33% 12.50%
3 [183.75-186.63) 185.19 20 20.83% 33.33%
4 [186.63-189.50) 188.06 23 23.96% 57.29%
5 [189.50-192.38) 190.94 17 17.71% 75.00%
6 [192.38-195.25) 193.81 15 15.63% 90.63%
7 [195.25-198.13) 196.69 7 7.29% 97.92%
8 [198.13-201.00] 199.56 2 2.08% 100.00%
Total 96 100%
MEDIDAS DE CENTRALIDAD

 Media Es el valor que más se repite, el valor con mayor frecuencia dentro del
conjunto de datos.
 Mediana
Se puede calcular para variables de tipo cualitativo: la categoría con
 Moda
más frecuencia.

Si solo hay un valor para la moda, la distribución se dice unimodal. En


el caso en que hayan dos valores más frecuentes, la distribución se
dice bimodal. Si existen varios valores que se repiten, la distribución se
dice multimodal. Si no hay valores que se repitan, la distribución se
dice amodal.

=MODA.UNO() =MODA.VARIOS()
MEDIDAS DE POSICIÓN

 Cuantiles Valores que dividen una variable o un conjunto de


datos ordenados en grupos de la misma cantidad.
 Cuartiles
 Percentiles
El cuantil es el valor por debajo del cual se encuentra el % de los
 Deciles datos.

 Mediana 𝛼2 =¿

𝛼1 =¿

Los cuartiles, quintiles, deciles, percentiles e incluso la mediana


son casos particulares de los cuantiles de orden 4, 5, 10, 100 y 2
respectivamente.
MEDIDAS DE POSICIÓN

 Cuantiles Valores que dividen una variable o un conjunto de


datos ordenados en grupos de la misma cantidad.
 Cuartiles
Cuartiles: Dividen la variable en 4 grupos de frecuencia semejantes.
 Percentiles =CUARTIL.INC(… ; Q)
 Deciles Q = 0,1,2,3,4

 Mediana
=PERCENTIL.INC(… ; %) Quintiles: Dividen la variable en 5 grupos de frecuencia semejantes.
% = 0,2 0,4 0,6 0,8

=PERCENTIL.INC(… ; %) Deciles: Dividen la variable en 10 grupos de frecuencia semejantes.


% = 0,1 0,2 … 0,8 0,9

=PERCENTIL.INC(… ; %) Percentiles: Dividen la variable en 100 grupos de frecuencia


semejantes.
MEDIDAS DE DISPERSION

Medidas que indican la variablidad que hay dentro del conjunto de datos y la
confiabilidad de las medidas resumen que se calculen sobre estos.

“La estadística es una ciencia


que demuestra que si mi vecino
tiene dos coches y yo ninguno,
los dos tenemos uno”

Es importante tener en cuenta las medidas de dispersión a la


hora de presenter resultados o medidas resumen como las de
tendencia central
MEDIDAS DE DISPERSION

 Rango Medidas que indican la variablidad que hay dentro del


conjunto de datos y la confiabilidad de las medidas
resumen que se calculen sobre estos.
El rango es la medida más simple de variación absoluta,
 Varianza es la diferencia entre la observación más pequeña y la
 Desviación estándar más grande

 Coeficiente de variación

=MAX(celdas) – MIN(celdas)

El rango es una medida sensible a datos


extremos y puede ignorar la manera en la que
se distribuye el conjunto de datos
MEDIDAS DE DISPERSION

 Rango Medidas que indican la variablidad que hay dentro del


conjunto de datos y la confiabilidad de las medidas
 Varianza resumen que se calculen sobre estos.
La varianza es el promedio de la diferencia de todos los
valores con respecto a la media
para la muestra
10 12 14 15 17 18 18 24
=VAR.S(celdas)
para la población
2 ( 10 −16 )2 + ( 12− 16 )2 +…+ ( 24 −16 )2
 Desviación estándar 𝑠 =
8 −1
 Coeficiente de variación 2 130
𝑠= =𝟏𝟖 .𝟓𝟕
7
=VAR.P(celdas)
La interpretación de la varianza no es intuitiva
pues la unidad de medida no es la misma que
la de los datos originales, la desviación
estándar sí.
MEDIDAS DE DISPERSION
 Rango La desviación estándar es la raíz cuadrada del promedio
de la diferencia de todos los valores con respecto a la
 Varianza media (la raíz cuadrada de la varianza)
 Desviación estándar 10 12 14 15 17 18 18 24

𝑠= √ 𝑠 =√ 18.57=𝟒 . 𝟑𝟏
2

para la muestra Interpretación: en promedio, los datos se encuentran


alejados de la media en 4.31 unidades

para la población
=DESVEST.M(celdas)
 Coeficiente de variación

=DESVEST.P(celdas)
MEDIDAS DE DISPERSION
 Rango • Para el cálculo de la desviación estándar, cada valor
del conjunto de datos es tenido en cuenta.
 Varianza • Los valores extremos pesan sobre esta medida pues
en el cálculo, su diferencia con respecto a la media
 Desviación estándar es elevada al cuadrado
Si los datos se distribuyen de manera normal,
el porcentaje de datos alrededor de la media
para la muestra
corresponde a :

para la población
=DESVEST.M(celdas)
 Coeficiente de variación

=DESVEST.P(celdas)
MEDIDAS DE DISPERSION
• El coeficiente de variación, a diferencia de las otras
 Rango medidas, representa una medida de variación
relativa.
 Varianza • Es posible interpretarla como un porcentaje.
 Desviación estándar • Muestra la variación relative con respecto a la media
por lo que puede ser usada para comparer dos
 Coeficiente de variación conjuntos de datos, incluso cuando sus unidades no
son las mismas.
Media Desviación estándar CV
15.5 3.33 21.48%
15.5 0.92 5.93%
15.5 4.57 29.48%

Interpretación: indica que tan preciso es el promedio como medida representativa de los datos

Hasta 7%: estimador preciso Entre 15 y 20%: estimador regular


Entre 8 y 14%: estimador aceptable Mayor a 20%: estimación poco precisa

DANE: https://www.dane.gov.co/files/investigaciones/boletines/censo/est_interp_coefvariacion.pdf
MEDIDAS DE FORMA

 Asimetría Cuando dos o más conjuntos de datos tienen las


mismas medidas de posición y dispersión, es posible
compararlas mediante la forma de su distribución.
Coeficiente de asimetría de Fisher
𝑺𝒊 𝒎𝟑 ≈ 𝟎
𝑺𝒊 𝒎𝟑< 𝟎 𝑺𝒊 𝒎𝟑> 𝟎
¡no siempre!
 Apuntamiento o curtosis
Sesgada a izquierda Simétrica Sesgada a derecha
=COEFICIENTE.ASIMETRIA(celdas)
Coeficiente de curtosis de Fisher

asimétrica + asimétrica -
𝒙=𝑴𝒆=𝑴𝒐
𝒙< 𝑴𝒆<𝑴𝒐 𝒙> 𝑴𝒆>𝑴𝒐
MEDIDAS DE FORMA

 Asimetría Cuando dos o más conjuntos de datos tienen las


mismas medidas de posición y dispersión, es posible
compararlas mediante la forma de su distribución.
Coeficiente de asimetría de Fisher

 Apuntamiento o curtosis 𝑺𝒊 𝒎𝟒 >𝟎 𝑺𝒊 𝒎𝟒 ≈ 𝟎 𝑺𝒊 𝒎𝟒 <𝟎


Leptocúrtica Mesocúrtica Platicúrtica
Coeficiente de curtosis de Fisher

=CURTOSIS(celdas) La curtosis de una distribución normal es 3, por lo que


para comparer cualquier distribución, se resta este valor
GRACIAS

También podría gustarte