Las medidas de dispersión miden qué tan juntos o separados están los datos de una distribución y ayudan a describir un conjunto de datos junto con las medidas de tendencia central. Algunas medidas comunes de dispersión son la varianza, desviación estándar y rango de variación, las cuales indican qué tan lejos están los datos del promedio y su homogeneidad.
0 calificaciones0% encontró este documento útil (0 votos)
13 vistas12 páginas
Las medidas de dispersión miden qué tan juntos o separados están los datos de una distribución y ayudan a describir un conjunto de datos junto con las medidas de tendencia central. Algunas medidas comunes de dispersión son la varianza, desviación estándar y rango de variación, las cuales indican qué tan lejos están los datos del promedio y su homogeneidad.
Las medidas de dispersión miden qué tan juntos o separados están los datos de una distribución y ayudan a describir un conjunto de datos junto con las medidas de tendencia central. Algunas medidas comunes de dispersión son la varianza, desviación estándar y rango de variación, las cuales indican qué tan lejos están los datos del promedio y su homogeneidad.
Las medidas de dispersión miden qué tan juntos o separados están los datos de una distribución y ayudan a describir un conjunto de datos junto con las medidas de tendencia central. Algunas medidas comunes de dispersión son la varianza, desviación estándar y rango de variación, las cuales indican qué tan lejos están los datos del promedio y su homogeneidad.
Descargue como DOCX, PDF, TXT o lea en línea desde Scribd
Descargar como docx, pdf o txt
Está en la página 1de 12
Introducción:
Las medidas de dispersión consisten en números que otorgan
información acerca de la variabilidad de los datos. Es decir, se encargan de mostrar qué tan juntos o separados se encuentran los datos de una distribución. Por lo general, se usa junto con las medidas de tendencia central, como la media o la mediana, para proporcionar una descripción general de un conjunto de datos.
Como resalta Matemovil, “los valores de las medidas de dispersión nos
permiten saber si los datos se encuentran estrechamente agrupados, si se encuentran ampliamente dispersos o si son iguales”.
Cuando la medida de dispersión posee un valor pequeño, esto quiere
decir que los datos están ubicados cerca a la posición central, mientras que cuando tienen un valor grande, quiere decir que están más separados o alejados al centro.
Entonces, considerando lo mencionado, podemos definir las medidas
de dispersión como las medidas estadísticas orientadas en dar a conocer qué tan lejanas o próximas se encuentran las puntuaciones de una variable, respecto a la media o promedio aritmético. Las medidas de dispersión en cambio miden el grado de dispersión de los valores de la variable. Dicho en otros términos las medidas de dispersión pretenden evaluar en qué medida los datos difieren entre sí. De esta forma, ambos tipos de medidas usadas en conjunto permiten describir un conjunto de datos entregando información acerca de su posición y su dispersión.
Ahora que ya tienes más claro el concepto de las medidas de
dispersión o variabilidad, te brindaremos algunas de sus características más representativas para que no te pierdas de ningún detalle:
Las medidas de dispersión indican qué tan diseminados se
encuentran los datos de una distribución. Permite conocer qué tan cerca o lejos de la media se encuentran los datos. Las medidas de variabilidad te dan la posibilidad de saber la homogeneidad o heterogeneidad de las distribuciones de los datos. Su aplicación es fácil y rápida. Su valores de dispersión siempre son positivos o cero, en caso estos sean iguales. El uso de las medidas de dispersión se puede aplicar en diversos ámbitos, como el sector salud, industrial, económico empresarial, etc. Los procedimientos para obtener las medidas estadísticas difieren levemente dependiendo de la forma en que se encuentren los datos. Si los datos se encuentran ordenados en una tabla estadística diremos que se encuentran “agrupados” y si los datos no están en una tabla hablaremos de datos “no agrupados”.
Según este criterio, haremos primero el estudio de las medidas
estadísticas para datos no agrupados y luego para datos agrupados.
1. Medidas estadísticas en datos no agrupado
2. Medidas de tendencia central 3. Promedio o media La medida de tendencia central más conocida y utilizada es la media aritmética o promedio aritmético. Se representa por la letra griega µ cuando se trata del
Promedio del universo o población y por Ȳ (léase Y barra) cuando se
trata del promedio de la muestra. Es importante destacar que µ es una cantidad fija mientras que el promedio de la muestra es variable puesto que diferentes muestras extraídas de la misma población tienden a tener diferentes medias. La media se expresa en la misma unidad q
los datos originales: centímetros, horas, gramos, etc.
Estos cálculos se pueden simbolizar:
:
Donde Y1 es el valor de la variable en la primera observación, Y2 es
el valor de la segunda observación y así sucesivamente. En general, con “n” observaciones, Yi representa el valor de la i-ésima observación. En este caso el promedio está dado por
De aquí se desprende la fórmula definitiva del promedio:
Desviaciones: Se define como la desviación de un dato a la
diferencia entre el valor del dato y la media: Mediana
Otra medida de tendencia central es la mediana. La mediana es el
valor de la variable que ocupa la posición central, cuando los datos se disponen en orden de magnitud. Es decir, el 50% de las observaciones tiene valores iguales o inferiores a la mediana y el otro 50% tiene valores iguales o superiores a la mediana.
Si el número de observaciones es par, la mediana corresponde al
promedio de los dos valores centrales. Por ejemplo, en la muestra 3, 9, 11, 15, la mediana es (9+11)/2=10.
Moda
La moda de una distribución se define como el valor de la variable que
más se repite. En un polígono de frecuencia la moda corresponde al valor de la variable que está bajo el punto más alto del gráfico. Una muestra puede tener más de una moda.
Medidas de dispersión
Las medidas de dispersión entregan información sobre la variación de
la variable. Pretenden resumir en un solo valor la dispersión que tiene un conjunto de datos. Las medidas de dispersión más utilizadas son: Rango de variación, Varianza, Desviación estándar, Coeficiente de variación. Rango de variación
Se define como la diferencia entre el mayor valor de la variable y el
menor valor de la variable. La mejor medida de dispersión, y la más generalizada es la varianza, o su raíz cuadrada, la desviación estándar. La varianza se representa con el símbolo σ² (sigma cuadrado) para el universo o población y con el símbolo s2 (s cuadrado), cuando se trata de la muestra. La desviación estándar, que es la raíz cuadrada de la varianza, se representa por σ (sigma) cuando pertenece al universo o población y por “s”, cuando pertenece a la muestra. σ² y σ son parámetros, constantes para una población particular; s2 y s son estadígrafos, valores que cambian de muestra en muestra dentro de una misma población. La varianza se expresa en unidades de variable al cuadrado y la desviación estándar simplemente en unidades de variable.
Fórmulas
Donde µ es el promedio de la población.
Donde Ȳ es el promedio de la muestra.
Consideremos a modo de ejemplo una muestra de 4 observaciones.
Según la fórmula el promedio calculado es 7, veamos ahora el cálculo de las medidas de dispersión:
s2 = 34 / 3 = 11,33 Varianza de la muestra
La desviación estándar de la muestra (s) será la raíz cuadrada de
11,33 = 3,4.
Interpretación de la varianza (válida también para la desviación
estándar): un alto valor de la varianza indica que los datos están alejados del promedio. Es difícil hacer una interpretación de la varianza teniendo un solo valor Coeficiente de variación
Es una medida de la dispersión relativa de los datos. Se define como
la desviación estándar de la muestra expresada como porcentaje de la media muestral.
Es de particular utilidad para comparar la dispersión entre variables
con distintas unidades de medida. Esto porque el coeficiente de variación, a diferencia de la desviación estándar, es independiente de la unidad de medida de la variable de estudio.
Medidas de tendencia central y de dispersión en datos agrupados
Se identifica como datos agrupados a los datos dispuestos en una distribución
de frecuencia. En tal caso las fórmulas para el cálculo de promedio, mediana, modo, varianza y desviación estándar deben incluir una leve modificación. Moda en datos agrupados
Si la variable es de tipo discreto la moda o modo será al valor de la
variable (Yi) que tenga la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que este valor de variable corresponde a la mayor frecuencia absoluta =16.
Más adelante se presenta un ejemplo integrado para promedio,
mediana, varianza y desviación estándar en datos agrupados con intervalos.
Varianza en datos agrupados
Para el cálculo de varianza en datos agrupados se utiliza la fórmula
Bibliografía ESSENTIAL PYTHON: DE LA CIENCIA DE DATOS A LA AUTOMATIZACIÓN. (n.d.). (n.p.): GAVEA LAB. (s.f.).