Medidas de Tendencia Central
Medidas de Tendencia Central
Medidas de Tendencia Central
Al realizar un estudio estadstico, es comn agrupar los datos en una tabla de distribucin de frecuencias y agregar uno o ms grficos que permitan interpretar la informacin obtenida. Las medidas de tendencia central vienen a complementar el anlisis. Una medida de tendencia central es un valor utilizado para describir un conjunto de datos, los resume en una cifra representativa e identifica la posicin central. Incluyen la media, la mediana y la moda. Sin embargo, junto a estas medidas, se encuentran otros indicadores que muestran hasta qu punto las medidas de tendencia central son representativas como sntesis de la informacin. Estos indicadores son las medidas de dispersin, que se refieren a la variabilidad que existe en el conjunto de datos. Entre estas se encuentran la desviacin estndar, varianza, coeficiente de variacin y el rango.
Donde
(se lee x barra) es la media del conjunto de datos es la suma de todos los datos es el nmero total de datos
La media es un modelo de los datos, que toma en cuenta cada valor del conjunto como parte de su clculo. Puede ser que el valor obtenido no sea igual a ningn valor de los datos. Una de sus caractersticas primordiales es que es el
valor con la menor cantidad de error en el conjunto de datos. Adems, es la nica medida de tendencia central en la que la suma de las desviaciones de cada valor respecto a la media es siempre cero. Entre sus desventajas estn que se ve afectada por los valores extremos y no se puede calcular si faltan valores debidos a omisin o faltan respuestas. Ejemplo: Nicols desea calcular el promedio anual de sus notas en Matemtica. En el primer trimestre obtuvo 78, en el segundo 85 y en el tercero 86. Cul es el promedio anual de Nicols en Matemtica? Solucin: Sabemos que , pues tenemos tres datos (78, 85, 86)
Calculemos la suma de los valores de esos datos: Ahora dividamos el resultado de la suma (249) por el total de datos (3):
Resp./ El promedio anual de Nicols en matemtica es 83. 2. La mediana: se conoce tambin como la mitad, pues es el valor que divide en conjunto de datos en dos subconjuntos con igual cantidad de datos cada uno. Los datos de un subconjuntos son todos menores o a lo sumo igual que la mediana, mientras que los datos del otro subconjunto, son todos mayores o a por lo menos igual que la mediana. Primero, se deben ordenar en orden ascendente (de menor a mayor) todos los datos obtenidos. Pueden ordenarse de mayor a menor tambin. La mediana se calcular segn uno de los siguientes casos: a. El nmero total de datos es impar: se divide el nmero total de datos por dos, y el resultado obtenido, redondeado al entero mayor, es la posicin de la mediana en el conjunto de datos ordenado. Ejemplo: Calcule la mediana para los siguientes datos: 25, 30, 31, 35, 24, 33, 29
Solucin: Primero, ordenamos los datos en orden ascendente: 24 25 29 30 31 33 35 Calculamos la posicin central: En total tenemos 7 datos, por consiguiente:
Pero 3.5 redondeado al entero mayor es 4, por lo que la mediana es el dato en la cuarta posicin, es decir, 30.
Resp./ La mediana del conjunto de datos es 30. b. El nmero total de datos es par: se divide el nmero total de datos por dos, y el resultado obtenido nos dir la posicin de la que tomaremos dicho dato y el dato a la derecha de este. A continuacin de calcular el promedio de los valores de esos dos datos, y ese promedio ser la mediana. Ejemplo: Calcule la mediana para los siguientes datos: 26, 32, 32, 24, 25, 30 Solucin: Primero, ordenamos los datos en orden ascendente: 24 25 26 30 32 32 Calculamos la posicin central:
Por tanto, sumamos el valor del dato en la posicin 3 (26) ms el valor del dato a su derecha que es 30. Y luego, dividimos la suma por 2.
Resp./ La mediana de este conjunto de datos es 28. Una ventaja de la mediana es que no se ve afectada por los valores extremos. 3. La moda: es el valor del dato que se repite con mayor frecuencia. Si en un conjunto de datos, ningn valor se repite, entonces no hay moda. Por el contrario, si varios valores se repiten, entonces hay varias modas. Es til como medida para variables nominales. Una ventaja de la moda es que es fcil de identificar visualmente Ejemplo: Cul es la moda del siguiente conjunto de datos: 4, 5, 6, 3, 7, 4, 3, 3, 4, 2, 4? Solucin: Si no logramos ver fcilmente el valor que ms se repite, podemos: a. Ordenar los datos de menor a mayor 2 3 3 3 4 4 4 4 5 6 7 De esta manera, observamos que el valor que ms se repite es 4. Por tanto: La moda es 4. b. Hacer una tabla de frecuencia absoluta Valor Frecuencia 2 1 3 3 4 4 5 1 6 1 7 1
Segn la tabla, el valor que ms se repite es 4, por lo que este valor es la moda. Medidas de dispersin: 1. Varianza: cuantifica la variabilidad de los datos respecto a su media. Se calcula de forma diferente segn sea para una muestra o para la poblacin:
; para la poblacin. En ambos casos, se suman las diferencias de cada dato menos la media, al cuadrado. Se dividen por el nmero de datos menos 1 (n-1), si es una muestra; o por el nmero total de datos (N), si es una poblacin. 2. Desviacin estndar o desviacin tpica: es la raz cuadrada de la varianza. Indica cun agrupados estn los datos respecto a la media. Si los datos estn muy agrupados respecto a la media, la desviacin estndar es pequea. Por el contrario, si los datos son muy dispersos, la desviacin estndar ser grande, y como consecuencia, el promedio deja de ser representativo.
3. Rango: es la diferencia entre los valores extremos de los datos, se calcula restando al mximo valor de los datos, el menor valor. Utiliza solamente una parte de la informacin. 4. Coeficiente de variacin: se calcula como el cociente entre la desviacin estndar y la media.
Permite comparar diferentes muestras. Es una medida de dispersin relativa. Es muy importante recalcar, que las medidas de tendencia central resumen la informacin provista por un conjunto de datos, sin embargo, junto a ellas, deben calcularse las medidas de dispersin para poder hacer un anlisis certero.