Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estadística Descriptiva

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 14

ESTADÍSTICA DESCRIPTIVA

Existen cálculos matemáticos que permiten extraer de los datos una tendencia real positiva o
negativa de los resultados. Es precisamente la estadística descriptiva la que nos ayuda a analizar y
describir los datos para obtener un resultado final.

Se dice que la estadística descriptiva es la base de cualquier análisis de datos. Conozcamos más de
sus características y tipos que existen.

¿Qué es la estadística descriptiva?

El término estadística descriptiva se refiere al análisis, el resumen y la presentación de los


resultados relacionados con un conjunto de datos derivados de una muestra o de toda la
población.

La estadística descriptiva comprende tres categorías principales: distribución de frecuencias,


medidas de tendencia central y medidas de variabilidad.

Por estadística descriptiva entendemos, por ejemplo, el cálculo de la media y la mediana, dos
indicadores muy importantes y sobre todo diferentes. La mediana es un indicador que «no tiene
en cuenta los valores extremos, a veces poco frecuentes», a diferencia de la media, que está muy
influida por estos valores extremos.

Objetivo de la estadística descriptiva

El objetivo de la estadística descriptiva es describir los datos observados de forma sintética y


significativa para poder analizarlos mejor. Es recoger observaciones sobre sujetos con una
determinada propiedad y traducir estas observaciones en números que proporcionen información
sobre dicha propiedad.

En resumen, su objetivo es estructurar y representar la información contenida en los datos.

Importancia de la estadística descriptiva

La estadística descriptiva facilita la visualización de los datos. Permiten presentarlos de forma


significativa y comprensible, lo que a su vez da pie a una interpretación simplificada del conjunto
de datos en cuestión.

Los datos brutos serían difíciles de analizar, y la determinación de tendencias y patrones puede ser
un reto. Además, los datos en bruto dificultan la visualización de lo que muestran los datos.

Además, el uso de la estadística descriptiva permite resumir y presentar un conjunto de datos


mediante una combinación de descripciones tabuladas y gráficas. La estadística descriptiva se
utiliza para resumir datos cuantitativos complejos.

Conoce también la importancia del análisis descriptivo.

Tipos de estadística descriptiva

La estadística descriptiva ayuda a describir y comprender las características de un conjunto de


datos específico ofreciendo breves resúmenes sobre la muestra y las medidas de los datos.
Estos son los tipos de estadística descriptiva:

– Distribución de frecuencias

Utilizada tanto para datos cualitativos y cuantitativos. Representa la frecuencia o el recuento de los
diferentes resultados en un conjunto de datos o muestras.

La distribución de frecuencias se presenta normalmente en una tabla o un gráfico. Cada entrada de


la tabla o el gráfico va acompañada del recuento o la frecuencia de aparición de los valores, en un
intervalo, rango o grupo específico.

La distribución de frecuencias es básicamente una presentación o un resumen de datos agrupados


que se han clasificado en función de clases mutuamente excluyentes y del número de ocurrencias
en cada clase respectiva. Permite una forma más estructurada y organizada de presentar los datos
en bruto.

Los cuadros y gráficos más comunes utilizados en la presentación y visualización de la distribución


de frecuencias incluyen gráficos de barras, histogramas, gráficos circulares y gráficos de líneas.

– Tendencia central

La tendencia central es otro de los tipos de estadística descriptiva, y se refiere al resumen


descriptivo de un conjunto de datos utilizando un único valor que refleja el centro de la
distribución de los datos.

Las medidas de tendencia central también se conocen como medidas de localización central. La
media, la mediana y la moda son consideradas las medidas de tendencia central.

La media, que se considera la medida de tendencia central más popular, es el valor medio o más
común en un conjunto de datos. La mediana se refiere a la puntuación media de un conjunto de
datos en orden ascendente. La moda se refiere a la puntuación o valor más frecuente en un
conjunto de datos.

– Variabilidad

Una medida de variabilidad es una estadística de resumen que refleja el grado de dispersión de
una muestra. Las medidas de variabilidad determinan la distancia que los puntos de datos parecen
tener con respecto al centro.

La dispersión y la variabilidad se refieren y denotan el rango y la amplitud de la distribución de los


valores en un conjunto de datos. El rango, la desviación estándar y la varianza se utilizan,
respectivamente, para representar diferentes componentes y aspectos de la dispersión.

El rango representa el grado de dispersión o un ideal de la distancia entre los valores más altos y
más bajos dentro de un conjunto de datos. La desviación estándar se utiliza para determinar la
varianza media de un conjunto de datos y proporciona una idea de la distancia o la diferencia entre
un valor de un conjunto de datos y el valor medio del mismo conjunto de datos.
La varianza refleja el grado de dispersión y es esencialmente una media de las desviaciones al
cuadrado.

Quizá te interese conocer sobre los tipos de datos estadísticos.

Ejemplos de investigación descriptiva

Estos son algunos ejemplos donde se aplica la investigación descriptiva:

Ejemplo 1:

Las estadísticas descriptivas sobre una universidad se refieren a la puntuación media en los
exámenes de matemáticas de los alumnos de nuevo ingreso. No dice nada sobre por qué los datos
son así o qué tendencias podemos ver y seguir.

La estadística descriptiva ayuda a simplificar grandes cantidades de datos de forma significativa.


Reduce muchos datos a un resumen.

TABULACION DE DATOS :
Tras la recogida de datos, el siguiente paso en un trabajo estadístico consiste en
una representación de estos datos de manera directa, concisa y visualmente
atractiva. Esto se hace en Estadística mediante la tabulación de la variable
estadística o del atributo. Realizar una tabulación consiste en elaborar tablas
simples, fáciles de leer y que de manera general ofrezcan una acertada visión de
las características más importantes de la distribución estadística estudiada.

Tabulación para carácter cualitativo

La tabulación de un carácter cualitativo es la más simple de todas. Como norma


general, para construir una tabla de un carácter cualitativo, debemos tener en
cuenta:
 Construir una tabla de tres columnas.
 En la primera columna se colocan los distintos atributos.
 En la segunda columna las frecuencias absolutas, (recuento de
datos para cada atributo).
En la tercera columna las frecuencias relativas (división de
frecuencia absoluta entre el total de datos), o los porcentajes (para
porcentajes se multiplica por cien los valores de la frecuencia
relativa).

Tabulación para variable cuantitativa discreta

Para realizar una tabulación de una variable cuantitativa discreta, se recomienda la


siguiente disposición:
 En la primera columna colocar los distintos valores ordenados
de menor a mayor de la variable discreta.
 En la segunda columna los valores de las frecuencias absolutas
(recuento de datos).
 En la tercera columna los valores de las frecuencias relativas
(división de la frecuencia absoluta entre el total de datos) o de
los porcentajes (para porcentajes se multiplica por cien cada
frecuencia relativa.
 En la cuarta columna los valores de las frecuencias absolutas
acumuladas (acumulación o suma de cada frecuencia absoluta
con todas las anteriores ).
 En la quinta columna los valores de las frecuencias relativas
acumuladas o porcentajes acumulados (lo mismo que para el
caso de la frecuencia relativa).

Tabulación para variable cuantitativa continua

Para los casos en que la variable es continua y también para los casos de discreta
con muchos valores distintos de la variable, la tabulación se realiza agrupando los
valores de la variable en intervalos, generalmente de la misma amplitud y con el
criterio de que el límite inferior de cada intervalo se considera dentro del intervalo
y el límite superior se considera fuera del intervalo. La amplitud de los intervalos
dependerá de cada ejercicio. No es aconsejable tener un número exagerado de
intervalos. En la primera columna situamos los distintos intervalos previamente
planificados y en las restantes columnas se procede de la misma forma que para
variable discreta.

DISTRIBUCION DE FRECUENCIAS OBSOLUTAS Y RELATIVAS.


Si hablamos de frecuencia estadística, podemos definirlo como el número
de veces que ocurre un evento en un experimento o el número de veces
que se repite un dato en una muestra estadística.

Para definir correctamente las frecuencias necesitamos diferenciar entre


dos tipos o dos maneras de representarlas:

 Frecuencia Absoluta: es la definición que entenderíamos


habitualmente como frecuencia estadística. Básicamente es el conteo
de operaciones que se repiten en una muestra o experimento.

 Frecuencia Relativa: se trata simplemente del cociente entre la


frecuencia absoluta (calculada según las indicaciones del punto
anterior) y el tamaño de la muestra o el número de veces que se haya
realizado un experimento.

Frecuencias acumuladas. Del mismo modo que realizamos los dos


cálculos indicados en los párrafos anteriores, tanto las frecuencias
absolutas y como las frecuencias relativas pueden ser mostradas de forma
acumulada.

Vamos a ver un ejemplo de cálculo de frecuencias acumuladas,


frecuencias absolutas y frecuencias relativas, con una tabla muy
sencilla. Os aseguro que es la forma más sencilla de entenderlo:

Notas de un alumno: 7, 10, 10, 4, 10, 7


Histograma.
Es una representación visual de los datos y es una sucesión de rectángulos construidos sobre un sistema de
coordenadas cartesianas de la manera siguiente.

Para explicar este tema vamos a retomar el Ejemplo 2 del apartado 1.2.1.1; además de lo ya calculado,
también tenemos que determinar los límites reales de cada clase.

Para calcular los límites reales:

 Dividimos la precisión entre dos: ½ = 0.5

Límite real inferior: se resta la cantidad calculada a cada uno de los límites inferiores.

Límite inferior Límite superior Límite real inferior Límite real superior
32 41 31.5 41.5
42 51 41.5 51.5
52 61 51.5 61.5
62 71 61.5 71.5
72 81 71.5 81.5
82 91 81.5 91.5
92 101 91.5 101.5

Límite real superior: se le suma la cantidad calculada a cada uno de los límites superiores.

Cada clase se puede identificar por su marca de clase o centro de clase, la cual se puede calcular de la
siguiente forma:

 Xc = (Linf + Lsup) / 2

La fórmula anterior también aplica para los límites reales.

Vamos a aplicar la fórmula de marca de clase para el ejemplo en cuestión.

Límite Límite Límite real Límite real Marca de clase


inferior superior inferior superior Xc
32 41 31.5 41.5 32+41/2 = 36.5

42 51 41.5 51.5 42+51/2 = 46.5

52 61 51.5 61.5 52+61/2 = 56.5

62 71 61.5 71.5 62+71/2 = 66.5

72 81 71.5 81.5 72+81/2 = 76.5

82 91 81.5 91.5 82+91/2 = 86.5

92 101 91.5 101.5 92+101/2 = 96.5

También debemos de calcular la frecuencia porcentual. Ésta se determina a partir de la frecuencia relativa.
Esto es:
 f % = frel x 100 = f/n x 100

Ejemplo: 1. Retomando el ejemplo

Tabla 3

Número de Clase Frecuencia Frecuencia relativa Frecuencia


clase absoluta porcentual
1 32 - 41 4 4/50 = 0.08 0.08x100=8%

2 42 – 51 6 6/50 = 0.12 0.12x100=12%

3 52 – 61 8 8/50 = 0.16 0.16x100=16%

4 62 – 71 12 12/50 = 0.24 0.24x100=24%

5 72 – 81 11 11/50 = 0.22 0.22x100=22%

6 82 – 91 7 7/50 = 0.14 0.14x100=14%

7 92 – 101 2 2/50 = 0.04 0.04x100=4%

Total 100%

La suma total de la frecuencia porcentual debe ser 100%

Pasos para la realización del histograma:

1. Se parte de una tabla que incluya límites reales y frecuencias absolutas, relativa y porcentual.
2. Se eligen los ejes cartesianos, donde la variable estará en el eje horizontal y la frecuencia absoluta,
relativa o porcentual irá en el vertical.
3. Se marcan en el eje horizontal los límites reales y se levantan líneas desde esos puntos. La longitud
de la base de cada rectángulo será igual al ancho del intervalo.
4. La altura de cada rectángulo se localiza en el eje vertical y corresponderá a la frecuencia que se
haya elegido, absoluta, relativa o porcentual.
5. De ser posible, debe cuidarse que la altura del máximo rectángulo sea tres cuartos de la longitud
utilizada para el eje horizontal.

Ojivas

La curva ojiva da una imagen del crecimiento de una distribución, con base en el hecho de que cualquiera de
las distribuciones debe comenzar en cero y terminar en cien. Pasos para construir una ojiva:

1. Ser parte de una tabla que incluya los límites reales superiores de una distribución, además de una
frecuencia acumulada absoluta, relativa o porcentual, según sea el caso.
2. Se eligen los ejes cartesianos, donde la variable estará en el eje horizontal y la frecuencia absoluta,
relativa o porcentual en el eje vertical.
3. Se marcan en el eje horizontal los límites reales superiores de cada clase y se trazan líneas
perpendiculares que cruzaremos con las respectivas líneas perpendiculares de sus frecuencias
acumuladas. Esa intersección representará un punto en el plano cartesiano.
4. La altura de cada punto será la frecuencia acumulada que se haya elegido, absoluta, relativa o
porcentual.
Diagrama de pastel (diagrama circular).

Los diagramas de pastel resultan convenientes cuando la importancia no radica en mostrar el número de
veces que ocurre cierta característica o atributo respecto a los demás valores de la variable, sino que se trata
de resaltar la proporción (o porcentaje) en que estas características aparecen en comparación con el total.

Pasos para elaborar un diagrama de pastel.

1. Se toma como base una tabla de distribución de frecuencias, y se calculan el ángulo y el ángulo
acumulado de cada categoría.
o Θ = f abs / n x 360
o Θ = frel x 360
o Θ = f% x 3.6

Donde las frecuencias se arreglan en orden descendente de preferencia.

2. Se dibuja un círculo y se localiza el ángulo cero, porque éste será el punto de partida.
3. Con un transportador se dibuja el primer ángulo, luego se marca el siguiente ángulo acumulado, y
así, sucesivamente, hasta completarlos en el círculo.
4. Se agregan leyendas a los gajos resultantes, si se desea.
5. Nota: para que un diagrama de pastel sea útil, debe construirse para una variable cuyos valores no
sean demasiados.

Ejemplo:

o Retomando el Ejemplo 1 del Tema 1.1;

Calificación f frel Θ = frel X 360º

Pésimo = 1 20 0.1666 59.97

2 28 0.2333 83.99

3 26 0.2166 77.97

4 26 0.2166 77.97

Excelente = 5 20 0.1666 59.97

Total: 120
MEDIDAS DE TENDENCIA CENTRAL: MEDIA MEDIANA MODA Y MEDIA GEOMETRICA

La media, mediana y moda son las medidas de tendencia central más importantes, de mayor
aplicación y más fáciles de calcular. Sin embargo, en ciertas circunstancias son útiles otras medidas
de tendencia central y aunque su uso no sea frecuente, es conveniente conocerlas; estas son:

La media ponderada es una generalización de la media aritmética. Es una medida de


tendencia central, que es apropiada cuando en un conjunto de datos cada uno de ellos tiene
una importancia relativa (o peso) respecto de los demás datos. Se obtiene multiplicando cada
uno de los datos por su ponderación (peso) para luego sumarlos, obteniendo así una suma
ponderada; después se divide esta entre la suma de los pesos, dando como resultado
la media ponderada

matemáticas y estadística, una media o promedio es una medida de tendencia central.


Resulta al efectuar una serie determinada de operaciones con un conjunto de números y que,
en determinadas condiciones, puede representar por sí solo a todo el conjunto. Existen
distintos tipos de medias, tales como la media geométrica, la media ponderada y la media
armónica aunque en el lenguaje común, tanto en estadística como en matemáticas la
elemental de todas ellas es el término que se refiere generalmente a la media aritmética.
¿Qué es la media?

La media, también conocida como promedio, es el valor que se obtiene al dividir la suma de un
conglomerado de números entre la cantidad de ellos.

La media representa el punto de equilibrio de la distribución y está influida por los valores
extremos. Proporciona una medida de la tendencia general o valor medio de los datos.

Se calcula sumando todos los valores del conjunto de datos y dividiendo la suma por el número
total de puntos de datos.

Algunas características de la media son:

 Considera todas las puntuaciones


 El numerador de la fórmula es la cantidad de valores
 Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra

Cómo sacar la Media

Para obtener la Media de un conjunto solo tienes que seguir estos sencillos pasos:

1. Determina el conjunto de valores que buscas promediar.


2. Suma los valores para obtener el total
3. Haz el conteo de la cantidad de valores en el conjunto.
4. Divide la suma del conjunto entre la cantidad de números.

Ejemplo de Media

En una tienda mayorista se quiere calcular el promedio de ventas que realizaron los empleados
durante el mes. Para calcular la media se realiza lo siguiente:
¿Qué es la mediana?

La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores, es decir, que al
ordenar los número de menor a mayor, éste se encuentra justamente en medio entre los que están por arriba.

Se calcula sumando todos los valores del conjunto de datos y dividiendo la suma por el número total de
puntos de datos.

La media representa el punto de equilibrio de la distribución y está influída por los valores extremos.
Proporciona una medida de la tendencia general o valor medio de los datos.

Algunas características de la media son:

 Las operaciones para calcular el valor son muy sencillas de realizar.


 La medida no depende de los valores de las variables, solamente de su orden.
 Generalmente, los valores son enteros.
 Se puede calcular aunque los números que se encuentren arriba y abajo no tengan límites.

Como sacar la Mediana

Los pasos para sacar la mediana son:

1. Ordena todos los números del más pequeño al más grande.


2. Encuentra el número del medio del conjunto.

 Si tienes una cantidad impar: Tacha el número al final de la izquierda, después el primero a la
derecha, y repite el proceso hasta quedarte con un número, que será la mediana.
 Si tienes una cantidad par, al final quedarás con dos números en el centro. Súmalos y divídelos entre
2 para obtener la mediana.

Ejemplo de Mediana

 La cantidad de valores es impar

Si se tienen los valores: 9,5,4,2,7, se ordenan: 2, 4, 5, 7, 9. El elemento de en medio es el 5, ya que se


encuentra dos valores por encima y dos valores por debajo.

 La cantidad de valores es par

Si se tienen los valores 9,5,4,2, se ordenan: 2,4,5,9. En este caso se toman los dos valores centrales 5 y 4, la
mediana es el promedio de ambos: 9

¿Qué es la moda?
La moda es el valor que aparece más dentro de un conjunto de datos. A diferencia de la media y la mediana,
la moda no requiere valores numéricos y puede utilizarse con datos categóricos o discretos.
Un conjunto de datos puede tener un modo, conocido como unimodal, o varios modos, denominados bimodal
o multimodal. Se llama amodal cuando en un conglomerado no se repiten los valores.

Las principales características de la moda son:

 Es una muestra muy clara


 Las operaciones para determinar el resultado son muy fáciles de elaborar
 Los valores que se presentan pueden ser cualitativos y cuantitativos

Como sacar la Moda


Los pasos para obtener la moda de un conjunto son:

 Escribe todos los números del conjunto.


 Encuentra el número o los números (en los casos bimodales o multimodales) que aparezcan más
veces.

Ejemplo de Moda

MEDIDAS DE DISPERSIÓN RANGO VARIANZA Y DESVIACIÓN ESTÁNDAR

Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar
las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor más elevado y el valor más bajo.

2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se
calcula como sumatorio de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tamaño de la muestra.

La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más
concentrados están los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, más dispersos están.

4.- Coeficiente de variación de Pearson: se calcula como cociente entre la


desviación típica y la media.

Ejemplo: vamos a utilizar la serie de datos de la estatura de los alumnos de una


clase (lección 2ª) y vamos a calcular sus medidas de dispersión.

Desviación estándar
Al igual que la varianza, la desviación estándar es una medida de variabilidad que también toma
en cuenta la dispersión de los valores de los datos respecto a su media. Sin embargo, su significado
es más valioso que el de la varianza, pues su resultado se encuentra expresado en las mismas
unidades de la variable que se examina y no en valores elevados al cuadrado como lo hace la
varianza. La desviación estándar se representa mediante la letra griega σ para el caso de una
población, o por S en el caso de una muestra. Se obtiene sacando la raíz cuadrada al resultado de
la varianza, no importa si ésta se trata de una varianza para datos no agrupados o para datos
agrupados, o provenientes de una muestra o de una población. Al proporcionar sus resultados en
unidades no cuadradas, la desviación estándar es muy fácil de interpretar y su resultado tiene
mayor significado en el análisis de un fenómeno. Las fórmulas para la desviación estándar para
datos no agrupados son:

También podría gustarte