Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tema 1. Estadística Descriptiva

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 27

Estadística descriptiva

[1.1] Introducción. Estadísticos de resumen


[1.2] La media
[1.3] La moda
[1.4] La desviación típica
[1.5] El coeficiente de variación
[1.6] Los coeficientes de asimetría y apuntamiento (kurtosis)
[1.7] La mediana y la MEDA
[1.8] Los cuartiles y el rango intercuartílico
[1.9] El diagrama de cajas. Datos atípicos y outliers
[1.10] Comparación de media y mediana. Robustez
[1.11] La media recortada

TEMA
Semana de refuerzo - Estadística

Esquema

TEMA 1 – Esquema © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

1.1 Introducción. Estadísticos de resumen

En este tema se presentan los principales indicadores y métricas que permiten resumir
un conjunto de datos y sacar conclusiones de interés sobre sus principales características
y propiedades. Estos indicadores y métricas se denominan estadísticos de resumen,
estadísticos descriptivos o simplemente estadísticos.

Los estadísticos de resumen se dividen en categorías en función del tipo de información


que proporcionan, si bien la clasificación varía en muchas ocasiones entre autores.

En la asignatura emplearemos la siguiente clasificación de los estadísticos de resumen


que se van a estudiar:

 Media
Medidas de tendencia central  Moda
 Mediana
 Media recortada

 Varianza
 Desviación típica
Medidas de dispersión  Coeficiente de variación
 MEDA
 Rango
 Rango intercuartílico

 Mediana
Medidas de posición  Cuartiles
 Deciles
 Percentiles

Medidas de forma  Coeficiente de asimetría


 Coeficiente de apuntamiento o curtosis

1.2. La media

Definición

La media es la medida básica y más utilizada para resumir un conjunto de


datos, y constituye un estadístico de resumen que debe calcularse (siempre

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

que sea posible) a la hora de analizar una determinada variable en una


muestra o población.

Para una variable determinada la media se define como la suma de los valores de todas
las observaciones de la variable dividida entre el número de observaciones.

Matemáticamente, dado un conjunto de N datos {x1, x2,…, xN}, su media se calcula como:

x1 + x2 + … + xN Σ
i= 1
xi
x= =
N N

Por su propia definición, la media no puede calcularse para variables que no


sean numéricas, o que, siendo numéricas, no admitan la operación de suma
entre valores. Por tanto, sólo puede calcularse para variables medidas en una
métrica de intervalo o de razón. Esto mismo aplicará para la totalidad de
medidas de descripción de datos que se estudiarán en este tema (salvo la
moda), aún cuando, para evitar reiteración, no volverá a hacerse esta precisión en el
futuro.

Un caso particular de cálculo de la media es el de variables cuantitativas (medidas


en escalas de intervalo o de razón) de las que no se dispone de todas las
observaciones, sino únicamente de los intervalos o clases en los que se ha
dividido dicha variable y las frecuencias (absolutas o relativas) de cada
intervalo. En ese caso la media se calcula como:

x= Σ
i= 1
ci fi

Donde k es el número de intervalos, ci es la marca de clase del intervalo i, y fi es la


frecuencia relativa del intervalo i.

Interpretación

La media puede interpretarse de dos formas diferentes:

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

La media es el centro de gravedad del conjunto de datos. Si imaginamos los


datos en una recta, la media en el valor donde habría que colocar el fulcro para
mantener en equilibrio dicha recta.
La media es una medida del volumen total de la variable. En efecto, si se
multiplica la media por el número de observaciones, resulta la suma de todas las
informaciones, es decir, el volumen total de la variable.

Propiedades

La media tiene tres propiedades básicas:

La suma de las desviaciones de todos los datos respecto de la media es


siempre igual a cero, dado que las desviaciones positivas y negativas se
compensan, de modo que al sumarlas, siempre da cero. De forma matemática:

(x1 – x) + (x2 – x) +… + (xN – x) = Σ


i= 1
(xi – x) = 0

La media de una variable resultante de la suma de otras variables


originales es igual a la suma de las medias de las variables originales. De
forma matemática:

(x + y + … + z) = x + y + … + z

La media de una variable resultante de multiplicar la variable original por


una constante k es igual a la media de la variable original multiplicada por
dicha constante k. De forma matemática:

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

(k x) = k x

1.3. La moda

Para una variable determinada la moda se define como el atributo o valor con mayor
frecuencia absoluta. En el caso de variables cuantitativas divididas en intervalos o clases,
de denomina intervalo o clase modal al intervalo o clase que más frecuencia absoluta
presenta.

La moda puede calcularse para cualquier tipo de variable, con independencia de


la métrica empleada para medirla.

Una variable puede tener una única moda (en cuyo caso se denomina unimodal) o
varias modas (bimodal, trimodal, etc.)

Variable unimodal Variable bimodal

1.4. La desviación típica

Definición

La media o la moda son medidas que aportan información sobre la tendencia central
de los datos, pero no aportan ninguna información sobre si los datos están o
no dispersos respecto a esa tendencia central, y en qué medida lo están. Para
dar esa información la métrica más utilizada es la desviación típica.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Para una variable determinada la desviación típica (también llamada desviación


estándar) se define como la raíz cuadrada positiva de la media de las desviaciones
cuadráticas respecto a la media (las desviaciones respecto a la media elevadas al
cuadrado).

Matemáticamente, dado un conjunto de N datos {x1, x2,…, xN}, su desviación típica se


calcula como:

sx = Σ
i= 1
(xi – x)2

NOTA: Algunos autores definen la desviación


típica considerando (N-1) en lugar de N en el
denominador. En la asignatura consideraremos N
en el denominador.

En el caso particular de variables cuantitativas cuando se dispone únicamente de


los intervalos o clases en los que se ha dividido dicha variable y las frecuencias de
cada intervalo, la desviación típica se calcula como:

k
sx = Σ (ci – x)2 fi
i= 1

Donde k es el número de intervalos, ci es la marca de clase del intervalo i, y fi es la


frecuencia relativa del intervalo i.

Al cuadrado de la desviación típica, es decir, a la media de las desviaciones


cuadráticas respecto a la media, se le denomina varianza. La razón de que se
emplee con mayor asiduidad la desviación típica que la varianza para caracterizar un
conjunto de datos es que la desviación típica se expresa en las mismas unidades
que la variable estadística estudiada (por ejemplo: euros, ºC, etc.) mientras que la
varianza se expresa en esas unidades al cuadrado (por ejemplo: euros2, ºC2, etc.),
lo cual dificulta su interpretación.

Interpretación

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

La desviación típica mide la dispersión de los valores de la variable en torno a la


media: a mayor desviación típica, mayor es la dispersión de los valores de la
variable respecto a la media (es decir, más ‘separados’ están en promedio los valores
respecto a la media), y viceversa.

Una importante interpretación de la desviación típica es la llamada regla de


Chebychev, que dice que para cualquier conjunto de datos la proporción (en
tanto por ciento) de observaciones que se encuentran a una distancia de la
media menor de m veces la desviación típica es de:

100 (1 – 1/m2) %

De ello se deduce que:

En el intervalo (x – 2sx, x + 2sx) hay al menos el 75% de los datos


En el intervalo (x – 3sx, x + 3sx) hay al menos el 88% de los datos
En el intervalo (x – 4sx, x + 4sx) hay al menos el 93% de los datos

Propiedades

La desviación típica tiene dos propiedades básicas:

La desviación típica es igual a la raíz cuadrada positiva de: la media de


una variable que sea el cuadrado de la variable original menos la media
de la variable original al cuadrado. De forma matemática:

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

sx = Σ
i= 1
xi 2
- x2
N

La media de una variable resultante de una transformación lineal de la


variable original es proporcional a la desviación típica de la variable
original. De forma matemática:

sax + b = a sx

1.5. Coeficiente de variación

Definición

El coeficiente de variación se define como el cociente entre la desviación típica y el valor


absoluto (es decir, siempre positivo) de la media de dicha variable.

De forma matemática, el coeficiente de variación se expresa como:

sx
CVx =
x

Interpretación

El coeficiente de variación es una medida de la dispersión o variabilidad de los


datos que no tiene en cuenta la magnitud de los mismos. Su utilidad radica en
que es una métrica adimensional (es decir, no tiene dimensiones) dado que se
dividen dos magnitudes medidas con las mismas unidades, entre sí y con la variable
estadística bajo estudio.

Por tanto, permite comparar la dispersión o variabilidad entre variables que


estén medidas con diferentes unidades o que tengan valores muy diferentes,

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

por ejemplo, una con valores muy altos y la otra con valores muy bajos. Imaginemos dos
variables con los mismos datos, pero una de ellas medida en euros y otra en céntimos de
euro; es fácil comprender que la variable medida en céntimos de euro tendrá una media
y una desviación típica más altas que la otra medida en euros, pero el coeficiente de
variación será idéntico, lo que muestra que la dispersión comparada entre ambas
variables es, como es evidente, la misma.

1.6. Los coeficientes de asimetría y apuntamiento (curtosis)

Existen dos propiedades importantes de una variable estadística relacionada


con la forma que tiene su histograma:
Simetría
Apuntamiento (también llamada curtosis)

Simetría

Se dice que una variable tiene una distribución1 simétrica respecto de un eje
vertical llamado eje de simetría (y situado en la media), si existe el mismo
número de valores a la derecha que a la izquierda de dicho eje y, por tanto, el
mismo número de desviaciones respecto a la media con signo positivo que
con signo negativo.

En cambio, se dice que la variable tiene una distribución asimétrica positiva (o a


la derecha) si la ‘cola’ a la derecha de la media es más larga que la de la izquierda, es
decir, si hay valores más separados de la media a la derecha. Del mismo modo,
se dice que hay una distribución asimétrica negativa (o a la izquierda) si la ‘cola’
a la izquierda de la media es más larga que la de la derecha, es decir, si hay valores
más separados de la media a la izquierda.

1 Una distribución es la representación alisada de un histograma o su polígono de frecuencias asociado.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Distribución asimétrica Distribución asimétrica


Distribución simétrica a la derecha a la izquierda

Para poder conocer la simetría de una variable respecto de la media sin necesidad de
representar su histograma o su polígono de frecuencias, se ha definido un indicador
que permite decidir sobre el tipo de simetría de una determinada variable y,
en su caso, la magnitud de la asimetría: es el coeficiente de asimetría.

Matemáticamente, el coeficiente de asimetría se define como sigue:

Σ
i= 1
(xi - x)3
CAx =
N sx3

En el caso particular de variables cuantitativas cuando se dispone únicamente de


los intervalos o clases en los que se ha dividido dicha variable y las frecuencias de
cada intervalo, el coeficiente de asimetría se calcula como:

Σ
i= 1
(ci - x)3 fi
CAx =
sx3

Donde k es el número de intervalos, ci es la marca de clase del intervalo i, y fi es la


frecuencia relativa del intervalo i.

El coeficiente de asimetría se interpreta como sigue:

Si el coeficiente de asimetría es cero, la distribución de la variable es simétrica.


Si el coeficiente de asimetría es positivo, la distribución es asimétrica a la
derecha, dado que pesan más las desviaciones positivas respecto a la media que las

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

negativas. Cuanto mayor es el coeficiente de asimetría (más positivo)


mayor es su asimetría a la derecha.
Si el coeficiente de asimetría es negativo, la distribución es asimétrica a la
izquierda, dado que pesan más las desviaciones negativas respecto a la media que
las positivas. Cuanto menor es el coeficiente de asimetría (más negativo)
mayor es su asimetría a la izquierda.

Apuntamiento o curtosis

Otra característica importante de una variable es el apuntamiento o curtosis de su


distribución, es decir, lo picuda que es. En base a ello una variable determinada puede
tener una distribución:
Mesocúrtica, si tiene un apuntamiento igual a una distribución tomada como
referencia (distribución normal, que estudiaremos en temas posteriores en la
asignatura)
Platicúrtica, si tiene un apuntamiento menor a la distribución normal
Leptocúrtica, si tiene un apuntamiento mayor a la distribución normal

Como en el caso de la simetría, para poder conocer el apuntamiento de una variable


respecto de la distribución de referencia sin necesidad de representar su histograma o su
polígono de frecuencias, se ha definido un indicador que permite decidir sobre el
tipo de apuntamiento de una determinada variable y la magnitud del mismo:
es el coeficiente de apuntamiento o de curtosis.

Matemáticamente, el coeficiente de apuntamiento o de curtosis se define como sigue:

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Σ
i= 1
(xi - x)4
CApx =
N sx4

En el caso particular de variables cuantitativas cuando se dispone únicamente de


los intervalos o clases en los que se ha dividido dicha variable y las frecuencias de
cada intervalo, el coeficiente de apuntamiento o de curtosis se calcula como:

Σ
i= 1
(ci - x)4 fi
CApx =
sx4

Donde k es el número de intervalos, ci es la marca de clase del intervalo i, y fi es la


frecuencia relativa del intervalo i.
El coeficiente de apuntamiento o de curtosis se interpreta como sigue:

Si es tres, la distribución es mesocúrtica, dado que para la distribución de


referencia (la distribución normal) el coeficiente toma valor tres.
Si es mayor que tres, la distribución es leptocúrtica. Cuanto mayor es el
coeficiente, más apuntada es la distribución.
Si es menor que tres, la distribución es platicúrtica. Cuanto menor es el
coeficiente, más plana es la distribución.

Dado que la distribución de referencia a efectos de estudiar el apuntamiento tiene un


coeficiente de apuntamiento igual a 3 con la definición que se ha expuesto, algunos
autores definen el coeficiente de apuntamiento restando 3 a esta definición,
de modo que la distribución de referencia tiene, con esta nueva definición, un
coeficiente de apuntamiento nulo. Empleando esta definición empleada por
algunos autores, una distribución mesocúrtica tiene un coeficiente de apuntamiento
cero, una platicúrtica negativo, y una leptocúrtica positivo.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

1.7. La mediana y la MEDA

Mediana

Para una variable determinada la mediana es el valor de la variable que deja el mismo
número de datos antes y después que él, o lo que es lo mismo, el que se ocupa el lugar
central de todos los datos cuando éstos están ordenados de menor a mayor.

Matemáticamente, dado un conjunto de N datos {x1, x2,…, xN}, su mediana se calcula de


la siguiente manera:

Si el número de observaciones N es impar la mediana es igual al dato central,


una vez ordenados los datos de menor a mayor.

medx = x N +1
2

Si el número de observaciones N es par: la mediana es igual a la semisuma de


los dos datos centrales, una vez ordenados los datos de menor a mayor.

x N +x N
+1
2 2
medx =
2

En las fórmulas anteriores, el valor contenido entre paréntesis en el subíndice


significa la posición de la observación dentro del conjunto de datos, una vez
ordenado éste de menor a mayor.

La MEDA

La MEDA se define como la mediana del conjunto de datos que resulta de calcular la
desviación absoluta de cada dato respecto de la mediana global de la variable.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Es la métrica equivalente a la desviación típica cuando la tendencia central se


calcula mediante la mediana en lugar de emplear la media. Matemáticamente se expresa:

MEDAx = med ( x1 – medx , x2 – medx , …, xN – medx )

1.8. Cuartiles y rango intercuartílico

Cuartiles, deciles y percentiles

Para una variable determinada, los cuartiles son los valores de la variable que, una vez
ordenados los datos de menor a mayor, dividen a la distribución en cuatro partes que
contienen el mismo número de observaciones (igual frecuencia absoluta).

De la propia definición de cuartiles se deriva que existen tres cuartiles:

Q1 o cuartil del 25%, que es el valor de la variable que deja a su derecha el 25%
de los datos, una vez ordenados éstos de menor a mayor.
Q2 o cuartil del 50%, que es el valor de la variable que deja a su derecha el 50%
de los datos, una vez ordenados éstos de menor a mayor. Por su propia definición,
el cuartil Q2 es igual a la mediana.
Q3 o cuartil del 75%, que es el valor de la variable que deja a su derecha el 75%
de los datos, una vez ordenados éstos de menor a mayor.

Si en vez de dividir el conjunto de datos en cuatro partes con la misma frecuencia


absoluta se decide hacerlo en diez partes de igual frecuencia, se llega al concepto de
deciles.

Para una variable determinada, los deciles son los nueve valores de la variable que, una
vez ordenados los datos de menor a mayor, dividen a la distribución en diez partes que
contienen el mismo número de observaciones (igual frecuencia absoluta).

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Los nueve deciles se representan por D1, D2,…, D9, y la interpretación de cada uno
de ellos es similar a la de los cuartiles, variando el porcentaje de datos que deja a la
derecha cada uno de ellos una vez ordenados los datos (así, el decil D5 deja a la derecha
el 50% de los datos y equivale a la mediana).

La última generalización posible es considerar los 99 valores que, una vez


ordenados los datos de menor a mayor, dividen a la distribución en cien
partes que contienen cada una de ellas contiene el mismo número de
observaciones (igual frecuencia absoluta). En este caso se habla de percentiles,
y se representan por Pa, donde a es el porcentaje de valores que dejan a su derecha,
una vez ordenado el conjunto de datos de menor a mayor.

Rango intercuartílico

El rango intercuartílico, representado por RI, es la diferencia entre el cuartil Q3


y el cuartil Q1, y representa el rango en el que se da el 50% de las
observaciones centrales del conjunto de datos.

1.9. El diagrama de cajas. Datos atípicos y outliers

El diagrama de cajas es un gráfico mediante el cual se visualizan aspectos


importantes del conjunto de datos, en concreto:

La mediana
Los cuartiles Q1 y Q3
Los datos atípicos y outliers
La simetría de la distribución

Para construir el diagrama de cajas se han de seguir los siguientes pasos:

Calcular la mediana, los cuartiles y el rango intercuartílico.


Dibujar una recta horizontal y en ella una escala que vaya del valor menor al valor
mayor en el conjunto de datos.
Sobre dicha recta horizontal, dibujar tres líneas verticales, una en la mediana y
las otras dos en cada uno de los cuartiles.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Cerrar las líneas anteriores con dos segmentos horizontales, de forma que la
representación refleje dos rectángulos unidos por una arista.
Marcar sobre la escala horizontal dos segmentos verticales, uno a la izquierda y
una distancia de 1,5 RI desde Q1, y otra a la derecha y a una distancia 1,5
RI desde Q3.
Repetir la operación para 3 RI, marcando con líneas verticales discontinuas.
Representar con puntos los valores que quedan:
o Hacia la izquierda, a una distancia superior a 1,5 RI e inferior a 3 RI desde Q1.
o Hacia la derecha, a una distancia superior a 1,5 RI e inferior a 3 RI desde Q3.
Estos valores reciben el nombre de datos atípicos.
Representar con aspas los valores que quedan:
o Hacia la izquierda, a una distancia superior a 3 RI desde Q1.
o Hacia la derecha, a una distancia superior a 3 RI desde Q3.
Estos valores reciben el nombre de valores extremos o outliers.

Gráficamente el diagrama de cajas tiene un aspecto como el que se muestra a


continuación:

1,5 RI 1,5 RI

3 RI 3 RI

Q1 Mediana Q3

1.10. Comparación de media y mediana. Robustez

En Estadística se define robustez a la estabilidad en el cálculo ante la presencia de datos


atípicos u observaciones extremas.

Desde ese punto de vista la mediana es mucho más robusta que la media, dado
que esta última es muy sensible a la aparición de valores muy altos o muy bajos, que
‘pesarán’ mucho o poco en el cálculo de la media, mientras que para el cálculo de la
mediana son sólo unas observaciones más, cuyo ‘peso’ es idéntico al del resto de
observaciones.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Esta mayor sensibilidad de la media a datos atípicos u observaciones extremas tiene una
implicación relacionada con la simetría de la variable:

Si la distribución es simétrica, media y mediana coinciden en el mismo valor.


Si la distribución es asimétrica a la derecha, la media es mayor que la
mediana, dado que hay más valores altos (cola derecha de la distribución).
Si la distribución es asimétrica a la izquierda, la mediana es mayor que la
media, dado que hay más valores bajos (cola izquierda de la distribución).
Distribución asimétrica Distribución asimétrica
Distribución simétrica a la derecha a la izquierda

Media = mediana Mediana Media Media Mediana

Por todo ello, la mediana es una métrica de resumen más acertada si en el


conjunto de datos se han detectado datos atípicos u observaciones extremas,
o si se prevé que existan.

1.11. La media recortada

Se denomina media recortada al α% a la media que resulta tras eliminar del


proceso de cálculo el α% de las observaciones por ambos extremos, es decir,
tanto el α% de las observaciones mayores como el α% de las observaciones menores.

La utilidad de emplear la media recortada es que permite dotar de robustez al


cálculo de la media, al prescindir de los valores extremos o outliers, que pueden
causar valores de media excepcionalmente altos o bajos.

La media recortada se interpreta exactamente igual que la media, con la


salvaguarda de que se ha de considerar la eliminación de observaciones que se
ha realizado.

TEMA 1 – Ideas clave © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Lo + recomendado

No dejes de leer…

Estadísticos de promedio. Tendencia central


López López, Eduardo. Universidad Complutense de Madrid (2006)

El documento define los tres estadísticos básicos de tendencia central (media, mediana
y moda) y describe su proceso de cálculo, incluyendo ejemplos de cada uno de ellos.
Asimismo, se describe la utilidad de cada una de las medidas presentadas, y cuándo es
adecuada cada una de ellas.

El documento está disponible en el aula virtual o en la siguiente dirección web:


http://www.ucm.es/info/mide/docs/central.pdf

No dejes de ver…

Introductory Statistics - Chapter 3: Measuring data

El vídeo muestra los conceptos básicos de la Estadística que se han desarrollado en el


tema 3, incluyendo detalles sobre el cálculo e interpretación de las diferentes medidas de
tendencia central, de dispersión y de posición.

El vídeo está disponible en el aula virtual o en la siguiente dirección web:


http://www.youtube.com/watch?v=NIhU9HB1NwM

TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Medidas de tendencia central y medidas de dispersión

El vídeo muestra el proceso paso a paso para el cálculo de las principales medidas de tendencia
central (media, mediana y moda) y medidas de dispersión (rango, varianza y desviación típica)
utilizando el software Excel, mediante dos procedimientos diferentes: a) cálculo manual
mediante las fórmulas de Excel, y b) a través del módulo de Análisis de Datos incorporado en
Excel, que realiza un resumen de los principales estadísticos de un conjunto de datos de forma
automática.

El vídeo está disponible en el aula virtual o en la siguiente dirección web:


http://www.youtube.com/watch?v=vgpB5OT6cyQ&feature=related

TEMA 1 – Lo + recomendado © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

+ Información

A fondo

Medidas de posición para la descripción de una variable


‘Estadística básica con aplicaciones en Excel’. Edición electrónica gratuita (2007)
Quesada Ibarguen, Víctor Manuel y Vergara Schmalbach, Juan Carlos.

El documento aborda la definición y cálculo de las principales medidas de posición que


se han estudiado a lo largo del tema: percentiles, deciles y cuartiles. Asimismo, plantea
el cálculo de estos estadísticos utilizando el software Excel.

El documento está disponible en el aula virtual o en la siguiente dirección web:


http://190.121.143.77/textos/metodologia/estadistica/capitulo-vi.pdf

Medidas descriptivas básicas de tendencia central y dispersión


Morales Vallejo, Pedro (2007). Universidad Pontificia de Comillas

El documento describe con toda profundidad las principales medidas de tendencia


central y dispersión, definiendo los conceptos relacionados con cada uno de los
estadísticos, así como sus propiedades, forma de cálculo e interpretación.

El documento está disponible en el aula virtual o en la siguiente dirección web:


http://www.upcomillas.es/personal/peter/estadisticabasica/MedidasBasicas.pdf

TEMA 1 – +Información © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Webgrafía

The Data and Story Library (DASL)

Biblioteca online donde se pueden encontrar conjuntos de datos para practicar los
conceptos estadísticos aprendidos. Asimismo, ilustra el empleo de los conceptos y
métodos estadísticos básicos, de modo que su consulta puede servir al alumno a valorar
qué cálculos estadísticos son apropiados en cada caso y por qué.

http://lib.stat.cmu.edu/DASL/

TEMA 1 – +Información © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Buscador de fórmulas estadísticas en Microsoft Excel

La página proporciona una interesante funcionalidad de búsqueda de las fórmulas


estadísticas soportadas por Excel (entre ellas todas las estudiadas en este tema), así como
las diferencias que existen en dichas fórmulas entre las diferentes versiones comerciales,
actuales o anteriores, de Microsoft Excel. Esta funcionalidad puede ayudar al alumno a
adquirir agilidad en la aplicación de los conceptos estadísticos con Excel.

http://office.microsoft.com/es-es/excel-help/results.aspx

Bibliografía

HERNÁNDEZ BASTIDA, A. Curso elemental de Estadística Descriptiva. Ediciones


Pirámide. Madrid, 2007

KAZMIER LEONARD, J. Estadística aplicada a la Administración y la Economía.


McGraw-Hill. Madrid. 2006

MARTIN-GUZMAN CONEJO, M. P. Manual de Estadística Descriptiva. Civitas.


Madrid. 2006

MONTERO LOREZO, J.M. Estadística Descriptiva. Thomson Paraninfo S.A. Madrid.


2007

NEWBOLD, P. Estadística para Administración y Economía. Pearson-Prentice Hall.


Madrid. 2008

TEMA 1 – +Información © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

PÉREZ, C. Estadística aplicada a través de Excel. Prentice Hall. Madrid. 2002

RITCHEY FERRIS, J. Estadística para las Ciencias Sociales. McGraw Hill. México D.F.
2008

SARABIA VIEJO, A. y MATE JIMÉNEZ, C. Problemas de Probabilidad y Estadística.


Elementos teóricos, cuestiones, aplicaciones con Statgraphics. CLAGSA. Madrid. 1993

TRIOLA, M.F. Elementary Statistics. Addison Wesley. Boston. 2002

TEMA 1 – +Información © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

Test

1. ¿Cuál de las siguientes afirmaciones sobre la media son verdaderas?


A. La suma de las desviaciones de todos los datos respecto de la media es siempre
igual a cero, dado que las desviaciones positivas y negativas se compensan, de
modo que al sumarlas, siempre da cero.
B. La media de una variable resultante de la suma de otras variables originales es
igual a la suma de las medias de las variables originales.
C. La media de una variable resultante de la multiplicación de otras variables
originales es igual al producto de las medias de las variables originales
D. La media de una variable resultante de multiplicar la variable original por una
constante k es igual a la media de la variable original multiplicada por dicha
constante k.

2. Tres investigadores están analizando un fenómeno estadístico y obtienen los


resultados que se muestran. Sin necesidad de más información, ¿cuál de ellos es
seguro que ha cometido un error?
A. Investigador 1: media 12.1 gramos; desviación típica 6.8 gramos2
B. Investigador 2: media 14.1 gramos; desviación típica 2.6 gramos
C. Investigador 3: media 18.7 gramos; desviación típica 3.6 gramos
D. No es posible saberlo

3. La media de una determinada variable es 18 cm y la desviación típica es 2cm. En base


a la regla de Chebychev, ¿cuántos datos habrá como mínimo en el intervalo [12,24]
cm?
A. El 75% de los datos
B. El 99% de los datos
C. El 88% de los datos
D. El 25% de los datos

4. La variable estadística A tiene un coeficiente de variación de 1.2 y la variable


estadística B tiene un coeficiente de variación de 3.7. ¿Cuál de ellas tiene una mayor
dispersión en los datos?
A. La variable A
B. La variable B
C. No es posible saberlo, necesitaría conocer además la media de ambas variables

TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

D. No es posible saberlo, necesitaría conocer además la media y la desviación típica


de ambas variables

5. ¿Cuál de las siguientes afirmaciones es correcta?


A. Cuanto mayor es el coeficiente de asimetría, la distribución de la variable es
más asimétrica a la derecha, y mayor su ‘cola’ a la izquierda
B. Cuanto mayor es el coeficiente de asimetría, la distribución de la variable es
más asimétrica a la derecha, y mayor su ‘cola’ a la derecha
C. Cuanto menor es el coeficiente de asimetría, la distribución de la variable es
más asimétrica a la derecha, y mayor su ‘cola’ a la izquierda
D. Cuanto menor es el coeficiente de asimetría, la distribución de la variable es
más asimétrica a la derecha, y mayor su ‘cola’ a la derecha

6. Una variable tiene un coeficiente de asimetría de 7.1 y un coeficiente de apuntamiento


de 2.4, ¿qué se puede decir de la distribución de la variable?
A. Es asimétrica a la derecha y leptocúrtica
B. Es asimétrica a la izquierda y leptocúrtica
C. Es simétrica y platicúrtica
D. Es asimétrica a la derecha y platicúrtica

7. Una determinada variable estadística tiene una media de 22.8ºC y una mediana de
24.1ºC, ¿qué puedes decir de la distribución de la variable?
A. Que es asimétrica a la izquierda
B. Que es asimétrica a la derecha
C. Que es leptocúrtica
D. Que es platicúrtica

8. Sabiendo que una variable estadística tiene Q1 = 9 y Q3 = 39, ¿cuáles de los siguientes
valores de la variable puede considerarse un valor extremo o outlier?
A. El valor -101
B. El valor 154
C. El valor 141
D. El valor -75

TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR)


Semana de refuerzo - Estadística

9. ¿Cuál de las siguientes afirmaciones sobre los cuartiles Q1 y Q3 es falsa?


A. Entre ambos cuartiles ha de estar la mediana
B. Entre ambos cuartiles ha de estar la media
C. Entre ambos cuartiles se encuentran siempre cinco deciles
D. La diferencia de Q3 a Q1 es el rango intercuartílico

10. ¿Cuáles de las siguientes afirmaciones sobre la robustez de las medidas de tendencia
central de una variable son correctas? Puede haber más de una respuesta válida.
A. La mediana de la variable es más robusta que la media
B. La media recortada de la variable es más robusta que la media
C. La media de la variable es más robusta que la media recortada si no hay
observaciones extremas
D. La media es la más robusta de las medidas de tendencia central si no hay
observaciones extremas

TEMA 1 – Test © Universidad Internacional de La Rioja (UNIR)

También podría gustarte