Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Apuntes de Descriptiva y Ejercicios

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 16

MEDIDAS DESCRIPTIVAS

Las medidas descriptivas son valores numéricos calculados a partir de la muestra y


que nos resumen la información contenida en ella.

Medidas de posición

Las medidas de posición relativa se llaman en general cuantiles y se pueden


clasificar en tres grandes grupos: Cuartiles, quintiles, deciles, percentiles.

Las medidas de posición como los cuartiles, quintiles, deciles y percentiles dividen
a una distribución ordenada en partes iguales. Para calcular las medidas de posición
es necesario que los datos estén ordenados de menor a mayor.

a - Los Cuartiles
(Qk): son los tres valores de la variable de una distribución
que la dividen en cuatro partes iguales, es decir, al 25%, 50% y 75%. Para
calcular el valor de uno de los cuatro Cuartiles, se utiliza la fórmula:

Qk = k (n/4)
En donde:

Qk = Cuartil número 1, 2, 3 ó 4
n = total de datos de la distribución.

Se advierte que la posición del segundo cuartil corresponde a la ubicación de la


mediana, es decir que el segundo cuartil será siempre igual a la mediana.

Para calcular los cuartiles (datos no agrupados) debes seguir los siguientes pasos:

1º Se ordenan los datos de menor a mayor.


2º Se determina la posición que ocupa cada cuartil mediante la fórmula: Qk = k
(n/4)
Para que te quede más claro:

El primer cuartil (Q1) es el valor de la variable que supera a lo más el 25 % de los datos y
es superado por a lo más el 75 % de ellos en la distibución ordenada de menor a mayor.
El segundo cuartil (Q2) es un valor que supera a lo más el 50 % de los datos y es superado por a lo
más el 50 % de ellos, es decir, Q2 coincide con la mediana.
El tercer cuartil (Q3) es un valor que supera a lo más al 75 % de los datos y es superado por a lo
más el 25 % de ellos.

Ejemplos:
a) Dado el siguiente conjunto de datos: 2 ; 5 ; 9 ; 3 ; 13 ; 10 ; 11 ; 6 ; 7. ¿Cuál es el valor del
tercer cuartil?

1° ordenamos los datos de menor a mayor:

2; 3; 5; 6; 7; 9; 10; 11; 13

n= 9

2º Se determina la posición que ocupa cada cuartil mediante la fórmula: Qk = k (n/4)

Q3 = 3 (9 /4)
Q3 = 6,75; En caso de ser un número decimal se aproxima al entero más cercano superior ,
que sería 7. Este valor indica la posición del cuartil 3.

En nuestro caso el 7° valor sería:

2; 3; 5; 6; 7; 9; 10; 11; 13

Respuesta: el valor del tercer cuartil sería 10


b) Dadas las siguientes tablas de datos. Calcule los cuartiles Q1,Q2,Q3
Respuesta:

En la primera serie el número total de datos es n = 70, por lo que:

Q1 → 1(n/4) = 1(70/4) = 17,5 (indica la posición en que se encuentra el Q1)


Q2→ 2 (n/4) = 2 (70/4) = 35 (indica la posición en que se encuentra el Q2)
Q3→ 3 (n/4) =3 (70/4) = 52,5 (indica la posición en que se encuentra el Q3)

Y se desprende directamente de la tabla de frecuencias absolutas que:

Q1 = 5, ya que si nos fijamos en la tabla el número 17,5 se encuentra contenido en


el número 32 de la tabla.
Q2 = 7, ya que si nos fijamos en la tabla el número 35 se encuentra contenido en el
número 52 de la tabla.
Q3 = 10, ya que si nos fijamos en la tabla el número 52,5 se encuentra contenido en
el número 66 de la tabla.

En la segunda serie el número total de datos es n = 64, por lo que:

Q1 → 1(n/4) = 1(64/4) = 16 Recuerden que esta es la posición


Q2→ 2 (n/4) = 2 (64/4) = 32
Q3→ 3 (n/4) =3 (64/4) = 48

Y se desprende directamente de la tabla de frecuencias absolutas que:

Q1 = 5
Q2 = (5+7) / 2 = 6
Q3 = 7

MEDIDAS DE CENTRALIZACIÓN

Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como
representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones
en un conjunto de datos. Por orden de importancia, son:

◆ MEDIA: (media aritmética o simplemente media). es el promedio aritmético de las


observaciones, es decir, el cociente entre la suma de todos los datos y el número de ellos. Si xi es
el valor de la variable y ni su frecuencia, tenemos que:

Si los datos están agrupados utilizamos las marcas de clase, es decir c i en vez de xi.
◆ MEDIANA (Me): es el valor que separa por la mitad las observaciones ordenadas de
menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50%
son mayores. Si el número de datos es impar la mediana será el valor central, si es par
tomaremos como mediana la media aritmética de los dos valores centrales.

◆ MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya
frecuencia absoluta es mayor. No tiene porque ser única.

MEDIDAS DE DISPERSIÓN

Las medidas de tendencia central ttienen como objetivo el sintetizar los datos en un valor
representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia
central son representativas como síntesis de la información. Las medidas de dispersión cuantifican
la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central.
Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes
muestras y las relativas que nos permitirán comparar varias muestras.

MEDIDAS DE DISPERSIÓN ABSOLUTAS

◆ VARIANZA (s2): es el promedio del cuadrado de las distancias entre cada observación y la
media aritmética del conjunto de observaciones.

∑𝑛
𝑖=1(𝑥𝑖 −𝑥)
2 ∑𝑛 2
𝑖=1(𝑥𝑖 −𝑥) ∗𝑓𝑖
s2 =√ ó s2 =√
𝑛−1 𝑛−1
Haciendo operaciones en la fórmula anterior obtenemos otra fórmula para calcular la varianza:
Si los datos están agrupados utilizamos las marcas de clase en lugar de X i.

◆ DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la variable
pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación
típica que se define como la raíz cuadrada positiva de la varianza

𝑺 = √𝑺𝟐

◆ RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre el valor de las observaciones


mayor (dato mayor )y el menor (dato mayor). Re = xmax - xmin

MEDIDAS DE DISPERSIÓN RELATIVAS

◆ COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de


dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no
son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la
desviación típica y el valor absoluto de la media aritmética

𝑺
𝑪𝑽 = ∗ 𝟏𝟎𝟎
𝒙

CV representa el número de veces que la desviación típica contiene a la media aritmética y por lo
tanto cuanto mayor es CV mayor es la dispersión y menor la representatividad de la media.

MEDIDAS DE FORMA
Diremos que una distribución es simétrica cuando su mediana, su moda y su media aritmética
coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias (absolutas o relativas)
descienden más lentamente por la derecha que por la izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la
distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el


Coeficiente de Asimetría de Pearson:

EL SESGO: Mide las desviaciones de las MTC., Ya que el sesgo es el grado de asimetría o falta de
asimetría, de una distribución, si el polígono de frecuencias visualizado de una distribución tiene
una cola más larga a la derecha del máximo central que a la izquierda, se dice que la distribución
esta sesgada a la derecha o que tiene sesgo positivo (asimetría positiva) y si al contrario se dice que
tiene sesgo (asimetría negativa) en la asimetría encontramos si es:
Mediante la comparación entre media, mediana y moda como se muestra en el gráfico también se
puede indicar la asimetría.

MEDIDA DE APUNTAMIENTO O CURTOSIS


Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen
3 tipos de distribuciones según su grado de curtosis:

Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los


valores centrales de la variable (el mismo que presenta una distribución normal).
Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los
valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de
concentración alrededor de los valores centrales de la variable.

𝑸𝟑 − 𝑸𝟏
𝑪=
𝟐(𝑷𝟗𝟎 − 𝑷𝟏𝟎 )

Si los coeficientes de asimetría y curtosis corresponden a los


datos de una variable cuantitativa y ambos están con valores
entre -1,5 y 1,5, entonces dichos datos siguen una distribución
normal.
TABLAS DE FRECUENCIAS CON DATOS AGRUPADOS

Cuando los valores de la variable son muchos, conviene agrupar los datos en intervalos o
clases para así realizar un mejor análisis e interpretación de ellos.

• Para construir una tabla de frecuencias con datos agrupados, conociendo los intervalos, se
debe determinar la frecuencia absoluta (fi) correspondiente a cada intervalo, contando la
cantidad de datos cuyo valor está entre los extremos del intervalo. Luego se calculan las
frecuencias relativas y acumuladas, si es pertinente.

• Si no se conocen los intervalos, se pueden determinar de la siguiente manera: (recuerda


que los intervalos de clase se emplean si las variables toman un número grande de valores o
la variable es continua).
- Se busca el valor máximo de la variable y el valor mínimo. Con estos datos se determina
el rango.

- Se divide el rango en la cantidad de intervalos que se desea tener,(por lo general se


determinan 5 intervalos de lo contrario es ideal que sea un número impar por ejemplo 5, 7, )
- Comenzando por el mínimo valor de la variable, que será el extremo inferior del primer
intervalo, se suma a este valor la amplitud para obtener el extremo superior y así
sucesivamente.

• Otra forma de calcular la cantidad de intervalos es aplicando los siguientes métodos:

Método Sturges: k = 1 + 3,332 log n


donde:
k= número de clases
n= tamaño muestral

Debemos tener en cuenta 2 cosas. Primero que el número de intervalos me tiene que dar
impar, segundo que el resultado se redondea generalmente a la baja. Si al redondear a la baja
nos da como resultado un número par debemos redondear al alza. Este es el método que tiene
mayor precisión.
O podemos realizar √𝑛

Ahora podemos comenzar a construir la tabla de frecuencias:


Habitualmente, los intervalos se consideran cerrados a la izquierda y abiertos a la derecha,
es decir que el extremo inferior está incluido en el intervalo, pero el extremo superior no.
Es importante mencionar que las clases o intervalos para las variables continuas pueden ser
de tres tipos:

abiertas: clases abiertas tienen límites determinados (a,b), pero los valores que la contienen
comprenden valores muy cercanos a estos límites sin comprenderlos a ellos mismos, esto se
representa con un intervalo definido entre paréntesis (). Esto quiere decir que esta clase
contiene valores desde a hasta b pero no contiene exactamente a ni b solo valores muy
cercanos.

cerradas: las clases cerradas, además de los valores que están entre a y b, los contiene a ellos,
y se representa con corchetes [a,b].

semiabiertas: pueden contener a o b más los valores que están entre ellos, y se puede
representar con un corchete y un paréntesis, por ejemplo, (a,b], en este caso no contiene el
valor a y si los valores de b, además de los valores que están entre estos.

1- Media aritmética para datos agrupados

Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva
y su resultado dividirlo por el número total de datos:

La marca clase de una tabla para datos agrupados en intervalos corresponde al promedio de
los extremos de cada intervalo.

2- Moda

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con


datos agrupados, hablaremos de intervalo modal.

La moda se representa por Mo.

2.1- Todos los intervalos tienen la misma amplitud.

𝑓𝑚𝑜𝑑 − 𝑓𝑚𝑜𝑑−1
𝑋𝑚𝑜𝑑 = 𝑙𝑖 + [ ]∗𝐶
(𝑓𝑚𝑜𝑑 − 𝑓𝑚𝑜𝑑−1 ) + (𝑓𝑚𝑜𝑑 − 𝑓𝑚𝑜𝑑+1 )

𝑙𝑖 Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia absoluta).
𝑓𝑚𝑜𝑑 Frecuencia absoluta del intervalo modal.

𝑓𝑚𝑜𝑑 -1 Frecuencia absoluta del intervalo anterior al modal.

𝑓𝑚𝑜𝑑+1 Frecuencia absoluta del intervalo posterior al modal.

𝐶 Amplitud de los intervalos.

- Si la moda está en el primer intervalo, entonces 𝑓𝑚𝑜𝑑−1 = 0. Si la moda está en el último


intervalo, entonces 𝑓𝑚𝑜𝑑+1 = 0.

- Puede haber más de una moda en el caso en que dos o más valores de la variable presenten
la misma frecuencia (distribuciones bimodales o multimodales).

3- Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de
menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo
para variables cuantitativas.

Cálculo de la mediana para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad


de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2

Luego calculamos según la siguiente fórmula:

𝑛
− 𝐹𝑚𝑒𝑑−1
𝑋𝑚𝑒𝑑 = 𝑙𝑖 + [ 2 ]∗𝐶
𝑓𝑚𝑒𝑑

𝑙𝑖 es el límite inferior de la clase donde se encuentra la mediana.

𝐹𝑚𝑒𝑑−1 es la frecuencia acumulada anterior a la clase mediana.

𝑓𝑚𝑒𝑑 es la frecuencia absoluta del intervalo mediano.

𝐶 Amplitud de los intervalos.


Resuelva los siguientes ejercicios

1. El número de días necesarios por 10 equipos de trabajadores para terminar 10


instalaciones de iguales características han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80
días. Calcular la media, mediana, moda, varianza y desviación típica. Y concluya a
partir de ellos.

2. En un centro comercial, se consultó la edad a todas las personas que entraban


entre las 12:00 h y 12:30 h. Los resultados obtenidos fueron los siguientes:

a) Construya una tabla de frecuencias e indique tres conclusiones de ella


b) Indique gráficamente los datos, y concluya a partir de ella
c) Demuestre que la media de las edades es representativa o no de los
datos.
d) Indique los cuartiles y concluya con ellos
3. En la siguiente tabla se muestran las edades de un grupo de personas.

a) Calculemos la media aritmética


b) Mediana y moda
c) Estas medidas son verdaderas

4. La tabla muestra la pérdida de peso (en libras) que obtuvieron cada uno de los clientes
de una clínica de control del peso durante el último año.

10 13 22 26 16 23 35 53
17 32 41 35 24 23 27 16
20 60 48 43 52 31 17 20
33 18 23 8 24 15 26 46
30 19 22 13 22 14 21 39
28 43 37 12 20 11 25 9
15 21 21 25 34 10 23 29
28 18 17 24 16 2 7 12
28 20 36 16 14 6 18 16
57 31 34 28 4 2 19 26

a) Construya una distribución de frecuencias de los datos.


A partir de los la tabla de frecuencia, responda las siguientes preguntas:

1. Halle la media de la distribución de los datos agrupados e indique si esta representativa de


los resultados obtenidos por los clientes de la clínica.
2. ¿Los datos de la pérdida de peso tienen una distribución simétrica (normal) o no? Si no es
simétrica, indique si es sesgada positiva o negativamente, ¿y qué significa esto para la clínica?
3. Realice un diagrama de caja y bigotes, y a partir de él, responda cuál fue la pérdida de peso
del 25% superior de los clientes

5. La siguiente tabla muestra los resultados de un análisis estadístico realizado en el


programa estadístico SPSS sobre los puntajes obtenidos por los alumnos de una clase
de estadística al presentar el examen final de la materia.
De acuerdo a los resultados obtenidos es posible indicar los siguientes ítems o no, y
explíquelos
a) ¿De qué forma los datos son asimétricos?
b) Más del 75% de los datos se encuentran en 77 puntos?
c) Es correcto presentar estos datos con estos parámetros estadísticos. Explique
d) La varianza que indica en estos datos

Estadísticos

Puntaje

Válidos
N 70
Perdidos 0
Media 76,3714
Mediana 77,0000
Moda 76,00
Desv. típ. 11,83237
Varianza 140,005
Asimetría -,300
Error típ. de asimetría ,287
Curtosis -,289
Error típ. de curtosis ,566
Rango 53,00
Mínimo 46,00
Máximo 99,00
P25 68,7500
50
e 77,0000
70 82,0000
r
75 84,5000
c
e90 93,0000
n
t
i
l
e
s

e) ¿El puntaje esperado obtenido de los estudiantes se aproxima a los datos reales? Si o no y
explique las razones.

6. Una empresa quiere disminuir la brecha de género y para ello realizó una encuesta, una
de las variables que se revisó es la edad, a partir de ello se obtuvo el siguiente diagrama
que representa las edades, donde la caja superior representa las mujeres y la caja
inferior representa a los hombres, a partir de ello indique cuatro comparaciones entre
las edades de mujeres y hombres que le puedan servir a la empresa.

7. Un corredor entrena para una determinada carrera y se toman los tiempos que necesita
para recorrer los 100m, durante 10 días consecutivos (cada día se toman varios tiempos
y se calculan mediana, cuartiles, valores mínimo y máximo)

De acuerdo a estos resultados indique si el entrenamiento ha funcionado y sustente su


respuesta.
8. Las temperaturas medias registradas durante el mes de mayo en Madrid, en
grados centígrados, están dadas por la siguiente tabla:

Construya la representación gráfica correspondiente

9. Se desea realizar un estudio estadístico con algunas personas del municipio de


Dosquebradas, acerca de la necesidad o no del pico y placa para los automóviles.
Indique la población, muestra y variables para ese estudio.

10. Clasificar las siguientes variables en cualitativas y cuantitativas


a) Lugar de nacimiento
b) Color de ojos
c) Nota de matemáticas
d) Deporte preferido
e) Peso
f) Edad
g) Estado civil

11. Unos grandes almacenes disponen de un aparcamiento para sus clientes. Los siguientes
datos que se refieren al número de horas que permanecen en el aparcamiento una serie
de coches:

Se pide:
a) Obtener la tabla de frecuencias para ese conjunto de datos. Interpretar la tabla.
b) Obtener la tabla de frecuencias ascendente y descendente.
c) Determinar e interpretar la tercera cuartilla y el percentil del 42%.
d) Calcular el tiempo medio de permanencia de los coches en el aparcamiento. Interpretar el
resultado y los elementos que intervienen.

Bibliografía

Portal educativo, conectando neuronas. https://www.portaleducativo.net/octavo-


basico/791/Tablas-de-frecuencias-con-datos-agrupados
xi fi fac Fre Fre acu xi*fi (Xi-X)2*fi
1 1 1 2,380952 2,380952 1 1027,01021
3 3 4 7,142857 9,52381 9 2708,46663
4 2 6 4,761905 14,28571 8 1687,45642
10 1 7 2,380952 16,66667 10 531,164209
11 1 8 2,380952 19,04762 11 486,070209
15 1 9 2,380952 21,42857 15 325,694209
16 1 10 2,380952 23,80952 16 290,600209
17 2 12 4,761905 28,57143 34 515,012418
19 1 13 2,380952 30,95238 19 197,318209
21 1 14 2,380952 33,33333 21 145,130209
22 1 15 2,380952 35,71429 22 122,036209
23 1 16 2,380952 38,09524 23 100,942209
25 1 17 2,380952 40,47619 25 64,754209
26 1 18 2,380952 42,85714 26 49,660209
27 1 19 2,380952 45,2381 27 36,566209
29 1 20 2,380952 47,61905 29 16,378209
30 1 21 2,380952 50 30 9,284209
33 1 22 2,380952 52,38095 33 0,002209
34 2 24 4,761905 57,14286 68 1,816418
36 3 27 7,142857 64,28571 108 26,160627
42 2 29 4,761905 69,04762 84 160,312418
45 1 30 2,380952 71,42857 45 142,874209
47 1 31 2,380952 73,80952 47 194,686209
48 1 32 2,380952 76,19048 48 223,592209
51 1 33 2,380952 78,57143 51 322,310209
54 1 34 2,380952 80,95238 54 439,028209
55 1 35 2,380952 83,33333 55 481,934209
58 1 36 2,380952 85,71429 58 622,652209
61 1 37 2,380952 88,09524 61 781,370209
65 1 38 2,380952 90,47619 65 1020,99421
69 1 39 2,380952 92,85714 69 1292,61821
70 1 40 2,380952 95,2381 70 1365,52421
73 2 42 4,761905 100 146 3192,48442
SUMA 42 1388 18581,9048

También podría gustarte