Tarea 2. - Torres Martha
Tarea 2. - Torres Martha
Tarea 2. - Torres Martha
Tipos de muestreo
La estructura de los datos es la que indica cuál es el tipo de muestreo más apropiado a
utilizar.
Medidas de tendencia central
Media armónica
n
xH =
1
∑x
i
Media acotada
∑ xi
i=1
x %=
n
Manejo de datos
Los datos fuera de la realidad o datos outlayers, son aquellos que no pertenecen a
la población en donde se encuentran.
En 1976 John W. Tukey desarrolló el gráfico Boxplot o gráfica de caja y bigote, que
se utiliza para detectar datos aberrantes. La caja encierra el 50% de los datos, antes de la
caja hay el 25% de los datos, después de la caja queda otro 25% de los datos. Cuando se
hace la gráfica, debe hacerse a escala y ésta puede ser horizontal o vertical.
25%-25%-25%-25%
Estos son los datos que
van a estar dentro de la
caja
RIQ=Q3 −Q1
LBS=Q3+ (1.5∗RIQ )
Cuantiles
Los cuantiles persiguen dividir los datos en grupos con la finalidad de que sean
más fáciles de trabajar. Un cuantil divide en n partes, entonces, hay n-1 cuantiles. Los
cuantiles pueden ser:
- Mediana [m]: divide los datos en dos partes 50%-50% Hay una mediana
- Terciles [T]: dividen los datos en tres partes 33.33%-33.33%-33.33% Hay dos
terciles
- Cuartiles [Q]: dividen los datos en cuatro partes 25%-25%-25%-25% Hay tres
cuartiles
- Pentiles [P]: dividen los datos en cinco partes 20%-20%-20%-20%-20% Hay
cuatro pentiles
- Sextiles o Hexiles [S]: dividen los datos en seis partes 16.66%-16.66%-16.66%-
16.66%-16.66%-16.66% Hay cinco sextiles
- Heptiles o Septiles [H]: dividen los datos en siete partes. Hay seis heptiles
- Octiles [O]: dividen los datos en ocho partes
- Noniles [N]: dividen los datos en nueve partes
- Deciles [D]: divide los datos en diez partes
- Undeciles [U]: dividen los datos en once partes
- Dodeciles [d]: dividen los datos en doce partes
- Percentiles [p]: dividen los datos en cien partes
C j= ( n+1d ) j
Donde j es el número de cuantil que se busca, n es el número de datos y d el
número de divisiones de ese cuantil. La fórmula nos indica la posición que ocupa el
cuantil que buscamos, así que es necesario tener ordenados los datos.
Medidas de dispersión
- Residual: hay tantos residuales como datos. Se expresa con la letra r, es qué tan
lejano está el dato del valor de la media aritmética.
r i=x i− x
- Varianza: Es el promedio de los residuales cuadrados. Su símbolo es σ 2(para
referirse a la varianza poblacional) y s2 (en el caso de la varianza muestral). Sin
embargo, no se ocupa la varianza poblacional porque el tamaño de la población
siempre fluctúa.
N
∑ r i2
σ 2= i=1 varianza poblacional
N
∑ r i2
s2= i=1 varianza muestral insesgada
n−1
∑ r i2
s2= i=1 varianza muestral sesgada
n
√
n
∑ ( x i−x )2
i=1
s=
n−1
- Rango: es el valor máximo menos el mínimo
Rango=x n−x i
Tipos de gráficas
El propósito de una gráfica es vender los datos, deben resultar estética e impactante
para todxs, es por ello, que hacer una buena gráfica es un arte. Existe la regla del 7,
donde dice que máximo se deben de poner 7 elementos en una gráfica para que ésta no
resulte difícil de entender.
Se estudiarán gráficas como el gráfico de burbujas y el histograma.
Un histograma cuenta con clases, que son agrupaciones que se les da a los datos
numéricos, estas clases no deben de pasar de 7, y se delimitan con la fórmula:
Rango
Rango de clase=
Número de clases
Se forman las clases agrupando los datos que correspondan a los intervalos Límite
Inferior de Clase hasta el Límite Superior de Clase
LIC + LSC
Marca de Clase=
2
Ejercicios y tareas
Muestreos
1 15 22 85 TERCILES
2 16 23 86 n= 42
3 23 24 87 d= 3
4 25 25 87 # Tercil Posición Valor
5 27 26 96 1 14.3333 59
6 30 27 101 2 28.6667 103
7 32 28 103
8 36 29 103 PENTILES
9 36 30 112 n= 42
10 49 31 118 d= 5
11 50 32 118 # Tercil Posición Valor
12 57 33 119 1 8 3/5 36.00
13 58 34 123 2 17 1/5 63.60
14 59 35 123 3 25 4/5 90.60
15 59 36 129 4 34 2/5 123.00
16 60 37 130
17 63 38 131 HEPTILES
18 66 39 134 n= 42
19 68 40 136 d= 7
20 72 41 141 # Tercil Posición Valor
21 80 42 148 1 6 1/7 30.2857
2 12 2/7 57.2857
Ejemplo Regla de la Palanca 3 18 3/7 66.8571
4 24 4/7 87.0000
((63)(4)+(66)(1))/5=63.6 5 30 5/7 116.2857
6 36 6/7 129.8571
PROMEDIO #REF!
MODA AMODAL
MEDIANA 82.5
Boxplot
Diagrama de Burbujas 80 datos
49.4 O
49.5 O
49.6 O O
49.7 O O
49.8
49.9 O O
50.0
50.1 O O
50.2 O O
50.3 O O O O O
50.4 O O
50.5 O
50.6 O O
50.7 O
50.8 O O O O
50.9 O
51.0 O O O O O
m M 51.1 O O O O O O O
51.2 O O O O O
51.3 O O O O
51.4 O O
51.5 O O O O
51.6 O O
51.7 O O O O O O
51.8 O O O O O O
51.9 O O O
52.0 O O O
52.1 O
52.2 O
52.3
52.4
52.5
52.6
52.7
52.8 O
52.9
53.0
53.1 O
Media Aritmética
# Datos 80 # Dato Ln # Dato Ln
Con Suma datos 4084.60 1 49.1 3.8939 41 51.1 3.9338
fórmulas Media 2 49.4 3.9000 42 51.2 3.9357
51.0575
calculada 3 49.5 3.9020 43 51.2 3.9357
Media 4 49.6 3.9040 44 51.2 3.9357
Con excel 51.0575
calculada 5 49.6 3.9040 45 51.2 3.9357
6 49.7 3.9060 46 51.2 3.9357
Mediana Moda 7 49.7 3.9060 47 51.3 3.9377
51.10 51.10 8 49.9 3.9100 48 51.3 3.9377
9 49.9 3.9100 49 51.3 3.9377
Media Geométrica 10 50.1 3.9140 50 51.3 3.9377
Producto
11 50.1 3.9140 51 51.4 3.9396
de los 4.37109E+136
Con 12 50.2 3.9160 52 51.4 3.9396
datos
fórmulas MedGeom 13 50.2 3.9160 53 51.5 3.9416
51.0514
calculada 14 50.3 3.9180 54 51.5 3.9416
MedGeom 15 50.3 3.9180 55 51.5 3.9416
Con excel 51.0514
calculada 16 50.3 3.9180 56 51.5 3.9416
Promedio
17 50.3 3.9180 57 51.6 3.9435
Con logaritmo 3.9328
18 50.3 3.9180 58 51.6 3.9435
logaritmo s
MedGeom 19 50.4 3.9200 59 51.7 3.9455
s 51.0514
calculada 20 50.4 3.9200 60 51.7 3.9455
21 50.5 3.9220 61 51.7 3.9455
22 50.6 3.9240 62 51.7 3.9455
23 50.6 3.9240 63 51.7 3.9455
24 50.7 3.9259 64 51.7 3.9455
25 50.8 3.9279 65 51.8 3.9474
26 50.8 3.9279 66 51.8 3.9474
27 50.8 3.9279 67 51.8 3.9474
28 50.8 3.9279 68 51.8 3.9474
29 50.9 3.9299 69 51.8 3.9474
30 51 3.9318 70 51.8 3.9474
31 51 3.9318 71 51.9 3.9493
32 51 3.9318 72 51.9 3.9493
33 51 3.9318 73 51.9 3.9493
34 51 3.9318 74 52 3.9512
35 51.1 3.9338 75 52 3.9512
36 51.1 3.9338 76 52 3.9512
37 51.1 3.9338 77 52.1 3.9532
38 51.1 3.9338 78 52.2 3.9551
39 51.1 3.9338 79 52.8 3.9665
40 51.1 3.9338 80 53.1 3.9722
Varianza de los siete datos
Contador Dato Residual Residual^2Residual^3Residual^4
1 1.53 1.5300 2.341E+00 3.582E+00 5.480E+00
2 1.58 1.5800 2.496E+00 3.944E+00 6.232E+00
3 1.59 1.5900 2.528E+00 4.020E+00 6.391E+00
4 1.63 1.6300 2.657E+00 4.331E+00 7.059E+00
5 1.64 1.6400 2.690E+00 4.411E+00 7.234E+00
6 1.65 1.6500 2.723E+00 4.492E+00 7.412E+00
7 1.77 1.7700 3.133E+00 5.545E+00 9.815E+00
Σ Residual 11.3900 1.857E+01 3.032E+01 4.962E+01
Varianza 3.095E+00
Con excel 5.690E-03
Varianza 80 datos
# DatoResidual r^2 r^3 r^4 # DatoResidual r^2 r^3
1 49.1 49.1000 2410.810 1.184E+05 5.81E+06 41 51.1 51.1000 2611.2100 1.334E+0
2 49.4 49.4000 2440.360 1.206E+05 5.96E+06 42 51.2 51.2000 2621.4400 1.342E+0
3 49.5 49.5000 2450.250 1.213E+05 6.00E+06 43 51.2 51.2000 2621.4400 1.342E+0
4 49.6 49.6000 2460.160 1.220E+05 6.05E+06 44 51.2 51.2000 2621.4400 1.342E+0
5 49.6 49.6000 2460.160 1.220E+05 6.05E+06 45 51.2 51.2000 2621.4400 1.342E+0
6 49.7 49.7000 2470.090 1.228E+05 6.10E+06 46 51.2 51.2000 2621.4400 1.342E+0
7 49.7 49.7000 2470.090 1.228E+05 6.10E+06 47 51.3 51.3000 2631.6900 1.350E+0
8 49.9 49.9000 2490.010 1.243E+05 6.20E+06 48 51.3 51.3000 2631.6900 1.350E+0
9 49.9 49.9000 2490.010 1.243E+05 6.20E+06 49 51.3 51.3000 2631.6900 1.350E+0
10 50.1 50.1000 2510.010 1.258E+05 6.30E+06 50 51.3 51.3000 2631.6900 1.350E+0
11 50.1 50.1000 2510.010 1.258E+05 6.30E+06 51 51.4 51.4000 2641.9600 1.358E+0
12 50.2 50.2000 2520.040 1.265E+05 6.35E+06 52 51.4 51.4000 2641.9600 1.358E+0
13 50.2 50.2000 2520.040 1.265E+05 6.35E+06 53 51.5 51.5000 2652.2500 1.366E+0
14 50.3 50.3000 2530.090 1.273E+05 6.40E+06 54 51.5 51.5000 2652.2500 1.366E+0
15 50.3 50.3000 2530.090 1.273E+05 6.40E+06 55 51.5 51.5000 2652.2500 1.366E+0
16 50.3 50.3000 2530.090 1.273E+05 6.40E+06 56 51.5 51.5000 2652.2500 1.366E+0
17 50.3 50.3000 2530.090 1.273E+05 6.40E+06 57 51.6 51.6000 2662.5600 1.374E+0
18 50.3 50.3000 2530.090 1.273E+05 6.40E+06 58 51.6 51.6000 2662.5600 1.374E+0
19 50.4 50.4000 2540.160 1.280E+05 6.45E+06 59 51.7 51.7000 2672.8900 1.382E+0
20 50.4 50.4000 2540.160 1.280E+05 6.45E+06 60 51.7 51.7000 2672.8900 1.382E+0
21 50.5 50.5000 2550.250 1.288E+05 6.50E+06 61 51.7 51.7000 2672.8900 1.382E+0
22 50.6 50.6000 2560.360 1.296E+05 6.56E+06 62 51.7 51.7000 2672.8900 1.382E+0
23 50.6 50.6000 2560.360 1.296E+05 6.56E+06 63 51.7 51.7000 2672.8900 1.382E+0
24 50.7 50.7000 2570.490 1.303E+05 6.61E+06 64 51.7 51.7000 2672.8900 1.382E+0
25 50.8 50.8000 2580.640 1.311E+05 6.66E+06 65 51.8 51.8000 2683.2400 1.390E+0
26 50.8 50.8000 2580.640 1.311E+05 6.66E+06 66 51.8 51.8000 2683.2400 1.390E+0
27 50.8 50.8000 2580.640 1.311E+05 6.66E+06 67 51.8 51.8000 2683.2400 1.390E+0
28 50.8 50.8000 2580.640 1.311E+05 6.66E+06 68 51.8 51.8000 2683.2400 1.390E+0
29 50.9 50.9000 2590.810 1.319E+05 6.71E+06 69 51.8 51.8000 2683.2400 1.390E+0
30 51 51.0000 2601.000 1.327E+05 6.77E+06 70 51.8 51.8000 2683.2400 1.390E+0
31 51 51.0000 2601.000 1.327E+05 6.77E+06 71 51.9 51.9000 2693.6100 1.398E+0
32 51 51.0000 2601.000 1.327E+05 6.77E+06 72 51.9 51.9000 2693.6100 1.398E+0
33 51 51.0000 2601.000 1.327E+05 6.77E+06 73 51.9 51.9000 2693.6100 1.398E+0
34 51 51.0000 2601.000 1.327E+05 6.77E+06 74 52 52.0000 2704.0000 1.406E+0
35 51.1 51.1000 2611.210 1.334E+05 6.82E+06 75 52 52.0000 2704.0000 1.406E+0
36 51.1 51.1000 2611.210 1.334E+05 6.82E+06 76 52 52.0000 2704.0000 1.406E+0
37 51.1 51.1000 2611.210 1.334E+05 6.82E+06 77 52.1 52.1000 2714.4100 1.414E+0
38 51.1 51.1000 2611.210 1.334E+05 6.82E+06 78 52.2 52.2000 2724.8400 1.422E+0
39 51.1 51.1000 2611.210 1.334E+05 6.82E+06 79 52.8 52.8000 2787.8400 1.472E+0
Clases
Rango = 4
Número de clases 7
Rango de clase = 0.57142857 0.6