Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tarea 2. - Torres Martha

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 15

Estadística (Semana 2)

Tipos de muestreo

- Muestreo aleatorio puro: garantiza que cada miembro de la población tiene la


misma oportunidad de ser seleccionado en la muestra, la probabilidad de
selección de un sujeto a estudio “x” es independiente de la probabilidad que
tienen el resto de los sujetos que integran forman parte de la población. Es
posible obtener la muestra mediante programas computacionales que arrojen
números aleatorios.
- Muestreo aleatorio sistemático: este tipo de muestreo es más utilizado en los
procesos de producción, ya que permite obtener una muestra aleatoria pero
dentro de un cierto sistema establecido. Cada miembro es seleccionado según la
enésima posición de una lista de los miembros de la población, el primero de
ellos se escoge al azar.
- Muestreo estratificado puro: Consiste en subdividir a la población en grupos
homogéneos en función al estudio que se desea realizar. Es apropiado cuando la
población ya está dividida en estratos, refleja de forma más precisa las
características de la población estratificada en comparación con otro tipo de
muestras.
- Muestreo por conglomerados puro: La población está subdividida en
subpoblaciones llamadas conglomerados. La selección de los conglomerados que
integran la muestra es al azar y se incluyen a todos en la muestra. Usualmente
produce un mayor error muestral y es menos precisa en las estimaciones que una
muestra aleatoria simple del mismo, pero es menos costosa y más rápida.

La estructura de los datos es la que indica cuál es el tipo de muestreo más apropiado a
utilizar.
Medidas de tendencia central

Media armónica

Es la quinta medida de tendencia central, la media armónica se usa para cuestiones


que son medidas inversas (los datos están relacionada de manera inversa), por ejemplo,
la velocidad y el tiempo con distancia constante. Proporcionan el valor medio de datos
obtenidos mediante esas operaciones. La función en excel se llama media.armo. Tiene
una limitación, no se puede utilizar cuando uno de los datos es cero. Se representa con
x H y con μ H la media armónica poblacional

n
xH =
1
∑x
i

Media acotada

Sexta medida de tendencia central, se crea quitando datos. La media acotada es


empleada cuando hay un dato fuera de la realidad, necesariamente cuando se quita un
dato, se debe quitar otro dato que no esté fuera de la realidad. Se representa con x barra
subíndice el porcentaje de los datos usados. Los datos deben de estar ordenados y se
quitan los datos de los extremos, siempre por pares.

∑ xi
i=1
x %=
n

Manejo de datos

Los datos fuera de la realidad o datos outlayers, son aquellos que no pertenecen a
la población en donde se encuentran.

¿Cómo se pueden identificar los datos outlayers?

En 1976 John W. Tukey desarrolló el gráfico Boxplot o gráfica de caja y bigote, que
se utiliza para detectar datos aberrantes. La caja encierra el 50% de los datos, antes de la
caja hay el 25% de los datos, después de la caja queda otro 25% de los datos. Cuando se
hace la gráfica, debe hacerse a escala y ésta puede ser horizontal o vertical.

Los datos se dividen en cuartiles:

25%-25%-25%-25%
Estos son los datos que
van a estar dentro de la
caja

Se calcula el rango intercuartílico con:

RIQ=Q3 −Q1

También se calcula límite del brazo inferior (LBI) con:

LBI =Q1−( 1.5∗RIQ )

Y el límite del brazo superior (LBS) con:

LBS=Q3+ (1.5∗RIQ )

Se dibuja la gráfica a escala donde la mitad de los datos están encerrados en el


cuadro y los brazos encierran la otra mitad, cuando un dato se encuentra fuera del
límite de alguno de los brazos, se marca como outlayer.

Cuantiles

Los cuantiles persiguen dividir los datos en grupos con la finalidad de que sean
más fáciles de trabajar. Un cuantil divide en n partes, entonces, hay n-1 cuantiles. Los
cuantiles pueden ser:

- Mediana [m]: divide los datos en dos partes 50%-50% Hay una mediana
- Terciles [T]: dividen los datos en tres partes 33.33%-33.33%-33.33% Hay dos
terciles
- Cuartiles [Q]: dividen los datos en cuatro partes 25%-25%-25%-25% Hay tres
cuartiles
- Pentiles [P]: dividen los datos en cinco partes 20%-20%-20%-20%-20% Hay
cuatro pentiles
- Sextiles o Hexiles [S]: dividen los datos en seis partes 16.66%-16.66%-16.66%-
16.66%-16.66%-16.66% Hay cinco sextiles
- Heptiles o Septiles [H]: dividen los datos en siete partes. Hay seis heptiles
- Octiles [O]: dividen los datos en ocho partes
- Noniles [N]: dividen los datos en nueve partes
- Deciles [D]: divide los datos en diez partes
- Undeciles [U]: dividen los datos en once partes
- Dodeciles [d]: dividen los datos en doce partes
- Percentiles [p]: dividen los datos en cien partes

Para calcular la posición del cuantil jotaésimo es preciso utilizar la fórmula

C j= ( n+1d ) j
Donde j es el número de cuantil que se busca, n es el número de datos y d el
número de divisiones de ese cuantil. La fórmula nos indica la posición que ocupa el
cuantil que buscamos, así que es necesario tener ordenados los datos.

Medidas de dispersión

- Residual: hay tantos residuales como datos. Se expresa con la letra r, es qué tan
lejano está el dato del valor de la media aritmética.
r i=x i− x
- Varianza: Es el promedio de los residuales cuadrados. Su símbolo es σ 2(para
referirse a la varianza poblacional) y s2 (en el caso de la varianza muestral). Sin
embargo, no se ocupa la varianza poblacional porque el tamaño de la población
siempre fluctúa.
N

∑ r i2
σ 2= i=1 varianza poblacional
N

∑ r i2
s2= i=1 varianza muestral insesgada
n−1

∑ r i2
s2= i=1 varianza muestral sesgada
n

- Desviación estándar: es la raíz cuadrada de la varianza. La función de excel que


la calcula es VAR

σ =√ σ 2 desviación estándar poblacional

s= √ s desviación estándar muestral


2

También se puede calcular con la fórmula


n

∑ ( x i−x )2
i=1
s=
n−1
- Rango: es el valor máximo menos el mínimo
Rango=x n−x i

Tipos de gráficas

El propósito de una gráfica es vender los datos, deben resultar estética e impactante
para todxs, es por ello, que hacer una buena gráfica es un arte. Existe la regla del 7,
donde dice que máximo se deben de poner 7 elementos en una gráfica para que ésta no
resulte difícil de entender.
Se estudiarán gráficas como el gráfico de burbujas y el histograma.

Un histograma cuenta con clases, que son agrupaciones que se les da a los datos
numéricos, estas clases no deben de pasar de 7, y se delimitan con la fórmula:

Rango
Rango de clase=
Número de clases

Se forman las clases agrupando los datos que correspondan a los intervalos Límite
Inferior de Clase hasta el Límite Superior de Clase

Clase A=LIC al LSC

donde LSC=LIC + Rango de clase

Los datos obtenidos se registran en tablas especificando si el rango de la clase será


abierto o cerrado, además se incorporan las columnas de marca de clase y f, donde f es
el número de datos que entran en esa clase y la marca de clase es el punto central de la
misma.

LIC + LSC
Marca de Clase=
2
Ejercicios y tareas
Muestreos

Muestreo aleatorio puro


1 50.1 11 50.6 21 51.1 31 50.8 41 52.2 51 51.9 61 51.2 71 52.0
2 50.6 12 49.1 22 51.8 32 51.0 42 50.8 52 51.8 62 51.1 72 49.7
3 50.7 13 51.4 23 51.9 33 50.4 43 51.7 53 51.0 63 49.5 73 52.0
4 51.1 14 51.8 24 50.3 34 51.5 44 51.7 54 50.3 64 49.9 74 49.7
5 52.0 15 51.3 25 51.1 35 50.8 45 49.4 55 50.3 65 51.1 75 51.2
6 50.8 16 51.5 26 51.1 36 51.2 46 50.3 56 51.3 66 51.7 76 51.8
7 51.4 17 51.0 27 51.7 37 50.1 47 52.1 57 51.0 67 52.8 77 51.1
8 49.9 18 50.9 28 50.2 38 51.5 48 51.0 58 50.2 68 49.6 78 51.3
9 51.8 19 50.3 29 50.5 39 51.7 49 51.7 59 50.4 69 49.6 79 51.2
10 51.3 20 51.2 30 51.6 40 51.5 50 51.9 60 51.6 70 53.1 80 51.8

Muestreo aleatorio sistemático


1 50.1 11 50.6 21 51.1 31 50.8 41 52.2 51 51.9 61 51.2 71 52.0
2 50.6 12 49.1 22 51.8 32 51.0 42 50.8 52 51.8 62 51.1 72 49.7
3 50.7 13 51.4 23 51.9 33 50.4 43 51.7 53 51.0 63 49.5 73 52.0
4 51.1 14 51.8 24 50.3 34 51.5 44 51.7 54 50.3 64 49.9 74 49.7
5 52.0 15 51.3 25 51.1 35 50.8 45 49.4 55 50.3 65 51.1 75 51.2
6 50.8 16 51.5 26 51.1 36 51.2 46 50.3 56 51.3 66 51.7 76 51.8
7 51.4 17 51.0 27 51.7 37 50.1 47 52.1 57 51.0 67 52.8 77 51.1
8 49.9 18 50.9 28 50.2 38 51.5 48 51.0 58 50.2 68 49.6 78 51.3
9 51.8 19 50.3 29 50.5 39 51.7 49 51.7 59 50.4 69 49.6 79 51.2
10 51.3 20 51.2 30 51.6 40 51.5 50 51.9 60 51.6 70 53.1 80 51.8

Muestreo estratificado puro


ESTRATO ESTRATO
1 ESTRATO
2 E
3 STRATO ESTRATO
4 ESTRATO
5 E
6 STRATO ESTARTO
7 8
1 49.1 11 50.1 21 50.5 31 51.0 41 51.1 51 51.4 61 51.7 71 51.9
2 49.4 12 50.2 22 50.6 32 51.0 42 51.2 52 51.4 62 51.7 72 51.9
3 49.5 13 50.2 23 50.6 33 51.0 43 51.2 53 51.5 63 51.7 73 51.9
4 49.6 14 50.3 24 50.7 34 51.0 44 51.2 54 51.5 64 51.7 74 52.0
5 49.6 15 50.3 25 50.8 35 51.1 45 51.2 55 51.5 65 51.8 75 52.0
6 49.7 16 50.3 26 50.8 36 51.1 46 51.2 56 51.5 66 51.8 76 52.0
7 49.7 17 50.3 27 50.8 37 51.1 47 51.3 57 51.6 67 51.8 77 52.1
8 49.9 18 50.3 28 50.8 38 51.1 48 51.3 58 51.6 68 51.8 78 52.2
9 49.9 19 50.4 29 50.9 39 51.1 49 51.3 59 51.7 69 51.8 79 52.8
10 50.1 20 50.4 30 51.0 40 51.1 50 51.3 60 51.7 70 51.8 80 53.1
Muestreo estratificado puro
CONGLOMCONGLOM
1 CONGLOM
2 CONGLOM
3 CONGOLM
4 CONGLOM
5 CONGLOM
6 CONGLOM
7 CONGLOM
8 CONGLO
9
1 49.1 9 49.9 17 50.3 25 50.8 33 51.0 41 51.1 49 51.3 57 51.6 65 51.8 73 51.
2 49.4 10 50.1 18 50.3 26 50.8 34 51.0 42 51.2 50 51.3 58 51.6 66 51.8 74 52.
3 49.5 11 50.1 19 50.4 27 50.8 35 51.1 43 51.2 51 51.4 59 51.7 67 51.8 75 52.
4 49.6 12 50.2 20 50.4 28 50.8 36 51.1 44 51.2 52 51.4 60 51.7 68 51.8 76 52.
5 49.6 13 50.2 21 50.5 29 50.9 37 51.1 45 51.2 53 51.5 61 51.7 69 51.8 77 52.
6 49.7 14 50.3 22 50.6 30 51.0 38 51.1 46 51.2 54 51.5 62 51.7 70 51.8 78 52.
7 49.7 15 50.3 23 50.6 31 51.0 39 51.1 47 51.3 55 51.5 63 51.7 71 51.9 79 52.
8 49.9 16 50.3 24 50.7 32 51.0 40 51.1 48 51.3 56 51.5 64 51.7 72 51.9 80 53.
Cuartiles

1 15 22 85 TERCILES
2 16 23 86 n= 42
3 23 24 87 d= 3
4 25 25 87 # Tercil Posición Valor
5 27 26 96 1 14.3333 59
6 30 27 101 2 28.6667 103
7 32 28 103
8 36 29 103 PENTILES
9 36 30 112 n= 42
10 49 31 118 d= 5
11 50 32 118 # Tercil Posición Valor
12 57 33 119 1 8 3/5 36.00
13 58 34 123 2 17 1/5 63.60
14 59 35 123 3 25 4/5 90.60
15 59 36 129 4 34 2/5 123.00
16 60 37 130
17 63 38 131 HEPTILES
18 66 39 134 n= 42
19 68 40 136 d= 7
20 72 41 141 # Tercil Posición Valor
21 80 42 148 1 6 1/7 30.2857
2 12 2/7 57.2857
Ejemplo Regla de la Palanca 3 18 3/7 66.8571
4 24 4/7 87.0000
((63)(4)+(66)(1))/5=63.6 5 30 5/7 116.2857
6 36 6/7 129.8571

PROMEDIO #REF!
MODA AMODAL
MEDIANA 82.5
Boxplot
Diagrama de Burbujas 80 datos
49.4 O
49.5 O
49.6 O O
49.7 O O
49.8
49.9 O O
50.0
50.1 O O
50.2 O O
50.3 O O O O O
50.4 O O
50.5 O
50.6 O O
50.7 O
50.8 O O O O
50.9 O
51.0 O O O O O
m M 51.1 O O O O O O O
51.2 O O O O O
51.3 O O O O
51.4 O O
51.5 O O O O
51.6 O O
51.7 O O O O O O
51.8 O O O O O O
51.9 O O O
52.0 O O O
52.1 O
52.2 O
52.3
52.4
52.5
52.6
52.7
52.8 O
52.9
53.0
53.1 O
Media Aritmética
# Datos 80 # Dato Ln # Dato Ln
Con Suma datos 4084.60 1 49.1 3.8939 41 51.1 3.9338
fórmulas Media 2 49.4 3.9000 42 51.2 3.9357
51.0575
calculada 3 49.5 3.9020 43 51.2 3.9357
Media 4 49.6 3.9040 44 51.2 3.9357
Con excel 51.0575
calculada 5 49.6 3.9040 45 51.2 3.9357
6 49.7 3.9060 46 51.2 3.9357
Mediana Moda 7 49.7 3.9060 47 51.3 3.9377
51.10 51.10 8 49.9 3.9100 48 51.3 3.9377
9 49.9 3.9100 49 51.3 3.9377
Media Geométrica 10 50.1 3.9140 50 51.3 3.9377
Producto
11 50.1 3.9140 51 51.4 3.9396
de los 4.37109E+136
Con 12 50.2 3.9160 52 51.4 3.9396
datos
fórmulas MedGeom 13 50.2 3.9160 53 51.5 3.9416
51.0514
calculada 14 50.3 3.9180 54 51.5 3.9416
MedGeom 15 50.3 3.9180 55 51.5 3.9416
Con excel 51.0514
calculada 16 50.3 3.9180 56 51.5 3.9416
Promedio
17 50.3 3.9180 57 51.6 3.9435
Con logaritmo 3.9328
18 50.3 3.9180 58 51.6 3.9435
logaritmo s
MedGeom 19 50.4 3.9200 59 51.7 3.9455
s 51.0514
calculada 20 50.4 3.9200 60 51.7 3.9455
21 50.5 3.9220 61 51.7 3.9455
22 50.6 3.9240 62 51.7 3.9455
23 50.6 3.9240 63 51.7 3.9455
24 50.7 3.9259 64 51.7 3.9455
25 50.8 3.9279 65 51.8 3.9474
26 50.8 3.9279 66 51.8 3.9474
27 50.8 3.9279 67 51.8 3.9474
28 50.8 3.9279 68 51.8 3.9474
29 50.9 3.9299 69 51.8 3.9474
30 51 3.9318 70 51.8 3.9474
31 51 3.9318 71 51.9 3.9493
32 51 3.9318 72 51.9 3.9493
33 51 3.9318 73 51.9 3.9493
34 51 3.9318 74 52 3.9512
35 51.1 3.9338 75 52 3.9512
36 51.1 3.9338 76 52 3.9512
37 51.1 3.9338 77 52.1 3.9532
38 51.1 3.9338 78 52.2 3.9551
39 51.1 3.9338 79 52.8 3.9665
40 51.1 3.9338 80 53.1 3.9722
Varianza de los siete datos
Contador Dato Residual Residual^2Residual^3Residual^4
1 1.53 1.5300 2.341E+00 3.582E+00 5.480E+00
2 1.58 1.5800 2.496E+00 3.944E+00 6.232E+00
3 1.59 1.5900 2.528E+00 4.020E+00 6.391E+00
4 1.63 1.6300 2.657E+00 4.331E+00 7.059E+00
5 1.64 1.6400 2.690E+00 4.411E+00 7.234E+00
6 1.65 1.6500 2.723E+00 4.492E+00 7.412E+00
7 1.77 1.7700 3.133E+00 5.545E+00 9.815E+00
Σ Residual 11.3900 1.857E+01 3.032E+01 4.962E+01
Varianza 3.095E+00
Con excel 5.690E-03

Varianza 80 datos
# DatoResidual r^2 r^3 r^4 # DatoResidual r^2 r^3
1 49.1 49.1000 2410.810 1.184E+05 5.81E+06 41 51.1 51.1000 2611.2100 1.334E+0
2 49.4 49.4000 2440.360 1.206E+05 5.96E+06 42 51.2 51.2000 2621.4400 1.342E+0
3 49.5 49.5000 2450.250 1.213E+05 6.00E+06 43 51.2 51.2000 2621.4400 1.342E+0
4 49.6 49.6000 2460.160 1.220E+05 6.05E+06 44 51.2 51.2000 2621.4400 1.342E+0
5 49.6 49.6000 2460.160 1.220E+05 6.05E+06 45 51.2 51.2000 2621.4400 1.342E+0
6 49.7 49.7000 2470.090 1.228E+05 6.10E+06 46 51.2 51.2000 2621.4400 1.342E+0
7 49.7 49.7000 2470.090 1.228E+05 6.10E+06 47 51.3 51.3000 2631.6900 1.350E+0
8 49.9 49.9000 2490.010 1.243E+05 6.20E+06 48 51.3 51.3000 2631.6900 1.350E+0
9 49.9 49.9000 2490.010 1.243E+05 6.20E+06 49 51.3 51.3000 2631.6900 1.350E+0
10 50.1 50.1000 2510.010 1.258E+05 6.30E+06 50 51.3 51.3000 2631.6900 1.350E+0
11 50.1 50.1000 2510.010 1.258E+05 6.30E+06 51 51.4 51.4000 2641.9600 1.358E+0
12 50.2 50.2000 2520.040 1.265E+05 6.35E+06 52 51.4 51.4000 2641.9600 1.358E+0
13 50.2 50.2000 2520.040 1.265E+05 6.35E+06 53 51.5 51.5000 2652.2500 1.366E+0
14 50.3 50.3000 2530.090 1.273E+05 6.40E+06 54 51.5 51.5000 2652.2500 1.366E+0
15 50.3 50.3000 2530.090 1.273E+05 6.40E+06 55 51.5 51.5000 2652.2500 1.366E+0
16 50.3 50.3000 2530.090 1.273E+05 6.40E+06 56 51.5 51.5000 2652.2500 1.366E+0
17 50.3 50.3000 2530.090 1.273E+05 6.40E+06 57 51.6 51.6000 2662.5600 1.374E+0
18 50.3 50.3000 2530.090 1.273E+05 6.40E+06 58 51.6 51.6000 2662.5600 1.374E+0
19 50.4 50.4000 2540.160 1.280E+05 6.45E+06 59 51.7 51.7000 2672.8900 1.382E+0
20 50.4 50.4000 2540.160 1.280E+05 6.45E+06 60 51.7 51.7000 2672.8900 1.382E+0
21 50.5 50.5000 2550.250 1.288E+05 6.50E+06 61 51.7 51.7000 2672.8900 1.382E+0
22 50.6 50.6000 2560.360 1.296E+05 6.56E+06 62 51.7 51.7000 2672.8900 1.382E+0
23 50.6 50.6000 2560.360 1.296E+05 6.56E+06 63 51.7 51.7000 2672.8900 1.382E+0
24 50.7 50.7000 2570.490 1.303E+05 6.61E+06 64 51.7 51.7000 2672.8900 1.382E+0
25 50.8 50.8000 2580.640 1.311E+05 6.66E+06 65 51.8 51.8000 2683.2400 1.390E+0
26 50.8 50.8000 2580.640 1.311E+05 6.66E+06 66 51.8 51.8000 2683.2400 1.390E+0
27 50.8 50.8000 2580.640 1.311E+05 6.66E+06 67 51.8 51.8000 2683.2400 1.390E+0
28 50.8 50.8000 2580.640 1.311E+05 6.66E+06 68 51.8 51.8000 2683.2400 1.390E+0
29 50.9 50.9000 2590.810 1.319E+05 6.71E+06 69 51.8 51.8000 2683.2400 1.390E+0
30 51 51.0000 2601.000 1.327E+05 6.77E+06 70 51.8 51.8000 2683.2400 1.390E+0
31 51 51.0000 2601.000 1.327E+05 6.77E+06 71 51.9 51.9000 2693.6100 1.398E+0
32 51 51.0000 2601.000 1.327E+05 6.77E+06 72 51.9 51.9000 2693.6100 1.398E+0
33 51 51.0000 2601.000 1.327E+05 6.77E+06 73 51.9 51.9000 2693.6100 1.398E+0
34 51 51.0000 2601.000 1.327E+05 6.77E+06 74 52 52.0000 2704.0000 1.406E+0
35 51.1 51.1000 2611.210 1.334E+05 6.82E+06 75 52 52.0000 2704.0000 1.406E+0
36 51.1 51.1000 2611.210 1.334E+05 6.82E+06 76 52 52.0000 2704.0000 1.406E+0
37 51.1 51.1000 2611.210 1.334E+05 6.82E+06 77 52.1 52.1000 2714.4100 1.414E+0
38 51.1 51.1000 2611.210 1.334E+05 6.82E+06 78 52.2 52.2000 2724.8400 1.422E+0
39 51.1 51.1000 2611.210 1.334E+05 6.82E+06 79 52.8 52.8000 2787.8400 1.472E+0
Clases
Rango = 4
Número de clases 7
Rango de clase = 0.57142857 0.6

CLASE LIC LSC MARCA f


A 49.1 49.7 49.4 7
B 49.7 50.3 50 11
C 50.3 50.9 50.6 11
D 50.9 51.5 51.2 27
E 51.5 52.1 51.8 21
F 52.1 52.7 52.4 1
G 52.7 53.3 53 2

También podría gustarte