Universidad Del Tolima Estadistica I Septiembre 2020
Universidad Del Tolima Estadistica I Septiembre 2020
Universidad Del Tolima Estadistica I Septiembre 2020
ESTADISTICA I
SEPTIEMBRE 2020
EJEMPLOS
5 10 8
Hallar a) Xi = b) Xi = c) Xi =
i =1 i =1 i =1
6 2
Xi =
i =1
9 8 2
a) Xi = b) Xi =
i =3 i =2
X 1 = 39 X 2 = 53 X 3 = 20 X 4 = 44 X 5 = 34 X 6 = 64
X 7 = 37 X 8 = 21 X 9 = 76 X 10 = 88 X 11 = 47 X12 = 43
7 8 5 2 12 2
Hallar a) Xi b) Xi c) Xi d) Xi
i =1 i =3 i =1 i =6
f 1 = 68 f 2 = 30 f 3 = 83 f 4 = 48 f 5 = 92 f 6 = 65 f 7 = 54
f 8 = 46 f 9 = 40 f 10 =35 f 11 = 57 f 12 = 72
6 7 2 11 2 10 2
Hallar: a) fiXi b) ( fiXi ) c) fi Xi d) fi (Xi)
1
i =2 i =3 i =5 i =4
12 2 2
e) fi Xi
i=5
n
K = nK
i=1
2. La sumatoria del producto de una constante por una variable es igual a la constante por
la sumatoria de la variable.
n n
KX = K ∑ Xi
i=1 i=1
3. La sumatoria de los valores de una variable mas una constante es igual a la sumatoria
de la variable mas n veces la constante.
n n n n
(K +Xi) = ∑ Xi + ∑ K = ∑ Xi + nK
i=1 i=1 i=1 i=1
Corolario:
n n
∑ (Xi –K) = ∑ Xi - nK
i=1 i=1
n
∑ K = (n –m +1) K
2
i=m
EJERCICIOS
X1 = 25 X2 = 42 X3 = 29 X 4 = 26 X 5 = 45 X 6 =47 X 7 = 34 X 8 = 31
X9 = 32 X10 = 34 X11= 22 X12= 27 X13= 56 X14= 36
f1 = 17 f2 = 30 f3 = 36 f4 = 33 f5 = 54 f6 = 37 f7 = 45 f8 = 40 f9 =39
f10 = 43 f11= 21 f12= 38 f13= 44 f14= 18
5 8 11 14 5 7 8 4
a) ∑ Xi b) ∑ fi c) ∑ Xi d) ∑ fi e) ∑ (Xi)2 f) ∑ (fi)2 g) ∑ (Xi)2 fi h) ∑ (Xi)2 (fi)2
i=1 i=1 i=1 i=1 i=1 i=1 i=1 i=1
6 7 8
i) ∑ (Xi fi)2 j) ∑ Xi (fi)2 k) ∑ ((fi)2 – Xi)
i=1 i=1 i=1
3. Para los mismos valores dados en 1. Observe que en los siguientes ejercicios el límite
inferior es diferente de 1.
Hallar:
14 13 12 14 13 11
a) ∑ Xi fi b) ∑ ((Xi)2 – fi) c) ∑ (Xi)2 (fi)2 d) ∑ (Xi)2 – (fi2) e) ∑ Xi (fi)3 f) ∑ (Xi)3 fi
i= 8 i=6 i=5 i=4 i=7 i=4
10 14
g) (∑ Xi fi)2 h) ∑ (Xi fi)2
i=4 i=6
MEDIA ARITMÉTICA X
Si X1, X2, X3,.. , Xn , con “ n” datos, la media aritmética se define como la suma de todos
los valores observados, dividido por el # de observaciones ( n )
n
X= X1+X2+X3+……Xn = ∑ Xi
N i=1 n
3
Ej. Los datos siguientes corresponden al # de personas que nacen en Colombia por dia.
2150, 2866, 2405, 4367, 3597, 6379, 4562, 3284, 3497, 4568, 4358, 5788, 5291
Ej: X =
Ej. # de memorias USB de música se venden por semana en la ciudad Cali mes de
diciembre 2019 .
4135, 5089, 6050, 6126, 11242, 4354, 4284, 4321, 7498, 2884,5876,
X=
X=
Método tradicional X=
82, 92, 81, 68, 72, 84, 69, 52, 63, 89, 81, 66, 85, 61, 78,73, 65, 91, 76, 78.
80, 91, 77, 82, 94, 67, 73, 78, 79, 88, 91, 84, 83, 58, 93, 93, 72, 59, 74, 39
4
DESVENTAJAS DE LA MEDIA ARITMÉTICA
A) Es muy sensible a los valores muy grandes o muy pequeños y por lo tanto no aparece
como un valor típico.
251, 82, 76, 178, 8975, 163, 137, 98, 163, 142, 92, 84, 139, 154, 80, 154, 318 , 236, 92,
827,136
1. M ( K ) = K
2. M ( X + K ) = K + M ( X )
3. M ( KX ) = KM ( X )
n
4. ∑ (X i – X) = 0
I=1
1) 3456, 3456 , 3456, 3456 , 3456, 3456 , 3456, 3456 , 3456, 3456 , 3456, 3456 ,
X=
5
2) La empresa “ MJ “ de la ciudad de Barranquilla n cuenta con 20 empleados en su
empresa con una asignación mensual en el año 2020 de
Analizando la situación económica del país se estima para el año 2021 dos propuestas de
aumento.
1. Aumentarle a cada trabajador $ 220.000
58, 95, 84, 82, 93, 60, 89, 78, 90, 62, 240, 86 ,62 ,88,
Xi X ( Xi – X )
58
95
84
82
93
60
89
78
90
62
240
86
62
88
6
5) Para determinar el ingreso promedio mensual de los trabajadores de una empresa se
toma una muestra de tamaño 37 trabajadores n = 37. La muestra a su vez tiene n1 = 23 n1
= Obreros, n2 = 10 n2 = Empleados, n3 = 4 Directivos
n1 + n2 + n3 = n
La partición de la muestra se hace necesaria para que dentro del estudio es requerido
también el ingreso promedio por categorías.
LA MEDIANA ( Me)
50% ≤ Me ≤ 50%
7
Se define como aquel valor de la variable que supera a NO más de la mitad de las
observaciones y al mismo tiempo es superado por no más de la mitad de las observaciones.
50 % ≤ Me ≤ 50 %
239, 168, 254, 188, 253, 241, 243, 276, 156, 254, 230 ,258,, 238, 146, 155, 202, 208, 158,
171, 163
b) # de personas atendidas por dia en Consulta Psicológica Hospital Universitario del Valle
de Cali ( JULIO 2020 )
76 ,48, 68, 58, 48, 33, 68, 54, 47, 42, 46, 63, 71, 157, 85, 80, 91, 96
VENTAJAS DE LA MEDIANA
c) Hay situaciones en que la única medida de tendencia central que puede calcularse es la
mediana, tal como sucede en el caso de una distribución cuyos intervalos extremos no
están definidos.
DESVENTAJAS DE LA MEDIANA
8
c) No se adapta a cálculos posteriores aritméticos, por cuanto si se obtienen las medianas
de diferentes grupos, no se puede obtener una mediana de los grupos reunidos.
MODA Mo
Llamada también Moda o valor Modal. Corresponde al dato que mas se repite cuando son
datos no agrupados y si son datos agrupados la moda será el dato correspondiente a la
máxima frecuencia.
Puede ocurrir que en una serie determinada no haya moda o que existan dos o más, en
este caso se denomina bimodal o trimodal.
765, 2485 , 264, 273, 442, 288, 765 263, 232, 765, 273, 292, 285, 410,238, 536, 801, 765
VENTAJAS
A) El hecho de que la moda indica el punto de mayor concentración, lo hace tal vez, la
mejor medida de tendencia central. Cuando una distribución es muy asimétrica, se ve
que la moda es la más representativa del grupo y en algunos casos, si la moda y el
promedio asimétrico son significativamente diferentes de valor, es preferible usar la
moda.
DESVENTAJAS
9
MEDIA PONDERADA X w
n
X w = ∑ Xi Wi
i=1 Donde W1 = ( i = 1,2,3....,n ) son los pesos
n O ponderaciones correspondientes a cada
∑ Wi Valor de la variable.
i=1
Ej: Sobre una escala de calificación de 1 a 5, en cada uno de los 3 exámenes de una
asignatura, un estudiante obtuvo las siguientes calificaciones.
La Media Geométrica (G) se define como la raíz n – exima del producto de “n” términos
n
MG = √ X1 x X2 ,…….Xn
1) X 1 = 354 X 2 = 67
M G = √ (354) (67)
2) X 1 = 913 X2 = 356 X3 = 42
MG = 7√
10
Para n valores de la forma X la media geométrica será calculada usando la siguiente
formula.
n
MG = antilog ∑ log Xi
i=1
n
Al trabajar con distribución de frecuencias, las frecuencias de cada clase son los pesos o
ponderaciones y se calculan así:
n
Log G = MG = antilog ∑ log Xi fi
i=1
n
Log G =
1) Solo se define para valores positivos, será igual a cero si alguno de los valores
es cero.
131, 124, 115, 121, 114, 151, 145, 142, 168, 138, 132, 215
MG =
Ej: Si el crecimiento de las ventas en un negocio fue en los cuatro últimos años de 16 % ,
27 %, 14 % , 12 % , halla la medida anual de crecimiento.
MG=
11
Respuesta = % media anual de crecimiento.
MEDIA ARMONICA H
Ej: Hallar la media armónica de los números 61, 68, 139,143, 48 ,218 , 234, 215
H= n o 1 = 1 + 1 + 1 + ….. + 1
1 + 1 + 1 + …..+ 1 H X1 X2 X3 Xn
X1 X2 X3 Xn
n
Ej: Si se trata de una serie ponderada
Ej: Un auto recorre 180 Km a una velocidad de 100 Km/ hora y otro 140 Km a velocidad
de 80 Km/ hora o cual es la velocidad media?.
n
∑ Vi Si
Vm = i=1
n
∑ Si
i=1
12
TALLER
2) Escriba tres ejemplos de variable discreta diferentes a los ejemplos de las copias.
54, 68, 32, 158, 61, 43, 48, 135, 834, 53, 254, 254 , 69, 123, 265, 267 , 136
TALLER ESTADÍSTICA
5, 6, 5, 6, 6, 0, 8, 8, 8, 8, 4, 0, 11, 6, 5, 7, 6, 5, 9, 9, 15
13
2) La media aritmética de los salarios pagados en una semana a los empleados de una
empresa ascendió a $ 264.000. La media aritmética de los salarios pagados a los
hombres y a las mujeres fue respectivamente $ 294.000 y $ 252.000. Determinar el
porcentaje de hombres y mujeres en dicha empresa.
3) Una persona viaja durante 4 días, diariamente recorre 150 Kms, pero maneja el primero
y el último dia a 80 Kms, el segundo a 60 kms y el tercero a 70 kms. ¿ Cual es la
velocidad Media durante el viaje? .
5) Un avión vuela una distancia de 900kms. Si cubre el primero y ultimo tercio del viaje a
250kms/h y el tercio medio a 300 Kms/ h. ¿ Cual es la velocidad media?
7) Los siguientes datos corresponden a los salarios diarios en pesos pagados por una
fábrica a sus personal de obreros en un dia de trabajo
135.000 14
123.000 15
106. 000 31
149.000 26
Con el incremento de los salarios el gerente propone un aumento del 12 % diario para cada
uno de los obreros y estos exigen un aumento de 7000 pesos diarios para cada uno. Analice
que es más ventajosos para la fábrica y que para cada grupo de obreros, según su clasificación
por nivel de salarios. ¿ Como actuaría usted?
b) 167, 1375, 99, 89, 82, 94, 121, 92, 136, 124, 78,85, 67
122, 85, 61, 52, 121, 61, 53, 73, 68, 178, 132, 90, 248
149, 401, 152, 189, 54, 165, 176, 367, 182, 176
14
a) Aumento del 10 % en los gastos por viáticos
b) Aumento del 5 % más $ 160.000
c) Aumento de $ 190.000
10) Una compañía emplea tres clases de personal calificado, semicalificado y no calificados
para elaborar un producto. La compañía desea conocer el costo promedio en mano de
obra si se tiene la siguiente información.
No calificado $ 27.300 1
Semicalificado $ 48.670 2
Calificado $ 67.854 5
11) Una compañía toma una muestra de 7 artículos y encuentra que cuestan $118, 146,
165, 131, 154, 123, más de lo que costaba un año antes siendo el año anterior la base
100 %. Hallar la media de los porcentajes.
13) Los siguientes datos corresponden a los salarios diarios en pesos pagados por una
fábrica a su personal de obreros en un dia de trabajo
74.000 10
39.000 16
30.000 38
45.000 26
43.000 18
Con el incremento de los salarios el gerente propone un aumento del 10 % diario para cada uno
de los obreros y estos exigen un aumento de $ 59.200 diarios para cada uno . Analize que es
mas ventajoso para la fabrica y que para cada grupo de obreros según su clasificación por
niveles de salarios. ¿ Como actuaría usted?
1 7%
2 9%
15
3 11 %
4 15 %
5 14 %
16) Una compañía toma una muestra de nueve artículos y encuentra que cuestan 104, 1211
112, 115, 127, 143, 134,143 y 168 % más de lo que costaba un año antes siendo el año
anterior la base 100 %. Hallar la media de los porcentajes.
A B C D
MACARRIO 32 26 72 34
PAULA 47 17 60 19
CRISTIAN 21 32 45 37
CARMENZA 48 19 62 42
ANDRES 47 34 76 31
AMILBIA 36 24 61 16
RICARDO 44 22 68 32
EDUARDO 58 11 33 28
WILLIAN 41 25 65 43
JUAN CARLOS 19 32 61 26
16
AMARANTO 56 36 31 46
EUGENIA 34 33 67 22
EMMANUEL 21 38 56 35
JUAN COVI 53 29 44 29
Ej: Se gastan $ 315.000 en lápices, cuya unidad de venta por docena son a $ 1170. Luego se
da otro gasto en lápices de $ 270.000 con costo por unidad de venta por docena de $ 1296 ¿
Cual fue el costo promedio por docena de los lápices?
X 1 = 1.170 X 2 = 1.296
H = 315.000 + 270.000
1 x 315.000 + 1 x 270.000
1.170 1.296
Ej: Un obrero puede pintar una casa en 6 días y otro puede pintarla en 8 días.
Hallar el rendimiento de un obrero cuyo rendimiento sea representativo de los rendimientos de
los dos obreros.
H = 2 = 2 = 2 = 96 = 48 = 6 6
1 + 1 8+6 14 14 7 7
6 8 48 48
Comprobación: Dos obreros demoran en pintar la casa días.
17
Ejemplo: calcular los cuartiles, dos deciles y cuatro percentiles, de los siguientes datos que
corresponden al # de trabajadores por empresa que han sido despedidos en los últimos 6
meses en Colombia.
284, 308, 214, 235, 402, 296, 162, 82, 938 139, 238, 354, 451, 98, 68, 183, 284, 261,
961, 256, 276, 376, 163, 139, 82, 167, 242, 299, 187, 197, 336, 279.
MEDIDAS DE POSICION
K = 1, 2,3,
K = 1 Q1
K = 2 Q2
K= 3 Q3
QK = nxK + 1 Si nxK
4 4
1 nxK + nxK + 1 Si n x K
2 4 4 4
K = 1, 2, . . . , 9
K = 1 D1
K = 2 D2
DK = nxK + 1 Si nxK
10 10
1 nxK + nxK + 1 Si n x K
2 10 10 10
18
PERCENTILES
Un segmento queda dividido en cien partes iguales mediante 99 puntos cada uno de estos
puntos recibe el nombre de Percentil, el símbolo es Pk
K = 1, 2, . . . , 99
Pk = n x k + 1 , si nxk
100 100
25, 34, 23, 11, 26, 37, 27, 43, 16, 37, 34, 16, 25, 29, 35, 39, 37, 49 36, 43, 47, 31, 12, 20, 17,
29, 21
A x 100 + c
n 2
c= 100 =
n
Este porcentaje se aproxima al entero más cercano.
Cuando n 100 el porcentaje corresponde al mismo percentil buscado.
19
VARIANZA Y DESVIACIÓN ESTANDAR
“ Ejemplo”
n = X A = RA =
n = XB = RB =
8 – ---- =
ESTADISTICA I
20
Las siguientes tablas muestran las derivaciones de cada uno de los términos a la X para las
distribuciones A y B.
DISTRIBUCIÓN A DISTRIBUCIÓN B
Xi X Xi – X Xi X Xi – X
2 2
VARIANZA S = S
Es una medida que determina el grado de desviación o de dispersión de los datos de una
distribución con respecto a la X .
Si el valor de la varianza de una distribución A es menor que el encontrado en una distribución
B, se dice que los datos de la distribución A son más homogéneos que los de la distribución B.
Para una muestra de tamaño n , X1, X2, X3, ... , Xn y media aritmética X , la varianza se
puede calcular así:
n n n
2
S = 2
= ∑ ( Xi – X )2 ò S =2
= ∑ Xi2
2
∑ Xi fi
i=1 i=1 - i=1
n n n
A = B =
DESVIACIÓN ESTANDAR =S
Otra medida que nos sirve para calcular la dispersión de los valores de la muestra respecto a la
X es
S= = √ varianza
21
COEFICIENTE DE VARIACION
Esta medida relaciona la desviación estándar y la media, para expresar la desviación como un
porcentaje de la media.
EJERCICIO:
a) 121, 82, 64, 78, 128, 87, 85, 225,152, 134, 245, 332, 154, 232,
156, 234, 156, 81, 83, 176, 64, 91
b) 36, 58, 64, 72, 67, 29, 145, 183, 123, 78 ,55, 84, 176
22