Estadistica Ciclo 3
Estadistica Ciclo 3
Estadistica Ciclo 3
a) Recolección de datos
b) Organización de datos
(1) Tabulación
(2) Graficación
c) Análisis y medición de datos
a) Recolección de datos
Para esta etapa tomaremos los siguientes conceptos básicos:
Población: conjunto de observaciones efectuadas
Individuo: cada elemento de la población.
Atributo: característica investigada en la observación. Estos pueden ser cualitativos
(sexo, religión, nacionalidad) o cuantitativos (estatura, peso, área –estos son
continuos, se miden en números reales-; número de hijos, número de goles –
discretos, se miden en números enteros-)
Por ejemplo: si se desea realizar un estudio estadístico de las estaturas de los alumnos
de tercer año,
Población: conjunto de estaturas
Individuo: cada estatura
Atributo: la estatura
Teniendo presente la clasificación, clasifica los siguientes atributos
1. Afiliación política de los habitantes de la Capital de Chile.
2. Cantidad de ganado vacuno en las provincias de la Río Bueno y La Unión.
3. Religión de los padres de familia de la comunidad educativa Santa Cruz.
4. Ingresos de los obreros.
5. Cantidad de alumnos de las diferentes carreras de la Facultad de Ciencias Exacta
en la U.L.A.
6. Sexo de los alumnos de una escuela.
7. Estado civil de los habitantes de la ciudad de Río Bueno.
8. Cantidad de películas nacionales estrenadas durante un año.
9. Color de cabellos de los alumnos de un curso.
10. Puntaje obtenido por los alumnos que ingresan a la carrera de Medicina.
i. Serie simple:
Completa los cuadros siguientes, ordenando los datos obtenidos.
Alumno Talla Alumno Talla Alumno Talla Alumno Talla
1 1,52 11 21 31
2 1,53 12 22 32
3 1,54 13 23 33
4 1,54 14 24 34
5 1,55 15 25 35
6 1,55 16 26 36
7 1,56 17 27 37
8 1,57 18 28 38
9 1,58 19 29 39
10 1,58 20 30 40
ii. Agrupación de datos por serie o distribución de frecuencias: se registra la frecuencia
de cada valor de la variable. La frecuencia puede ser absoluta (f), número que indica
la cantidad de veces que la variable toma un cierto valor, relativa (fr), cociente entre
la frecuencia absoluta de cada valor de la variable y el número total de
observaciones; relativa porcentual que es el porcentaje de la fr; frecuencia
Acumulada la suma de la fi y la acumulada porcentual, que el la suma de fr% .
Agrupación de datos por intervalos de clase: intervalos iguales en los que se divide el
número total de observaciones. Es conveniente utilizar los intervalos de clase cuando
se tiene un gran número de datos de una variable continua.
¿Cómo saber cuántos intervalos considerar? ¿Cómo determinar su amplitud?
Primero debemos determinar el rango de los datos, que es la diferencia entre el
mayor y el menor de los valores obtenidos.
Rango = xmáx – xmín
Totales
Estas son las notas obtenidas por los 100 candidatos que se presentaron a un
concurso:
38 51 32 65 25 28 34 12 29 43
71 62 50 37 8 24 19 47 81 53
16 62 50 37 4 17 75 94 6 25
55 38 46 16 72 64 61 33 59 21
13 92 37 43 58 52 88 27 74 66
63 28 36 19 56 84 38 6 42 50
98 51 62 3 17 43 47 54 58 26
12 42 34 68 77 45 60 31 72 23
18 22 70 34 5 59 20 68 55 49
33 52 14 40 38 54 50 11 41 76
6 4 2 8 18 16 10 6 7 5 12 8 9
12 17 11 9 16 19 18 18 16 14 12 7 10
3 11 7 12 5 9 11 15 9 4 1 6 11
7 8 10 15 3 2 13 9 11 17 13 12 8
Las edades de veinte chicos son 12, 13, 14, 10, 11, 12, 11, 13, 14, 12, 10, 12, 11, 13,
12, 11, 13, 12, 10 y15. Organiza los datos en una tabla de frecuencias.
¿Qué porcentaje de chicos tienen 12 años?
¿Cuántos chicos tienen menos de 14 años?
En cada día del mes de enero, en el camping Iglú hubo la siguiente cantidad de
turistas: 12, 14, 17, 16, 19, 15, 15, 21, 24, 26, 28, 24, 25, 26, 20, 21, 34, 35, 33, 32, 34,
38, 40, 43, 41, 45, 50, 53, 58. Construye una tabla de frecuencias para estos datos.
(3) Gráficos: la recopilación de datos y la tabulación pueden traducirse gráficamente
mediante representaciones convenientemente elegidas: barras, sectores circulares,
mapas curvas, etc.
Los gráficos permiten visualizar e interpretar el fenómeno que se estudia, en forma más
clara.
Las barras se utilizan generalmente para representar atributos cualitativos o
cuantitativos discreto. La longitud es igual a la frecuencia de cada observación. Pueden
ser barras simples o múltiples, según se trate de representar uno o más atributos.
Las barras pueden ser horizontales o verticales.
neutra
negativa
positiva
0 20 40 60
600
500
Industrial
400
Bancario
300
Adm. Pública
200 Educativo
100 Comercio
0
Enero Febrero Marzo
Los gráficos circulares o gráficos de torta son útiles para comparar datos pues, en
general, trabajan con porcentuales. El área de cada sector representa el porcentaje que
corresponde a la frecuencia de un cierto valor de la variable. Esta representación es
conveniente cuando el número de sectores es pequeño y sus áreas están bien
diferenciadas.
Evaluación del gobierno X
positiva
positiva
negativa negativa
neutra neutra
1800
1600
1400
importación de
1200 la Argentina
1000
800
exportación de
600
la Argentina
400
200
0
millones de dólares
Estas son sólo algunas de las formas posibles de graficación y las que encontrarás con
más frecuencia.
Medidas de posición: se utilizan para encontrar un valor que represente a todos los
datos. Las más importantes son: la media aritmética, la moda y la mediana.
Medidas de dispersión: nos informan cómo están distribuidos los datos. La más
importante es el desviación estándar (), que mide la dispersión de los datos con
respecto al promedio. Cuanto menor es el desvío estándar, menos dispersos están los
datos con respecto al promedio.
Para calcular el desvío estándar, seguimos los siguientes pasos:
Calculamos la diferencia entre cada uno y el promedio.
Elevamos al cuadrado cada una de las diferencias anteriores.
Sumamos todos los valores hallados en el paso anterior y dividimos el resultado por
la cantidad de datos. Así obtenemos la varianza.
Calculamos el desviación estándar () como la raíz cuadrada de la varianza.
x
n
2
i x
i 1
n: número de datos
n
Diego y Sergio, dos de los nadadores del ejercicio anterior, obtuvieron el mismo
promedio y sin embargo sus tiempos están distribuidos de manera diferente.
Calcula los desvíos estándares de los tiempos de los nadadores:
61,7 -0,64
61,7 -0,64
62,3 -0,04
62,9 0,56
63,1 0,76
total
total
Diego
5 Sergio
Entonces:
Podemos ver que el desvío estándar de................................... es menor que el de
................................., lo cual indica que el promedio representa mejor los datos de
................................., porque sus tiempos fueron menos dispersos.
Entonces, aunque cinco datos son muy pocos para hacer estadística, si con esa
información hay que elegir un nadador de ese equipo para la próxima competencia,
conviene que sea.......................................
La Media Aritmética: x
f ·x x
3830
76.6 ptos. 77 ptos.
f 50
50
18 ·5
Me 75 75 7·5 75 4.375 79.375 79 ptos.
2
8 8
4 20
Luego, Mo 80 · 5 80 81,25 puntos. 81 puntos.
4 12 16
Se estima que el valor más repetido de los puntajes de esta prueba fue el 81.
Ejercicios
2–4–3–2–1–1–6–3–0–3–2–4–6–9–3–2–1–6
4º A: 45 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54
33 45 44 41 34 36 34 54
4º B: 43 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42
41 49 40 37 34 44 41 43
¿cuál de los dos cursos tiene el rendimiento más parejo? ¿qué distribución estadístico
permite comparar la distribución de este tipo de datos?
4º A : 3.2 3.5 4.9 5.0 3.1 4.1 2.9 2.8 3.8 4.5 4.3 4.5 4.1 5.8 3.9 3.6 4.2 4.6 1.9
2.8 2.9 3.3 3.9 4.2 4.1 4.3 4.6 4.4 3.8 3.6
4º B : 3.5 2.9 1.3 1.7 3.6 5.6 2.8 5.2 5.3 4.1 4.1 4.4 1.6 5.1 4.3 5.0 5.3 3.2 2.8
2.6 5.5 5.4 4.8 4.9 4.3 2.9 3.9 5.4 5.3 4.2
175 156 172 159 161 185 186 192 179 163 164 170 164 167 168 174 172
168 176 166
167 169 182 170 169 167 170 162 172 171 174 171 155 171 171 170 157
170 173 173
174 168 166 172 172 158 159 163 163 168 174 175 150 154 175 160 175
177 178 180
169 165 180 166 184 183 174 173 162 185 189 169 173 171 173
5) A los mismos alumnos anteriores se les aplico una prueba de inteligencia, estos han
sido:
87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94
115 89 82
141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87
108 115
103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116
108 102 101
118 138 99 105 112 94 96 132 118 123 108 131 127 100 91
Agrupa los datos en intervalos de amplitud 8. Y haz lo mismo que en problema
anterior.
1) Clasifica las siguientes variables como cualitativas o cuantitativas, y a estas últimas
como continuas o discretas:
2) Muchas de las personas que invierten en bolsa lo hacen para conseguir beneficios
rápidos, por ello el tiempo en que mantienen las acciones es relativamente breve.
Preguntada una muestra de 40 inversores habituales sobre el tiempo en meses que han
10.5 11.2 9.9 15.0 11.4 12.7 16.5 10.1 12.7 11.4
11.6 6.2 7.9 8.3 10.9 8.1 3.8 10.5 11.7 8.4
12.5 11.2 9.1 10.4 9.1 13.4 12.3 5.9 11.4 8.8
7.4 8.6 13.6 14.7 11.5 11.5 10.9 9.8 12.9 9.9
3) Investigados los precios por habitación de 50 hoteles de una ciudad se han obtenido
los siguientes resultados
700 300 500 400 500 700 400 750 800 500
500 750 300 700 1000 1500 500 750 1200 800
400 500 300 500 1000 300 400 500 700 500
300 400 700 400 700 500 400 700 1000 750
700 800 750 700 750 800 700 700 1200 800
Determínese:
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
3.2 3.7 4.2 4.6 3.7 3.0 2.9 3.1 3.0 4.5
4.1 3.8 3.9 3.6 3.2 3.5 3.0 2.5 2.7 2.8
3.0 4.0 4.5 3.5 3.5 3.6 2.9 3.2 4.2 4.3
4.1 4.6 4.2 4.5 4.3 3.2 3.7 2.9 3.1 3.5
Se pide:
a) Construir la tabla de frecuencias
b) Si sabemos que los bebes que pesan menos de 3 kilos nacen prematuramente
¿Qué porcentaje de niños prematuros han nacido entre estos 40?
c) Normalmente los niños que pesan más de 3 kilos y medio no necesitan estar
en la incubadora ¿Puedes decirme que porcentaje de niños están en esta
situación?
d) Representa gráficamente la información recogida
[Li-1,Li) ci ni fi Ni Fi
[0,10) 2 0,05 2 0,05
[10,20) 0,15
[20,30) 0,4
[30,40) 15 0,775
[40,50) 1
7) Antes de las últimas elecciones generales, una encuesta realizada sobre la intención
Se pide:
Confeccionar una tabla de frecuencias que recoja esta información y elabora dos
tipos de gráficos distintos a partir de ella. ¿Qué porcentaje de votantes espera
tener cada formación política?
35
30
25
20
15
10
5
0
2 3 4 5 6 7 8
9) En una finca de apartamentos en Benicasim, se reúne la comunidad de vecinos para
ver si contratan una persona que les lleve la contabilidad. El resultado de la votación es
0.6
0.5
0.4
0.3
0.2
0.1
0
0–1 1–2 2–3 3–4
PROBABILIDADES
Para extender los resultados de la muestra a la población, es necesario utilizar la idea
de modelo probabilístico. Cuando tomamos una muestra de una población, nuestras
conclusiones o inferencias acerca de la población tienen un grado de incertidumbre. El
objetivo de este capítulo es presentar una introducción a la teoría de la probabilidad
como fundamento para la inferencia estadística, la que finalmente nos permitirá tomar
una decisión sobre nuestro problema.
Comprueba tus intuiciones sobre el azar1
¿Cómo piensas que deberían ser los resultados de lanzar una moneda 20 veces
seguidas? ¿Serías capaz de escribir 20 resultados de lanzar una moneda (sin lanzarla
realmente, sino como tú piensas que debieran salir) de forma que otras personas
piensen que has lanzado la moneda en realidad? O, ¿podría otra persona adivinar que
estás inventado?
1
de “Didáctica de la Estadística” Carmen Batanero, U. de Granada http://www.ugr.es/~batanero/
1. Vamos a comprobar qué tal son tus intuiciones respecto a los resultados aleatorios.
Abajo tienes dos cuadrículas. En la primera de ellas escribe 20 resultados sin
realizar realmente el experimento. En la segunda mitad lanza la moneda 20 veces y
escribe los resultados obtenidos. Pon C para cara y S para sello.
2. ¿Cómo podremos distinguir una secuencia realmente aleatoria de otra que hemos
inventado?
3. Comparemos el número de caras en las secuencias real y simulada de todos los
alumnos de la clase. ¿Cómo podríamos organizar y resumir estos datos?
PERMUTACIONES Y COMBINACIONES
Teorema fundamental principio multiplicativo) Si un suceso puede tener lugar de m
maneras distintas y cuando ocurre una de ellas, se puede realizar otro suceso
independiente de m formas distintas. Ambos sucesos se pueden realizar de m*n
formas diferentes.
Permutaciones: una permutación de un cierto número de elementos es una
disposición en la que entran todos ellos en un orden determinado. (Diremos que
todos se mueven). En otras palabras una permutación es una variación en la que n=r,
es decir:
Ejercicios
1.- ¿De cuántas maneras se pueden sentar diez personas en diez sillas dispuestas en
fila?
2.- ¿De cuántas maneras se pueden sentar cinco personas en cinco sillas dispuestas en
fila?
3.- ¿De cuántas maneras se pueden sentar seis personas en una mesa circular?
4.- ¿De cuántas maneras se pueden sentar siete personas en siete sillas dispuestas en
fila si una de ellas ocupa un lugar fijo?
6.- Se quiere construir un dominó con los números del 0 al cinco. ¿Cuántas piezas
tendrá este juego lúdico?
7.- A una ceremonia asisten cinco matrimonios, los que se dispondrán en la primera corrida de
asientos dispuestas en fila. De cuántas maneras pueden sentarse si:
¿Se sientan al azar?
¿La “pareja” debe quedar siempre junta?
¿La mujer debe estar al lado derecho de su marido?
¿Un determinado matrimonio debe quedar en el centro?
8.- Se tomara una fotografía a tres matrimonios. De cuántas maneras se puede hacer
si: