Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Unidad 2-Parte 1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 4

Unidad 2: Recolección de datos y su clasificación

2.1 Agrupación en clases y tablas de distribución de frecuencias.

Una vez que se han recolectado los datos (observaciones), es importante


caracterizar (describir) cómo se comportan, lo que se logra determinando la
frecuencia con que ocurren esos valores mediante distribuciones de frecuencias,
conocidas también como “tablas de frecuencias” y de graficas.

Las distribuciones de frecuencias permiten observar cómo se distribuye un conjunto


de datos. Por tanto, es posible observar donde se encuentra la mayor concentración
si estos están muy dispersos o no, por ejemplo. Es decir, son tablas en las que se
muestran todos los posibles valores de una variable junto con el número de veces
que cada uno de ellos es observado.

Ejemplo 1: Se entrevistó a 20 jóvenes, para conocer el número de refrescos de cola


que beben al día. Construye una tabla de frecuencias con las respuestas obtenidas:

5 2 2 4 5
1 1 4 2 1
3 5 1 0 5
0 3 2 3 4

Solución: El primer paso consiste en ordenar la información de menor a mayor, de esta


forma: 0 0 1 1 1 1 2 2 2 2 3 3 3 4 4 4 5 5 5 5

La variable de estudio es el número de refrescos de cola que beben al día, y los


valores son: 0, 1, 2, 3, 4 y 5, posteriormente se cuentan cuantas personas beben 0
refrescos, cuántas 1, y así sucesivamente, a esto se le conoce como frecuencia
absoluta o frecuencia de clase.

Número de refrescos Conteo Frecuencia absoluta (FA)


0 II 2
1 IIII 4
2 IIII 4
3 III 3
4 III 3
5 IIII 4
Total 20
La interpretación verbal de esta tabla de frecuencias es la siguiente: De las 20
personas entrevistadas, 2 no beben refrescos de cola, 4 toman uno al día, 4 toman
dos al día, 3 toman tres refrescos al día, también 3 beben 4 refrescos al día y
finalmente 4 toman cinco refrescos de cola al día.

A partir de la distribución de frecuencias, también pueden calcularse las frecuencias


relativas (FR). Para ello solo hay que dividir, cada una de las frecuencias absolutas
entre el total de datos y multiplicarlo por cien para representarlo como porcentaje.
Así mismo se pueden agregar las frecuencias acumuladas.

Número de Frecuencia Frecuencia FA FR


Conteo
refrescos Absoluta (FA) Relativa (FR) acumulada acumulada
0 II 2 0.10 | 10% 2 0.10 | 10%
1 IIII 4 0.20 | 20% 6 0.30 | 30%
2 IIII 4 0.20 | 20% 10 0.50 | 50%
3 III 3 0.15 | 15% 13 0.65 | 65%
4 III 3 0.15 | 15% 16 0.80 | 80%
5 IIII 4 0.20 | 20% 20 1 | 100%
Total 20 1 | 100%

2.2 Estudio de la información

Cuando la información que se muestra es difícil de interpretar, el objetivo es


presentar de manera simplificada el conjunto de datos obtenidos agrupándolos en
una tabla de frecuencias. La cual contiene un determinado número de clases de
igual tamaño, debiendo definir el ancho (tamaño) de clase. Esto se da cuando los
datos son continuos, es decir, provenientes de un proceso de medición, por ello es
necesario modificar la distribución de frecuencias, puesto que los datos deben
organizarse en clases. El proceso para construir una distribución de frecuencias
para datos continuos es el siguiente:

1. Se ordenan los datos de menor a mayor.


2. Se determinan el valor máximo y mínimo del conjunto de datos y se calcula
la amplitud o rango (distancia) con esta fórmula:
Amplitud o rango = Valor máximo – Valor mínimo

3. Se establece el número ‘K’ de clases (intervalos) de acuerdo con cualquiera


de las siguientes fórmulas:
a) Núm. de clases ‘K’ = 1 + 3.322 log(n) (Formula de Sturges)
donde log(n) es el logaritmo base 10, del número de datos.

b) Núm. de clases ‘K’ = √𝑛


Nota: Si el resultado es decimal se debe redondear al entero más próximo. Es aconsejable
que una distribución de frecuencias tenga cinco clases o más ya que así puede
determinarse mejor el comportamiento de los datos. Este dato siempre es un entero.

4. Se calcula el ancho que debe tener cada clase:


𝑅𝑎𝑛𝑔𝑜
𝐴𝑛𝑐ℎ𝑜 = 𝑁ú𝑚.𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠

El ancho de clase se refiere a la longitud que existe entre el límite inferior y el límite
superior de una clase.
Nota: Si los datos del problema son enteros y el resultado es decimal se debe redondear al
entero superior más próximo. Si los datos tienen uno o dos decimales, se deberá redondear
a uno o dos decimales, según sea el caso.

5. Se ubican los límites de cada clase.


6. Se determina la marca de clase, que es el punto medio entre el límite inferior
y el superior.
7. Por último, se cuenta el número de observaciones que corresponden a cada
clase, es decir, la frecuencia absoluta. También se puede calcular la
frecuencia relativa (FR) decimal o en porcentaje.

Ejemplo 2: El gobierno federal propone diferentes estrategias con el fin de disminuir


el costo de la energía eléctrica, entre ellas se encuentra el cambio de focos por
lámparas ahorradoras, apagar las luminarias y el cambio de horario. Se requiere
obtener información sobre el consumo de la energía en los hogares, para lo cual se
pidió a un grupo de 38 alumnos que cada uno de ellos llevara a clase su último
recibo de luz. En la facturación aparece el consumo en KwH. A continuación, se
muestra la información de los 38 consumos:

299, 308, 335, 317, 330, 327, 346, 315, 320, 301, 312, 320, 324, 319, 314, 309, 326,
314, 311, 322, 325, 300, 322, 312, 307, 311, 334, 322, 298, 308, 312, 336, 314, 312,
305, 315, 301, 327.

El procedimiento para resumir los datos es agruparlos, lo que se conoce como tabla
de frecuencias. Para su elaboración se siguen los pasos siguientes:
1. Se ordenan los datos de menor a mayor: 298, 299, 300, 301, 301, 305, 307,
308, 308, 309, 311, 311, 312, 312, 312, 312, 314, 314, 314, 315, 315, 317, 319,
320, 320, 322, 322, 322, 324, 325, 326, 327, 327, 330, 334, 335, 336, 346.

2. Se determina la lectura mayor y la menor, y se calcula la distancia entre estos


valores.
Distancia = Máximo – mínimo
Distancia = 346 – 298 = 48

3. Se calcula el número de clases ‘K’, con cualquiera de las siguientes formulas:

a) K = 1 + 3.322 log(38) = 6.248 ≈ 6 Clases

b) K = √38 = 6.16 ≈ 6 Clases

4. Se calcula el ancho de clase dividiendo la distancia entre el numero ‘K’ de


clases que se determinaron en el paso anterior.
𝑅𝑎𝑛𝑔𝑜 48
Ancho (aproximado de igual clase) = = =8
𝑁ú𝑚.𝑑𝑒 𝑐𝑙𝑎𝑠𝑒𝑠 6

5. Se ubican los límites de cada clase, sumando el ancho a cada una.


298-306; 306-314; 314-322; 322-330; 330-338; 338-346

6. Se determina la marca de clase, que es el punto medio entre el límite inferior


y el superior (este valor no se redondea).

7. Se cuenta el número de observaciones que corresponden a cada clase, es


decir, el conteo y la frecuencia absoluta. Considerando que, si una
observación aparece en 2 clases, deberá ser considerada en la clase anterior.
También se puede calcular la frecuencia relativa (FR).

8. Calcular y agregar las frecuencias acumuladas tanto de la absoluta como de


la relativa.

N° de Intervalo Marca de Frecuencia Frec. Abs. Frecuencia Frecuencia Rel.


Conteo
Clases de clase clase Absoluta Acumulada Relativa (%) Acumulada %
1 298 - 306 302 IIIII I 6 6 15.79 15.79
2 306 – 314 310 IIIII IIIII III 13 19 34.21 50
3 314 - 322 318 IIIII IIII 9 28 23.68 73.68
4 322 – 330 326 IIIII III 6 34 15.79 89.47
5 330 - 338 334 III 3 37 7.89 97.36
6 338 - 346 342 I 1 38 2.63 99.99

También podría gustarte