Guia No 2 de Estadistica Grado 10
Guia No 2 de Estadistica Grado 10
Guia No 2 de Estadistica Grado 10
2: ESTADISTICA - GEOMETRIA
GRADO: NOVENO
ESTANDAR: Selecciono y uso algunos métodos estadísticos adecuados al tipo de problema, de información
y al nivel de la escala en la que esta se representa (nominal, ordinal, de intervalo o de razón).
DERECHO BÁSICO DE APRENDIZAJE: Propone un diseño estadístico adecuado para resolver una
pregunta que indaga por la comparación sobre las distribuciones de dos grupos de datos, para lo cual usa
comprensivamente diagramas de caja, medidas de tendencia central, de variación y de localización.
INDICADORES DE EVALUACIÓN
ORIENTACIÓN DIDÁCTICA
Resolver en el cuaderno
Para analizar una variable cualitativa se hace una caracterización de ella. Caracterizar una variable tiene como
objetivo presentar tablas de frecuencias que brinden información resumida: además, presentar diagramas en
los cuales se pueda interpretar dicha información y determinar de manera general el o los datos de mayor
frecuencia.
Así, el tipo de bebida hidratante que prefieren los deportistas que participan en las carreras 10 Km, la marca
de harina que prefiere un fabricante de pastas, el género literario que prefiere un grupo de personas son, entre
otras, variables cualitativas.
DISTRIBUCIÓN DE FRECUENCIAS
Una distribución de frecuencias es el registro de todos los valores de la variable y de sus frecuencias
asociadas, tales como: frecuencia absoluta, frecuencia relativa, frecuencia porcentual y frecuencias
acumuladas.
A continuación, se describen cada una de las frecuencias asociadas a una distribución de frecuencia.
• Frecuencia absoluta
La frecuencia absoluta corresponde al número de veces que se repite una de las categorías o valores de la
variable. Se simboliza como fi.
• Frecuencia Relativa
La frecuencia relativa se define como: la frecuencia absoluta dividida entre el total de observaciones, se
simboliza como fr, por lo tanto, donde fi es la frecuencia absoluta y n es el total de observaciones.
• Frecuencia porcentual
• Frecuencias acumuladas
Las frecuencias acumuladas permiten conocer rápidamente el número de observaciones que están por debajo
de una categoría o un valor, los valores acumulados solo tienen sentido cuando la variable es de tipo ordinal.
Es posible calcular las frecuencias acumuladas absolutas (F), como la suma de las frecuencias absolutas (fi),
y las frecuencias relativas acumuladas (Fr), como la suma de las frecuencias relativas ( .).
El diagrama de barras y el diagrama circular se utilizan para visualizar de manera clara y precisa cada una de
las categorías de la variable y de esta forma facilitar la interpretación de la información dada en una
distribución de frecuencias.
• Diagrama de barras
El diagrama de barras relaciona cada una de las categorías de la variable colocadas en un eje de la gráfica,
con su frecuencia absoluta o relativa que se ubica en el otro eje.
• Diagrama circular
El diagrama circular presenta los porcentajes de cada categoría de la variable en un círculo, de tal forma que
para determinar la parte del círculo que corresponde a cada categoría, se multiplica la frecuencia relativa por
360°.
Ejemplos
Para la siguiente situación encontrar algunas características de la variable de estudio a partir de la tabla de
frecuencias. Luego, elaborar el diagrama circular y el diagrama de barras.
En el tipo de vivienda familiar se pueden considerar tres posibles categorías: vivienda en alquiler (VA),
vivienda con hipoteca (VH) o vivienda propia (VP). Se realizó un estudio estadístico con una muestra de
4.500 familias cuyo resultado se representa de una manera cuantitativa, relacionando las familias con el tipo
de vivienda, como se ilustra en la siguiente tabla.
• El total de la frecuencia absoluta es la cantidad total de familias 4.500, mientras que el total de la
frecuencia re1ativa fr siempre es 1.
• La frecuencia relativa acumulada (Fr) se obtiene como la suma acumulada de las frecuencias relativas
de las filas anteriores hasta la propia fila.
• La vivienda propia tiene el mayor porcentaje con un 39,5% de las familias. Le sigue la categoría de
vivienda en alquiler, con un 39,2'l6 de familias. Finalmente, la categoría con menos individuos
corresponde a las familias de vivienda con hipoteca. En este caso las características de cada una de las
categorías son fáciles de apreciar porque el número de categorías de la variable es muy pequeño.
• Los porcentajes acumulados no tiene sentido interpretarlos cuando se trabaja con variables
cualitativas nominales. La información de que el 60,5% de las familias viven en alquiler o en vivienda
con hipoteca resulta ser una interpretación superficial.
A partir de la tabla de distribución de frecuencias se construye el diagrama de barras y el diagrama circular
como sigue:
MODA
La moda de una distribución de frecuencias es el valor de la variable con mayor frecuencia. La moda es una
de las medidas de tendencia central más usada en las variables cualitativas, ya que al conocer cuál es la
categoría con mayor frecuencia de una variable, es posible describir de una forma general el comportamiento
del grupo de individuos. Se simboliza Md.
En algunos casos, las distribuciones de la frecuencia pueden restringirse por la cantidad de datos que
determinan la moda. Así, en una distribución con una única moda recibe el nombre de distribución unimodal,
en una distribución en la que dos o más valores alcanzan la máxima frecuencia se denominan distribuciones
bimodales o multimodales, según el caso.
MEDIANA
Cuando se trabaja con variables cualitativas ordinales la moda no es el único dato estadístico que tiene
sentido. Como en las variables ordinales es posible establecer un orden entre las categorías entonces es
posible encontrar la mediana.
Para encontrar el dato central o mediana, primero se ordenan los datos de menor a mayor,
y luego, se tiene en cuenta los siguientes criterios:
Una empresa productora de cremas humectantes para el cuerpo, reparte de manera aleatoria 235 unidades del
nuevo producto entre un número igual de posibles consumidores, después realizó una encuesta sobre el nivel
de satisfacción respecto al producto. En el siguiente cuadro se muestran los resultados obtenidos.
• La variable es de tipo cualitativa ordinal.
• La moda es para la categoría de “bastante satisfecho‟, ya que tiene la mayor frecuencia, 96
personas. Como tiene una única moda, entonces, es una distribución unimodal.
• La mediana está en la misma categoría que la moda “bastante satisfecho‟ porque del número total
En algunas situaciones es necesario estudiar dos características diferentes de los individuos de una población.
Para la caracterización de dos variables se usan las tablas de contingencia, las tablas marginales y las gráficas de
barras para representar la información sin distinguir si la variable es ordinal o nominal.
TABLAS DE CONTINGENCIA
Las tablas de contingencia se emplean para registrar y analizar la relación entre dos variables.
Por ejemplo, 400 niños de un colegio fueron clasificados de acuerdo con el grupo socioeconómico al que
pertenecen y a la presencia o ausencia de algún defecto en el lenguaje. Los resultados fueron los siguientes:
En esta tabla de contingencia las filas representan las categorías de la variable “Defecto del lenguaje‟ y las
columnas, a las categorías de la otra variable „Grupo socioeconómico“. El valor de cada casilla representa al
número de individuos que poseen simultáneamente las categorías de la fila y de la columna que se cruzan,
por ejemplo, hay 8 niños cuyo nivel socioeconómico es alto y además presentan algún defecto del lenguaje.
Las cifras en la columna de ]a derecha (91 y 309) y de la fila inferior (50, 45, 135 y 170) reciben el nombre
de frecuencias marginales y la cifra situada en la esquina inferior derecha es el gran total (400). Es decir, en
las frecuencias marginales por filas no interesa el nivel socioeconómico sino que hay 91 niños con algún
defecto del lenguaje y 309 niños que no tienen ningún defecto. Y en las frecuencias marginales por columnas
no interesa si los niños poseen algún defecto de lenguaje sino que hay 50 niños cuyo nivel socioeconómico es
alto; 45, cuyos nivel es medio alto; 170, con nivel medio bajo y 135, con nivel bajo.
A partir de la tabla de contingencia es posible construir la tabla de contingencia relativa, realizando el
cociente entre cada número de las casillas y el gran total se muestra a continuación:
Además, si cada valor relativo se multiplica por 100 se obtiene la tabla de contingencia porcentual como se
muestra en la siguiente tabla.
En las tablas anteriores se puede observar que la mayoría de los niños pertenece a un nivel socioeconómico
medio bajo, 42,5%, y que más de la mitad de los niños no presenta deficiencia de lenguaje, 77,25%. Por otro
lado, dentro del grupo de niños que presenta deficiencias en el lenguaje el grupo socioeconómico alto es el
que menos casos presenta, 296, mientras que el grupo medio bajo es el que más deficiencias tiene, 8%.
TABLAS MARGINALES
Una tabla marginal es una tabla cruzada, en la cual se muestran frecuencias relativas con relación al total de
cada fila o cada columna. Se extrae de una tabla de contingencia teniendo en cuenta el total de una de las
variables involucradas.
La tabla marginal correspondiente a la tabla de contingencia del ejemplo de los niños de la escuela primaria
para el caso de la variable deficiencia del lenguaje, se construye dividiendo cada frecuencia entre el total
correspondiente a cada fila. Al obtener los porcentajes asociados a las frecuencias relativas de la tabla se
puede concluir que el 35,2% de los niños que presenta deficiencia del lenguaje y 44,7% de los niños que no
presentan ninguna deficiencia, pertenecen al grupo socioeconómico medio bajo.
DIAGRAMA PARA TABLAS DE CONTINGENCIA
Existen diferentes representaciones para las tablas de contingencia, entre las más utilizadas están los
diagramas de barras, donde se relacionan las dos variables con rectángulos en distintas posiciones, como se
muestra a continuación.
TRANSFERENCIA (VALORACIÓN)