Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Introducción A La Estadistica Educativa

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 148

Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

LEI

Introducción a la
Estadística Educativa

Autores:
Dra. Marta Graciela del Valle Pece
M.Sc. Ing. Margarita Juárez de Galíndez
Mg. Lic. María Mercedes Simonetti de Velazquez

1
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

PROGRAMA

UNIDAD I: Estadística

Concepto. Etapas en el trabajo estadístico. Estadística Descriptiva e


Inferencial. Variable: concepto. Clasificación de variables. Series
simples. Agrupamiento de datos en series de frecuencias. Frecuencias
absolutas. Frecuencias relativas. Porcentajes. Frecuencias acumuladas,
frecuencias relativas acumuladas y porcentajes acumulados. Tasas de
uso común: de escolarización, de analfabetismo, de desgranamiento, de
retención.

UNIDAD II: Presentación de datos estadísticos.

Partes funcionales y construcción de tablas estadísticas. Elementos


estructurales de las tablas. Tablas simples, cruzadas. Análisis de tablas
estadísticas. Técnicas de representaciones gráficas. Reglas de
construcción. Gráficos según los distintos tipos de variables.

UNIDAD III: Medidas de resumen.

Medidas de tendencia central. Media aritmética, mediana y moda.


Comparación de media, mediana y moda. Distribuciones simétricas y
asimétricas. Medidas de dispersión. Rango, variancia y desviación
estándar y desviación mediana. Coeficiente de variación. Medidas de
localización. Percentiles y rango percentil. Aplicaciones.

UNIDAD IV: Nociones elementales de probabilidad.

Experimentos aleatorios: conceptos básicos. Probabilidad clásica,


frecuencial y axiomática. Teorema de la suma y del producto de
probabilidades.

Tabla de contingencia. Cálculo de probabilidades. Asociación de


variables.

Distribución de probabilidades de variables aleatorias discretas:


Uniforme y Binomial.

2
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Cálculo de probabilidad en variables aleatorias continuas: distribución


normal y distribución normal estándar.

UNIDAD V :Tablas de Contingencia

Distribución ji-cuadrado. Verificación de hipótesis. Tablas de


contingencia. Pruebas de independencia mediante la prueba  2
cuadrado, en tablas de contingencia de c x f .

UNIDAD VI: Inferencia estadística.

Población. Definición de muestra aleatoria. Diseños de muestreo.


Muestreo aleatorio simple. Muestreo sistemático. Muestreo por estratos.
Muestreo por conglomerados: concepto

3
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

CAPITULO I

UNIDADES I y II

INTRODUCCIÓN

La palabra Estadística proviene del latín status (estado).


Precisamente la primera aplicación de la estadística consistió en la
recopilación de datos y la construcción de gráficos para describir el
estado de un país. Con el correr del tiempo esta herramienta fue
evolucionando hasta que en la actualidad podríamos decir que no hay
aspectos de la vida cotidiana donde no se aplique la Estadística.
Hogares, gobiernos y negocios se apoyan en datos estadísticos para
dirigir sus acciones.

El objetivo que se persigue con este módulo es proporcionar al


docente herramientas y técnicas para obtener datos, procesarlos para
obtener información que sirva para la interpretación correcta de
fenómenos que se producen en su ámbito de trabajo.

ESTADÍSTICA. CONCEPTOS.

La Estadística es una colección de métodos para planear


experimentos, obtener datos, y después organizar, resumir, presentar,
analizar, interpretar y llegar a conclusiones basadas en ellos (Triola,
2004).

Otra definición considera a la Estadística como una disciplina


perteneciente a la Matemática Aplicada que se dedica al estudio
cuantitativo de fenómenos colectivos. Proporciona los métodos para:

 La recolección de datos
 Su ordenamiento, resumen y presentación,
 Su análisis e interpretación y
 Posterior enunciado de conclusiones.

Los cuatro pasos que se han enumerado constituyen las etapas del
trabajo estadístico.

4
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

La primera etapa tiene como objetivo recolectar datos proveniente de


medición, conteo u observación efectuado sobre el material objeto de
estudio en base a un plan formulado según los principios del diseño
experimental y las técnicas de muestreo.

La segunda etapa consiste en ordenar los datos en tablas


estadísticas, presentarlos mediante gráficos y diagramas y resumirlos a
través del cálculo de promedios, porcentajes e índices.

En la tercera etapa se analizan los resultados obtenidos en la etapa


anterior, y comienzan a distinguirse las características del fenómeno, lo
que permite utilizar diferentes métodos para analizarlos e
interpretarlos.

En la última etapa se debe concluir acerca del estudio realizado.

Si las conclusiones, se refieren exclusivamente a los datos de los que se


dispone (una parte de la población que se desea estudiar), se dice que
la Estadística es Descriptiva.

Si por el contrario, las conclusiones van más allá de los datos que
se dispone y se refieren a un conjunto mayor (población), del cual se
extrajeron, se dice que la Estadística es Inferencial; las conclusiones
van de lo particular (muestra) a lo general (la población).Esta se basa en
el estudio de la teoría de probabilidades que nos permite medir el error
de nuestras afirmaciones.

Las estadísticas (en plural) se obtienen como resultado del


trabajo estadístico y están constituidas por porcentajes, promedios,
tablas, gráficos y otros elementos que describen un fenómeno y ayudan
a su comprensión (Ej.: estadísticas demográficas, estadísticas del
fútbol, estadísticas de accidentes de tránsito, estadísticas
universitarias, etc.).

Es necesario definir algunos conceptos importantes: por ejemplo

Población. Se define población como el conjunto de individuos u


objetos que comparten una característica común,
en la que el investigador está interesado.

Muestra. Es un subconjunto de la población. Debe ser


representativa, es decir se deben mantener las
mismas características de la población en estudio.

Una población puede ser finita o infinita.

5
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Población finita Una población finita es aquélla que puede ser


físicamente listada

Población infinita. Una población es infinita, cuando en la


práctica no puede ser físicamente listada

Ejemplo. Una población puede ser definida como los alumnos del
Jardín de Infantes Niño Jesús del Barrio San Martín
de la ciudad de La Banda. Los alumnos pueden ser
listados e individualizados a través de los registros
áulicos. Es un ejemplo de población finita.

Personas portadoras de SIDA en Santiago del


Estero, constituyen un ejemplo de población
infinita.

Unidad de observación: es aquélla sobre la cual se efectúan las


mediciones u observaciones. La unidad de
observación puede ser una persona, una familia,
una planta, una parcela, etc.

Dato: es el valor que se obtiene de la medición, observación o


conteo efectuada en la unidad de observación o
unidad de muestreo.

Por ejemplo si el objetivo de una investigación es el rendimiento de


los alumnos, la unidad de observación es el alumno.

El número de materias rendidas contadas en un alumno es el dato.

El conjunto de datos obtenidos de cada unidad de observación


constituirá la base para el análisis estadístico del rendimiento de
los alumnos.

6
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Variables. Concepto y tipos.

Variable. Una variable es cualquier característica que varía de


una unidad de muestreo a otra en la población o en
la muestra

Ejemplo 1: Supóngase que interesa conocer la salud de los


alumnos, entonces la variable a observar en cada alumno será el
estado de salud, el que podrá asumir dos valores: sano o enfermo.

Ejemplo 2: Si interesa saber el número de hermanos que posee


cada alumno, se tendrá valores que van desde 0(ningún hermano), 1,
2...,n y se deberá contar cuantos hermanos posee cada alumno.

Ejemplo 3: Si el objetivo de un estudio fuera la talla alcanzada


por alumnos, se debe medir la variable altura la que, expresada en
metros podrá tener valores mayores a 1 metro.

En los tres ejemplos anteriores, el nombre de la variable y la


forma de obtener sus valores está resaltado en negrita. En el primer
ejemplo, los valores que puede asumir la variable son calidades, por lo
que se dice que la variable es cualitativa. Las calidades o categorías
pueden ser naturales como al definir la variable sexo, o arbitrarias
como la clasificación de alturas en bajas, medianas y altas.

Por el contrario, en los otros dos ejemplos los valores que asumen las
variables pueden expresarse mediante números, por lo que las dos
últimas variables son cuantitativas. En el caso de número de
hermanos, la variable toma sólo determinados valores en el intervalo
que va de cero a n, por lo que se la denomina variable cuantitativa
discreta o discontinua; cuando la variable toma los infinitos valores
dentro del intervalo se dice que la variable es cuantitativa continua

Otra forma de clasificación de las variables es mediante el empleo


de cuatro niveles de medición: nominal, ordinal, de intervalo y de razón.
Cuando se manejan datos reales el nivel de medición es importante ya
que orienta sobre el procedimiento estadístico a utilizar.

7
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Un nivel de medición es nominal cuando los valores de


variables son nombres, etiquetas o categorías y no se puede establecer
un orden entre ellos.

Ejemplo: colores de ojos, estado de salud, lugar de nacimiento de un


alumno. Aunque las ciudades pueden ser ordenadas según su tamaño,
densidad poblacional, grado de contaminación del aire, etc, en general,
la variable “lugar de nacimiento” no tiene un orden establecido

Con estos datos no es posible realizar cálculos. A veces se asignan


números a las diferentes categorías; a la variable salud que posee dos
valores sano y enfermo, podemos codificarlas numéricamente de la
siguiente manera 1= sano, 2= enfermo pero esto no es nada más que
una codificación y tales números no tienen significado computacional.

Un nivel de medición es ordinal cuando se puede establecer un


orden entre las categorías de la variable. Ejemplo: máximo nivel de
instrucción alcanzado por los padres de los alumnos: analfabeto,
primario, secundario, terciario, universitario.

Lo único que podemos decir es que el nivel de instrucción secundario es


mayor que el primario y que el universitario es mayor que el primario,
secundario o terciario, pero no podemos decir cuanto mayor es una
categoría de la variable respecto a la otra.

Supongamos que se codifican dichos niveles con 1, 2, 3, 4 y 5.

Si bien se podría hacer la diferencia entre 2-1=1 y 4-3=1, este resultado


1 no significa que entre el primario y el analfabeto hay la misma
cantidad de conocimiento que entre el universitario y el nivel terciario.

Otro nivel de medición es el de intervalo. En este nivel la


diferencia entre dos valores de datos tiene un significado. En este nivel
no hay un cero natural, donde nada de la cantidad esté presente. El
valor del cero es convencional

Ejemplo: La variable Temperatura está medida en escala de intervalo.


Un termómetro por ejemplo, mide la temperatura en grados que son del
mismo tamaño en cualquier punto de la escala. Aquí no existe un punto
de partida natural, el valor 0° es arbitrario y no representa la ausencia
total de calor. La diferencia entre 20ºC y 21ºC es la misma que entre
12ºC y 13º. Se pueden realizar operaciones de suma y resta pero no
cociente entre valores.

Por último el nivel de medición de razón o cociente aunque se


parece al nivel de medición de intervalo tiene un punto de partida o cero
inherente (donde cero indica que nada de la cantidad está presente).
Para los valores en este nivel tanto las diferencias como los cocientes

8
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

tienen significado. En este nivel se pueden realizar todas las


operaciones.

Ejemplo: Los precios de los libros de texto (0$ representa ningún costo
y un precio de $60 es dos veces más costoso que uno de $30).

Datos

Variable Variable
Categórica o numérica o
cualitativa cuantitativa

Escala Escala Escala de Escala de


nominal ordinal intervalo razón
minal

Series de datos. Series simples

El conjunto de valores de una variable constituye una serie de


datos. Se presentan a continuación series de datos referidas a los tres
ejemplos que se dieron para ilustrar tipos de variables:

Ejemplo 1: En el año 2004, se examinan 30 niños de Jardín de


Infantes de la escuela San Francisco y se anota su estado de salud
(S=Sano, E=Enfermo).

Generalmente las variables se designan con las últimas letras del


abecedario en mayúscula por ej. X y los valores que toma la variable
con x minúscula; incluso se coloca xi donde el subíndice i indica el
número de individuo observado; de éste modo las 30 observaciones son:

xi : S, S, E, E, E, S, S, E, S, S, S, S, S, E, S, S, S, S, E, S, S, S, S, S, S,
S, S, S, S, S.

9
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

El subíndice “ i “ varía de 1 a 30. Así, x1 = S; x7 = S;

X14 = E; . . . x30 =S.

Ejemplo 2: Un maestro de preescolar de la Escuela San Martín


interroga a 30 alumnos sobre el número de hermanos que poseen.

Xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0.

El subíndice “i“ va desde 1 a 30 y entonces x1 = 4; x5 = 0; x12 = 5; .


.; x30 =0.

Ejemplo 3: Un maestro mide la talla de sus 25 alumnos de


Sección Maternal de la Escuela San Francisco la que expresada en cm
es la siguiente:

xi(cm):
70,75,74,87,92,89,72,83,84,79,98,99,95,87,84,85,79,78,95,99,97,84,8
6,78,74.

Ahora “i” va desde 1 a 25, entonces x1 = 70; x2 = 75; . . .;

x25 =74.

Los datos en bruto, tal cual fueron obtenidos, sin agrupar


constituyen una serie simple.

Tablas y gráficos

Organización de datos categóricos o cualitativos.

Cuando la masa de datos obtenidos es muy grande y éstos están


desordenados, no dan información alguna; conviene por lo tanto
ordenarlos y tabularlos, haciendo uso de tablas estadísticas, que deben
confeccionarse de tal modo que los datos resulten fáciles de ser leídos e

10
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

interpretados. Con los datos del ejemplo 1 se puede construir una tabla
de frecuencias.

Tabla de frecuencias. Una tabla de frecuencias para variable


cualitativa, es una tabla que asocia cada categoría de la
variable con el número de veces que se repite la categoría.

Tabla 1. Alumnos de Jardín de Infantes, de la Escuela San Francisco,


según estado de salud. Año 2004.

i Categorías:xi Frecuencias: fi

(Estado de salud) (nº de alumnos)


1 Sano 24
2 Enfermo 6
Total 30

Fuente: Datos ficticios

Frecuencia absoluta: Es el nº de veces que se repite cada categoría de


la variable. Se la simboliza con fi.

La suma de las frecuencias absolutas, es igual al nº total de


2

f
i  30
observaciones, en éste caso 30 ( i 1 ). Nótese que “ i “ ahora se
refiere a las categorías, x1 = Sano, f1 = 24;

x2 = Enfermo, f2= 6.

La tabla de frecuencias, es la más sencilla de las tablas y es una


tabla de simple entrada pues los individuos se clasifican según una
única variable, estado de salud en el ejemplo.

Los datos organizados en tabla de simple entrada para variable


cualitativa, pueden presentarse mediante gráficos, que tiene la
finalidad de que la información entre por los ojos. El gráfico que puede
usarse en éste caso es el gráfico de barras.

11
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 1a. Alumnos de Jardín de Infantes, de la Escuela San


Francisco, según estado de salud. Año 2004.

30
Nº de alumnos 25
20
15
10
5
0
Sanos Enfermos
Estado de salud

Fuente: Datos ficticios

. Para su construcción se utiliza el sistema de coordenadas


ortogonales. Sobre el eje horizontal se colocan las distintas categorías
de la variable en estudio (estado de salud) y sobre el eje vertical con una
escala adecuada, se representan las frecuencias. Se dibujan barras de
ancho constante, una para cada valor de la variable, con una altura que
representa el valor de la frecuencia que corresponde a cada categoría.
Es conveniente que la separación entre las barras sea menor que el
ancho de las mismas.

El ancho de las barras debe elegirse teniendo en cuenta el espacio


disponible, el número de categorías de la variable a representar y la
altura que les corresponde, con el objeto de obtener un gráfico
proporcionado. Las barras pueden dibujarse en sentido vertical u
horizontal.

12
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 1b. Alumnos de Jardín de Infantes, de la Escuela. San


Francisco, según estado de salud. Año 2004.

Enfermos
Estado de salud

Sanos

0 5 10 15 20 25 30

Nº de alumnos

Fuente: Datos ficticios

En algunos trabajos es necesario calcular frecuencias relativas.

Frecuencia relativa de una categoría es la proporción de veces que


ocurre dicha categoría.

Se obtiene dividiendo la frecuencia absoluta de cada categoría entre la


suma de las frecuencias de todas las categorías. La suma en éste caso
es f1 + f2 = 24 + 6 = 30, y se expresa literalmente mediante el signo
 que se denomina sumatoria, así

i  2


i  1
fi  f 1  f 2  24  6  30

a la frecuencia relativa de la clase i-ésima se la simboliza con fri y se


la calcula de la siguiente manera:

fi
fri 
f i

La suma de las frecuencias relativas es siempre igual a 1.

 fr
i 1
i 1

Si se multiplica las frecuencias relativas por 100 se obtienen


porcentajes. En éste ejemplo sería:

13
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Tabla 2. Alumnos de Jardín de Infantes, de la Escuela. San Francisco,


según estado de salud. Año 2004.

i xi fi fri Porcentajes:

(Estado de salud) %
1 Sano 24 24/30=0,80 80

2 Enfermo 6 6/30=0,20 20

Total 30 1,00 100

Fuente: Datos ficticios

Se pueden representar los datos de la tabla 2 mediante un gráfico de


barras, sólo que en el eje vertical van los porcentajes.

Gráfico 2. Alumnos de Jardín de Infantes, de la Escuela San


Francisco, según estado de salud. Año 2004.

% 100
80
60
40
20
0
sanos enfermos
Estado de salud

Fuente: Datos ficticios

Otro gráfico adecuado para representar series de frecuencias de


variable cualitativa es el gráfico de sectores circulares, llamado
gráfico de tortas o pie charts.

14
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Tabla 3. Alumnos de Jardín de Infantes, de la Escuela San Francisco,


según sexo. Año 2004.

Sexo fi fri 360ºxfri

(nº de
alumnos)
Varones 15 0,38 137º
Mujeres 25 0,62 223º
Total 40 1,00 360º

Fuente: Datos ficticios

Se elige un radio por ej. 3cm (el valor del radio se elige según el espacio
que se disponga para el gráfico) y se grafica un círculo La superficie de
dicho círculo representa el total de alumnos (40), en consecuencia, le
corresponde un ángulo de 360°. Se puede discriminar mediante
sectores circulares la porción que corresponde a las mujeres y a los
varones. Los grados correspondientes a los sectores se obtienen
multiplicando la frecuencia relativa por 360º.

Gráfico 3. Alumnos de Jardín de Infantes, de la Escuela. San


Francisco, según sexo. Año 2004.

Varón
Mujer

38%

62%

Fuente:Datos ficticios

15
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Variables cuantitativas.

Ejemplo: Nº de hermanos que tienen los alumnos de preescolar de la


escuela San Martín

xi: 4,1,6,0,0,1,2,3,1,0,2,5,6,4,2,0,1,2,4,3,5,6,1,3,2,4,5,2,6,0

Para el caso de variables cuantitativas discretas, la tabla de


frecuencias se construye de la siguiente manera: se ubica el valor
mayor y el menor valor de la variable (en el ejemplo 2 del n° de
hermanos por alumno, el menor valor es cero y el valor mayor 6), se
colocan todos los valores correspondientes en la primera columna de la
tabla, y luego se cuentan las veces que se presentan dichos valores. La
tabla resultante es:

Tabla 5. Alumnos de preescolar de la escuela San Martín según Nº de


hermanos.

Xi fi Fi fr %
0 5 5 0,17 17
1 5 10 0,17 17
2 6 16 0,20 20
3 3 19 0,10 10
4 4 23 0,13 13
5 3 26 0,10 10
6 4 30 0,13 13
Total 30 1,0 100

Fuente: Datos ficticios

La diferencia que existe entre cada clase es constante e igual a 1.

Además de las frecuencias relativas (cuyo cálculo se explicó en


párrafos anteriores) aquí se puede calcular también las frecuencias
acumuladas fa. La frecuencia acumulada de una clase se obtiene
sumándole a la frecuencia de la clase, la frecuencia de las clases
anteriores.

F(0)=5

F(1)=5+5=10

F(2)=5+5+6=16 = F(1)+6

16
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

La tabla de frecuencias para variables cuantitativas discretas se


representa mediante un gráfico de bastones. En la abscisa se colocan
los valores de la variable y se levanta para cada uno de ellos una línea
de altura igual a su frecuencia.

Gráfico 4. Alumnos de preescolar de la escuela San Martín según


Nº de hermanos.

4
frecuencia

0
0 1 2 3 4 5 6
Número de hermanos

Fuente: Datos ficticios

Interpretación:

El número 6 en la columna de fi significa que 6 alumnos tienen 2


hermanos.

El número 19 en la columna Fi significa que 19 alumnos tienen 3


hermanos o menos.

El número 20 en la columna de porcentajes significa que el 20% de los


alumnos tienen 2 hermanos.

17
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Para el caso de variables cuantitativas continuas como los


datos del ejemplo 3 (altura en cm de 25 alumnos de una sección
maternal de la Escuela San Francisco) que fueron obtenidos por
medición, se recomienda construir intervalos de clase, cuya amplitud
depende de la cantidad de intervalos que se deseen construir y la
cantidad de datos que posee la serie simple. Es recomendable que los
intervalos de clases sean iguales, es decir que la amplitud de los
mismos (a) sea constante. La técnica a emplear para el agrupamiento de
una serie simple de variable cuantitativa continua es sencilla.

xi (cm): 70, 75, 74, 87, 88, 89, 72, 83, 84, 79, 98, 99, 95, 87, 84, 85,
79, 78, 95, 99, 97, 84, 86, 78, 74

1. -Se ubica el valor mayor que toma la variable (99 cm) y el valor
menor (70 cm).

2. - Se obtiene la diferencia, la que se denomina Rango o amplitud de


variación y se designa con la letra R.

R  xmax  xmin  99  70  29

3.– El número de intervalos aproximado se puede calcular con la


siguiente fórmula:

log(n  1)
n de intervalos 
log(2)

dónde n: n° de valores de la serie o tamaño de la muestra

log: logaritmo decimal

log(25  1)
nde int erv.   4,7004  5 int ervalos
log(2)

Cuando en la variable que se estudia existen intervalos


predeterminados, el número de clases o intervalos dependerá de la
amplitud que se usa habitualmente.

4. - El rango se divide entre el nº de clases o intervalos de clases, 5 para


éste ejemplo, (se recomienda que el número de intervalos no sea menor
que 5, ni mayor de 15, pues en el primer casos se reduce demasiado la
información y en el segundo no se cumple con el objetivo del

18
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

agrupamiento) obteniéndose una idea aproximada de la longitud o


amplitud del intervalo de clase.

Rango 29
a   5 .8  6
n º de int ervalos 5

Éste valor de amplitud es orientativo, por lo que se decide tomar


una amplitud de intervalo 5 cm para facilitar el agrupamiento.

5.- Se delimitan las clases buscando preferentemente valores enteros


para sus límites. Se debe elegir el límite inferior del 1er intervalo de tal
manera que contenga al menor valor de la serie (70 cm). La elección
recae en el 70. El límite superior del 1er intervalo, se obtiene sumando
al Li la amplitud.

Li del 1er intervalo = 70

Ls del 1er intervalo = Li + a= 70 + 5 = 75

El límite inferior del 2do intervalo debe coincidir con el límite


superior del primer intervalo.

Li del 2do intervalo = 75

Ls del 2do intervalo Li + a= 75+ 5 = 80

El límite inferior del 3er intervalo debe coincidir con el


límite superior del 2do intervalo, y así sucesivamente, hasta que el límite
superior del último intervalo, contenga el valor observado más alto de la
variable.

19
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

6.- Una vez formadas las clases se procede al conteo, que consiste en
determinar el nº de observaciones (frecuencias) de cada clase. Una
manera sencilla de hacerlo es leyendo la serie simple y ubicando
mediante marcas cada valor de la variable en su clase correspondiente.
De ésta manera cuando se termine de pasar lista a la serie simple, el
agrupamiento ha sido efectuado.

Tabla 6. Alumnos de Sección maternal de la escuela San Francisco


según su altura.

Intervalo de clase xi fi fri

(altura en cm) (marca de clase)


70 a 75 72,5 4 0,16
75 a 80 77,5 5 0,20
80 a 85 82,5 4 0,16
85 a 90 87,5 5 0,20
90 a 95 92,5 1 0,04
95 a 100 97,5 6 0,24
Total 25 1,00

Fuente: Datos ficticios

Un problema que se puede presentar es el siguiente: si un valor


de la variable coincide con uno de los límites del intervalo, por ejemplo
la altura 95 cm ¿dónde se lo ubica? ¿en el quinto o en el sexto intervalo
de clase? La respuesta es: puede ubicarlo en cualquiera de los
intervalos, pero si se elige un criterio se lo debe respetar hasta el final
del agrupamiento. En éste ejemplo al nº 95 se lo ubica en el 6°
intervalo, de la misma manera, cuando aparezca por ejemplo un valor
85, debe ser anotado como perteneciente al intervalo en el que el nº 85
se encuentra como límite inferior. El intervalo de clase es cerrado en el
límite inferior y abierto en el superior. Esto se indica de la siguiente
forma 75;80 los valores del intervalo van desde 75 a 79,9999.

7.- Se agrega una tercera columna, titulada “marca de clase” o “punto


medio de clase” que se designa con xi que contiene los valores
correspondientes a los puntos medios de cada uno de los intervalos y se
calcula así:

20
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Li1  Ls1 70  75
x1    72,5
2 2

Li 2  Ls 2 75  80
x2    77,5
2 2

También se puede calcular de la siguiente manera

x 2  x1  a  72,5  5  77,5

x3  x 2  a  77,5  5  82,5

Al efectuar el agrupamiento, se pierde detalle de la información ya


que, por ejemplo, de los valores que resultaron ubicados en la primera
clase, sólo se sabe ahora que se encuentran entre 70 y 75. Por eso, en
caso de ser necesario asignar un valor a cada uno de ellos, como es en
el cálculo de la media aritmética a partir de la tabla de frecuencias, se
opta por pensar que todos tienen igual valor, que es el correspondiente
al punto medio de clase.

Un gráfico adecuado para representar una serie de frecuencias de


variable cuantitativa continua es el histograma (gráfico nº 5). Su
construcción es fácil. Se utiliza el sistema de coordenadas cartesianas
ortogonales. En el eje de las ordenadas (vertical) se marcan las
frecuencias (fi) y en el de las abscisas (horizontal), la variable según la
cual se efectuó la clasificación (altura). Consiste en rectángulos
adyacentes (uno por cada clase) con bases materializadas por la
amplitud de clases (5 cm). La altura está dada por la frecuencia
correspondiente a la clase. Cuando las clases son iguales, el área del
histograma es proporcional a la frecuencia total.

21
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 5.Alumnos de Sección maternal de la escuela San Francisco


según su altura.

6
5
4
Nº alum.

2
1

0
70 75 80 85 90 95 100

Altura (cm)

Fuente:Datos ficticios

Otro gráfico adecuado para representar la serie de frecuencias de


variable cuantitativa continua es el polígono de frecuencias (gráfico
6). Se emplea para su realización el sistema de coordenadas cartesianas
ortogonales. Se coloca la variable clasificadora en el eje horizontal y las
frecuencias en el vertical.

La construcción es sencilla, se marcan tantos puntos como pares


de valores (xi,fi) o sea según marcas de clase, frecuencias haya en la
tabla. En la tabla Nº 6 vemos que hay 6 pares de valores; el primer par
tiene abscisa 72,5 y ordenada 4 y así sucesivamente hasta marcar el
sexto par. Luego se unen los puntos mediante trazos rectos. Algunos
autores, en su afán de mantener la proporcionalidad entre la superficie
y la frecuencia aconsejan cerrar el polígono de frecuencias uniendo el
primer punto con la marca de clase inmediata anterior y el último
punto con la inmediata superior; en éstos dos casos la unión de los
puntos se realiza con trazos cortados.

La principal ventaja de los polígonos de frecuencias consiste en


que ellos permiten dibujar en el mismo sistema de eje dos o más
polígonos correspondientes a series diferentes que tengan similar
posición sobre el eje de las x, así se puede compararlos, lo cual resulta
engorroso efectuar con los histogramas a causa de la superposición de
las superficies de los rectángulos.

22
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 6.Alumnos de Sección maternal de la escuela San Francisco


según su altura.

5
Nº de alumnos

0
65 70 75 80 85 90 95 100 105
Altura(cm)

Fuente: Datos ficticios

Como cada miembro de una población presenta diversas


características, se puede necesitar clasificarlos de acuerdo a dos de
ellas. Cuando el número de individuos medidos es pequeño, se
enumeran todos los pares de observaciones, si alguno de ellos aparece
dos veces, se lo repite y la presentación suele hacerse de modo que una
de las dos variables esté ordenada.

Tabla 9. Alumnos de un Jardín de Infantes según su peso y altura.

Peso 30 20 25 26 25 22 26 28 31 35
(kg)
Alt 80 65 68 75 72 68 74 80 82 85
(cm)

Fuente: Datos ficticios

Para representar estos datos que corresponden a dos


variables cuantitativas continuas se utilizan los gráficos de dispersión
o scatter plot, que se construye de la siguiente manera: se coloca una
de las variables en las abscisas o eje horizontal, por ejemplo la altura y
la otra variable, el peso, en el eje vertical, con sus escalas
correspondientes, luego se marcan tantos puntos como pares de valores
(xi, yi) se tengan.

23
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 7. Alumnos de un Jardín de Infantes según su peso y


altura.

100

80
Altura (cm)

60

40
20 25 30 35 40
Peso (kg)

Fuente: Datos ficticios

Éste gráfico sirve para mostrar la relación entre las dos variables
y se usa cuando para el mismo valor de xi se tiene diferentes valores de
yi. Si esto no ocurre puede utilizarse el gráfico lineal, que se construye
de igual manera que el anterior, con la única diferencia que se unen los
puntos. Éste gráfico, se suele emplear, especialmente, en los casos
donde la variable que se representa en el eje horizontal es el tiempo. De
éste modo se puede ver la evolución de la otra variable en el período
considerado. Pueden representar simultáneamente en el mismo gráfico
dos o más variables, como se observará al representar gráficamente los
datos de la tabla Nº 10.

Tabla 10. Inasistencias mensuales de alumnos de una Sección de


preescolar de la Escuela San Martín según sexo.

Meses N° de inasist.
Mujeres Varones
Marzo 3 4
Abril 5 7
Mayo 2 4
Junio 6 5
Julio 8 8
Agosto 4 5
Sept. 3 4
Octubre 4 3
Noviem. 5 2
Diciem. 1 6

Fuente: Datos ficticios

24
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 8. Inasistencias mensuales de alumnos de una Sección


preescolar de la Escuela San Martín según sexo.

9
Mujeres
8 Varones

7
Nº de inasistencias

0
M A M J J A S O N D
Meses

Fuente: Datos ficticios

Cuando los pares de valores son muy numerosos, las tablas se


presentan según lo muestra la tabla 11; en éste caso se dice que las
tablas son de doble entrada pues son dos las variables de
clasificación.

Tabla 11. Alumnos de Jardín de Infantes de una ciudad de Santiago del


Estero según ocupación de la madre y lugar de residencia.

Barrios Total
Ocupación
de la
Madre A B C
A. de casa 400 500 200 1100
Profesional 200 200 50 450
Empleada 300 400 100 800
Total 900 1100 350 2350

Fuente: Datos ficticios

En este ejemplo cada alumno se caracteriza según la variable


Ocupación de la madre (variable cualitativa nominal) y Barrio de
residencia (variable cualitativa nominal).

25
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Los valores que se encuentran en la celda son frecuencias, es decir


representan la cantidad de alumnos que comparten las dos
características.

Las partes de una tabla son:

La matriz, formada por la primera fila, lleva los encabezamientos de las


columnas y / o la primera columna que titula a las filas.

El cuerpo constituido por celdas.

La información proporcionada por los valores de las celdas se


completa con la suministrada por los encabezamientos de las filas y
columnas; en las celdas se encuentra la frecuencia, es decir la cantidad
de elementos o individuos que poseen las dos características.

Por ejemplo el 100 de la última celda significa que en esa escuela


hay 100 alumnos que viven en el Barrio C y cuyas madres son
empleadas.

El gráfico que se utiliza para representar éste tipo de tablas es el


gráfico de barras compuestas (gráfico 9) y el gráfico de barras
agrupadas (gráfico 10).

Gráfico de barras compuestas

La construcción del gráfico de barras compuestas es sencilla. Se


comienza dibujando las barras como si fueran simples es decir con las
alturas correspondientes a los totales y luego se yuxtaponen los valores
parciales hasta alcanzar el de su suma. En el ejemplo, Barrio A, se
procede de la siguiente manera: se marca una barra de altura 900, en
ella se indica la subdivisión que corresponde a alumnos cuyas madres
son amas de casa con el valor 400; para marcar el nº de alumnos que
es 200, se marca 400+200=600 en el eje vertical lo que queda
corresponde nº de alumnos cuyas madres son empleadas. De igual
manera se procede con los barrios B y C.

26
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Gráfico 9. Alumnos de Jardín de Infantes de una ciudad de


Santiago del Estero según ocupación de la madre y lugar de residencia.

1200
Empleada
Profesional
1000
A. de casa
Nº de alumnos

800

600

400

200

0
A B C

Lugar de residencia

Fuente: Datos ficticios

Gráfico de barras agrupadas

Sirven para representar fenómenos similares a los que originan


barras compuestas. La diferencia con éstas estriba en que, para cada
valor de la variable independiente “x” en éste ejemplo lugar de
residencia, se dibujan grupo de barras . El número de barras en
cada grupo es el del número de categorías de la segunda variable, en
este ejemplo ocupación de las madres.

Gráfico 10. Alumnos de Jardín de Infantes de una ciudad de Santiago


del Estero según ocupación de la madre y lugar de residencia.

600
A. de casa
Profesional
500
Empleada
Nº de alumnos

400

300

200

100

0
A B C

Lugar de residencia
Fuente: Datos ficticios

27
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Otro tipo de gráficos son los gráficos de figuras o pictogramas.


Son los más indicados para publicaciones de divulgación popular,
por su fácil e inmediata interpretación. Consisten en dibujos
esquemáticos y relacionados con el fenómeno a representar. Cada
figura es equivalente a una cantidad determinada, preferentemente
entera, de unidades de la variable dependiente y el número de
unidades no su tamaño, es proporcional a la magnitud a
representar.

Cartogramas: Se emplean cuando es importante señalar la


distribución geográfica de un determinado acontecimiento, razón por
la cual se construyen sobre planos o mapas.

Cartogramas de señalización (Gráfico 11): Sirven para indicar la


distribución de una variable cualitativa sobre una base geográfica.
Mediante figuras, colores o diferentes rayados se señala que hay en
lugares determinados.

Gráfico 11. Qué es lo que caracteriza a cada provincia argentina.

Fuente: Pensando en plural. División de educación tributaria. AFIP.


Mayo 2005. ISBN Nº987-9101-26-X

28
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Cartogramas de densidad: además de indicar que hay y dónde, de


ellos se puede obtener la información de cuánto hay. Mediante
diferente rayado o colores y también utilizando barras sobre la base
geográfica, se puede expresar la cuantía del fenómeno como así
también su ubicación. Suelen utilizarse pictogramas, gráficos de
líneas, en general cualquiera de los descriptos, sobre el mapa o
plano.

Resumiendo: los datos se ordenan, clasifican y presentan en formas


de tablas. Las tablas pueden de ser de simple entrada (cuando los
individuos se clasifican según una variable), de doble entrada
(cuando los individuos se clasifican según dos características) y de
triple o más entradas (cuando se clasifican los datos según tres o
más variables).Las tablas se complican a medida que se agregan más
variables, por lo tanto es preferible varias tablas sencillas a una
complicada.

Toda tabla debe llevar título, el cuál debe responder a las preguntas
¿Según?, ¿Qué?, ¿Cuándo? y ¿Dónde?.

No se debe olvidar la fuente de datos que indica de donde proviene la


información.

Se debe incluir los totales.

En caso de expresar los datos en porcentajes, deben indicarse los


totales de los cuales provienen.

Con respecto a los gráficos, éstos constituyen una de las formas más
útiles de presentación de datos estadísticos. Su importancia reside
en las múltiples formas que pueden adoptar, lo que permite su
aplicación a una amplia gama de finalidades: didácticas, de
investigación, etc. Sirven para mostrar la relación entre una o más
variables. La variedad de tipo de representaciones gráficas exige una
cautelosa elección de acuerdo a su finalidad. La selección de la
presentación gráfica debe, por lo tanto tener los siguientes aspectos:

Tipo de análisis estadístico, características y número de los


fenómenos o variables a representar y público al que va dirigido.

29
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Recomendaciones para la construcción correcta de un gráfico.

Una vez elegido el tipo de gráfico adecuado, es conveniente no


descuidar las siguientes consideraciones:

*Decidir cuál de las variables es la independiente “x” y cuál la


dependiente “y”.

*La representación gráfica debe ser sencilla, simple y explicarse por


sí misma.

*Título se coloca encabezando el gráfico y debe responder a las


preguntas; qué, según, cuándo, dónde?.

*Fuente de datos. Se coloca al pie del gráfico.

*Escalas se elige de tal modo que no alteren la objetividad de la


representación, hecho éste muy utilizado para fines publicitarios
donde es común ver escalas construidas con el propósito de alterar
el fenómeno exagerando ventajas y enmascarando la realidad, o lo
que es peor aún eliminando la graduación de los ejes, evitando de
ésta forma todo patrón de comparación. Las escalas deben
construirse buscando obtener como resultado un dibujo armónico y
proporcionado.

*Debe nominarse los ejes de modo tal que no quede duda alguna
acerca de las variables que en ellos se representan.

*No olvidar el corte de ejes en caso de ser necesario. Éste debe


efectuarse entre el 0 y el valor mínimo a representar.

*Aclaración de las unidades de representación.

*Las referencias serán colocadas al pie o al costado del gráfico.

*En caso de usarse abreviaturas, éstas serán aclaradas con la debida


extensión, en el renglón siguiente al correspondiente a las fuentes.

*En lo posible acompañar los gráficos con las tablas estadísticas que
lo originen.

*Si el trabajo lo requiere y es necesario expresar algunos valores en


%, deben consignarse las cifras de las cuales provienen éstos
porcentajes.

30
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

INDICES

El Índice es un indicador útil tanto para fijar situaciones como para


hacer un diagnóstico. Cuando interesa comparar los valores de una
característica de la educación (matrícula, asistencia de alumnos,
número de profesores, etc...) en el tiempo o en el espacio, ya sea
comparando dos valores entre sí o todos con uno de ellos se puede
realizar un cociente cuyo resultado se denomina Índice simple.

Ejemplo: Se desea comparar la matrícula en preescolar de una ciudad


en el año 2004 con la matrícula en el año 1994. Si la primera es de
4000 alumnos y la de 1994 es de 2000, el Índice será:

4000
I 2004 / 1994  2
2000

Lo que indica que la matrícula en el año 2004 es el doble que la


matrícula de 10 años atrás, en preescolar.

El valor que va en el denominador se llama base.

El Índice del año base es 1:

2000
I 1994 / 1994  1
2000

Con frecuencia se multiplica por 100 los índices con lo que entonces los
índices son los porcentajes correspondientes siendo 100 el porcentaje
del índice base.

Los Índices más comunes utilizados en educación son:

 Razón de alumnos matriculados en las escuelas con respecto a la


población en edad escolar.

N alumnos matriculados
I
Población en edad escolar

Ejemplo: En el año 2001, en el departamento Robles, Pcia. de Santiago


del Estero según el INDEC, la población en edad preescolar fue de 3229
y los alumnos matriculados fue de 1272. La razón de alumnos
matriculados es entonces en ese año de:

1272
I  0.39
3229

31
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Es decir que solo el 39% del total de la población en edad preescolar


asiste a la escuela en ese departamento.

 Alumnos por maestro en las escuelas primarias.

N alumnos
I
N maestros

Ejemplo: Si el total de alumnos de preescolar de una escuela es de 300


y el plantel docente es de 15 docentes (Datos ficticios), la razón alumnos
por maestro es de:

300
I  20
15

Es decir que en esa escuela hay 20 alumnos por cada maestro.

 Porcentaje de población analfabeta de 15 años y más.

N analfabetos de 15 años y más


I *100
Población de 15 años y más

Ejemplo: En la provincia de Santiago del Estero según el INDEC, en el


año 2001 el total de población de 15 años y más fue de 571546
personas. De ellas, 31625 no tenían ninguna instrucción.

El Porcentaje de población analfabeta para la provincia es entonces,

31625
I *100  5.53%
571546

 Tasa de ausentismo de docentes.

Es el porcentaje de ausentismo de docentes en un período de tiempo


determinado.

N º de días de ausencia de todos los docentes en un período


Ta  *100
N º de días de clase de todos los docentes en ese período

32
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Ejemplo: Si en un Jardín de Infantes hay una planta docente de 15


personas y el total de inasistencias de los docentes (por diversas
causas) en el año es de 405, la Tasa de ausentismo se calcula como
sigue (considere que los días de clase en el año son 180):

405
Ta  * 100  15%
15 * 180

Tasa de desgranamiento

Es la proporción de alumnos ingresados al primer grado (o curso) que


no lograron culminar todos los grados (o cursos) correspondientes al
nivel, en el período establecido.

N º de alumnos que no culminaron sus estudios en el período establecido


Td  *100
N º de alumnos matriculados al inicio del período

Ejemplo: Si en el estudio de la cohorte 1974-1980 el número de


alumnos matriculados en la Argentina en la escuela primaria al inicio
del período es de 729048 y los que no culminaron sus estudios es de
337292 (Fuente: Estado, Sociedad y Educación en la Argentina de fin de
siglo. D. Filmus. Troquil-Bs.As.1996. Pag.87, citado por Lic. Julio
Zurita: Guía de actividades del a asignatura: Introducción a la
estadística Educativa. Escuela para la Innovación educativa. UNSE.)

La Tasa de desgranamiento es:

337292
Td   0,46
729048

Es decir que en ese período hay un desgranamiento del 46%.

El 46% de los alumnos matriculados al inicio del período no culminaron


sus estudios al final del mismo.

 Tasa de retención de la cohorte

Es la proporción de alumnos ingresados al primer grado (o curso) que


lograron culminar todos los grados (o cursos) correspondientes al nivel,
en el período establecido.

N º de alumnos que culminaron sus estudios en el período establecido


Tr  * 100
N º de alumnos matriculados al inicio del período

33
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Ejemplo: Si en el mismo período considerado en el ejercicio anterior


terminan el 7º grado 391756 alumnos de los 729048 matriculados, la
Tasa de retención será:

391756
Tr   0,5374
729048

Es decir que la Tasa de retención es aproximadamente del 54%.

El 54% del os alumnos matriculados al inicio del período culminaron


sus estudios al final del mismo.

 Tasa de escolarización

Proporción de la población en edad escolar que está efectivamente


escolarizada

N º de alumnos matriculados
Ez  * 100
Población en edad escolar

Ejemplo: La población de 5 años y más para Sgo. del Estero en el 2001


según el INDEC es de 706794 habitantes. De ellos asisten a la escuela
237708.

La Tasa de escolarización es:

237708
I *100  33,63%
706794

Es decir que el 33.63% de la población en edad escolar asiste a la


escuela.

34
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

GUÍA DE EJERCITACIÓN

Actividad 1

Clasifique en base al siguiente listado las variables socio educativas, en


cualitativas nominales u ordinales y cuantitativas discretas o continuas

Variable Tipo
1- Religión

2- Nº de alumnos promocionados por


sección

3- Barrios

4- Nivel de educación alcanzado por


el tutor

5- Edad de los alumnos

6- Sexo

7- Nº de inasistencias mensuales

8- Altura de los alumnos

9- Lugar de nacimiento

10- Peso de los alumnos

11- Horas de juego

12- Nº de materias que cursan

13- Nº de hermanos que tiene cada


alumno

14- Grado de satisfacción por la


asignatura

15 Superficie construida por escuela

16 Nº de escuelas por Departamento

17 Categorías de escuela

35
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Actividad 2

Los siguientes datos corresponden a Nº de inasistencias de los


alumnos de una sección de Jardín de Infantes correspondientes al
primer cuatrimestre:

xi: 8 5 3 4 2 5 4 4 10 6
6 7 5 5 3 9 7 2 6 4
9 4 5 0 8 6 5 1 1 4
5 7 2 7 6 4 9 4 5 3

a) ¿Que indica el subíndice i?


b) ¿Cuál es la variable que se estudia?. Clasifíquela.
c) Ud. debe presentar un cuadro de inasistencias de los alumnos.
¿Cómo construye el mismo?
d) Incluya en la tabla: frecuencias acumuladas, frecuencias
relativas, porcentaje y porcentaje acumulado correspondiente a
cada valor de la variable.
e) Presente los resultados con el gráfico apropiado.

Actividad 3

A los padres de 50 alumnos de sección de 5 años de Jardín de Infantes


de un establecimiento de la Capital de la Pcia. de Sgo. del Estero, se les
distribuyó un cuestionario con la finalidad de determinar la actitud de
los mismos ante el desempeño de los docentes. Una de las preguntas
estaba referida al grado de conformidad sobre el desarrollo de
actividades lúdicas.

Los resultados obtenidos fueron los siguientes:

xi:

MC MD C I C MC D D MC MC
I MC I MC D MC MD C D C
MC D MC D MC D MD I C C
C MD MC I C MC MC D C MC
C MC D MD MC I D MC I MC

36
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Donde:

MC: muy conforme

C: conforme

I: indiferente

D: disconforme

MD: Muy disconforme

a) Indique el tamaño de la muestra


b) Ud. debe representar al establecimiento en una reunión de
docentes en la que participan distintos Colegios de la Capital.
¿Como presentaría la opinión de los padres?
c) Que título colocaría a la presentación?
d) Incluya en la misma frecuencias relativas y porcentajes
correspondiente a cada valor de la variable.
e) Presente esos mismos resultados con un gráfico de barras
simples.
f) Indique si corresponde calcular frecuencia acumulada. En el caso
de respuesta afirmativa obtenga dicha frecuencia.
g) Analice los resultados obtenidos

Actividad 4

En un estudio realizado en el Jardín de infantes de la Escuela Normal


de la ciudad de La Banda para determinar la zona de influencia del
mismo según el lugar de residencia de los alumnos, los resultados
obtenidos fueron los siguientes:

Alumnos del Jardín de Infantes de la Escuela Normal de La ciudad de


La Banda según el barrio en el que residen.

Barrios Número de
alumnos
Barrio San Martín 100
Barrio Villa Rosita 80
Barrio Menéndez 40
Barrio Mercantil 20
Total 240

Fuente: Datos ficticios

37
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

a) ¿Que representa el número 100?


b) ¿Cuál es la variable de clasificación? Indique de que tipo de
variable se trata.
c) Obtenga frecuencias relativas y los porcentajes correspondientes.
d) Determine si corresponde calcular frecuencias acumulada.
e) Realice gráfico de tortas.
f) ¿Qué otro gráfico puede emplear para representar estos datos?

Actividad 5

Los siguientes datos corresponden a la edad de los tutores de alumnos


que concurren al Jardín de Infantes de un establecimiento escolar.

xi:

44 30 45 48 31 45 33 35 54 44
45 47 38 56 29 43 43 62 60 30
52 36 45 31 31 32 34 32 54 55
55 46 61 39 43 38 47 45 38 37
63 49 34 48 34 64 44 47 36 60
50 52 37 41 29 37 49 37 39 56
39 46 46 31 60 29 53 40 41 58

Presentar los datos:

a) En una tabla con un número conveniente de intervalos de clase.


b) En una tabla con 5 intervalos.
c) ¿Qué gráficos utilizaría para representar los datos contenidos en
estas tablas?
d) Con la tabla presentada en el ítem b, realice un histograma.
e) Con la tabla presentada en el ítem a, realice un polígono de
frecuencias.

Actividad 6

Los siguientes datos corresponden a niños en edad preescolar en la


Pcia. de Santiago del Estero, discriminados por sexo. Año 2001.

Categoría de Total Sexo


edad Varones Mujeres
1(3 años) 3320 1654 1666
2(4 años) 7399 3605 3794
3(5 años) 14448 7207 7281

FUENTE: INDEC. Censo Nacional de Población, Hogares y Viviendas.


2001.

38
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

En base a los datos proporcionados en la tabla anterior realice:

a) Gráfico de barras simples que muestre el número total de niños


que pertenecen a la primera categoría de edad. ¿Qué otro tipo de
gráfico podría utilizar en la representación?
b) Gráfico de tortas que muestre el número de niños
discriminados por sexo para la categoría 2 de edad.
c) Realice un gráfico de barras agrupadas por categoría de edad.
d) Realice un gráfico de barras porcentuales por categoría de edad
discriminando dentro de cada una de ellas los porcentajes de
varones y mujeres.

Actividad 7

Utilice un gráfico lineal para mostrar la evolución de egresados del


Polimodal.

Año Nº de
egresados
1980 233
1985 278
1990 321
1995 375
2000 391

FUENTE: Datos ficticios

Actividad 8

En base a los datos de la siguiente tabla:

Población en edad escolar, Nº de alumnos matriculados y Nº de


maestros correspondiente a cuatro lugares de la República Argentina.

Lugar Población en Nº de Nº de Nº de
edad escolar alumnos alumnos no maestros
matriculados matriculados
A 300000 248.000 7.000
B 150000 106.000 4.000
C 25000 24.000 1.200
D 160000 142.000 4.750

Fuente: Datos Ficticios

39
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Calcular para cada lugar:

a) Proporción de alumnos matriculados


b) Nº de alumnos por maestro
c) Tasa de escolarización
d) Número de alumnos No matriculados
e) Porcentaje de alumnos No matriculados

Actividad 9

Dada la siguiente tabla, calcule la tasa de retención y el desgranamiento


de cada cohorte y en base a los resultados realice el análisis
correspondiente

Retención y Desgranamiento de la Escuela Primaria. Su evolución en 3


ciclos escolares del período 1964-1980.

Ciclo Escolar Alumnos matriculados


1er Grado 7º Grado
1964 - 1970 723.264 321.940
1969 - 1975 751.049 375.723
1974 - 1980 729.048 391.756

Fuente: Estado, sociedad y educación en la Argentina de fin de siglo. D.


Filmus. Troquil-Bs.As.-1996-Pág.87.Citado por Lic,. Julio Zurita: Guía
de actividades de la asignatura: Introducción a la Estadística Educativa.
Escuela para la Innovación Educativa. UNSE. Año

a) Calcule la tasa de desgranamiento


b) Calcule la tasa de retención
c) Interprete los resultados obtenidos

Actividad 10

La siguiente tabla fue extraída del Censo Nacional de Población,


Hogares y Vivienda . 2001.

Población de 10 años y más de departamentos de Santiago del Estero,


por condición de alfabetismo y sexo. Año 2001.

40
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Provincia Población Condición de alfabetismo


de 10 años Alfabetos Analfabetos
y más Total Varones Mujeres Total Varones Mujeres
Total 607.782 571.067 284.309 286.758 36.715 19.030 17.685
Capital 191.311 186.724 87.894 98.830 4.587 2.299 2.288
Banda 97.689 92.937 45.066 47.871 4.752 2.461 2.291
Río 38.435 34.962 17.361 17.601 3.473 1.960 1.513
Hondo
Copo 19.241 17.264 9.156 8.108 1.977 948 1.029

a) Calcular la tasa de analfabetismo de los distintos Departamentos que


se muestran en la Tabla.

b) ¿Cuál es el porcentaje de población de más de 10 años sabiendo que


la población total de Santiago del Estero, según el Censo del año 2001
es de 804.457 ?

c) ¿Cuál es la tasa de analfabetismo de las mujeres en los distintos


departamentos?

d) Calcule la tasa de analfabetismo correspondiente a los varones de los


distintos departamentos.

41
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

CAPÍTULO II

UNIDAD III

MEDIDAS DE POSICIÓN Y DISPERSIÓN

INTRODUCCIÓN

En todo trabajo estadístico luego de recolectar los datos,


ordenarlos, agruparlos en tablas y presentarlos gráficamente, es
preciso extraer alguna información que caracterice a la población de la
cual se los extrajo.

Por ello, el objetivo de éste capítulo es interiorizarlos acerca de las


medidas de posición y, variación más utilizadas para caracterizar a la
población en estudio, y en que caso se emplea cada una de ellas,
interpretando los resultado a través del pensamiento crítico.

Los métodos de éste capítulo suelen denominarse métodos de


estadística descriptiva, porque su objetivo es resumir o describir las
características importantes de un conjunto de datos. Éstas
características se refieren al centro, variación, distribución, datos
distantes y cambios a través del tiempo.

1. MEDIDAS DE POSICIÓN

Supongamos que una directora está preocupada por las


inasistencias de los alumnos del jardín bajo su dirección. Necesita
resumir los datos y dar un único valor sencillo y representativo que
pueda servir de referencia para todos los alumnos; esta medida que
sirve para ubicar el conjunto de datos en una escala de medición, se
denominan Medidas de Posición, y si además indican el centro de ése
conjunto de valores, se denominan Medidas de posición y tendencia
central.

Se conocen varias formas de determinar el centro de un conjunto de


datos. A continuación, se indicarán tres que son las más comúnmente
utilizadas: media aritmética, mediana y modo.

42
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

1.1. Media aritmética

La media (aritmética) es la medida de posición y tendencia central,


generalmente, la más importante de todas las medidas numéricas
utilizadas para describir los datos; constituye lo que la mayoría de la
gente denomina promedio. Es quizás la más conocida y usada.

a) Cálculo de las media aritmética en series simples

 Ejemplo 1

Se registró los días de inasistencias en un año, de una muestra de


cinco alumnos de la sección materna del jardín y se desea averiguar
cuál es el promedio de inasistencias de esa muestra. La variable en
estudios es:

X = nº de inasistencias de los alumnos

Los valores de la variable son:

xi : 0; 16; 12; 5; 7

La media aritmética en una serie simple de datos, se la obtiene al dividir


la suma de todos los valores de la variable entre la cantidad valores
sumados. A la media aritmética se la representa con x :

0  16  12  5  7 x1  x 2  x3  x 4  x5
x i
x   i 1

5 5 5 ,

y su fórmula de cálculo es la siguiente

x i
x i 1
n 2.1

43
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

En la fórmula se utiliza la letra griega  (sigma mayúscula) que indica


que los valores de la variable deben sumarse.

El símbolo n denota el tamaño de la muestra, que es el número de


alumnos observados y que constituyen el número de valores de la
variable que se dispone para el estudio.

Cuando los datos provienen de una muestra el símbolo de la media


aritmética es x (se denomina “x barra”); si se calcula la media aritmética
con los datos de toda la población se simboliza con :

x i
 i 1

N 2.2

 denota la sumatoria del conjunto de valores.

x i expresan los diferentes valores que toma la variable.

n tamaño de la muestra, cantidad de valores observados

N tamaño de la población

Como nuestros datos pertenecen a una muestra para calcular la media


utilizamos la fórmula 2.1

x i
0  16  12  5  7 40
x i 1
  8
5 5 5

Interpretación: Los alumnos tienen en promedio 8 inasistencias por


año.

44
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Algunas propiedades de la media aritmética

1-La media aritmética es reproductora del total.

2- Si llamamos desvío a la diferencia entre un valor y la media


aritmética

 d    x
i i 
x 0

xi d i  xi  x
0 0 – 8 =-8
5 5 - 8 =-3
7 7 - 8 =-1
12 12 – 8 = 4
16 16 – 8 = 8
Total 0

Una desventaja de la media es su sensibilidad a valores extremos, de


modo que un valor excepcional puede afectarla de una manera drástica,
en este caso no representa en forma adecuada al centro de dicho
conjunto y tiende a dirigirse a ese valor extremo.

Si por equivocación al pasar los datos en el ejemplo de las inasistencias


de los 5 alumnos colocamos 66 en vez de 16.

 Ejemplo 2

X = inasistencias de alumnos

xi : 0; 66; 12; 5; 7

La inasistencia promedio toma el valor 18, alejándose el promedio


hacia al valor extremo 66.

x i
0  66  12  5  7 90
x  i 1
   18
5 5 5

45
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

La media aritmética no representa el centro del conjunto de datos. Este


problema o desventaja se resuelve utilizando otra medida de resumen
de datos que se denomina: mediana.

La media aritmética se puede calcular cuando los valores de las


variables son cuantitativos tanto continuos como discretos.

1. 2 Mediana.

La mediana (de un conjunto de datos): es una medida de tendencia


central que divide a la serie ordenada de datos en dos partes iguales. La
mediana se designa con Me, es un valor de variable que expresa que el
50% de los datos son menores o iguales a la mediana y el otro 50%
mayores o iguales a ella.

a) Cálculo de la mediana en series simples

 Ejemplo 3

Se desea determinar el valor mediano de las inasistencias de los


alumnos del ejemplo 2,

El tamaño de la muestra, “n” es impar.

X: inasistencias de alumnos

xi : 0; 66; 12; 5; 7

Para su cálculo debemos ordenar primero los datos en forma


ascendente o descendente.

Si el número de observaciones es impar, la mediana es el valor de la


variable que se localiza exactamente en la mitad de la lista.

En caso de que el número de observaciones fuera par, el valor de la


mediana se obtiene promediando los dos valores centrales.

El o los valores centrales se ubican con:

n 1
2

46
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Solución. Primero se ordenan los datos

0; 5; 7; 12; 66.

Se cuenta el número de valores de la muestra, n = 5 es un número


impar se busca la ubicación de la mediana

5 1 6
 3
2 2

Este valor nos indica que el valor de la mediana esta ubicado en el


tercer lugar:

0; 5; 7; 12; 66.

Me = 7 inasistencias

Interpretación: el 50% de las inasistencias son menores o iguales a 7.

 Ejemplo 4

En el caso de que n sea par

X = inasistencias de alumnos

xi : 0; 66; 12; 5; 7;10

Solución. Primero se ordenan los datos

0; 5; 7; 10; 12; 66.

Las muestra posee tamaño n = 6 valores, es un número par se busca la


ubicación de la mediana

6 1 7
Posición de los valores centrales   3,5
2 2

Los valores centrales son dos y ocupan el tercer y cuarto lugar, como la
mediana es un único valor se la obtiene como el promedio de esos dos
valores centrales:

47
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

0; 5; 7; 10; 12; 66

7  10
Me   8,5  8
2

Interpretación: el 50% de las inasistencias de los alumnos son


menores o iguales a 8.

Deben quedar claro dos conceptos:

Primero: La mediana no se ve influenciada por los valores extremos, ya


que en su cálculo interviene el orden y no la magnitud de los valores.

Segundo: la media aritmética es sensible a valores extremos.

La mediana se puede determinar cuando los valores de las variables son


cuantitativos tanto continuos como discretos y para variables
cualitativas que se miden en escala ordinal.

1. 3. Modo.

El Modo es el valor de la variable que ocurre con mayor frecuencia. Se


designa frecuentemente como Mo.

Se debe hacer notar aquí que el Mo es un valor de variable y la


frecuencia de este valor sugiere su importancia estadística.

Cuando dos valores ocurren con la misma frecuencia y ésta es la más


alta, ambos valores son modas, por lo que el conjunto de datos es
bimodal.

Cuando más de dos valores ocurren con la misma frecuencia y ésta es


la más alta, todos los valores son modas, por lo que el conjunto de
datos es multimodal.

Cuando ningún valor se repite, se dice que no hay moda.

48
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

 Ejemplo 5.

Calcule las modas para los siguientes conjuntos de datos:

Serie A: 4,5; 7,6; 2,8; 4,5; 3,6; 2,6

Serie B: 4; 5; 3; 4; 6; 8; 5

Serie C: 27; 27; 27; 55; 55; 55; 88; 88; 99

Serie D: 1; 2; 3; 6; 7; 8; 9; 10

Solución:

En la serie A. El número 4,5 es la moda pues es el valor que ocurre


con mayor frecuencia (2 veces).

En la serie B. Los números 4 y 5 son modas, ya que ambos ocurren


con la frecuencia más alta (2 veces).

En la serie C. Los números 27 y 55 son modas, ya que ambos ocurren


con la frecuencia más alta (3 veces).

En la serie D. No hay moda, ya que ningún valor se repite.

La moda puede determinarse en variables cuantitativas continuas y


discretas, en variables cualitativas ordinales y nominales, pero es la
única medida de posición y tendencia central que puede usarse cuando
se trata de variables cualitativas nominales.

 Ejemplo 6.

Una encuesta efectuada a los padres de los alumnos del jardín sobre la
actitud de los niños al concurrir a su jardincito mostró que el 100
concurren contentos al jardín; 76 concurren protestando; 39 concurren
llorando. La única medida que disponemos para resumir estos datos en
un único valor es el modo. El valor modal de la actitud es concurren
contentos.

No podemos calcular la media por que no se pueden sumar los valores


de la variable que son: contentos, protestando, llorando; tampoco
podemos calcular la mediana pues no podemos ordenar los valores, de

49
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

ahí que la única medida para resumir los valores de una variable
cualitativa medida en escala nominal es el modo.

1.b. Cálculo de las medidas de posición en series de frecuencias

Veremos como se calculan la medidas de posición y tendencia central


cuando los datos están agrupados en una serie de frecuencias.

1.1.b. Media aritmética.

Como en una serie de frecuencias, fi nos indica las veces que se repite
el valor de la variable, debemos considerarlas en el cálculo de la media
aritmética.

 Ejemplo 7

La profesora de nivel inicial esta interesada en conocer el número


promedio de hermanos que tienen sus alumnos. Para ello toma la ficha
de 25 alumnos y ordena los datos de interés en la tabla 1.

Tabla 1. Alumnos de la primera sección del Jardín Municipal Nº 1,


clasificados según el número de hermanos.

Nº de hermanos Nº de alumnos

(xi) (fi)
0 1
1 9
2 7
3 5
4 3
Total 25

Fuente: Datos ficticios

Si aplicamos la fórmula 2.1, deberíamos sumar 1 vez cero, nueve veces


1 y así sucesivamente hasta sumar 3 veces 4 y dividir esa suma entre
25 que es el tamaño de la muestra.

50
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

xi: nº de hermanos

fi : número de alumnos que poseen xi hermanos

25

x i
0  1...  1  2...  3...  4...  4 50
x  i 1
  2
25 25 25

Pero, este cálculo se podría realizar en forma más simple y es obtener


esa misma suma reemplazándola por la multiplicación. Utilizando la
frecuencia fi que indica las veces que se repite el valor de la variable xi.

xi f 1  x 2 f 2  ...  x5 f 5
x
f 1  f 2  ...  f 5

ahora expresando literalmente la fórmula de la media aritmética


tenemos

1 n
x  xi f i
n i 1

Este promedio se conoce como media aritmética ponderada. Para poder


calcular la media aritmética ponderada correspondiente al ejemplo
planteado, agregamos a la tabla de frecuencias anterior una columna
auxiliar que facilitará el cálculo de la media.

Tabla 2. Alumnos de la primera sección del Jardín Municipal Nº 1,


clasificados según el número de hermanos.

Nº de hermanos Nº de alumnos xi*fi

(xi) (fi)
0 1 0
1 9 9
2 7 14
3 5 15
4 3 12
Total 25 50

Fuente: Datos ficticios

51
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Podemos concluir diciendo que los alumnos de la primera sección del


Jardín Municipal Nº 1 en promedio poseen 2 hermanos.

1.2.b. Mediana

El cálculo del valor mediano del nº de hermanos que poseen los


alumnos de nivel inicial de una escuela rural, se realiza de la siguiente
manera, cuando los datos están presentados en una serie de
frecuencias (tabla 3).

En esta serie de frecuencias de variable cuantitativa discreta, los


datos ya están ordenados, por lo que solo resta encontrar el valor
central, cuya posición se encuentra en el lugar

n  1 44  1 45
   22,5
2 2 2

Tabla 3. Alumnos de la primera sección del Jardín de una escuela


rural, clasificados según el número de hermanos.

Nº de hermanos Nº de
alumnos
(xi)
(frecuencia,
fi)

2 5
3 5
4 30
5 4
Total 44

Fuente: Datos ficticios

O sea tenemos 2 valores centrales que están ubicados en los lugares 22


y 23. El valor mediano será el promedio de los valores de la variable
ubicados en esos lugares. Para ubicar dichos valores se deben seguir
los siguientes pasos:

52
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

1.-Calcular las frecuencias acumuladas correspondientes a cada


valor de la variable.

Tabla 4. Alumnos de la primera sección del Jardín de una escuela


rural, clasificados según el número de hermanos.

Nº de Nº de Frecuencias
hermanos alumnos acumulada
(Fi)
(xi) (frecuencia,
fi)

2 5 5
3 5 10
4 30 40
5 4 44
Total 44

Fuente: Datos ficticios

2.-Calcular el orden de localización de la mediana efectuando el


cociente

n  1 44  1 45
   22,5
2 2 2

donde n = tamaño de la muestra

Como el valor de la mediana se encuentra entre la posición 22 y la


posición 23, se busca en la columna de frecuencias acumuladas, el
menor valor que contiene a 22 (es 40), al que corresponde el valor de
variable 4 y el menor valor que contiene a 23 (es 40), al que
corresponde el valor de variable 4.

Por lo que el valor mediano es el promedio de los dos valores centrales.

44
Me  4
2

Interpretación: el 50 % de los alumnos de nivel inicial del Jardín de


una escuela rural, tienen 4 hermanos o menos.

53
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

1.3.b. Moda

Ejemplo: Calcular el valor más frecuente del número de hermanos


alumnos de nivel inicial de del Jardín de una escuela rural (Tabla 3).

Solución: La variable que se estudia es una variable cuantitativa


discreta.

Se busca en la columna fi el valor más alto, en este ejemplo es 30.

El valor de la moda es el valor de la variable que tiene frecuencia 30, es


decir

Mo = 4 hermanos

Interpretación: La mayoría de los alumnos de alumnos de nivel inicial


de del Jardín de una escuela rural poseen cuatro hermanos.

1.c. Variable agrupada en serie de frecuencias con intervalos de


clase, para variable aleatoria continua

1.1.c. Media aritmética.

 Ejemplo

Para realizar un estudio sobre la nutrición de la población infantil que


concurre a la escuela en una localidad rural, se consultaron los pesos,
en kilogramos, de los 50 alumnos de la escuela. Los que se encuentran
en la Tabla 5. Los datos se agruparon en intervalos de amplitud 2 kg y
con límites enteros. Determine el peso promedio de los alumnos.

Tabla 5. Peso de los alumnos del Jardín de una escuela rural.

Intervalo Nº de Marca de xi * fi
alumnos clase
(kg)
fi xi
10 a 12 12 11 132
12 a 14 19 13 247
14 a 16 7 15 105
16 a 18 6 17 102
18 a 20 6 19 114
Total 50 700

Fuente: Datos ficticios

54
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Solución

1.- Se calcula las marcas de clase.

Al organizar de esta forma los datos, se pierde información, pues la


tabla indica, por ejemplo que hay 12 alumnos que pesan entre 10 kg y
12 kg, pero no cuanto pesan realmente cada uno de ellos. Ahora
debemos encontrar un único valor que represente o resuma a todos los
valores del intervalo, ese valor es el promedio o media aritmética de los
límites del intervalo, a este promedio se lo denomina punto medio de la
clase o marca de clase. Este valor representará el valor xi de la fórmula
de la media.

10  12
x1   11
2

12  14
x2   13  xi  a  11  2  13
2

Se introduce una nueva columna en la tabla que la denominaremos xi.

La fórmula para encontrar la media en serie de frecuencias es

1 n
x  xi f i
n i 1

Pero en este caso xi representa a la marca de clase

n=tamaño de la muestra= 
fi

Ahora ya estamos en condiciones de aplicar la fórmula para el cálculo


de la media aritmética, por ello agregamos una columna que es el
producto de cada marca de clase por su frecuencia (xi*fi).

1 n 1
x   xi f i  * 700  14kg
n i 1 50

55
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Interpretación: Los alumnos pesan en promedio 14 kg.

1.2.c. Mediana

 Ejemplo

Se desea conocer el peso mediano de los 50 alumnos de una escuela


rural (Tabla 5). El cálculo de la mediana en serie de frecuencias para
variable cuantitativa continua se efectúa utilizando la siguiente fórmula

f i
 Fant Me
Me  L inf  2 *a
f Me

L inf : límite inferior de la clase mediana

f i

2 : Suma de la frecuencia entre 2

F ant Me
: frecuencia acumulada anterior a la clase mediana

f Me : frecuencia absoluta de la clase mediana

a: amplitud del intervalo a = Lsup- Linf

Peso de los alumnos del Jardín de una escuela rural.

Intervalo Nº de
alumnos
(kg)
fi
10 a 12 12
12 a 14 19
14 a 16 7
16 a 18 6
18 a 20 6
Total 50

Fuente: Datos ficticios

56
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Solución

1-En la tabla se agrega una columna en la cual se calcula los valores de


frecuencias acumuladas.

Peso de los alumnos del Jardín de una escuela rural.

Intervalo Nº de alumnos Fi

(kg) fi
10 a 12 12 12
12 a 14 19 31
14 a 16 7 38
16 a 18 6 44
18 a 20 6 50
Total 50

Fuente: Datos ficticios

Se calcula
f i

2- 2

El tamaño de la muestra se divide entre 2 porque la Mediana es el valor


de la variable que divide la serie ordenada de datos en 2 partes iguales.

f i

50
 25
2 2

3- Se busca en la columna Fi el menor valor que contiene a 25, el valor


que corresponde es 31, se señala la clase mediana y se aplica la
fórmula.

f i
 Fant Me
Me  L inf  2 *a
f Me
50
 12 25  12 13 * 2
Me  12  2 * 2  12  * 2  12   12  1,37  13,37
19 19 19

Interpretación:

El 50% de los alumnos pesan 13,37 kg o menos.

57
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

1.3.c. Moda

 Ejemplo

Se desea conocer el peso más frecuente de los 50 alumnos de una


escuela rural. El cálculo del modo en serie de frecuencias para variable
cuantitativa continua se efectúa utilizando la siguiente fórmula

D1
Mo  Linf Mo  *a
D1  D2

Donde:

D1  f Mo  f anterior a la clase Modal

D 2  f Mo  f posterior a la clase Modal

a: amplitud del intervalo

Solución

En la columna fi se busca el valor más alto, en nuestro ejemplo 19, se


señala la fila, ella constituye la clase modal.

Se calcula:

D1  19  12  7

D2  19  7  12

a = 14 - 12 = 2

Se aplica la fórmula

7 7 14
Mo  12  * 2  12  * 2  12   12,74kg
12  7 19 19

Interpretación: el peso más frecuente del grupo de alumnos es de


12,74 kg.

58
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Relación entre media, mediana y modo

Cuando la media, la mediana y el modo coinciden, la serie de datos


presenta una distribución simétrica unimodal (figura 1).

= Me=Mo
Figura 1. Distribución simétrica.

Cuando esa coincidencia no existe, se dice que la distribución unimodal


es asimétrica.

La asimetría es positiva (figura 2) cuando la media es mayor que la


mediana y la mediana mayor que el modo, en éste caso vemos que la
media aritmética se dirige hacia el o los valores extremadamente
grandes

Mo < Me <

Figura 2. Distribución asimétrica positiva.

La distribución presenta asimetría negativa ( figura 3) cuando la media


es menor que la mediana y la mediana menor que el modo; en éste caso
vemos que la media aritmética se dirige hacia el o los valores
extremadamente pequeños.

59
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

< Me< Mo

Figura 3. Distribución asimétrica negativa.

La distancia entre la media aritmética y el modo podría usarse como


una medida de asimetría (Ya-Lun Chou, 1990).

Asimetría = media – modo

En nuestro ejemplo:

Media = 14

Mo = 12,74

Asimetría =14 - 12,74= 1,26 Resultado positivo, la distribución es


asimétrica positiva

Cuánto mayor es esta distancia, negativa o positiva, tanto más


asimétrica es la distribución.

2- MEDIDAS DE LOCALIZACIÓN

Son Medidas de Posición que dividen los valores ordenados de una serie
en cuatro, diez o cien partes iguales y se denominan cuartiles, deciles y
percentiles.

2.1 Cuartiles

Los cuartiles son tres valores Q1, Q2, Q3, que dividen a la serie
ordenada en cuatro partes iguales.

Por debajo del primero quedan el 25% de los datos; por debajo del
segundo el 50% de los mismos y por debajo del tercero el 75%. El
segundo cuartil coincide con la Mediana.

60
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

2.2 Deciles

Los Deciles son nueve valores de la variable que dividen a la serie


ordenada de datos en 10 partes iguales, el decil 5 coincide con la
Mediana, es decir el 50% de los valores son menores o iguales al D5.

2.3 Percentiles

Los percentiles son 99 valores de la variable, que dividen al conjunto de


datos (ordenados de menor a mayor en cien partes iguales); el percentil
50 coincide con la mediana. El percentil 25 coincide con el primer
cuartel, el percentil 75 coincide con el valor del tercer cuartel. Los
percentiles se designan con la letra Pi, el subíndice i, varía de 1 a 99,
indicando el valor del percentil, que se desea calcular.

 Cálculo de percentiles:

Para calcular los percentiles de una distribución de frecuencias se


procede del mismo modo que en el caso de la mediana, salvo que ahora
n fi
dividiremos al tamaño de la muestra en cien partes iguales en
vez de dos.

 Ejemplo

Se desea conocer P20 de los días de licencia solicitadas por los


profesores de las escuelas de nivel inicial en la ciudad de Santiago del
Estero en el año 2004.

Tabla 6. Días de inasistencia de los profesores de las escuelas de nivel


inicial en la ciudad de Santiago del Estero en el año 2004.

Intervalo de clase Nº de docentes Fi

(días de licencia) (fi)


0 a 10 30 30
10 a 20 60 90
20 a 30 60 150
30 a 40 70 220
40 a 50 90 310
50 a 60 100 410
60 a 70 60 470
70 a 80 40 510
80 a 90 10 520
90 a 100 10 530
Total 530

Fuente: Datos ficticios

61
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

El cálculo de percentiles para variables agrupadas en serie de


frecuencias en intervalos de clase, se efectúa utilizando la siguiente
fórmula:

i fi
 Fant Pi
Pi  L inf  100 *a
f Pi

L inf : Límite inferior de la clase donde se encuentra el percentil

i = valor del percentil que se busca

Fant Pi: frecuencia acumulada anterior a la clase donde se encuentra el


Percentil i

fPi :frecuencia absoluta de la clase donde se encuentra el Pi

a: amplitud del intervalo a =Lsup- Linf

Solución

Cálculo del percentil 20

Pasos

1.- Se agrega una columna de frecuencias acumuladas (Fi)

2.- Se calcula

i fi 20 * 530
  106
100 100

3.- Se ubica en la columna Fi el menor valor que contiene a 106, en


nuestro ejemplo 150.

4.- Se calcula a: Lsup –Linf = 30-20=10

5.- Se aplica la fórmula.

106  90 16 * 10
P20  20  * 10  20   22,67  23 días
60 60

62
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Interpretación

P20 = 23 días

El 20 % de los docentes toman 23 días de licencia o menos

 Rango percentil

Se puede presentar, el problema inverso, es decir, conocer cuántos


profesores de nivel inicial toman 52 días de licencia o menos, es decir
nos dan como dato un valor de la variable y nos preguntan que
percentil le corresponde; a este procedimiento se lo denomina calcular
el Rango percentil.

Es decir el rango percentil de un valor dado es el porcentaje de valores


comprendidos debajo del valor solicitado.

 Ejemplo:

Calcular el rango percentil que le corresponde a 52 días de licencia de


los de los profesores de las escuelas de nivel inicial en la ciudad de
Santiago del Estero en el año 2004.

Repetimos la tabla 6 para visualizar mejor el cálculo.

Días de inasistencia de los profesores de las escuelas de nivel inicial en


la ciudad de Santiago del Estero en el año 2004.

Intervalo de clase Nº de docentes Fi

(días de licencia) (fi)


0 a 10 30 30
10 a 20 60 90
20 a 30 60 150
30 a 40 70 220
40 a 50 90 310
50 a 60 100 410
60 a 70 60 470
70 a 80 40 510
80 a 90 10 520
90 a 100 10 530
Total 530

Fuente: Datos ficticios

63
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Solución

1.- Ubicamos en la tabla el intervalo de clase donde se encuentra el


valor 52 es el intervalo que va de 50 a 60.

2.- Se calcula la Frecuencia acumulada que le correspondería al valor


52 con la siguiente fórmula:

( xi  Linf )
F ( xi )  * f int erv  FClase anterior
a

Donde:

F(xi)= Frecuencia acumulada correspondiente al valor que se busca

Linf Límite inferior del intervalo de clase donde se encuentra xi

finterv Frecuencia absoluta del intervalo donde se encuentra xi

a amplitud del intervalo

F clase ant. Frecuencia acumulada de la clase anterior al intervalo


donde se encuentra xi

(52  50) 2 *100


F (52)  *100  310   310  330
10 10

3.- Se calcula ahora el rango percentil con la siguiente fórmula

F ( xi )
Rp  *100
 fi
330
Rp  * 100  62.26%  62%
530

Interpretación:

El 62% de los los profesores de las escuelas de nivel inicial en la ciudad


de Santiago del Estero en el año 2004, toman 52 días de licencia o
menos.

64
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Cálculo gráfico de percentiles y rango percentil

Ejemplo

Calcular gráficamente el percentil 20

Solución

Se debe construir un gráfico de líneas; los pares de valores a graficar


corresponden al límite superior del intervalo con el porcentaje
acumulado correspondiente.

1.- Calcular porcentaje acumulados. Para ello se necesita calcular:

a) frecuencia relativa para cada intervalo

b) porcentaje

c) porcentaje acumulado

2.- Se grafica un polígono (Lsup; %acum.). El gráfico que se obtiene se


denomina ojiva.

Días de inasistencia de los profesores de las escuelas de nivel inicial en


la ciudad de Santiago del Estero en el año 2004.

Intervalo de Nº de fri Porcentaje Porcentaje


clase docentes acumulado
fri*100
(días de (fi)
licencia)
0 a 10 30 0,0566 5,67= 6 6
10 a 20 60 0,1132 11,32 = 11 17
20 a 30 60 0,1132 11,32 = 11 28
30 a 40 70 0,1321 13,21 = 13 41
40 a 50 90 0,1698 16,98 = 17 58
50 a 60 100 0,1887 18,87 = 19 77
60 a 70 60 0,1132 11,32 = 11 88
70 a 80 40 0,0755 7,55 = 8 96
80 a 90 10 0,0189 1,89 = 2 98
90 a 100 10 0,0189 1,89 = 2 100
Total 530 100

65
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

100

90
80

70
60
%

50

40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100

Días

5.-Si deseamos calcular el valor que corresponde al percentil 20. Se


ubica el valor 20 en el eje vertical y se traza una paralela al eje
horizontal hasta la curva y luego se traza una vertical hasta encontrar
el valor de días correspondiente, el que aproximadamente es 23.

Interpretación:

El 20 % profesores de las escuelas de nivel inicial en la ciudad de


Santiago del Estero en el año 2004 incurren en 23 días de licencia o
menos.

6.-Si deseamos conocer cual es el rango percentil que corresponde a 52


días, ubicamos ese valor en el eje horizontal y trazamos una paralela al
eje vertical hasta la curva y desde allí una paralela al eje horizontal,
leemos en el eje vertical el valor correspondiente al rango percentil
(aproximadamente 60).

66
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

100

90
80

70
60
%

50

40
30
20
10
0
0 10 20 30 40 50 60 70 80 90 100

Días

Los valores correctos se obtienen utilizando las fórmulas presentadas


anteriormente.

3.-MEDIDAS DE VARIABILIDAD O DISPERSIÓN

Las Medidas de Posición no son suficientes para describir el conjunto


de datos sino que es necesario tener una idea de como se distribuyen
los datos alrededor del centro de la distribución. Para eso surgen las
Medidas de Dispersión.

3.a.-MEDIDAS DE VARIABILIDAD EN SERIES SIMPLE. SU CÁLCULO

3.a.1. RANGO

Es llamado también amplitud total de variación de la variable. Se lo


obtiene como la diferencia entre el valor máximo y mínimo de la
variable.

Distribución A: 1, 5, 5, 5, 5, 5, 5, 5, 5, 9

Distribución B: 1, 1, 2, 4, 5, 6, 7, 7, 8, 9

Rango = Valor mayor – Valor menor

RA = 9 -1 = 8

RB = 9 -1 = 8

67
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Estas series tienen igual valor del rango, a pesar de que notamos que la
variabilidad de las dos distribuciones es diferente.

La desventaja de esta medida es que solo considera los valores extremos


sin tener en cuenta el comportamiento del resto de las observaciones.
Por lo que observamos que a pesar de tener variabilidades diferentes las
dos distribuciones, el rango no la capta.

Para solucionar este problema surgen otras medidas como el desvío


medio.

Si se considera las distribuciones anteriores:

Distribución A: 1, 5, 5, 5, 5, 5, 5, 5, 5, 9

Distribución B: 1, 1, 2, 4, 5, 6, 7, 7, 8, 9

¿Cómo se puede medir la variabilidad de un conjunto de datos? Si por


variabilidad se entiende el grado en que los valores de la distribución
difieren de la media y entre si, entonces la desviación promedio de los
valores a partir de la media puede resultar una medida razonable de
variabilidad

 x i x 
n

Pero por propiedades de la media sabemos que la suma de los desvíos


de los valores respecto a la media es siempre es cero, pues las
desviaciones positivas respecto a la media, anulan siempre a las
desviaciones negativas de la misma, con lo que resulta siempre un valor
promedio de cero.

Como esta medida de variabilidad parece razonable, debemos redefinir


nuestra medida para evitar los valores negativos. Una manera de
hacerlo es considerar el valor absoluto de los desvíos; la medida que se
obtiene se denomina:

68
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

3.a.2.DESVIO MEDIO:

Se define como el promedio del valor absoluto de los desvíos; se


designa con

DM.

DM 
d i

x i x
n n

Tabla 7: Distribución del número de hermanos de un grupo de


alumnos.

xi
di= xi  x
di
1 -4 4
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
9 4 4
 xi  50  d i   0  di  8
8
x5 DM   0,8
10

Fuente: Datos ficticios

Pero generalmente no se puede operar fácilmente cuando se


trabaja con valor absoluto, por eso se considera una segunda forma de
modificar esos signos negativos y consiste en elevar los desvíos al
cuadrado, lo que dará desvíos al cuadrado positivos. Esta nueva medida
de variabilidad se denomina varianza.

3.a.3. Varianza es el promedio de los desvíos al cuadrado y se designa


con S2 cuando se trata de una muestra y es un mejor
estimador de la varianza poblacional(  ) cuando la suma
2

de los desvíos al cuadrado se divide entre el tamaño de la


muestra menos 1; por ello la fórmula para calcular es para:

Variancia de una muestra (series simples)

69
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

 x  x 
n
2
i
S2  i 1
n 1

Varianza poblacional

 x  
2
i
2  i 1
N

Cuántos más tiendan los valores a diferir de la media, mayor será la


varianza. El valor numérico de la varianza de una distribución depende
de la unidad de medida que se utilice. Por consiguiente, cuando se
compara la varianza de dos o más distribuciones, hay que estar seguro
que la unidad de medida empleada es igual en todas las distribuciones.
En el ejemplo de la Tabla 7:

Distribución del número de hermanos de un grupo de alumnos.

xi
di= xi  x 
d12  xi  x 
2

1 -4 16
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
5 0 0
9 4 16
 xi  50  d i   0  x 2
i  x  32
x5 32
S2   3,56
9

Fuente: Datos ficticios

 x  x 
n
2
i
32
S2  i 1
  3,56
n 1 9

S2 = 3,56, aproximadamente 4 hermanos

Otra desventaja es que la varianza se expresa, en unidades al cuadrado


y no en término de las unidades originales de medición, lo que hace
difícil la tarea de relacionar en forma significativa el valor de la varianza

70
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

con el conjunto original de datos.

Por eso es conveniente, considerar una medida de variabilidad que se


exprese en unidades originales. Esta nueva medida denominada
desviación estándar se obtiene al extraer a la varianza la raíz cuadrada.

3.a.4.Desviación estándar muestral

 x  x 
n
2
i
S i 1
n 1

 x  x 
n
2
i
32
S i 1
  3,56  1,89
n 1 9

S = 2 hermanos

Desviación estándar poblacional

 x   
2
i
  i 1
N

Debe quedar claro que la desviación estándar mide la variación entre


los valores. Los valores cercanos producirán una desviación estándar
pequeña, mientras que los valores dispersos producirán una desviación
estándar más grande.

71
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

3.b.-MEDIDAS DE VARIABILIDAD EN SERIES DE FRECUENCIA


SIMPLE. SU CÁLCULO

Ejemplo: Calcular la variabilidad de las inasistencias de 32 alumnos.

Tabla N° 8. Inasistencias de 32 alumnos.

Nº de Nº de
inasistencias alumnos

(xi) (fi)
11 12
12 9
14 5
15 4
23 2
Total 32

FUENTE: Datos ficticios

Cuando se trata de variables cuantitativas discretas el Rango se


calcula:

3.b.1. Rango = Valor máximo - Valor mínimo + 1

Rango = R = 23 – 11 + 1 = 13 inasistencia

3.b.2 Desvío medio en serie de frecuencia simple

DM 
 d * f  x  x *f
i i i i

f if i

Cálculo:

1) Se calcula la media aritmética


2) Se calculan los desvíos
3) Se obtiene el valor absoluto y se los multiplica por sus
frecuencias
4) Se aplica la fórmula

72
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Inasistencias de 32 alumnos.

Nº de Nº de xi*fi d i  xi  x d1 di * fi
inasistencias alumnos

(xi) (fi)
11 12 132 -2 2 24
12 9 108 -1 1 9
14 5 70 1 1 5
15 4 60 2 2 8
23 2 46 10 10 20
32 416 66

x
x * f i i

416
 13
f i 32

El promedio de la inasistencia de los alumnos es de 13 días

DM 
d *f i i

66
 2,06
f i 32

DM= 2 días

3.b.3. Varianza en serie de frecuencia simple

 x  x   x  x  f
n n
2 2
i fi i i
S2  i 1
 i 1
n 1  f 1 i

1) Se calcula la media aritmética

2) Se calculan los desvíos

3) Se elevan los desvíos al cuadrado

4) Se multiplica cada desvío al cuadrado por su frecuencia

5) Se aplica la fórmula

73
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Inasistencias de 32 alumnos.

Nº de inasistencias Nº de alumnos xi*fi d i  xi  x d i2 d i2 * f i


(xi) (fi)
11 12 132 -2 4 48
12 9 108 -1 1 9
14 5 70 1 1 5
15 4 60 2 4 16
23 2 46 10 100 200
32 416 278
FUENTE: Datos ficticios

 x  x 
n
2
i fi
278 278
S  2 i 1
   8,97  9 días 2
n 1 32  1 31

3.b.4. Desviación estándar en serie de frecuencia simple

 x  x  * f  x  x  * f
n n
2 2
i i i i
S i 1
 i 1
n 1  f 1 i

 x  x  * f
n
2
i i
278 278
S i 1
   8,97  2,99  3 días
n 1 32  1 31

3.c.- MEDIDA DE VARIABILIDAD EN SERIE DE FRECUENCIAS DE


INTERVALOS DE CLASE

Los siguientes datos corresponden a peso de los alumnos del Jardín de


una escuela rural.

Peso de los alumnos del Jardín de una escuela rural.

Intervalo Marca de Nº de
clase alumnos
(kg)
(xi) fi
10 a 12 11 12
12 a 14 13 19
14 a 16 15 7
16 a 18 17 6
18 a 20 19 6
Total 50

Fuente: Datos ficticios

74
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

3.c.1.Rango

R = L. superior de la última clase – L. inferior de la primera clase.

Como los límites superiores de las clases son abiertos, es decir no toma
el valor 20, debemos colocar el valor 19,99

R =19,99 – 6 = 13,99 kg

3.c.2. Desvío medio en serie de frecuencia de intervalos

1) Se calcula la marca de clase y luego la media aritmética

x x * f
i i

700
 14kg
f i 50

2) Se calcula los desvíos

Peso de los alumnos del Jardín de una escuela rural.

Intervalo Marca de Nº de xi*fi d i  ( xi  x) d1 d1


clase alumnos *fi
(kg)
(xi) fi
10 a 12 11 12 132 -3 3 36
12 a 14 13 19 247 -1 1 19
14 a 16 15 7 105 1 1 7
16 a 18 17 6 102 3 3 18
18 a 20 19 6 114 5 5 30
Total 50 700 110

Fuente: Datos ficticios

3) Se obtiene el valor absoluto de los desvíos

4) Se multiplica cada desvío absoluto por su frecuencia, se suma

5) Se aplica la fórmula

DM  d * f i i

110
 2,2kg
f i 50

75
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

3.c.3. Variancia en serie de frecuencia de intervalos

1) Se calcula la media aritmética

2) Se calculan los desvíos

3) Se elevan los desvíos al cuadrado

4) Se multiplica cada desvío al cuadrado por su frecuencia

5) Se aplica la fórmula.
6)

Peso de los alumnos del Jardín de una escuela rural.

Intervalo Marca de Nº de xi*fi d i  ( xi  x) d i2 d i2 *


clase alumnos
fi
(kg)
(xi) fi
10 a 12 11 12 132 -3 9 108
12 a 14 13 19 247 -1 1 19
14 a 16 15 7 105 1 1 7
16 a 18 17 6 102 3 9 54
18 a 20 19 6 114 5 25 150
Total 50 700 338

Fuente: Datos ficticios

Varianza en serie de frecuencias de intervalos, la única diferencia con


las fórmulas para serie de frecuencias simples es que xi, representa el
punto medio de la clase o marca de clase

 x  x 
n
2
i fi
338 338
S 
2 i 1
   6,9 kg 2
n 1 50  1 49

3.c.4. Desviación estándar en serie de frecuencias de intervalos

 x  x  * f
n
2
i i
176 338
S i 1
   6,9  2,63kg
n 1 50  1 49

76
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

COEFICIENTE DE VARIACIÓN

Las cuatro medidas de variabilidad enunciadas precedentemente son


medidas de variabilidad absoluta. El coeficiente de variación es una
medida de variabilidad relativa.

Expresa la desviación estándar como un porcentaje de la media. Es una


medida adimensional, se expresa en % y sirve para comparar la
variabilidad entre dos o más distribuciones que provengan de diferentes
unidades de medidas o teniendo igual unidad de medida los valores de
diferente magnitud.

Coeficiente de variación muestral

S
C.V .  100
x

Ejemplo

Decir cual de las siguientes distribuciones es más variable:

xi: peso de los alumnos de nivel inicial (kg)

34 29 28 31 40

yi: altura de los alumnos de nivel inicial (m)

1,24 1,54 1,38 1,37 1,56

x = 32,4 kg Sx = 4,83kg

y =1,42 m Sy = 0,13m

No podemos decir que la variabilidad en peso es mayor que la


variabilidad en altura, ya que las variables están medidas en distintas
unidades, para poder compararlas la debemos expresar como
porcentaje de sus medias

CVx = (4,83/32,4)*100 = 14,91%

CVy = (0,13/1,42)*100 = 9,15%

77
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Conclusión: los alumnos tienen menor variabilidad en altura que en


peso.

Uso de la calculadora científica para el cálculo de Medidas de


Posición y Dispersión Calculadoras Casio modelo fx-82W.

Seguir las siguientes instrucciones:

Debe procurar que la calculadora se encuentre en disposición para


efectuar cálculos estadísticos. Para ello apriete mode 2 y en la parte
superior de la pantalla debe aparecer la notación SD.

Debe cerciorarse de que no hay nada acumulado en la memoria. Para


ello pulse SHIFT AC = y en su pantalla aparece el número cero. Se esta
en condiciones de introducir los datos.

Por ejemplo para serie simple: xi: 1 2 3 4 5

Marque el nº 1 y luego la tecla M+

Marque el nº 2 y luego la tecla M+

Marque el nº 3 y luego la tecla M+

Así sucesivamente hasta haber cargado todos los datos.

Para cerciorarse de la cantidad de datos introducidos

Pulse ALPHA y la tecla 3 en el cursor aparece la letra n, apriete ahora =


y aparecerá el 5, si Ud. Introdujo los 5 valores.

Para obtener la media aritmética pulse SHIFT y la tecla 1, en la pantalla


aparece

apriete = y en su pantalla aparece el valor 3 que es el valor de la media

Para obtener la desviación estándar marque SHIFT y la tecla 3, aparece


en su pantalla

78
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

 n1
presione = y en su pantalla aparecerá el valor1,58

Si aprieta ahora la tecla x2 obtendrá 2,50 que es el valor de la varianza


muestral S2.

Si desea obtener la suma de los valores de x presione Alpha y la tecla 2.

Para el caso de que la serie sea de frecuencia simple.

Se coloca la máquina en modo estadística Mode 2.

Presione SHIFT AC =; ya tiene la memoria limpia.

Se introduce el valor xi, luego SHIFT, la tecla que tiene la coma aparece
en la pantalla xi; ahora introduzca el valor de fi y una vez que tenga en
la pantalla xi;fi recién apriete M+ ; continúe así hasta introducir todos
los valores de su serie, para el cálculo de la media, desviación estándar
y varianza se procede luego apretando las teclas indicadas
anteriormente.

Cuando se trabaja con todos los datos de una población para el cálculo
de la desviación estándar se aprieta SHIFT y la tecla 2

79
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

GUÍA DE EJERCITACIÓN

Actividad 1

a) Los siguientes son pesos individuales de 10 alumnos de la segunda


sección de Jardín en kg:

20; 22; 20,5; 21; 23; 21; 22,9; 24; 24,6; 25

b) En la etapa de diagnóstico destinada a implementar un Plan de Salud


Bucal en alumnos de jardín de Infantes, en una jardín municipal, el
odontólogo determinó el número de caries que presentaba una muestra
de nueve alumnos, las que figuran a continuación

2; 4; 0; 2; 3; 5; 1; 2; 2

c) De la ficha de los alumnos de la primera sección se tomó ocho fichas


al azar y se anotó el salario que percibía mensualmente sus padres. Los
mismos figuran a continuación:

3000; 1000; 570; 400; 600; 1500; 500; 570.

1.- En cada ejemplo

a) indique la variable en estudio

b) Clasifique la variable

c) Indique el tamaño de la muestra

d) Identifique la unidad de muestreo

e) Indique la población en estudio

2.- ¿Cómo se denomina el conjunto de datos escritos en el orden en que


fueron medidos, observados o contados obtenidos para la variable que
se estudia?

3.- ¿Que medidas de posición y tendencia central utilizaría para


resumir los datos de los ejemplos a, b, y c? Calcule e interprete los
mismos.

4.- ¿En cuál de los tres casos arriba detallados, la media aritmética no
es adecuada para indicar el centro del conjunto? Justifique la
respuesta.

80
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Actividad 2

a) Para cada una de las series de e la Actividad 1. Indique las medidas


de dispersión o variabilidad que puede utilizar. Calcule.

b) Si Ud. quiere comparar la variabilidad de los pesos de los niños con


la variabilidad del ingreso de los padres presentadas en la Actividad 1,
¿que medida de dispersión emplearía? Justifique la respuesta,

Actividad 3

Se desea comprar libros de cuentos para la escuela, los que fueron


clasificados de la siguiente manera.

Libros Cantidad de
libros
Ficción 150
Para pintar 200
Para reconocer objetos 70

a) Indique el tamaño de la muestra

b) ¿Cuál es la variable de estudio? Clasifíquela

c) ¿Que medida de posición utilizaría para resumir los datos?

d) Si la directora le pide que sugiera el tipo de libro a comprar ¿Cuál


sería su respuesta?

Actividad 4

Los siguientes datos corresponden a Tipo de juego que prefieren los


alumnos del jardín

Tipo de Juego N° de alumnos

fi
Tobogán 30
Rompecabezas 10
El rincón de la casita 80
El rincón del carpintero 60
Fútbol 30

81
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

a) Indique la variable. Clasifíquela

b) Determine la Medida de Posición que corresponda a este caso.


Calcule e interprete.

Actividad 5

Clasificación de los alumnos según el número de comidas por día

N° de comidas 1 2 3 4 5 6

xi
N° de alumnos 1 4 10 23 9 6

fi

a) Calcule Media, Mediana y Modo.

b) Determine Desviación Estándar, Varianza y Coeficiente de Variación.

c) Indique si la distribución que se analiza es simétrica En caso de que


su respuesta sea negativa, indique el tipo de asimetría presenta.

d)¿Que porcentaje de alumnos realiza 4 comidas?

e)¿Qué porcentaje de alumnos realiza más de cuatro comidas?

Actividad 6

Las alturas de alumnos de la primera sección del jardín se muestran en


la siguiente tabla:

Altura de los alumnos de la primera sección del jardín en metros

altura(m) fi
1,10 - 1,12 2
1,12 - 1,14 5
1,14 - 1,16 10
1,16 - 1,18 8
1,18 - 1,20 2
1,20 - 1,22 4

a) ¿Cuál es la variable en estudio? Clasifíquela

82
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

b) Encuentre frecuencias acumuladas, porcentajes y porcentajes


acumulados.

c) Encuentre Media Aritmética, Mediana y Modo.

d) Calcule Desviación estándar y Coeficiente de variación.

e) Realice el gráfico de la distribución porcentual acumulada.

f) Determine gráfica y analíticamente el rango percentil para las


siguientes alturas:

1,17; 1,15; 1, 21. Interprete cada uno de ellos

g) Determine gráfica y analíticamente las alturas correspondientes a los


percentiles:

10, 25, 50, 75. Interprete cada uno de ellos

83
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

CAPÍTULO III

UNIDAD IV

PROBABILIDADES Y DISTRIBUCIONES DE PROBABILIDADES-

1.- INTRODUCCIÓN

La teoría de probabilidad tiene sus orígenes en la teoría de la


casualidad. Históricamente, la teoría de la Probabilidad comenzó con el
estudio de los juegos de azar, tales como la ruleta y las cartas.

La teoría de la Probabilidad no es tan extraña como pudiera


pensarse. Sin duda alguna, en la vida diaria con mucha frecuencia
emitimos juicios probabilísticos, aunque a menudo no lo reconocemos
como tales.

Por ejemplo, supongamos que, por razones diferentes, usted no


está preparado para la clase de hoy. Seriamente usted considera faltar a
clase. ¿Qué factores influirán en su decisión? Obviamente una
consideración será la probabilidad de que el profesor descubra su falta
de preparación. Si el riesgo es alto, usted decide no ir a clase. Veamos,
hay dos alternativas posibles:

1. Su falta de preparación será descubierta.


2. Su falta de preparación no será descubierta.

Hay incertidumbre en esta situación porque hay más de una


alternativa posible. Su decisión de asistir a clase, dependerá del
grado de certeza asociado con cada una de estas alternativas. Así, si
usted está bastante seguro de que prevalezca la primera alternativa,
usted decidirá no ir a clase.

Supóngase que su profesor con frecuencia pide a los estudiantes


que participen en clase activamente. De hecho, usted ha notado que la
mayoría de los estudiantes son interrogados en cada sesión de clase.

84
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Este es un ejemplo en el cual hay un alto grado de certeza asociada con


la primera alternativa. Dicho de esta manera, la probabilidad del
primero es mayor que la del segundo. Por consiguiente usted decide no
ir a clase. Usted ha tomado una decisión con base en un empleo
intuitivo, de la probabilidad.

Antes de estudiar la teoría de la probabilidad, es conveniente


comprender bien uno de los conceptos más importantes de la Inferencia
Estadística: el concepto de azar .

2.- EL CONCEPTO DE AZAR

Definimos una población como el conjunto completo de


individuos, objetos o medidas que tienen alguna característica común
observable. Muy rara vez se puede estudiar una población.
Seleccionamos muestras de una población con la esperanza de que los
estadísticos de la muestra nos permitan calcular los parámetros de la
población. Para obtener una correspondencia entre un estadístico y un
parámetro, la muestra debe ser seleccionada al azar utilizando el
muestreo al azar simple que se caracteriza porque cada una de las
observaciones tiene la misma probabilidad de ser seleccionada. Una
forma de obtener una muestra aleatoria, es mediante el Muestreo al
Azar Simple, de tal manera que cada individuo, objeto o medida tenga
igual probabilidad de ser seleccionado. Una característica sobre los
sucesos aleatorios, es que ningún suceso tiene efecto predecible sobre el
siguiente. Podremos comprender más clara y fácilmente el concepto de
azar en relación con los “juegos de azar, si suponemos que se juegan
limpiamente. Conocer el resultado del lanzamiento de una moneda al
aire, del lanzamiento de un dado, del resultado de un juego de ruleta,
no nos ayudará en absoluto en la predicción de los resultados por venir.
Esta característica de los sucesos al azar se conoce como
independencia. Si la independencia existe, podemos hablar de sucesos
realmente al azar.

3.- PROBABILIDAD Y ESTADÍSTICA

La Estadística Descriptiva, hace referencia a los datos que se


tienen en la mano. Cuando se quiere ir más allá de los datos
disponibles, es necesario inferir o sea utilizar la Estadística Inferencial.
Como ella infiere el todo (población) a partir de la información que da

85
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

una parte de ese todo (muestra), el conocimiento que adquiere es


incompleto y por lo tanto no “totalmente cierto” es decir, se debe
trabajar con probabilidades. Por ello, antes de estudiar las aplicaciones
de la Estadística Inferencial es necesario estudiar probabilidades.

4.- TEORIAS DE PROBABILIDAD

Se puede considerar la probabilidad como la teoría que tiene que


ver con los posibles resultados de los experimentos. Estos deben ser
potencialmente repetitivos, es decir, debemos ser capaces de
reproducirlos bajo condiciones similares. Debe ser posible enumerar
cada resultado que pueda ocurrir, y debemos ser capaces de establecer
las frecuencias relativas de estos resultados.

Se distingue el enfoque clásico, frecuencial y axiomático de la


teoría de probabilidad.

4.1.-EXPERIMENTOS ALEATORIOS. ESPACIO MUESTRAL.


EVENTOS.

El lanzamiento de un dado, o de una moneda, la extracción de un


naipe de la baraja, de las bolillas de la lotería son experiencias
aleatorias, pues sus resultados dependen del azar. También son
aleatorios: el tiempo de espera de una persona en la parada del
autobús, sexo de los hijos en un matrimonio, el número de hijos que
tendrá un matrimonio, etc.

Los primeros (lanzamiento, extracciones) son fáciles de seguir,


pues se pueden repetir tantas veces como se quiera de forma rápida. A
partir de ellos se obtienen leyes que rigen los fenómenos aleatorios y se
aplican al estudio de situaciones aleatorias.

86
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Conceptos necesarios para definir probabilidades

Experimentos aleatorios: son aquellos que, repetidos bajo idénticas


condiciones, no arrojan un único resultado sino un conjunto de
ellos.

 Ejemplos: Arrojar un dado


 Arrojar una moneda

Espacio muestral. Es el conjunto de los resultados posibles de un


experimento aleatorio y se denota con M.

Ejemplos.

 Para el caso de arrojar un dado, el espacio muestral resultante


es:

M  1,2,3,4,5,6

 Para el caso de arrojar una moneda, el espacio muestral


resultante es:

M={C, S}

 Para el caso de arrojar una moneda y un dado


simultáneamente, el espacio muestral resultante es:

M = (cara, 1) , ( cara , 2 ) .....,(cara , 6) , (sello , 1),...(sello, 6)

Evento simple .Es cada uno de los resultados de un experimento


aleatorio que no puede desglosarse en componentes más
simples. Se designan con la letra minúscula

“ ei “.

87
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Ejemplos

 Para el caso de arrojar un dado. Obtener el número 1, es un


evento simple, lo mismo ocurre con los números restantes

e={1}

e={2}

 Para el experimento aleatorio arrojar una moneda al aire, los


evento simples son

e={c}

e={s}

Evento compuesto. Es un subconjunto del Espacio Muestral. Es el


resultado de la unión de eventos simples. Se lo representa con
letra mayúscula.

 Para el caso de arrojar un dado. El espacio muestral es


M  1,2,3,4,5,6

 Obtener número par, es el resultado de la unión de los


eventos simples 2, 4, 6, y constituyen un subconjunto del
espacio muestral.

P={2, 4, 6}

 Obtener número impar

I={3, 5, 7}

 Obtener un número menor que 4

88
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

A={1, 2,3}

Suceso seguro: es el conjunto total M(espacio muestral).

Suceso imposible: es el conjunto vacío.

Operaciones con sucesos

En las aplicaciones de la teoría de probabilidades trataremos


muchas veces con eventos relacionados entre sí, más que con un solo
evento. Por esta razón consideraremos ahora un experimento aleatorio,
con su espacio muestral correspondiente M, y cualesquiera dos eventos
A y B en el experimento. Entonces:

*Union de Eventos A  B ( A unión B , A o B ) representa el evento


que ocurre si, y solo si ocurre A u ocurre B o ambos ( Una
notación más antigua que representa a A  B es A + B, y el
nombre correspondiente es suma de dos eventos)

*Intersección de Eventos. A  B ( A intersección B ó A y B )


representa el evento que ocurre si, y solo si, ocurren A y B
simultáneamente, esto es, si ocurren en la misma ejecución del
experimento en consideración.

Eventos mutuamente exclusivos. Son los eventos que no ocurren


simultáneamente. Este caso se representa solamente cuando A 
B = Ø, el evento vacío, de tal manera que A y B no tienen puntos
en común.

89
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

El evento A es el complemento del evento A con respecto al espacio


muestral M y contiene a todos los resultados de M que no se
encuentran en A.

 Ejemplo Para el caso del arrojar una dado, el espacio muestral es


M  1,2,3,4,5,6

 Evento A obtener un nº par

A= {2, 4, 6}

A = {1, 3, 5 }

 Ejemplo:

Un experimento consiste en tirar un dado y observar el número de


puntos que aparece en la cara superior. El espacio muestral se puede
describir fácilmente, ya que es finito. Las posibilidades para el dado son
seis: 1, 2, 3, 4, 5, 6. Por lo tanto, los posibles resultados son:

M = {1, 2, 3,4, 5, 6}

b) Describir los siguientes eventos:

A: Sale un número par.

B: Sale un número impar.

C: Sale un número menor que 4

D: Sale un número mayor que 3.

E: Sale un número impar o mayor que 3.

F. Sale un número par y menor que 4.

G: Sale un número par y un impar.

90
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Solución

 El evento:”Sale un número par” , está representado por


la letra A, su descripción puede realizarse mediante el
siguiente conjunto :

A  2,4,6 ,

 El evento “ Sale un número impar ”, está representado


por la letra B, su descripción puede realizarse mediante
el siguiente conjunto :

B =  1 , 3 , 5 .

 El evento “ Sale un número menor que 4” ”, está


representado por la letra C, su descripción puede
realizarse mediante el siguiente conjunto :

C= 1 , 2 , 3 

 El evento “Sale un número mayor que 3”, está


representado por la letra D, su descripción puede
realizarse mediante el siguiente conjunto :

D= 4 , 5 , 6 

 El evento “ Sale un número impar o mayor que 3”, se


representa por la letra E, está formado por todos los
resultado de B o de D o de ambos. Este evento recibe el
nombre de unión de B y D, se denota por B  D y su
descripción puede realizarse mediante el siguiente
conjunto:

B  D = E =1 , 3 , 4 , 5 , 6

 El evento “Sale un número par y menor que 4”, se


representa por la letra F, está formado por los resultados
comunes tanto a A como a C. Este evento recibe el
nombre de intersección de A y C, se denota por A  C
y su descripción puede realizarse mediante el siguiente
conjunto :

A  C = F = 2 

91
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

 El evento “Sale un número par y un número impar”,


se representa mediante la letra G, está formado por la
intersección de los eventos A y B, estos eventos no
tienen nada en común, por lo tanto la intersección de
ellos es vacía. A y B son mutuamente excluyentes o
disjuntos..

A  B = G =  = 

4.2. DEFINICIÓN CLÁSICA DE PROBABILIDAD (PROBABILIDAD A


PRIORI)

Supóngase que queremos conocer la probabilidad de que una


moneda caiga con la cara hacia arriba. Como hay solo dos posibles
resultados (cara o seca) adoptamos una situación ideal en la cual
esperamos que cada resultado tenga igual probabilidad de ocurrir. Así,
1
P (C ) 
la probabilidad de que se presente una cara, 2

Definición :La probabilidad de un evento A en un experimento aleatorio


está dado por: el cociente entre el número de casos favorables y el
número de casos igualmente posibles

N º de casos favorables a A
P( A) 
N º total de casos igualmente posibles

 Por ejemplo, la probabilidad de extraer el as de espada de una


baraja ordinaria de 52 cartas es 1/52.
 Pero la probabilidad de sacar un as de espada rojo es cero
(puesto que no hay figuras de espadas rojas en la baraja) no
hay sucesos posibles que favorezcan este resultado.
 Si los eventos son mutuamente excluyentes (esto es, si los
dos eventos no pueden ocurrir simultáneamente), pues A  B
= Ø , la P (Ø ) = 0

4.3. DEFINICIÓN DE PROBABILIDAD FRECUENCIAL (PROBABILIDAD


A POSTERIORI)

Las probabilidades se aproximan después de realizar la experiencia a la


frecuencia relativa. Por ejemplo, para saber cuál es la probabilidad de
obtener el as con un dado determinado, se arroja el dado 600 veces en
las cuales se obtienen 113 veces un as.

92
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

La probabilidad de obtener un as con ese dado es estimada por la


frecuencia relativa = 113/600 = 0.1883.

Realice ( u observe) un procedimiento un gran número de veces y


cuente las ocasiones que el suceso A ocurre en realidad. Con base en
estos resultados reales, P(As) se estima de la siguiente forma :

f (As)
P(As)   f r(As)
f
4.4. AXIOMAS DE PROBABILIDAD

Sea un experimento aleatorio que genera un espacio muestral M. Sea E1


y E2 eventos de un espacio muestral, se define probabilidad como una
función que asigna a cada evento del espacio un valor comprendido
entre 0,1 tal que se cumplan los siguientes axiomas:

1.- Si E es un evento cualquiera en un espacio muestral M, entonces

P ( E )  0 la probabilidad es positiva y

0  P( E )  1 la probabilidad de un suceso varía entre 0 y


1.

2.- Al espacio muestral M completo le corresponde

P(M)=1

3.- Si E1 y E2 son eventos mutuamente exclusivos y E1E2=, entonces


se cumple

P (E1  E 2) = P (E1 ) + P (E 2 )

Si el espacio muestral es infinito, debemos reemplazar el axioma 3 por

3* .- Si E1 , E 2 ,... son eventos mutuamente exclusivos, entonces


tenemos que

P (E1  E 2 … ) = P ( E1 ) + P ( E 2 ) +…

93
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

4.5. PROPIEDADES:

1.- Si Ø es el conjunto vacío, entonces P (Ø ) = 0 . Imposibilidad.

Por ejemplo, la probabilidad de extraer el as de espada de una


baraja ordinaria de 52 cartas es 1/52. Pero la probabilidad de sacar
un as de espada rojo es cero (puesto que no hay figuras de espadas
rojas en la baraja).no hay sucesos posibles que favorezcan este
resultado.


2.- Si E es el complemento de un evento E, entonces


P ( E ) = 1 – P( E )

3.- Si A  B , entonces P ( A ) menor o igual a P ( B ).

 La probabilidad de que ocurra el evento A , es decir que


al lanzar un dado salga un número par , se calcula como

P(A) =3/6 = 1/2

donde:

 el número de resultados favorables es 6, ya que A = 2, 4, 6,


tiene 3 elementos.
 el número total de resultados es 6, ya que M= {1 , 2 , 3 , 4 ,5,
6} tiene 6 elementos.

94
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

 La probabilidad de que ocurra el evento B, es decir que


al lanzar un dado salga un número impar , se calcula
como

P(B) =3/6 = 1/2

donde:

 el número de resultados favorables es 6, ya que B = 1, 3, 5,


tiene 3 elementos.
 el número total de resultados es 6, ya que M = {1, 2, 3, 4, 5, 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento C, es decir que


al lanzar un dado salga un número menor que 4 , se
calcula como

P(C) =3/6 = 1/2

donde:

 el número de resultados favorables es 3, ya que C= 1, 2, 3 ,


tiene 3 elementos.
 el número total de resultados es 6, ya que M = {1 , 2, 3, 4, 5 ,
6} tiene 6 elementos.

 La probabilidad de que ocurra el evento D, es decir que


al lanzar un dado salga un número mayor que 3 , se
calcula como

P(D) =3/6 = 1/2

donde:

 el número de resultados favorables es 3, ya que D= 4, 5, 6 ,


tiene 3 elementos.
 el número total de resultados es 6, ya que M = {1, 2, 3, 4, 5, 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento E, es decir que


al lanzar un dado salga un número impar o mayor que
3 , se calcula como

P(E) =5 / 6

95
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

donde:

 el número de resultados favorables es 5, ya que E=1,3,4,5,6 ,


tiene 5 elementos.
 el número total de resultados es 6, ya que M = {1 , 2, 3 , 4 ,5,
6} tiene 6 elementos.

 La probabilidad de que ocurra el evento F, es decir que


al tirar un dado salga un número par y menor que 4 ,
se calcula como

P(F) =1 / 6

donde:

 el número de resultados favorables es 1, ya que F = 2 , tiene


1 elemento.
 el número total de resultados es 6, ya que M = {1,2 , 3 , 4, 5, 6}
tiene 6 elementos.

 La probabilidad de que ocurra el evento G, esta formado


por la intersección de los eventos A y B que son
mutuamente excluyentes, al lanzar un dado ” obtener
un número impar y par “ , es cero, ya que es imposible
de que ocurra dicho evento. La probabilidad del evento
nulo o vacío siempre es 0. Se calcula como

P(G) = P (Ø ) = 0

donde:

 el número de resultados favorables es vacío, ya que G = =.


 el número total de resultados es 6, ya que M = {1, 2, 3, 4, 5, 6}
tiene 6 elementos.

96
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

4.5.TEOREMA DE LA SUMA DE PROBABILIDADES

Sean A y B dos eventos del espacio muestral M generado por un


experimento aleatorio. El teorema de la suma de probabilidades dice
que la probabilidad de la unión de A y B es la suma de las
probabilidades menos la probabilidad de la intersección. En símbolos:

Sean A y B  M entonces

P(AB)=P(A)+P(B)- P(AB)

Si los eventos son mutuamente excluyentes, el último término


desaparece, pues A  B = Ø y P (Ø ) = 0

P(AB)=P(A)+P(B)

 En el ejemplo, calcule la probabilidad del evento “sale cara o sale


un número par” correspondiente al experimento de lanzar
simultáneamente un dado y una moneda, utilizando el teorema
de la suma de probabilidades.

P(CP)=P(C)+P(P)- P(CP)

6 6 3 9 3
P (C  P )       0,75
12 12 12 12 4

4.6. PROBABILIDAD CONDICIONAL

Muchas veces necesitamos encontrar la probabilidad de un


evento B si se sabe que ha ocurrido un evento A. Esta probabilidad se
llama probabilidad condicional de B dado A, y se representa como P (
B / A ) . En este caso A sirve como un espacio muestral nuevo (
reducido ) , y la probabilidad es la fracción de P( A) que corresponde a
A B. Así que

P A  B 
P( B / A) 
P A

97
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Del mismo modo, la probabilidad condicional de A dado B es

P A  B 
P( A / B ) 
P B 

Volviendo al ejemplo del dado:

a) halle la probabilidad de que aparezca un número menor que 4 dado


que apareció un número mayor que 3

b) halle la probabilidad de que aparezca un número impar dado que


apareció un número mayor que 3

Solución :

a) P ( C / D ) se denomina probabilidad condicional de C dado que ha


ocurrido el evento D , se define como

P ( C / D ) = P ( C  D ) / P( D )

En este caso M = 1, 2 , 3 , 4 , 5 , 6 

C =  1 , 2 , 3  , D =  4 , 5 , 6  , P( D ) = 3 / 6 = 1 /2 , P( C  ) =
0

P(C/D)= 0/½ =0

98
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

b) P ( B / D) es la probabilidad condicional de que aparezca un número


impar dado que apareció un número mayor que 3.

P( D )= 3 / 6 = 1 / 2 P ( B  D ) = 1/6

P ( B / D = P( B  D ) / P( D ) = 1/6 / 12 = 1/3

4.7..TEOREMA DEL PRODUCTO DE PROBABILIDADES

En ocasiones, nos encontramos con la necesidad de determinar la


probabilidad de ocurrencia simultánea de dos o mas eventos. Para
obtener este resultado, deberemos aplicar la regla de multiplicación.

Regla de la Multiplicación : Si A y B son eventos contenidos en un


espacio muestral M , y P ( A )  0 y P ( B )  0, entonces se cumple que

P ( A y B ) = P(AB) = P(A)  P(B /A) = P ( B )  P ( A / B)

Cuando los eventos son independientes: En el caso especial en el que


la ocurrencia de A no está en absoluto relacionada con la ocurrencia de
B y viceversa, se dice que los sucesos son independientes. La
independencia se representa simbólicamente por

P ( B/ A ) = P(B) y P (A /B)=P(A).

Cuando los eventos son independientes la regla de la multiplicación


se simplifica a: Si A y B son eventos contenidos en un espacio muestral
M y P(A) 0 y P(B) 0, entonces “La probabilidad de la intersección es
el producto de las probabilidades” :

P ( A y B ) = P(AB) = P(A)  P(B)

En el ejemplo del dado: son A y C independientes?

Si la probabilidad del resultado A no depende de la ocurrencia de


un segundo evento C ( o viceversa) se dice que A y C son eventos

99
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

independientes. En términos de probabilidad se expresa que A y C son


eventos independientes si

P (A / C ) = P ( A ) ó bien P ( C / A ) = P ( C )

En caso de que A y C no sean eventos independientes (se


denominan dependientes), debido a que

P(A/C) ≠P(A) o bien P(C/A) ≠P(C)

Al lanzar un dado:

M=1, 2, 3, 4, 5, 6 y

A: número par

B: número impar

3
P( A) 
6

3
P( B ) 
6

1
P( A  B ) 
6

1
1
P( A / B )  6 
3 3
6 que no es igual a P ( A ) = 1 / 2 ,

1
1
P( B / A)  6 
3 3
6 que no es igual a P ( B ) = 1/2

100
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Muestreo con y sin reemplazo

Hay dos maneras de extraer objetos para obtener una muestra


de la población, conocido como muestreo de una población; estas son
las siguientes.

1.- Muestreo con reemplazo significa que el objeto que se extrajo al


azar se coloca de nuevo en el conjunto dado, se mezcla completamente
y se precede a extraer al azar el siguiente objeto.

2. Muestreo con reemplazo significa que el objeto que se extrajo se


deja aparte y no se lo introduce nuevamente.

 Ejemplo

Una caja contiene 10 juegos para niños de Jardín de Infantes, de


los cuales 3 están con fallas. Dos juegos se extraen al azar sin
reemplazo. Encontrar la probabilidad del evento tal que ninguno de
los 2 juegos tenga fallas.

Solución:

Consideremos los eventos

A: El primer juego extraído no tiene fallas.

B: El segundo juego extraído no tiene fallas.

Es claro que P (A) = 7/10, ya que 7 de los 10 juegos no son


defectuosos y estamos muestreando aleatoriamente, por lo cual cada
juego tiene la misma probabilidad ( 1/10 ) de ser escogido.

Si A ocurre, entonces quedan 9 juegos en la caja, 6 de los cuales


tienen fallas, por lo que

P (B / A)= = 6 / 9 = 2 / 3

Y por el teorema de la multiplicación, la respuesta es

P (A  B ) = 7 /10 . 2 / 3 = 0,47

101
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

 Ejemplo

Si se seleccionan dos cartas de un paquete de naipes bien


barajado, ¿cuál es la probabilidad de que ambas sean reinas?

Solución

Hay dos maneras de seleccionar las cartas: 1) Se puede


seleccionar una carta, reponerla en la baraja, barajar y extraer
una segunda carta. (Muestreo con reemplazo); 2) Se pueden
seleccionar las dos cartas consecutivamente sin reemplazar la
primera en la baraja (Muestreo sin reemplazo)

1º. Sea A el suceso de una reina en la primera extracción, y B el


suceso de una reina en la segunda extracción. Cuando el
muestreo es con reemplazo, la probabilidad de extraer una reina
permanece igual en las dos extracciones. Así, puesto que

P (A / B) = P (A) y P (B / A) = P (B), las dos extracciones son


independientes, por lo tanto

P (A  B) = P (A). P (B) = 4/52. 4/52= 16/ 2704

2º. Cuando se emplea el muestreo sin reemplazo la probabilidad


de obtener una reina en la segunda extracción se reduce siempre
que la primera carta seleccionada haya sido una reina. En otras
palabras , cuando P ( B / A )  P ( B ) o P ( A / B )  P ( A ) , los
sucesos no son independientes. La probabilidad de extraer una
reina en el segundo intento es 3 / 51. Empleando la fórmula
correspondiente, encontramos que la probabilidad de seleccionar
dos reinas en extracciones consecutivas procedentes de una
baraja sin reemplazo, es:

P (A  B) = P (A). P (B / A) = 4 / 52. 3 / 51 = 12 / 2652

Se debe notar que la diferencia entre ambos muestreos es despreciable


cuando la población es grande en relación con el tamaño de la muestra.

 Ejemplo: Para un estudio, se obtiene una muestra de padres de


alumnos de un Jardín de Infantes y se los clasifica según

102
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

ocupación y grado de compromiso con el mismo, obteniéndose


los siguientes resultados:

Padres de alumnos de un Jardín de Infantes, clasificados según


ocupación y grado de compromiso con el mismo.

Ocupación Grado de compromiso con el establecimiento


No Poco Comprometido Total
comprometido comprometido
Desocupado 20 10 5 35
Trabajo 10 15 10 35
permanente
Trabajo 15 10 5 30
temporario
Total 45 35 20 100

FUENTE: Datos ficticios

Suponga que se selecciona un padre al azar de este grupo. Obtenga las


probabilidades siguientes

 Que el padre no se comprometa con la institución.

45
P( A)   0,45
100

 Que el padre no se comprometa o se comprometa con la


institución.

P(AB)=P(A)+P(B)
45 20 65
P(A  B )  P    P      0,65
100 100 100

 Que el padre se comprometa poco con la institución.

100  35 65
P( A)    0,65
100 100

 Que el padre sea Desocupado y no se comprometa.

20
P(A  C )   0,20
100

 Probabilidad que el padre sea poco comprometido dado que tiene


trabajo permanente

103
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

15
P( B  O ) 100 15
P( B / O )     0,43
P(O ) 35 35
100

 Probabilidad que el padre tenga trabajo temporario o sea poco


comprometido

30 35 10 55
P(O  B )  P   P  P   B )      0,55
100 100 100 100

5.- DISTRIBUCIÓN DE PROBABILIDAD

Una distribución de probabilidad no es más que, como su nombre


lo indica, la asignación a cada evento posible de un experimento, de la
probabilidad que le corresponde.

Definición. Cualquier regla o mecanismo que sirva para determinar

P(X = x), probabilidad de que la variable aleatoria X tome


cada uno de los valores posibles x, se denomina una
Distribución de Probabilidad

Existen dos tipos de distribuciones que son importantes en las


aplicaciones prácticas, a saber: las distribuciones discretas y las
continuas. Una distribución discreta surge al contar (por ejemplo,
obtener un 6 y un 4 al lanzar dos dados, o bien sacar un rey al extraer
una carta de la baraja española). Una distribución continua aparecerá
si se mide (por ejemplo altura de los alumnos y alumnas de la clase).

Entre todas las distribuciones discretas, la Distribución Binomial


es la más sencilla. Entre las distribuciones continuas veremos la
Distribución Normal.

5.1. VARIABLE ALEATORIA

Una variable aleatoria X es una función cuyos valores son


números reales y dependen del “azar”.

104
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

5.2.DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA DISCRETA

La siguiente es la distribución de la variable aleatoria

Xi = nº de puntos obtenidos al arrojar un dado perfecto, o sea que todas


sus caras son igualmente posibles:

xi 1 2 3 4 5 6 Total
P(xi) 1/6 1/6 1/6 1/6 1/6 1/6 1

Obsérvese que se cumplen dos condiciones que son


necesarias para que un conjunto de pares ordenados (x,y) sea
considerada una distribución de probabilidades:

1) Para cada valor de x le corresponde un único valor de y que es


un valor de probabilidad (no negativo y menor o igual a 1),
 P xi 
2) M =1
3) Esta distribución recibe el nombre de uniforme, es una
distribución de variable aleatoria discontinua y sus parámetros
son los valores mínimos (a) y máximo (b) que puede tomar x.
Esto se indica como X ~ U (a, b).

5.2.1. DISTRIBUCIÓN BINOMIAL.

La variable X toma los valores 0, 1, 2, 3,..., n. (donde n es finito y


bien determinado). Se puede considerar que la Distribución Binomial
es la repetición de n pruebas independientes, cada una de las cuales
tiene solo dos resultados posibles: éxito o fracaso (por ejemplo tomar 4
pruebas en un año, cada una de las cuales puede ser aprobada o
desaprobada). La función de probabilidades es:

P ( x )  Cnx p x q n  x ,

x
donde C n son las combinaciones de n elementos tomadas de a x,

p= probabilidad de éxito en una sola prueba,

q = 1- p = probabilidad de fracaso.

105
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Las combinaciones se calculan como sigue:


C  (n.(n - 1). (n - 2)...(n - x  1))/x!
x
n

Los parámetros que definen a la distribución Binomial son n y p.

Las dos características necesarias de una distribución de


probabilidad consisten en que cada valor de P ( X = xn , p ) tiene que
ser mayor o igual a 0 y que la suma de todos los valores de P ( X = x
n , p ) debe ser igual a 1.

Ejemplo: Cuando se recibe un envío de lápices en la escuela, se


seleccionan de manera aleatoria, 15 unidades con el propósito de
verificar el porcentaje de unidades defectuosas en el envío. Con base en
información pasada, la probabilidad de tener una unidad defectuosa es
de 0,05. La directora ha decidido no recibir el envío cada vez que una
muestra de 15 unidades tenga dos o más defectuosas. ¿Cuál es la
probabilidad de que, se rechace el envío?

Solución

El modelo de distribución apropiado para esta situación


es la distribución binomial, se puede suponer que las 15
unidades que se seleccionan al día, constituyen un
conjunto de ensayos independientes de manera tal que la
probabilidad de tener una unidad defectuosa es de 0,05
entre ensayos. Definimos a la variable aleatoria X:
“número de unidades defectuosas” que se encuentran
entre las 15 unidades seleccionadas. El evento se definirá
como A: unidad defectuosa.

La probabilidad de defectuosa es

P(D) = 0,05

El número de ensayos n = 15

La probabilidad de que el envío no se reciba, es igual a la


probabilidad de que X sea igual o mayor que dos:

P(X  2) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)]

15!
P(0 15, 0,05) = (0,05) 0 (1  0,05)150
0! (15 - 0)!

= 1(0,95)15 = 0.4631

106
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

15!
(0,05)1 (1  0,05)151
P(1 15, 0,05) = 1! (15 - 1)! =

= 15(0,05)(0,95)14 = 0,3658

P(X  2 15, 0,05) = 1 – P(X < 2) =

=1 – (0,4631 + 0,3658) = 1 – 0,8289 = 0,1711

Por lo tanto la probabilidad de que, el envío sea rechazado es de 0,1711.

La distribución binomial es realmente una familia de distribuciones,


puesto que para cada valor diferente de n y p, que se denominan
parámetros de la distribución binomial, se puede definir una
distribución diferente. Sin tener en cuenta el valor de n, la distribución
es simétrica cuando p = 0,5. Cuando p es mayor que 0,5, la
distribución es asimétrica y su máximo se encuentra a la derecha del
centro. Cuando p es menor que 0,5, la distribución es asimétrica y su
máximo se encuentra a la izquierda del centro.

Tablas de la Distribución Binomial El cálculo de las probabilidades


binomiales mediante la ecuación anterior puede resultar laborioso
cuando n es grande. Afortunadamente hay tablas de probabilidades
binomiales y entonces no es necesario el uso directo de la ecuación.
Solamente necesitamos utilizar una tabla con los valores dados de n, p
y x para obtener la probabilidad deseada.

Para explicar el uso de la Tabla consideremos nuevamente


el ejemplo en el cuál deseábamos conocer: La probabilidad de que la
dirección rechace el envío es igual a la probabilidad de que X sea igual o
mayor que dos: para hallar esta probabilidad en la tabla, localizamos
primero n = 15, luego la columna de p = 0,05 y finalmente para x, las
filas marcadas con un 0 y un 1

P(X  2 15 , 005) = 1 – P(X < 2) = 1 – [P(X = 0) + P(X = 1)] = 1 – [0,463 +


0,366] = 0,171

107
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

p
n x 0,01 0,05 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 0,95 0,99 x
13 0 878 513 254 055 010 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0
1 115 351 367 179 054 011 002 0+ 0+ 0+ 0+ 0+ 0+ 1
2 7 111 245 268 139 045 010 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 21 100 246 218 111 035 006 001 0+ 0+ 0+ 0+ 3
4 0+ 3 28 154 234 184 087 024 003 0+ 0+ 0+ 0+ 4
5 0+ 0+ 006 069 180 221 157 066 014 001 0+ 0+ 0+ 5
6 0+ 0+ 001 023 103 197 209 131 044 006 0+ 0+ 0+ 6
7 0+ 0+ 0+ 006 044 131 209 197 103 023 001 0+ 0+ 7
8 0+ 0+ 0+ 001 014 066 157 221 180 069 006 0+ 0+ 8
9 0+ 0+ 0+ 0+ 003 024 087 184 234 154 028 003 0+ 9
10 0+ 0+ 0+ 0+ 001 006 035 111 218 246 100 021 0+ 10
11 0+ 0+ 0+ 0+ 0+ 001 010 045 139 268 245 111 0+ 11
12 0+ 0+ 0+ 0+ 0+ 0+ 002 011 054 179 367 351 115 12
13 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 010 055 254 513 878 13

14 0 869 488 229 044 007 001 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0


1 123 359 356 154 041 007 001 0+ 0+ 0+ 0+ 0+ 0+ 1
2 008 123 257 250 113 032 006 001 0+ 0+ 0+ 0+ 0+ 2
3 0+ 026 14 250 194 085 022 003 0+ 0+ 0+ 0+ 0+ 3
4 0+ 004 035 172 229 155 061 014 001 0+ 0+ 0+ 0+ 4
5 0+ 0+ 008 086 196 207 122 041 007 0+ 0+ 0+ 0+ 5
6 0+ 0+ 001 032 126 207 183 092 023 002 0+ 0+ 0+ 6
7 0+ 0+ 0+ 009 062 157 209 157 062 009 0+ 0+ 0+ 7
8 0+ 0+ 0+ 002 023 092 183 207 126 032 001 0+ 0+ 8
9 0+ 0+ 0+ 0+ 007 041 122 207 196 086 008 0+ 0+ 9
10 0+ 0+ 0+ 0+ 001 014 061 155 229 172 035 004 0+ 10
11 0+ 0+ 0+ 0+ 0+ 003 022 085 194 250 114 026 0+ 11
12 0+ 0+ 0+ 0+ 0+ 001 006 032 113 250 257 123 008 12
13 0+ 0+ 0+ 0+ 0+ 0+ 001 007 041 154 356 359 123 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 001 007 044 229 488 869 14

15 0 860 463 206 035 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0


1 130 366 343 132 031 005 0+ 0+ 0+ 0+ 0+ 0+ 0+ 1
2 0+ 135 267 231 092 022 003 0+ 0+ 0+ 0+ 0+ 0+ 2
3 0+ 031 129 250 170 063 014 002 0+ 0+ 0+ 0+ 0+ 3
4 0+ 005 043 188 219 127 042 007 0+ 0+ 0+ 0+ 0+ 4
5 0+ 001 010 103 206 186 092 024 003 0+ 0+ 0+ 0+ 5
6 0+ 0+ 002 043 147 207 153 061 012 001 0+ 0+ 0+ 6
7 0+ 0+ 0+ 014 081 177 196 118 035 003 0+ 0+ 0+ 7
8 0+ 0+ 0+ 003 035 118 196 177 081 014 0+ 0+ 0+ 8
9 0+ 0+ 0+ 001 012 061 153 207 147 043 0+ 0+ 0+ 9
10 0+ 0+ 0+ 0+ 003 024 092 186 206 103 010 001 0+ 10
11 0+ 0+ 0+ 0+ 001 007 042 122 219 188 043 005 0+ 11
12 0+ 0+ 0+ 0+ 0+ 002 014 063 170 250 129 031 0+ 12
13 0+ 0+ 0+ 0+ 0+ 0+ 003 022 092 231 267 135 009 13
14 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 031 132 343 366 130 14
15 0+ 0+ 0+ 0+ 0+ 0+ 0+ 0+ 005 035 206 463 860 15

108
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

5.3. DISTRIBUCIONES DE PROBABILIDADES DE VARIABLE


ALEATORIA CONTINUA

En estas distribuciones no es posible calcular la probabilidad en


puntos sino que hay que hacerlo en intervalos. Recuérdese que en las
variables discontinuas las probabilidades de intervalos se obtenían
sumando las probabilidades que corresponden a cada punto o valor de
la variable. En variables continuas, los valores que puede tomar la
variable son infinitos por lo que es necesario hacer una suma infinita es
decir una integral. En las variables continuas, la probabilidad de un
intervalo se obtiene integrando la función de densidad.

 Ejemplo: la distribución rectangular X ~ R (0,2).

Esta es una distribución rectangular (todos sus puntos tienen


igual densidad de probabilidad) que se extiende desde 0 a 2. El gráfico
de su función de densidad es el siguiente:

en el que se puede observar que la función de densidad es

f(x) = 1/2

La probabilidad de encontrar valores de variables entre 1 y 2 se


encuentra integrando la función de densidad entre esos límites.

La integral entre esos límites corresponde al área bajo de la curva entre


los mismos.

5.3.1. LA DISTRIBUCIÓN NORMAL

Si una variable es continua, varía desde  hasta   y su


función de densidad es:

109
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

2
1 x 
1  
2  

f (x) = e
 2 ,

se dice que x tiene distribución normal con parámetros  y  (media


aritmética y desviación estándar). Esto se simboliza como sigue:

X ~ N ( ,  )

Su gráfica es la siguiente:

0,40

0,30
f (x)

0,20

0,10

0,00
4 6 8 10 12 14
x

La distribución normal presenta las siguientes características:

1) Presenta un máximo en x =  , por lo tanto Mo = 

2) Es simétrica y su eje de simetría es f (  ) , por lo que se deduce que


Md =  = Mo.

3) Tiene dos puntos de inflexión ubicados en x =   

4) Toda transformación lineal de x da otra distribución normal.

5) Algunos sectores usados de la función son:

x =    corresponde aproximadamente al 68 % central

x =   2 corresponde aproximadamente al 95 % central

x =   3 corresponde aproximadamente al 99 % central

110
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

6) f(x) se acerca asintóticamente al eje x o sea que f(x) > 0.




1) Por ser función de densidad, el área bajo de la curva es


 f ( x)dx = 1


Para calcular la probabilidad de un intervalo en la distribución


normal, por tratarse de una variable continua, debe hacerse mediante
la integración de la función de densidad, lo cual equivale a calcular el
área bajo de la curva. Considérese por ejemplo que la altura de los
alumnos de la escuela tiene distribución normal con media  = 1,6 m y
desviación estándar  = 0,1 m. La probabilidad de que al seleccionar
un alumno al azar, posea altura comprendida entre 1,5 y 1,65
(P(1,5<x<1,65)) se obtiene integrando la función de densidad f(x), (en la
cual se debe reemplazar los valores correspondientes de  y  por 1,6 y
0,1 respectivamente) entre los límites 1,5 y 1,65.

La distribución normal estándar

Usando la propiedad que dice que la transformación lineal


x - 
z =
 conduce a una distribución también normal, cuyos
parámetros son  z = 0 y  z = 1 , se obtiene una nueva distribución que
se conoce con el nombre de distribución normal estándar o normal
0,1 y se la describe como

Z ~ N (0,1) cuya representación gráfica es la siguiente:

-5 -3 0 3 5
z

111
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Tablas de la distribución normal

El cálculo de probabilidades en la normal involucra el cálculo de


integrales que son muy engorrosas de resolver manualmente. Por ello,
las integrales están tabuladas para una distribución normal que es la
estándar.

Vamos a aprender el uso de tablas de una cola.

Tabla de “1 cola”

En ella, los valores de probabilidad se encuentran en el cuerpo de


la tabla y los valores de z se forman utilizando la primera columna y la
primera fila (es decir en lo que se conoce como matriz de la tabla). En
esta tabla es importante considerar el signo de z.

Como su nombre lo indica, para el valor de z considerado, da el


valor del área bajo de la curva desde menos infinito hasta z. Por ejemplo
si z = -2.1 la tabla da

P(z < -2,1) = 0,0179.

 Ejemplo :

Una población de pesos de alumnos en gr tiene distribución normal


con media y desviación estándar ( y  ) de 50 y 5 Kg. respectivamente.
¿Cuál es la probabilidad de

 que los alumnos pesen menos de 55 kg

En símbolos, la probabilidad buscada es P(x  55)

Para solucionar esto es necesario pasar de la normal que


nos interesa a la normal estándar. Esto se consigue
mediante el siguiente cambio de variable:

x - 
z =
 en este caso x = 55 ,  = 50 y  = 5 por lo que

z = (55 - 50)/5 = 1.

112
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

P(x  55) = P(z  1) = 0,8413

Cuando se busca un valor por menor, la probabilidad se


obtiene directamente en la tabla.

 que los alumnos pesen más de 57,75 kg

En símbolos, la probabilidad buscada es P(x  57,75)

Para solucionar esto es necesario pasar de la normal que


nos interesa a la normal estándar. Esto se consigue
mediante el siguiente cambio de variable:

z =
x -  en este caso x = 57.75 ,  = 50 y  = 5 por lo que

z = (57,75 - 50)/5 = 7,7/5 = 1,54.

P(x  57,75)= P(z  1,54) = 1- P(z  1,54)=1-0,9382=0,0618

113
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

. . . . .
00 01 02 03 04
0 0 0 0 0
.0 .8413 .8438 .8461 .8485 .8508
0 0 0 0 0
.1 .8643 .8665 .8686 .8708 .8729
0 0 0 0 0
.2 .8849 .8869 .8888 .8907 .8925
0 0 0 0 0
.3 .9032 .9049 .9066 .9082 .9099
0 0 0 0 0
.4 .9192 .9207 .9222 .9236 .9251
0 0 0 0 0
.5 .9332 .9345 .9357 .9370 .9382
0 0 0 0 0
.6 .9452 .9463 .9474 .9484 .9495
0 0 0 0 0
.7 .9554 .9564 .9573 .9582 .9591
0 0 0 0 0
.8 .9641 .9649 .9656 .9664 .9671
0 0 0 0 0
.9 .9713 .9719 .9726 .9732 .9738
0 0 0 0 0
.0 .9772 .9778 .9783 .9788 .9793
0 0 0 0 0
.1 .9821 .9826 .9830 .9834 .9838
0 0 0 0 0
.2 .9861 .9864 .9868 .9871 .9875

 que los alumnos pesen entre de 52,75 kg y 60 kg

En símbolos, la probabilidad buscada es P(52,75  x  60)

Para solucionar esto es necesario pasar de la normal que nos


interesa a la normal estándar. Esto se consigue mediante el siguiente

cambio de variable z = x -  , se buscan dos valores de z, primero para



el valor mayor de x, luego para el menor.

114
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

60 - 50 10 52,75 - 50 2,75
z2 =  2 z1 =   0,55
5 5 5 5

Se buscan los valores en la tabla para z=2; P(z  2)=0,9772

Se buscan los valores en la tabla para z=0,55; P(z  0,55)=0,7088

Luego se restan los valores

P(52,75  x  60)= P(0,55  z  2)=0,9772-0,7088=0,2684

Los valores de z más usados y que determinan intervalos


centrales (1-) son:

z0,10  1,64
 para el 90 % central
z 0, 05  1,96
 para el 95% central
z0, 01  2,58
 para el 99% central

 Ejemplo

En la población de pesos X ~ N(50 ; 5) ¿cuál es el intervalo que


corresponde al 95 % central de la población?

En la distribución de z, el 95 % central de la población


corresponde al intervalo que va desde -1,96 a +1,96, o sea  1,96. Es
muy simple, si se desea que en el centro esté el 95 % o, en tanto por
uno, 0,95, entonces en las colas debe quedar el 0,05. El valor que
z  1,96
corresponde 0, 05 .

Ya se determinó el intervalo en z, ¿cómo se pasa a la normal


con media 50 y desviación estándar 5? Se debe hacer el cambio inverso
de variable:

x - 
z = entonces x =   z 
 .

115
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Para indicar que el intervalo corresponde a un porcentaje central


determinado se acostumbra a llamar  a lo que queda en las colas.

x =   z 

Volviendo entonces al ejemplo, por ser z  = 1,96, el intervalo que


corresponde al 95 % central de la población de pesos de los alumnos es:

x = 50  1,96 * 5 = 50  9,80 .

El intervalo del 95 % central entonces va desde 40,20 kg a


59,80 kg.

116
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

GUÍA DE EJERCITACIÓN

Actividad 1

Indique con una cruz cual de los siguientes experimentos son


aleatorios:

 Comprar un número en una rifa y ganar el primer premio.


 Extraer de una bolsa con fichas blancas, rojas y verdes, una ficha
roja.
 Sumar dos números naturales menores que cuatro y obtener un
número de una cifra.
 Tirar un dado y obtener un múltiplo de dos.
 Tirar de un quinto piso un vaso de vidrio y que se rompa.
 Mirar por la ventana y ver pasar un auto de color azul.

Actividad 2

Describa el espacio muestral de los siguientes experimentos aleatorios:

 Extraer al azar un legajo de una bolsa que contiene los legajos de


5 docentes de 1ª sección y 3 docentes de 2a sección de un Jardín
de Infantes.
 Extraer al azar dos legajos de una bolsa que contiene los legajos
de 5 docentes de 1ª sección y 3 docentes de 2a sección de un
Jardín de Infantes.

Actividad 3

Escriba verdadero (V) o Falso (F):

 Cuando un experimento es imposible, la probabilidad es cero.


 Cuando un experimento es seguro la probabilidad es cero.
 La probabilidad de un experimento es un numero comprendido
entre 0 y 1.

117
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Actividad 4

En el experimento aleatorio de la Actividad N°2, segundo párrafo:

a) ¿Cuántos grupos de dos personas se formaron?


b) ¿En cuántos están docentes de la 1ª Sección?
c) ¿En cuántos están docentes de la 1ª Sección solamente?
d) ¿En cuántos están docentes de la 2ª Sección?
e) ¿En cuántos están docentes de la 2ª Sección solamente?
f) ¿En cuántos están docentes de la 1ª y 2ª Sección?
g) Calcule la probabilidad de cada uno de estos sucesos.

Actividad 5

Una oficina donde asignan becas para padres de los alumnos de Jardín
de Infantes, realiza la selección de los mismos para dos Becas de
distinto origen de fondos; los resultados posibles son Seleccionado (S) o
No Seleccionado (NS). El experimento consiste en tomar al azar un
alumno y observar el resultado en las dos selecciones.

a) Describa el espacio muestral de este experimento (suponga que los


padres de todos los alumnos han estado inscriptos en las dos Becas)
b) ¿Cuál es la probabilidad de que el padre del alumno haya sido
seleccionado en las dos Becas?
c) ¿Cuál es la probabilidad que el padre del alumno no haya sido
seleccionado en ninguna de las dos Becas?
d) ¿Cuál es la probabilidad que el padre del alumno haya sido
seleccionado en una Beca por lo menos?

Actividad 6

Cada uno de los ítems siguientes representa las probabilidades de cada


uno de tres eventos simples.

Marque el ítem correcto, justificando al mismo tiempo su respuesta.

a) P(E1) = 0,8 P(E2) = 0,3 P(E3) = 0,1

b) P(E1) = 0,3 P(E2) = 0,2 P(E3) = 0,5

118
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

c) P(E1) = -0,6 P(E2) = 0,2 P(E3) = 0,2

d) P(E1) = 1/3 P(E2) = 1/2 P(E3) = 1/6

Actividad 7

En una encuesta realizada a los padres de 90 alumnos que egresan


del Jardín de Infantes en un establecimiento educativo, se les
preguntaba sobre el nivel de instrucción alcanzado y si a los hijos los
inscribirían o no en el mismo establecimiento educativo para continuar
sus estudios. El resultado de la encuesta figura en la tabla siguiente:

Nivel de ¿Inscriben a Total


educación de los sus hijos en la
padres misma escuela?
Si No
Superior 20 10 30
Secundario 30 10 40
Primario 15 5 20
Total 65 25 90

Si se selecciona un padre al azar, cuál es la probabilidad de:

a) ¿Qué el padre posea educación superior?


b) ¿Qué el padre inscriba a su hijo en la misma escuela?
c) ¿Qué el padre inscriba a su hijo en la misma escuela y tenga
educación primaria?
d) ¿Qué el padre posea educación superior o secundaria?
e) ¿Qué el padre no posea educación superior?
f) ¿Qué el padre inscriba a su hijo en la misma escuela dado que posee
educación primaria?
g) ¿Qué el padre no inscriba a sus hijos en la misma escuela dado que
posee educación secundaria?
h) El evento que inscriba a su hijo en la misma escuela es
independiente del nivel de educación Superior alcanzado por el
padre?

119
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Actividad 8

En un examen de 10 bolillas un alumno no sabe dos de ellas. ¿Cuál es


la probabilidad que le toquen justamente las dos bolillas que no sabe?

Actividad 9

Una prueba tiene 2 preguntas con dos opciones: Verdadero (V) o


Falso(F).

a) ¿Cuál es la probabilidad de que acierte en las dos?


b) ¿Cuál es la probabilidad de que acierte por lo menos en una?
c) ¿Cuál es la probabilidad de que a las dos las conteste
incorrectamente?

Actividad 10

En una escuela hay tres Profesores de Educación Física. La


probabilidad de que no asistan a clase cada uno de ellos es de 0.05. ¿
Cuál es la probabilidad de que un día cualquiera falten los tres juntos?

Actividad 11

En un análisis realizado por el Director de un establecimiento


educativo, se determinó que de los alumnos ingresantes en EGB en una
cohorte, solo el 70% (en promedio) completó el polimodal. De ellos solo
el 15% lo hizo en el mismo establecimiento. ¿Cuál es la probabilidad de
que un nuevo alumno ingresante en EGB termine el Polimodal en la
misma escuela?

Actividad 12

La probabilidad de que a un alumno le interese Matemáticas en un


curso es de 0.1. Si se toman 3 alumnos de dicho curso al azar:

¿Cuál es la probabilidad de que:

a) No le agrade a ninguno Matemáticas?


b) Le agrade por lo menos a un alumno esta materia?
c) Le agrade como máximo a 2 alumnos?

120
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Actividad 13

La probabilidad de que un alumno apruebe una Prueba Integradora de


conocimientos de Matemática en el último año del Polimodal es de 0,25.
Si se seleccionan al azar 10 alumnos de un curso:

a) ¿Cuál es la probabilidad de que 5 alumnos aprueben?


b) ¿Cuál es la probabilidad de que no apruebe ningún alumno?
c) ¿Cuál es la probabilidad de que todos aprueben?
d) ¿Cuál es la probabilidad de que aprueben como mínimo 5 alumnos?
e) ¿Cuál es la probabilidad de que como máximo aprueben 5 alumnos?

Actividad 14

La probabilidad de que la última semana de clase los alumnos que


egresan cometan un acto de indisciplina serio es de 0,004. De 300
alumnos que terminan este año:

¿Cuál es la probabilidad de que:

a) 8 alumnos terminen sus estudios con una sanción por este acto de
indisciplina?
b) De qué más de 5 alumnos terminen sus estudios con una sanción
por este acto de indisciplina?
c) De que menos de 4 terminen sus estudios con una sanción por este
acto de indisciplina?
d) De qué ningún alumno cometa un acto de indisciplina serio?

Actividad 15

Los pesos de los alumnos de un curso de EGB se distribuyen


normalmente con  = 48 kg y  = 2 kg.

a) Obtenga los pesos estándar correspondientes a:

43 kg ; 44,5 kg ; 46 kg ; 49,5 kg ; 50 kg

b) ¿Cuál es la probabilidad de que un alumno tenga un peso menor a


44,5 kg?
c) ¿Cuál es la probabilidad de que un alumno tenga un peso mayor a
46 kg?
d) ¿Cuál es la probabilidad de que un alumno tenga un peso entre
44,5 kg y 49,5 kg?

121
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

e) ¿Cuál es la probabilidad de que un alumno tenga un peso de por lo


menos 46 kg?
f) Obtenga el Rango Percentil correspondiente a los pesos del item a).
Interprete que significa cada uno de ellos.
g) Si el número de alumnos a los que se ha medido el peso en ese curso
fuera de 200,

¿ cuántos alumnos tendrán un peso inferior a la media?. ¿Cuántos


alumnos tendrán un peso superior a 52 kg?

h) ¿Qué porcentaje de alumnos tienen un peso comprendido entre 45


kg y 47 kg?

Actividad 16

Los puntajes promedio con su correspondiente desviación estándar,


obtenidos por los alumnos del último curso de Polimodal en una
escuela en los exámenes finales de una asignatura son los siguientes:

CURSO  
A 5,9 1,5
B 6,75 1

Se supone que los puntajes se distribuyen normalmente:

a) Si un alumno del Curso A ha obtenido 7 puntos y otro del Curso B


igual puntaje, quiere decir que el nivel de aprendizaje es el mismo en
los dos cursos?. Justifique su respuesta.
b) ¿Qué porcentaje de alumnos obtuvieron más de 5 puntos en cada
curso? Analice en base a esto el rendimiento de cada curso.
c) ¿Qué porcentaje de alumnos obtuvieron más de 7 puntos en cada
curso?
d) ¿Qué porcentaje de alumnos obtuvieron menos de 4 puntos en cada
curso?
e) ¿En base a estos resultados qué conclusión puede enunciar?

122
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

CAPÍTULO IV

UNIDAD V

TABLAS DE CONTINGENCIA

INTRODUCCIÓN

Con alguna frecuencia deseamos verificar la hipótesis de que los


datos observados de una muestra son el resultado del hecho de que las
características de una población no tienen relación entre sí. Por
ejemplo, podemos hacer la hipótesis de que la actitud de la gente hacia
un determinado grupo minoritario no tiene relación con su nivel de
educación. En otra situación, podríamos estar interesados en verificar
la hipótesis de que, en varias poblaciones, la proporción de sujetos que
tienen una determinada característica, es la misma. Podemos, por
ejemplo, formular la hipótesis de que en tres grupos, digamos de
recursos económicos bajos, medios y altos, la proporción de personas
con conocimientos altos, y bajos acerca de la política nacional, es la
misma.

1.- DISTRIBUCIÓN JI-CUADRADA

Sean X 1, X 2,..., X n, variables aleatorias normales independientes


que tienen media 0 y variancia 1. La suma de sus cuadrados se
representa en general por 2 ( ji-cuadrada ), esto es,

 2  X 12  X 22  ...  X n2 2

A la distribución correspondiente a esta suma se la llama Distribución


ji-cuadrada, cuya función de densidad es

f ( x ) = Kn x (n-2) /2 e –x/2 cuando x  0

f(x)=0 cuando x 0

En esta fórmula n es un entero positivo que se llama número de grados


de libertad de la distribución y K n es una constante

123
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

K n = 1  2n/2 .  ( n/2)

Donde  ( n/2) es la función gamma.

Grados de libertad: es el número de clases en que las frecuencias


pueden distribuirse libremente.

1.1. Propiedades de la distribución del estadístico ji-cuadrada

 1. Los valores de ji-cuadrado son mayores o iguales a


cero.

No puede tomar valores negativos, ya que es suma de valores


elevados al cuadrado.

 2. La distribución ji-cuadrada no es simétrica. Tiene cola


estrecha que se extiende a la derecha; esto es, está
sesgada a la derecha.

 3. La forma de una distribución ji-cuadrada depende del


grado de libertad que es igual a n – 1 . En consecuencia
hay un número infinito de distribuciones ji-cuadrada.

 4. La distribución ji-cuadrada tiene valor medio  = n – 1


y variancia  2 = 2(n – 1)

La siguiente figura ilustra tres distribuciones 2 . Note que el valor


modal aparece en el valor (n-3) = (gl-2).

124
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Hipótesis: La palabra hipótesis se define como:

1. Una afirmación que está sujeta a verificación o comprobación.

2. Una suposición que se utiliza como base para una acción.

Una hipótesis es una afirmación o suposición y no un hecho


establecido.

Una hipótesis estadística es una suposición que se hace acerca


de la distribución de una variable aleatoria. Una prueba estadística de
una hipótesis es un procedimiento en el cual se usa una muestra con
el fin de determinar cuando podemos “no rechazar “ (aceptar ) la
hipótesis, es decir, actuar como si fuera cierta o cuando debemos
“rechazar” esta, es decir, actuar como si fuera falsa.

Las hipótesis estadísticas son de dos tipos. Primero está la


hipótesis nula, que se simboliza con H0 y que es la hipótesis que se
debe comprobar.

Para verificar una hipótesis nula, examinamos los datos de la


muestra tomada de la población pertinente y determinamos si son o no
compatibles con la hipótesis nula. Si los datos de la muestra no son
compatibles con la hipótesis nula, entonces H0 se rechaza. Si los
datos son compatibles con la hipótesis nula, entonces H0 no se
rechaza.

Si la hipótesis nula no se rechaza, decimos que los datos


particulares de la muestra no dan suficiente evidencia como para que
concluyamos que la hipótesis nula es falsa. Si la hipótesis nula se
rechaza, decimos que los datos particulares de la muestra sí dan
suficiente evidencia como para hacernos concluir que la hipótesis nula
es falsa y que una segunda hipótesis es verdadera. Esta segunda
hipótesis, de la que hemos concluido que es verdadera si la hipótesis
nula es rechazada, se denomina hipótesis alterna y se designa con el
símbolo H 1

125
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

1.2 Tabla de la Distribución ji-cuadrada

Para conocer el valor de 2, debemos consultar una tabla


específica, que contiene:

- En la matriz de las columnas, los grados de libertad.


- En la matriz de las filas, los valores de probabilidad.
- En el cuerpo de la tabla, los valores de 2 .

La tabla que se utilizará es la de 2 , la cual da valores críticos


para valores especiales de . Para denotar el valor crítico de una
distribución 2 con ( gl ) grados de libertad se usa el símbolo 2 (gl);
este valor crítico determina a su derecha un área  debajo la curva 2
y sobre el eje horizontal. Por ejemplo para encontrar 2 0.05(6) en la
tabla se localiza 6 gl en el lado izquierdo y  = 0,05 en el lado superior
de la misma tabla.

2. TABLA DE CONTINGENCIA

Definición: Una tabla de contingencia es una tabla en donde las


frecuencias corresponden a dos variables.( Una variable se utiliza para
categorizar renglones y una segunda variable para categorizar
columnas).

En una Tabla de Contingencia, los niveles de un criterio de


clasificación forman las filas y los niveles de otro criterio, las columnas.
Las celdas que se encuentran en las intersecciones de las filas y las
columnas contienen conteos o frecuencias de sujetos que se han
clasificados en forma cruzada con base en los dos criterios. Es
importante reconocer que la palabra contingencia se refiere a

126
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

dependencia, pero esto solo es una dependencia estadística, por lo cuál


no es posible utilizarla para establecer una cadena directa de causa-
efecto entre las dos variables en cuestión.

Las tablas de contingencia tienen especial importancia, puesto


que suelen utilizarse para analizar resultados de encuestas. Por
ejemplo, podemos hacer una pregunta a los sujetos en la que
identifiquen su género ( masculino / femenino), y otra en la que
describan la frecuencia de su uso del control remoto del televisor
(frecuentemente / algunas veces / nunca ), Se puede determinar si el
uso del control remoto del televisor es independiente del género.

La Tabla 1 es una tabla de contingencia generalizada en la que


se ha clasificado en forma cruzada una muestra de n sujetos. La tabla
muestra que el número de sujetos que cae en el nivel i del primer
criterio y el nivel j del segundo, es n ij . Un total de n r . sujetos cae
dentro de la categoría r del primer criterio y n . c sujetos caen dentro
de la categoría c del segundo criterio.

Tabla 1 : Clasificación de doble entrada de una muestra de sujetos.

Primer
criterio de
clasificación Segundo criterio de clasificación

Nivel Nivel

1 2 .......... j ........
c Total
1 n11 n12 ............ n1j ............. n1c n1.
2 n21 n22 ........... n2j ............ n2c n2.
. . .

. . .
I ni1 ni 2 ............ nij ............ nic ni.
. .

. .
R nr1 nr2 ........... nrj ......... nrc nr.
Total n.1 n.2 n.j n.c n

127
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

En general una tabla de contingencia tiene r filas y c columnas,


siendo f y c números mayores o iguales a dos. Una característica
importante en el análisis de las tablas de contingencia es el número de
grados de libertad de la tabla, que se define como el número de casillas
que pueden fijarse arbitrariamente cuando los totales por filas y
columnas se suponen fijos.

Se presentan dos tipos de prueba de hipótesis que se basan en


tablas de contingencia :Las pruebas de independencia, que se usan
para determinar si una variable de renglón de una tabla de contingencia
es independiente de su variable de columna y Las pruebas de
homogeneidad, que sirven para determinar si situaciones diferentes
tienen las mismas proporciones de alguna característica. Ambos tipos
de prueba de hipótesis utilizan los mismos métodos básicos. Veremos
únicamente las pruebas de independencia.

Se obtiene una tabla de contingencia 2 x 2 debido a que los


individuos se clasifican según dos criterios, y para cada criterio se hace
distinción entre dos categorías. Se habría obtenido una tabla de
contingencia 2 x 3 si hubiéramos usado 3 categorías .

3. PRUEBA DE JI-CUADRADO DE INDEPENDENCIA

Definición: Prueba la hipótesis de que no hay asociación entre la


variable de renglón y la variable de columna en una tabla de
contingencia.

Un investigador puede estar interesado en saber, respecto de una


población, si dos criterios de clasificación están probablemente
relacionados o no. Por ejemplo, podemos estar interesados en saber si
hay o no asociación entre la religión , y el interés político en algún
grupo de personas. Si concluimos que dos criterios de clasificación no
están relacionados, decimos que son independientes.

Dos criterios de clasificación son independientes si la


distribución de un criterio no depende de ninguna manera de la
distribución del otro. En el ejemplo, diremos que la participación
religiosa y el interés político son independientes si el hecho de conocer
la religión de una persona no interviene en la predicción de la
naturaleza de sus intereses políticos.

Para poder llegar a una decisión sobre la independencia de dos


criterios en una población, generalmente analizamos los datos de la
muestra y sacamos conclusiones acerca de la población a partir de los
resultados de la muestra.

128
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Para este tipo de problemas la técnica que más se emplea es la


denominada Prueba de Ji-Cuadrado de Independencia

Cuando se prueba la hipótesis de independencia entre las


variables de renglón y de columna, en una tabla de contingencia, los
supuestos, el estadístico de prueba y los valores, para aplicar la prueba
de ji-cuadrado de independencia hay que realizar los siguientes pasos:

1.- Tomamos una muestra aleatoria de sujetos de la población de


interés.

2.- Plantear las hipótesis. La hipótesis planteada es la afirmación de


que las variables de renglón y de columna son independientes, la otra
hipótesis que se plantea es la afirmación de que las variables renglón y
columna son dependientes, o sea :

La hipótesis nula que se va a verificar con la prueba de ji-cuadrado de


independencia es :

H 0 : Los dos criterios de clasificación son independientes

La hipótesis alterna es .

H 1 : Los dos criterios de clasificación no son independientes.

3.- Presentamos los datos en una Tabla de Contingencia, en la cual los


niveles de un criterio de clasificación forman las filas y los niveles del
otro criterio, las columnas.

4.- Calculamos las frecuencias esperadas para cada una de las celdas
de la tabla de contingencia. Esto lo hacemos suponiendo que la

129
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

hipótesis nula es verdadera , es decir, que los dos criterios de


clasificación son independientes.

5.- Comparamos las frecuencias esperadas y observadas calculando el


estadístico de prueba para una prueba de independencia.

O  E 2
 E
2 =

donde O ij es la frecuencia observada y E ij es la frecuencia esperada


de la celda ij. Si la hipótesis nula es verdadera, es decir, si los dos
criterios de clasificación son realmente independientes,  2 se
distribuirá aproximadamente como una distribución ji-cuadrada.

Definición. Un estadístico de prueba es una cantidad numérica que


se calcula a partir de los datos de una muestra y que se utiliza para
tomar la decisión de rechazar o no rechazar una hipótesis nula.

6.- Escogemos un nivel de significación  ( 5 % , 1% o alguno


semejante).

7.- Se determinan los valores críticos.

i) Los valores críticos se encuentra utilizando

grados de libertad = ( r – 1 ) . ( c - 1 )

ii) En una prueba de independencia de una tabla de


contingencia, la región crítica se localiza solo en la cola derecha.

130
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

8.- Comparamos el valor calculado de  2 c , para su significación, con


los valores tabulados de  2 t . Si  2 c es igual o mayor que  2 t para
los grados apropiados de libertad y el nivel escogido de significación  ,
rechazamos la hipótesis nula de independencia y concluimos que los
dos criterios de clasificación no son independientes.

Determinación de frecuencias esperadas. Para determinar las


frecuencias esperadas de las celdas de la tabla de contingencias, en una
prueba de ji-cuadrado de independencia, utilizamos nuestros
conocimientos sobre la probabilidad. Refirámonos a la tabla de
contingencia de la Tabla 1. Supongamos que deseamos estimar la
probabilidad de que un sujeto tomado al azar en esa población esté
caracterizado por el nivel 1 del primer criterio. El estimador de esa
probabilidad es n1 . / n , es decir, el número de sujetos de la muestra
caracterizados por el nivel 1 del primer criterio dividido por el número
total de sujetos de la muestra. De igual manera, para estimar la
probabilidad de que un sujeto tomado al azar en esta población se
categorice por el nivel 1 del segundo criterio de clasificación,
calculamos n . 1 / n.

Para obtener la frecuencia esperada de una celda determinada,


determinemos la probabilidad de que un sujeto , tomado al azar en esta
población, esté en esta celda. . Por ejemplo, calculemos la probabilidad
de que un sujeto tomado al azar en esa población esté contado en la
primera celda de la Tabla 1. Esto es, en otras palabras, la probabilidad
de que un sujeto tomado al azar en esta población esté caracterizado
por el nivel 1 de ambos criterios de clasificación. Sin ningún
conocimiento de la dependencia o independencia de los dos criterios,
estaríamos inclinados a estimar esta probabilidad calculando la
probabilidad conjunta n 11 / n. Siguiendo la hipótesis que los dos
criterios de clasificación son independientes, hacemos otro
razonamiento. En probabilidad vimos, que si dos eventos son
independientes, la probabilidad de su ocurrencia conjunta es igual al
producto de sus probabilidades individuales. Si establecemos esta regla
de modo que se pueda aplicar específicamente a una tabla de
contingencia, podemos hacer el siguiente planteamiento:

En una tabla de contingencia, si dos criterios de clasificación son


independientes, cada una de las probabilidades conjuntas asociadas con

131
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

la celda de la tabla es igual al producto de las probabilidades


marginales correspondientes.

Entonces siguiendo la hipótesis de independencia, la


probabilidad de que un sujeto tomado al azar en esta población esté
caracterizado por el nivel 1 de ambos criterios de estima mediante (n1.
/ n ) . (n . 1 / n ) .

Con el fin de obtener las frecuencias esperadas de las celdas de


la tabla de contingencia , multiplicamos cada una de las probabilidades
conjuntas por el tamaño total de la muestra, n . Por ejemplo, la
frecuencia esperada E 11 de la primera celda de la Tabla 1 está dada
por :

E 11 = (n1. / n ) . (n.1 / n ) . n

E 11 = ( n1. * .n .1 )/n (1)

La forma de este producto sugiere una forma general para obtener


la frecuencia que se espera de una celda:

(total de renglón )  .(total de columna )


E
( gran total )

El gran total se refiere al total de todas las frecuencias que se


observan en la Tabla.

Determinación de los grados de libertad: El número de grados de


libertad asociados con valor de  2 c calculado a partir de los datos de
una tabla de contingencia es igual al número de celdas que se pueden
llenar arbitrariamente si se han establecidos los totales marginales.

132
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

con  c
2
En general, el número de grados de libertad asociados
calculado en una tabla de contingencia es igual:

gl=(f–1).(c–1)

Figura: Región crítica (sombreada) para un contraste con el estadístico

 Ejemplo: Un sociólogo desea saber si es posible concluir


que hay relación respecto al estado de nutrición y
desempeño académico en una población de alumnos
pertenecientes al Nivel Inicial de Escuela de la Capital de
la Provincia de Santiago del Estero. El sociólogo seleccionó
una muestra de 500 alumnos.

La prueba de ji-cuadrado resulta adecuada para tomar una


decisión.

133
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Solución:

1. Los datos muestrales se seleccionan aleatoriamente.

2. Determinar Ho y H1.

La hipótesis nula que se va a verificar con la prueba de ji-cuadrado de


independencia es :

Ho : el estado nutricional y el desempeño académico son


independientes.

H1 : las dos variables no son independientes.

3. Presentación de los datos en una tabla de contingencia

Tabla 2: Estado de nutrición y desempeño académico de 500 niños de


una escuela primaria.

ESTADO DE
NUTRICIÓN
DESEMPEÑO MALO BUENO TOTAL
ACADÉMICO
MALO 105 15 120
SATISFACTORIO 80 300 380
TOTAL 185 315 500

134
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

4. Calculamos las frecuencias esperadas

Aplicando el procedimiento abreviado, calculamos las frecuencias que


se espera para cada celda, suponiendo independencia entre las variable
de renglón y las variables de columna de la tabla, empleando la fórmula
(1)

E 11 = 120 . 185 / 500 = 44,4 E12 = 120 . 315 / 500 =


75,6

E 21 = 380 . 185 / 500 = 140,6 E 22 = 380. 315 /500 =


239,4

5. Comparamos las frecuencias que se observadas y las frecuencias


que se esperan.

Tabla 3 . Frecuencias observadas y frecuencias esperadas del ejemplo 1

ESTADO DE NUTRICIÓN

DESEMPEÑO
ACADÉMICO Malo Bueno Total
Malo 105 ( 44,4 ) 15 ( 75,6 ) 120
Satisfactorio 80 ( 140,6 ) 300 ( 239,4 380
)
TOTAL 185 315 500

135
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

La tabla muestra las frecuencias esperadas entre paréntesis y las


frecuencias observadas.

Utilizamos los datos de la Tabla 3 y el Estadístico de prueba , que es

O  E 2
 E
2 =

para calcular el valor de 2

2 =(105– 44,4 ) 2 / 44,4 + (15 – 75,6 )2 / 75,6 + (80 – 140,6 ) 2 /140,6+


(300-239,4) 2 / 239,4 = 82.71+48.58+26.12+15.34=172.74

6. Determinación de los grados de libertad. Como el número de grados


de libertad asociado con 2 calculado en una tabla de contingencia es
igual a (c-1)*(f-1) o sea

g.l. = ( 2 – 1 ) . ( 2 – 1) = 1

El nivel de confianza: 5 

7. Buscamos el 2 en la tabla :

Para 1 grado de libertad y un nivel de confianza  = 5  , el

2 t = 3,84

136
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

El valor crítico es 2 t = 3,84, se encuentra en la tabla observando que


 = 0,05 en la cola derecha y que el número de grados de libertad es 1.

 Comparamos el 2 c y el 2 t ( el ji-cuadrado calculado con el


ji-cuadrado de tabla)

2 c = 172,74  2 t = 3,84

Como el estadístico de prueba está dentro de la región crítica,


rechazamos la hipótesis H 0 .

 Interpretamos: El estado nutricional y el desempeño académico


no son independientes.

137
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

GUIA DE EJERCITACIÓN

ACTIVIDAD 1

De un estudio realizado a quinientos alumnos de la Sala de 5 años


correspondiente a distintos Jardines de la Provincia, fueron clasificados
de acuerdo con el grupo socio-económico al que pertenecen y la
presencia o ausencia de ciertos defectos en el lenguaje.

Defecto del Grupo Socio-Económico


lenguaje Alto Medio alto Medio Bajo Bajo Total
Presente 8 24 32 27 91
Ausente 42 121 138 108 409
Total 50 145 170 135 500

¿Son compatibles estos datos, a un nivel de significación de 0,05, con


la hipótesis de que el defecto en el lenguaje no está relacionado con el
grupo socio-económico?

ACTIVIDAD 2

Los resultados de un estudio realizado por un sociólogo respecto al nivel


de comprensión de las consignas dadas a los alumnos de la Sala de 5
años en un Jardín de la ciudad Capital de Santiago del Estero,
clasificados según Nivel socioeconómico, se muestran en la tabla
siguiente:

Edad Nivel de Comprensión


Muy Bueno Bueno Escaso o Total
(en meses) Insuficiente
Baja 12 13 13
Media 13 16 11
Alta 18 15 11
Total

138
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

A nivel de significación de 0,05, comprobar si hay relación entre las dos


variables.

Nota Aclaratoria:

Edad Baja : 42 a 46 meses- Edad Media: 46 a 50 meses-

Edad Alta: 50 a 54 meses

ACTIVIDAD 3

En una investigación se estudiaron 631niños de 0 a 5 años de edad y se


analizó su estado nutricional, con referencia particular a si presentaban
o no retardo de crecimiento. Una vez hallados los resultados, el
investigador desea saber si el peso de nacimiento (bajo: igual o menor a
2500 g; normal: más de 2500 gramos) está asociado al retardo de
crecimiento posterior, con un nivel de significación de 0,05 %.

Peso de Retardo en el Crecimiento


Nacimiento Si No Total
Bajo 21 26 47
Normal 124 460 584
Total 145 486 631

139
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

CAPÍTULO V

UNIDAD VI

INFERENCIA ESTADÍSTICA

1. INTRODUCCIÓN

En capítulos anteriores se vió:

Estadística Descriptiva : Su objetivo es la recolección y reducción de


datos . Se estudian técnicas para presentar los datos de una forma más
comprensible y así poder visualizar propiedades de los mismos.

Cálculo de Probabilidades :La razón de su estudio es que la


Estadística incluye la toma de decisiones en presencia de
incertidumbre. Estas decisiones tomadas se basan en probabilidades.
Aquí conocemos ( o suponemos conocido) por completo el modelo
probabilístico que usamos, es decir, la población a estudiar la podemos
representar por una variable aleatoria X.

Recordemos que una población está constituida por todos los


elementos que poseen unos caracteres por cuyo estudio estamos
interesados. Una muestra, en cambio, es una parte de los elementos
de la población; pero esta parte ha de ser representativa del total.

Cuando el estadístico puede observar todos los elementos de la


población

( observación exhaustiva) , entonces su tarea se reduce a describir las


características y regularidades de la población. Pero si la observación no

140
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

puede ser exhaustiva, entonces aquellas características hay que


estudiarlas a través de una muestra representativa.

Hay que distinguir entre poblaciones finitas y poblaciones


infinitas. Se dice que una población es finita si tiene un número
limitado de sucesos o unidades elementales. Ejemplo de población
finita son, en un año dado los salarios recibidos por todos los docentes
de un Colegio, los títulos recibidos por todos los estudiantes de un país.
Mientras el número total de observaciones posibles sea limitado, se
trata de una población finita.

En cambio, una población infinita es la que, consiste en un


número infinitamente grande de observaciones. Por lo menos en teoría ,
no hay límite alguno al número de unidades que puede abarcar. Por
ejemplo, los resultados obtenidos al lanzar dos dados constituyen una
población infinita , lo mismo que los pesos al nacer de todos los seres
humanos. Una población infinita puede ser siempre generada a partir
de un conjunto finito de valores o unidades si el muestreo se hace con
reemplazo.

2. INFERENCIA ESTADÍSTICA

Definición: La Inferencia Estadística es el procedimiento por medio del


cual se llega a inferencias acerca de los parámetros de una población
mediante los resultados que se obtienen a partir de una muestra
extraída de esa población.

El objetivo principal de la Estadística Inferencial es la


estimación, esto es que mediante el estudio de una muestra aleatoria
seleccionada de una población se quiere generalizar las conclusiones al
total de la misma.

Definición de muestra aleatoria

Todo conjunto de n unidades de observación elementales tomadas


de una población dada, se puede considerar como una muestra de
tamaño n. Pero el tipo de muestra que aquí interesa es el de muestra
aleatoria. Una muestra aleatoria se puede tomar con o sin reemplazo.
Si la muestra se toma con reemplazo, de una población , finita o infinita
, la unidad tomada se vuelve a dejar en la población y el número de
unidades disponibles para seguir la operación no se afecta. Esto
también es cierto cuando la muestra se toma de una población infinita

141
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

sin reemplazo, es decir, cuando la unidad escogida no se vuelve a la


población. Cuando se toma un elemento, sin reemplazar, de una
población finita, el número de unidades que quedan tras cada unidad
que se saca se reduce en una unidad, y en consecuencia la probabilidad
de sacar cualquier unidad restante en operaciones sucesivas se
aumenta.

Es necesario formular nuestro concepto en forma precisa. Por


definición, una muestra debe tener ciertas propiedades como sigue:

Se supone que las muestras dan información acerca de la


población a que corresponde, ya que por lo general es demasiado
costoso, requiere demasiado tiempo, o es imposible observar o medir
todos los objetos pertenecientes a la población. La muestra debe
resultar de una selección aleatoria. Es decir, cada elemento de la
población debe tener una probabilidad conocida de integrar la muestra,
esto es, de ser tomado en la muestra; el caso mas sencillo y más común
es en donde la probabilidad es la misma para todos los elementos de la
población, y solo si se satisface este requisito ( al menos
aproximadamente) , los métodos estadísticos darán resultados
razonables y útiles.

Además, es necesario que las n ejecuciones del experimento


aleatorio con el que obtenemos n valores de la muestra sean
independientes, esto es, el resultado de una ejecución no debe influir
en las otras ejecuciones. Esto equivale a decir que la probabilidad de
que cualquier miembro de la población aparezca en una muestra, no
depende de la aparición o no aparición de los otros miembros de la
población en la muestra.

Hay que tener presente que el conocimiento de las características


de una población, salvo algunas excepciones, no puede conseguirse con
toda exactitud mediante una muestra. Si se tiene una población
humana y suponemos que no existen errores de observación, la única
manera de obtener exactamente la estatura media, el porcentaje de
analfabetos, etc… , en dicha población es observando todos los
elementos de ella. Pero si esta observación exhaustiva no es posible y se
utiliza como medio supletorio una muestra, entonces lo único que
puede obtenerse, salvo en algunos casos particulares, son estimaciones
de aquellas características.

El problema de la Inferencia Estadística parte del hecho cierto


de que una muestra, en general, no da una información exacta de las
características de la población que deseamos estudiar, por lo que se
utiliza la muestra para estimar dichas características. Este enfoque
origina la Teoría de la Estimación, mediante la cual se da solución a
los problemas específicos que se plantean.

142
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

3. DISEÑOS DE MUESTREO

La operación de tomar una muestra de una población se


denomina muestreo y los métodos de muestreo que se utilicen deben
garantizar aquella representatividad para que pueda hablarse
correctamente de una muestra estadística.

Si se desea conocer, por ejemplo, el consumo medio de proteínas


por alumno y dia en una ciudad y tomamos para ello un grupo de
familias integrado por la de más alto nivel de vida, se concluirá que ese
grupo no es representativo del total de familias de la ciudad. Por tanto,
el consumo medio que se obtenga del citado grupo no es una buena
estimación porque entraña un error de un tipo distinto del que cabe
esperar en una muestra representativa.

Conviene distinguir entre dos clases de error. De una parte


existen los errores muestrales, que son aquellos que están latentes en
toda muestra representativa, pues aun siéndolo no proporciona, salvo
raras excepciones, una medida exacta de las características de la
población; por ello hay que contar siempre con los errores muestrales o
errores de muestreo.

Y por otra parte están los sesgos, bajo cuya denominación se


incluyen algunos errores específicos de las muestras como los debidos a
su falta de representatividad, y otros que son comunes a toda
investigación estadística, tanto si es exhaustiva como si no lo es. A este
último grupo pertenecen los errores de observación, los originados por
definiciones defectuosas de los elementos de la población, de los
caracteres a investigar , los debidos a respuestas o medidas mal
efectuadas , a fórmulas inadecuadas, a cálculos equivocados, etc.

Ejemplo: Supongamos que deseamos tomar una muestra de 100


padres de alumnos de niños en edad de 4 y 5 años de un Colegio para
conocer su opinión acerca de un nuevo juego. Un posible método es
situarse a las nueve de la mañana en una entrada del Colegio y
preguntar a los 100 primeros padres que aparezcan. Con este
procedimiento los padres de niños que solo asisten por la tarde no
estarán representados en la muestra. Además, estarán muy poco o
nada representados los padres de niños que no acudan habitualmente.

Cuando algunos miembros de la población tienen una


probabilidad más alta que los otros de estar representados en una
muestra se dice que existe un sesgo de selección y la muestra puede
no ser representativa de la población. Por ejemplo, si existen diferencias
marcadas de opinión entre los padres nuevos y los veteranos, y la
muestra sólo incluye a los veteranos, tendrá un sesgo de selección. Una

143
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

forma de evitar este sesgo es tomar la muestra mediante un


procedimiento de selección objetivo que garantice a todos los elementos
de la población la misma oportunidad de aparecer en la muestra.

El método anterior presenta además el riesgo de un sesgo


adicional: el sesgo por no respuesta. Si los padres que no responden
son los más disconformes, la muestra contendrá una proporción menor
de padres de esta categoría y, de nuevo, puede no ser representativa de
la población que tratamos de investigar. El sesgo de no respuesta no
puede evitarse con certeza pero deben tomarse precauciones para
prevenir que ocurra.

3.1. MUESTREO ALEATORIO SIMPLE

El muestreo aleatorio simple está fundamentado en el puro azar.


Se puede decir que es un muestreo en el que si se saca al azar una
muestra de n unidades, toda posible muestra de n unidades tiene la
misma probabilidad de ser seleccionada. Una muestra obtenida por este
procedimiento se dice muestra aleatoria simple.

Uno de los métodos comúnmente utilizados para lograr que la


muestra sea aleatoria es numerar todos los elementos de una
población, escribir los números en tarjetas o fichas o bolillas o
cualesquiera cosas físicamente homogéneas; poner luego en una bolsa
estos objetos numerados y mezclarlos completamente. Se define el
tamaño n de la muestra y se sacan los objetos al azar uno por uno,
hasta que se obtenga el número deseado de partidas para anotar. El
procedimiento se puede simplificar utilizando una tabla de números
aleatorios.

3.2. MUESTREO ALEATORIO SISTEMÁTICO

Cuando los elementos de la población están ordenados en listas,


una alternativa más fácil de ejecutar que el muestreo aleatorio simple
es el muestreo sistemático. Muy a menudo, si se desea un muestreo
aleatorio simple se sigue un procedimiento sistemático en vez de un
método al azar. Según el procedimiento sistemático, se obtiene una
muestra tomando cada k-ésima unidad de la población tras numerar
las unidades de la población o haberlas ordenado de alguna manera. La
letra k representa un número entero, que es aproximadamente la razón
de muestreo entre el tamaño de la población y el tamaño de la muestra.

144
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Así, si la población consiste en 10.000 unidades de muestreo y se desea


una muestra de 500 unidades, entonces

K = 10.000 / 500 = 20

Y la muestra se obtiene tomando una unidad cada veinte de la


población.

Para que toda unidad de la población tenga igual probabilidad de


salir, el procedimiento debe empezar al azar. Con una razón de
muestreo de 20, se puede utilizar el procedimiento de la bolsa o del
bolillero poniendo 20 bolillas o 20 papelitos numerados de 1 a 20 en el
bolillero o bolsa. Tras revolver y mezclar completamente, se saca una
bolilla al azar. Si se saca la bolilla 11, se empieza con este número y se
incluye en la muestra cada vigésima bolilla a partir de esta, es decir, la
treinta y una, la cincuenta y una, y así sucesivamente.

3.3. MUESTREO POR ESTRATOS

El muestreo aleatorio simple debe utilizarse cuando los elementos


de la población son homogéneos respecto a la característica a estudiar,
es decir, a priori la predicción que haríamos del valor de la variable sería
el mismo para todos los elementos. Un muestreo que sería más efectivo
que este, es el muestreo aleatorio por estratos, procedimiento que
exige tener conocimiento previo de la población. El proceso de
estratificación contempla dividir la población en grupos homogéneos o
clases llamados estratos . Dentro de cada uno de tales estratos, están
los elementos situados de manera más homogénea con respecto a las
características que estén en estudio. Para cada estrato se toma una
submuestra mediante el procedimiento aleatorio simple, y la muestra
global se obtiene combinando las submuestras de todos los estratos.

El muestreo por estratos es el más efectivo cuando se trata de


poblaciones heterogéneas tales como datos de desempleo (que varían de
ocupación a ocupación), ventas al por menor (que difieren entre las
distintas regiones geográficas) , y las actitudes de los consumidores
respecto de los nuevos modelos de automóviles ( en las que influyen
factores tales como el sexo, la edad, y la categoría de ingreso). Al
hacerse la estratificación, las clases se establecen de modo que las
unidades de muestreo tienden a ser uniformes dentro de cada clase, y
las clases tienden a ser diferentes entre sí. Así se puede controlar la

145
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

proporción de cada estrato en la muestra global y no dejarla al azar y


queda asegurado el carácter representativo de la muestra.

El muestreo por estrato es por consiguiente una combinación de


submuestras de los estratos, que son muestras aleatorias simples o
sistemáticas. En cuanto tales, todo elemento disponible de cada estrato
tiene igual probabilidad de ser seleccionado, y esta será la situación
aun en el caso en que la muestra no sea proporcionada, en el cual las
probabilidades de ser seleccionado cada elemento individual de la
población no son iguales.

3.4.MUESTREO POR CONGLOMERADO

Diametralmente opuesto al muestreo por estratos está el


muestreo por conglomerados, que consiste en seleccionar primero al
azar grupos, llamados conglomerados , de elementos individuales de la
población, y en tomar luego todos los elementos o una submuestra de
ellos dentro de cada conglomerado para constituir así la muestra global.
Para lograr los mejores resultados en el plan del muestreo por
conglomerado, se hacen tan pequeñas como sea posible las diferencias
entre conglomerados, en tanto que las diferencias entre los elementos
individuales dentro de cada conglomerado se hacen tan grandes como
sea posible.

Por ejemplo, si queremos extraer una muestra aleatoria simple de


los estudiantes universitarios de un país sería necesario disponer de
una lista de todos ellos y de sus direcciones y teléfonos. Esta
información puede no estar disponible o ser muy cara de conseguir. Sin
embargo, en este caso, los estudiantes aparecen clasificados en
universidades, facultades y cursos. Podemos seleccionar en una
primera etapa algunas universidades, después algunas facultades al
azar de cada universidad, dentro de las facultades algunas clases y,
dentro de las clases, estudiantes mediante muestreo aleatorio.

Para la primera etapa solo necesitamos una lista de


universidades. Para las universidades seleccionadas es necesario luego
conocer las facultades que incluyen. En las facultades elegidas
necesitamos una lista de las clases, y de las clases que se tomen, una
relación de los estudiantes. Esta información estará disponible por lo
que este tipo de muestreo será factible.

Llamaremos conglomerados a estas unidades amplias donde se


clasifican los elementos de la población. En cada etapa de muestreo , en
lugar de seleccionar elementos al azar , seleccionamos conglomerados.
Los conglomerados se refieren a formas de agrupación física de las
unidades en el espacio o en el tiempo.

146
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

Idealmente los conglomerados tienen que ser lo más parecido


posible a muestras aleatorias de la población , de manera que cada
conglomerado sea tan heterogéneo como la población a investigar.

El muestreo por conglomerado tiene la ventaja de simplificar


enormemente la recogida de la información muestral. El inconveniente
obvio es que si los conglomerados son heterogéneos entre sí, como sólo
se analizan algunos de ellos, la muestra final puede no ser
representativa de la población.

3.5. MUESTREO POR CUOTAS

A veces la estratificación no es posible, o es muy cara, y se


recurre en su lugar al muestreo por cuotas. Por ejemplo, se desea
tomar una muestra de una población para estudiar la proporción de
personas que están de acuerdo con el uso de remedios especiales. Si
suponemos que la edad y el sexo pueden influir en la opinión,
deberíamos tomar una muestra donde estas características sean las
mismas que en la población base, lo que implica una muestra
estratificada. Sin embargo, esto requiere una lista de las personas de la
población que incluya su sexo y edad, lo que puede no estar disponible.
Sin embargo, si conocemos la proporción de cada sexo y la distribución
de la edad en la población, una solución frecuente es exigir que estas
características aparezcan en la muestra en la misma proporción que en
la población. Esto conduce a fijar cuotas de hombres y mujeres por
grupos de edad. El entrevistador debe conseguir los elementos de la
muestra respetando esta restricción de cuotas.

147
Licenciatura en Educación Inicial – Escuela para la Innovación Educativa - UNSE

BIBLIOGRAFÍA

- Benítez, Celia de; Pece, Marta G.; Galíndez, Margarita de.


(2003). Serie Didáctica N°7: “Elementos de Estadística para
técnicos en vivero y plantaciones forestales”, con guía de
ejercitación.

- Barbancho, A. (1983). Estadística Elemental Moderna. 9a


Edición. Ariel, S. A. – Barcelona. ISBN 84-344-2005-8
- Daniel, W.W. (1997) Bioestadística. ISBN 968-18-5196-X.
- Glass, G y Sanley,J. – Métodos Estadísticos Aplicados a las
Ciencias Sociales. Prentice /Hall Internacional
- Kreyszig, E. (1994). Introducción a la Estadística Matemática .
Principios y métodos. LIMUSA. –Noriega Editores. ISBN 968-18-
0729-4.
- Peña, D. y Romo, J. (1999) . Introducción a la Estadística para
las Ciencias Sociales. ISBN 84-481-1617-8.
- Triola, M.F.(2004). Estadística. Novena edición.ISBN 970-26-
0519-9. Editorial Pearson. México. 837 pags.
- Ya-Lun, Chou. (1990). Análisis Estadístico. ISBN 970-10-0046-3.
pags.808.

148

También podría gustarte