Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estadìstica Descriptiva

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 50

Estadísticas Descriptivas

Introducción

La ciencia estadística es considerada como un método que se utiliza para


analizar, organizar y dar significado a una gran cantidad de datos o de
información. En la actualidad constituye una herramienta poderosa para
generar conocimiento y por ello es aplicada en todas las áreas del saber.

La palabra estadística quiere decir ciencia del Estado, debido a que era
función de los estados recoger datos de sus habitantes con el objetivo principal
de recaudar impuestos. Hasta el siglo XIX la estadística era una ciencia
descriptiva que utiliza medias y gráficos para sintetizar datos sociales y
económicos. Después del siglo XIX, esta ciencia se va transformando en una
ciencia normativa para extraer conclusiones de los datos, prever la evolución
de las variables y guiar la toma de decisiones en ambiente de incertidumbre.

Los campos de aplicación en las diferentes ciencias son muchos. Por ejemplo:
en Psicología, para elaborar las escalas de los test y cuantificar aspectos del
comportamiento humano; en Sociología, para estudiar las opiniones de los
colectivos sociales sobres temas de actualidad; en Ciencia Política, para
conocer las preferencias de los electores antes de una elección; en general esta
ciencia es de gran ayuda para las demás cuando se desean medir las relaciones
entre variables y hacer predicciones sobre ellas.

1
Estadísticas Descriptivas

1.1Significado del término Estadística

El término estadística se deriva originalmente del vocablo “estado”,


ya que esta era la función tradicional de los gobiernos centrales de
llevar registros de población, nacimientos, defunciones, cosechas,
viviendas e impuestos, entre otros.

La estadística es considerada por algunos autores como una


disciplina científica dedicada al desarrollo y aplicación de la teoría y las
técnicas apropiadas para la recolección, clasificación, presentación,
análisis e interpretación de información cuantitativa obtenida por
observación o experimentación.

La función principal de la estadística es elaborar principios y


métodos que nos ayuden a tomar decisiones frente a la incertidumbre.

1.2- Objetivo de la Estadística

La estadística es un instrumento muy valioso para organizar la


información científica y para tomar decisiones acerca de ella.

Entre las finalidades de la estadística Ciro Martínez (1995) numera


las siguientes:
Conocer la realidad acerca de un fenómeno.
Determinar lo normal o típico de un fenómeno.
Determinar los cambios que presentan los fenómenos.
Relacionar dos o más fenómenos.

2
Estadísticas Descriptivas

Determinar las causas que originan el fenómeno.


Hacer estimaciones sobre el comportamiento futuro.
Partiendo de un grupo menor obtener conclusiones para un grupo
mayor.

1.3 Clasificación de la Estadística


El campo de acción de la estadística es muy amplio y variado por
lo que se divide en dos fases o ramas: la estadística descriptiva y la
estadística inferencial.

Estadística Descriptiva:
Se refiere a los métodos que implican la recolección, presentación
y caracterización de un conjunto de datos a fin de describir las diversas
características de ese conjunto de datos. Se limita sólo a la descripción
de dichos datos sin llegar a generalizar con respecto a un conjunto
mayor.
Algunas de sus técnicas son los cuadros, gráficos, cálculo de
promedios, porcentajes y medidas de variabilidad

Estadística Inferencial:
Se refiere a los métodos o técnicas que posibilitan la estimación
de una característica de una población cuando el propósito es no sólo
describir los datos sino generalizar o inferir lo observado para un
conjunto mayor. Es decir, es un proceso en donde se extrae una muestra
de una población, se analiza y los resultados que se obtienen se aplican
a la población.

3
Estadísticas Descriptivas

1.4 Relación de la Estadística con las Ciencias Sociales

Los métodos estadísticos son fundamentalmente los mismos,


independientemente donde se apliquen, ya sea en el análisis de
fenómenos físicos, en el estudio de mediciones educacionales, en el
estudio de datos provenientes de experimentos biológicos, o del análisis
cuantitativo del material económico. Siempre que haya una gran
masa de datos numéricos que requieran explicación, es estadístico
deberá considerar a su análisis como campo de actividades

II- Conceptos Básicos de la Estadística

2.1 Universo, Población y Parámetro


Universo: constituye la totalidad de un grupo de elementos u
objetos que se quiere investigar

Población: conjunto de todos los individuos (personas, objetos,


animales, etc.) que porten información sobre el fenómeno que
se estudia

Parámetro: son las características medibles en la población.


Deben escribirse en mayúscula y son los siguientes:
a) Tamaño de la Población (N).
b) Media Aritmética (µ).
c) Varianza (2)
d) Desviación estándar ( )

4
Estadísticas Descriptivas

2.2 Muestra, estadígrafo

Muestra: Es una parte de la población seleccionada de acuerdo


con un plan determinado. Es un subconjunto de extraído de la
población.

Estadígrafo: son las características medibles en la muestra y son


los siguientes:
a) Tamaño de la Población (n).
b) Media Aritmética ( ).
c) Varianza (S2)
d) Desviación estándar (S)

Marco muestral: lista de unidades o elementos de muestra.

2.3 Características de la Unidad Estadística

Unidades Estadística: objeto o individuo del que hay que


obtener la información.

Unidades de muestreo: número de elementos de la población, no


solapados, que se van a estudiar. Todo miembro de la población
pertenecerá a una y sólo una unidad de muestreo.

5
Estadísticas Descriptivas

2.4 Concepto de Variables

Una variable es una propiedad que puede variar y cuya variación


es susceptible de medirse. Se clasifican de la siguiente forma:

Variables cualitativas: Son aquellas que no aparecen en


forma numérica, sino como categorías o atributos: por ejemplo, el sexo,
color del cabello y profesión de una persona.

Variables cuantitativas: Son las que pueden expresarse


numéricamente como el peso, la temperatura, ingresos anuales y otras.
En las variables cuantitativas se distinguen dos tipos: las variables
discretas y las variables continuas.

Variables discretas: Frecuentemente son el resultado de


contar y, por lo tanto, toman sólo valores enteros. Ejemplo: Número de
estudiantes en un curso.

Variables continuas: Son aquellas cuyos valores pueden


ser cualquier cantidad en un intervalo, como la temperatura, el peso o la
altura de una persona o la superficie de las viviendas.

6
Estadísticas Descriptivas

III- Importancia de la Estadística como instrumento básico de la


Investigación.

3.1 La Observación Estadística


La estadística a menudo ha sido clasificada como método de
investigación ya que interviene en la misma a través de la
experimentación y observación.

Las primeras aplicaciones de la estadística se limitaban únicamente


a determinar el punto donde la tendencia general era evidente, de una
gran cantidad de datos observados.

El uso de la estadística como herramienta de la investigación no se


puede separar de la planeación general del proyecto de investigación, ya
que cuando se usa adecuadamente hace más eficiente las
investigaciones.

3.2 Etapas de la Investigación Estadística

1- Formulación del Problema

La formulación del problema es el primer paso del procedimiento


de investigación. El trabajo científico consiste, fundamentalmente, en
formular problemas y tratar del resolverlo.

Enfrentar o confrontar uno o varios problemas no basta; de lo que


se trata es de plantear y formular correctamente el problema. El
problema debe estar bien formulado; ésta es la regla de oro de comienzo
de todo proceso de investigación.

7
Estadísticas Descriptivas

La calidad de las conclusiones estadísticas depende de la


corrección y precisión de los datos que a su vez depende de la exactitud
en la formulación del problema.

2- Diseño de la investigación

Una vez delimitado el problema de investigación, hay que dar un

paso más y ver como organizar el conjunto de operaciones básicas que


permiten llevar adelante el proceso de investigación. Nos referimos al
diseño de la investigación. Esto implica que se debe decidir si estudiar
toda la población o solo una muestra.

Debe especificarse el diseño o plan de muestreo a seguir.

3- Recolección de Datos

Se refiere a los métodos usados para obtener información pertinente


de las unidades elementales introducidas en la muestra.

Para la tarea de recopilación, existen numerosos procedimientos.


Señalamos las siguientes técnicas de recopilación de datos:

o La observación
o La entrevista
o El cuestionario
o Las escalas de actitudes y de opiniones
o Los tests
o La sociometría
o La recopilación documental

8
Estadísticas Descriptivas

o El análisis de contenido

Se recomienda que el instrumento de medición sea válido y


confiable, de lo contrario no podemos basarnos en sus resultados.

4- Tabulación y descripción de resultados


Los datos deben ser ordenados en forma legible. Se recomienda
su presentación en cuadros y gráficos. Para describir los resultados se
calcularan proporciones, medidas de tendencia central y de dispersión.
Los Cuadros Estadísticos:
Un cuadro estadístico es una lista lógica de datos cuantitativos
interrelacionados, o sea es el arreglo ordenado de los datos para facilitar
su lectura e interpretación de los mismos.
Los componentes del cuadro estadístico son nueve Sección y
número del cuadro, Título, Encabezamiento, Columna Matríz, Cuerpo
del Cuadro, Columnas , Nota, Llamadas, Fuente de Información.
a) Sección y Numero del Cuadro: No es más que el número,
código o elemento que ubica el cuadro en la publicación.

b) Título: Descripción que precede al cuadro, debe ser redactado


en forma breve y se recomienda utilizar la forma de pirámide invertida.
Debe responder a las interrogantes Qué, Dónde, Cómo y Cuándo.
¿Qué?: Se refiere al hecho observado.
¿Donde?: Se refiere al lugar que corresponde la información.
¿Cómo? : Se refiere al orden en que se presenta la información la cual
debe comenzar por el encabezamiento identificado por la preposición

9
Estadísticas Descriptivas

“por” y debe seguir con la información de la columna matríz


identificada con la preposición “según”
¿Cuándo?: Se refiere al tiempo en que se cubre la información.

c) Encabezamiento: Reciben este nombre la serie de casillas situadas


en la parte superior del cuadro y en la cual se indican una o varias
clasificaciones de los datos.

d) Columna matríz: Colocada en el lado izquierdo es de hecho la


primera columna del cuadro. En ella se indican tanto las características
principales como las dependientes.

e) Cuerpo del Cuadro: Es el conjunto de columnas y líneas que


contiene el cuadro en orden vertical y horizontal, en él la se colocan
los datos sobre el hecho observado y las cifras deben ser alineadas a la
derecha, unidades debajo de unidades, decenas debajo de decenas, etc.
Los totales se colocan en la parte superior, horizontalmente y a la
izquierda.

f) Columnas: Están localizadas en el cuerpo del cuadro y nunca deben


aparecer en blanco.

g) Nota: Está destinada a ofrecer conceptos o definiciones que aclaren


el contenido de los cuadros o a indicar la metodología utilizada en la
investigación.

10
Estadísticas Descriptivas

h) Llamada: Información de carácter específico que se aplica a


determinada parte del cuadro. Se indica en el cuadro con el símbolo ( ),
Cuando va al lado de un número se identifica con una letra y debe ir
antes de ésta. Si va al lado de una palabra se pone en número y al final
de la misma.

i) Fuente de Información: Indica la publicación o entidad responsable


de la información.

Estructura del Cuadro Estadístico

1-N° del Cuadro 2-Titulo

3-Encabezamiento

4- Columna
Matriz 5-Cuerpo del cuadro

6-Columna
6-Columna

7-Nota
8-Llamada
9-Fuente de Información

11
Estadísticas Descriptivas

Ejemplo:
Para estudiar sus actitudes hacia aspectos sociales, a 1200
personas de Penonomé se les preguntó (entre otras cosas) si estaban
gastando “muy poco”, “más o menos lo debido” o “demasiado” en
programas de bienestar social. La siguiente tabla resume algunos de los
valores. Confeccione el cuadro estadístico.
Gastos N° de personas Sexo
Muy poco 296 136 hombres 160 mujeres
Mas o menos lo debido 360 110 hombres 250 mujeres
Demasiado 544 224 hombres 320 mujeres

Qué: Actitudes hacia aspectos sociales en programas de bienestar social


Dónde: en una muestra de personas de Penonomé
Cómo: por sexo, según gastos
Cuando: enero de 2004.
CUADRO N° 1. ACTITUDES HACIA ASPECTOS SOCIALES EN
PROGRAMAS DE BIENESTAR SOCIAL EN UNA MUESTRA
DE PERSONAS DE PENONOMÉ POR SEXO,
SEGÚN GASTOS. ENERO DE 2004.

SEXO
GASTOS TOTAL MASCULINO FEMENINO
Total … 1200 470 730
Muy Poco 296 136 160
Mas o menos lo debido 360 110 250
Demasiado 544 224 320
Fuente: Ministerio de Trabajo.

12
Estadísticas Descriptivas

Los Gráficos:
Constituyen uno de los medios más conocidos para la
presentación y el análisis de la información estadística, ya que permiten
una visión más clara, rápida y atractiva de lo que se está presentando,
aunque no nos den una expresión exacta de las cifras como los cuadros
estadísticos. No existen reglas estrictas en la elaboración de gráficos.

Gráfico Circular o de Pastel


Es un círculo dividido en sectores en el cual la medida angular de
cada sector es proporcional a la magnitud del valor que representa y el
círculo completo equivale a la suma de todos los componentes
representados. Se puede construir con cifras absolutas ó cifras relativas,
ya que el círculo completo representa el 100%.
Para confeccionar un gráfico circular se debe dibujar la
circunferencia y luego trazar un radio verticalmente al centro del
círculo, de manera que sirva de partida y desde él con un transportador
se midan los porcentajes de cada uno de los sectores o componentes del
gráfico. Dentro de cada sector se anota su valor porcentual y de existir
espacio también se rotula dentro el significado del sector.

13
Estadísticas Descriptivas

Ejemplo:
Con los datos del cuadro estadístico se tiene:
Tenemos que la población total es de 1200 personas, esto nos representa
el 100%. Luego por regla de tres simple calculamos los porcentajes:

% Muy poco Más o menos Demasiado


100% 1200 100%  1200 100%  1200
X 296 X 360 X 544
X= 296 x 100 X= 360 x 100 X= 544 x 100
1200 1200 1200

X= 25% X = 30% X = 45%

Transformación a grados
Muy poco Más o menos Demasiado
360° 100% 360° 100% 360° 100%
X 25% X 30% X 45%

X = 25 x 360 X= 30 x 360 X = 45x 360


100 100 100

X = 90.° X =108° X = 162°

14
Estadísticas Descriptivas

Gráfico N°1. ACTITUDES HACIA ASPECTOS SOCIALES EN PROGRAMAS


DE BIENESTAR SOCIAL DE UNA MUESTRA DE PERSONAS DE PENONOMÉ
. SEGUN GASTOS. ENERO DE 2004

Muy poco
25%
Demasiado
45%

Más o menos lo
debido
30%

Fuente: Ministerio de Trabajo.

Gráficos de Barras
Están compuestas por rectángulos de igual anchura y de
longitudes variables, que son determinadas por la magnitud de los
datos. Pueden ser de barras simples o compuestas.
Ejemplo 1: Barras Simples

15
Estadísticas Descriptivas

Fuente: Ministerio de Trabajo.

Ejemplo 2: Barras comparadas

Fuente: Ministerio de Trabajo.

Gráfico de Líneas
Corresponden a la expresión de una variable en el tiempo. Existen
gráficos de líneas simples y gráfica lineal de componentes.

Fuente: Escuela Nocturna Laboral de Aguadulce.

16
Estadísticas Descriptivas

5- Decisión o inferencia final


En esta fase se realiza el tratamiento estadístico-matemático de todos
los datos clasificados y tabulados.

El propósito del análisis es resumir y comparar las observaciones


llevadas a cabo de tal forma que sea posible materializar los resultados
de la investigación con el fin de proporcionar respuestas a las
interrogantes de la investigación, o sea a los problemas formulados. 

El objetivo de la interpretación en cambio es buscar un significado más


amplio a las respuestas mediante su relación con otros conocimientos
disponibles; generalizaciones, leyes, teorías etc.

17
Estadísticas Descriptivas

IV- Elementos para el Análisis Estadístico

4.1 Distribuciones de Frecuencias

Los principales métodos para organizar datos estadísticos


comprenden el ordenamiento de los elementos en subconjuntos que
presentan cualidades semejantes. Los datos agrupados pueden
resumirse gráficamente o en tablas. El nombre que reciben los datos
ordenados en grupos o categorías es el de Distribuciones de
Frecuencias.

4.1.1 Tipos de distribuciones y su construcción


Pueden ser: Distribuciones de Frecuencias no agrupadas y
agrupadas, a su vez se dividen en: Distribución Tipo I,
Distribución Tipo II y Distribución Tipo III.

4.1.1.1 Distribución de Frecuencia Agrupada


Son estadísticas que constan de muchas observaciones y la
variable toma también muchos valores .
Ejemplo:
Clase Frecuencia
50-59 9
60-69 13
70-79 18
80-89 15
90-99 5

18
Estadísticas Descriptivas

Se identifica en una distribución de frecuencias lo


siguiente:
Intervalo de Clase: El intervalo puede darse de manera
abierta y cerrada. En el ejemplo anterior un intervalo de
clase es aquel que va de 60 -69, lo cual sería la segunda
clase de la distribución de frecuencias.

Marca de Clase:
Conocida también como punto media la marca de clase es
el punto medio del intervalo de clase. Se obtiene sumando
los números extremos derecho e izquierdo de la clase y
luego dividiendo entre dos.
Por ejemplo la marca de clase del tercer intervalo sería:
(70 + 79)/2 = 149/2 = 74.5

Límites de Clase:
Son los números extremos de los intervalos de clase. Los
números ubicados en el extremo izquierdo se llaman límites
inferiores y los del extremo derecho son los límites
superiores. En la tabla anterior los límites inferiores serían:
50, 60, 70, 80 y 90; y los límites superiores: 59, 69, 79, 89
y 99.

Límites Reales de clases:

19
Estadísticas Descriptivas

Se calculan restando y sumando 0.5 a los límites inferiores


y superiores cuando se nos presentan intervalos de clases
representados por números enteros, si el intervalo está
representado con un entero con un decimal restamos y
sumamos de los límites superior e inferior 0.05.
En la tabla anterior los límites reales inferiores serían:
49.5, 59.5, 69.5, 79.5, 89.5; los límites reales superiores:
59.5, 69.5, 79.5, 89.5 y 99.5

Para construir Distribuciones de Frecuencias se


recomiendan los siguientes pasos:

1- Determinar el mayor y el menor de los números entre los


datos registrados para así encontrar el rango o amplitud.

2- Hallar el número de clases el cual se puede encontrar


mediante las siguientes fórmulas:
K =  n° de observaciones ó K = 1 + 3.3 log N

3- Encontrar el tamaño del intervalo mediante la siguiente


fórmula: TI = Rango / K.
Ejemplo:
Dada la siguiente serie de datos, construya la Distribución de Frecuencias
56 78 62 37 54 39 62 60
28 82 38 72 62 44 54 42
42 55 57 65 68 47 42 56
56 56 55 66 42 52 48 48
47 41 50 52 47 48 53 68

20
Estadísticas Descriptivas

Solución:
1- Rango: R = 81 – 28 = 53

2- Nº de clases: K =  40 = 6.32 = 6 ó K = 1 + 3.3 log (40)


= 1 + 3.3 (1.60) = 1 + 5.28  6
3- T.I. = Rango/ K = 53/6 =5.89  6
Clases Frecuencias
28 – 36 I 1
37 – 45 IIIII IIII 9
46 – 54 IIIII IIIII II 12
55 – 63 IIIII IIIII I 11
64 – 72 IIIII 5
73 – 81 II 2

4.1.1.2 Distribución de Frecuencia No Agrupada


Son Estadísticas que constan pocas observaciones.

Ejemplo:
Ventas diarias en una semana:
$275.00, 300.00, 315.25, 258.87, 275.38, 324.50,
321.20.

21
Estadísticas Descriptivas

4.1.2 Tabla de Frecuencias

4.1.2.1 Frecuencia Absoluta


La tabla de frecuencias absolutas no es más que la
distribución de frecuencias con las cifras o cantidades que
corresponden a cada intervalo de clase.

Clase Frecuencias Frecuencia Absoluta


28 – 36 I 1
37 – 45 IIII IIII 9
46 – 54 IIII IIII II 12
55 – 63 IIII IIII I 11
64 – 72 IIII 5
73 – 81 II 2

4.1.2.2 Frecuencia Relativa


Para obtener la frecuencia relativa se divide la frecuencia
absoluta de cada clase entre el total de observaciones. Estas
nos permiten conocer la proporción correspondiente a cada
clase.
Clases Frecuencia Absoluta Frecuencia Relativa
28 – 36 1 1 / 40 = 0.025
37 – 45 9 9 / 40 = 0.225
46 – 54 12 12 / 40 = 0.30
55 – 63 11 11 / 40 = 0.275

22
Estadísticas Descriptivas

64 – 72 5 5 / 40 = 0.125
73 – 81 2 2 / 40 = 0.05

4.1.2.3 Frecuencia Acumulada

Para ciertos propósitos resulta más oportuno y de mayor


utilidad acumular las frecuencias absolutas o relativas. Esto
se puede efectuar sumándolas hacia abajo, para obtener una
distribución acumulada de “menos de” o hacia arriba lo que
produce una distribución acumulada “mas de”.

Clases Frecuencia Absoluta Frecuencia Acumulada


28 – 36 1 1 / 40 = 0.025
37 – 45 9 10 / 40 = 0.25
46 – 54 12 22 / 40 = 0.55
55 – 63 11 33 / 40 = 0.825
64 – 72 5 38 / 40 = 0.95
73 – 81 2 40 / 40 = 1.00

4. 2 Representación Gráfica de una Distribución de

Frecuencias

La distribución de frecuencias como tal no ofrece una visión muy


clara de los datos, por ello existen tres métodos comunes de
representar gráficamente una distribución de frecuencias como lo
es el histograma, el polígono y la ojiva de frecuencias.

23
Estadísticas Descriptivas

4.2.1 El Histograma
Es una gráfica de barras verticales agrupadas, donde la base
de cada barra es la amplitud de clase y la altura es
proporcional a la magnitud de la frecuencia.
Para construir un histograma, se define la escala horizontal
apropiada y en ella se marcan loa límites reales de clase.
Las frecuencias correspondientes se representan en la
escala vertical y esta debe empezar en cero, sin cortes ni
interrupciones.

Ejemplo:

Clase Frecuencia
50-59 9
60-69 13
70-79 18
80-89 15
90-99 5

24
Estadísticas Descriptivas

4.2.2 Polígono de Frecuencias

En el polígono de frecuencias se localiza un punto sobre el


punto medio de cada intervalo de clase. Luego se une cada
punto con trazos de semirrectas y la figura resultante es el
polígono de frecuencias.

25
Estadísticas Descriptivas

Ejemplo:

4.2.3 Polígono de frecuencias Acumuladas (“menos de”,


“más de”.

Para su construcción se siguen los mismos pasos que en el


polígono de frecuencias al unir los puntos con trazos de
semirrectas, pero no con los puntos medios sino con las
frecuencias acumuladas “menos de” o “más de”.

26
Estadísticas Descriptivas

Ejemplo:

4.2 Medidas de Tendencia Central

27
Estadísticas Descriptivas

4.2.1 Promedios Computados

4.2.1.1 Media Aritmética

Es la más conocida y la que comúnmente utiliza la mayoría


de las personas. Se representa por y se obtiene sumando
un conjunto de puntajes y dividiendo entre el total de ellos.

(Datos simples)

Su fórmula es =  x , donde = La media,  la


suma. n n= el número total.

Ejemplo:
Suponga que usted es un trabajador social en una agencia
que ofrece servicios de asistencia al anciano. Se le pide
proporcionar información para los archivos de la agencia
sobre el promedio de visitas al médico de siete ancianos
durante un año. El número de visitas respectivo para cada
uno es: 7, 8, 11, 4, 5, 13 y 7.
= 7 + 8 + 11+ 4 + 5 + 13 + 7 = 55 = 7.85  8 visitas
7 7

Interpretación:

Los ancianos efectúan en promedio 8 visitas anuales al


médico.

(Datos Agrupados)

28
Estadísticas Descriptivas

=  f pm, donde f = frecuencia; pm= punto medio y


N N = número de

Para su cálculo primero calculamos los puntos medios de


cada clase, luego se multiplican por la frecuencia
correspondiente a cada clase. Por ultimo se realiza la suma
de todas esas multiplicaciones y se divide entre el total de
datos.
Ejemplo: Edad de un grupo de 40 personas.
Intervalo f pm fpm
28 - 36 1 32 32
37 - 45 9 41 369
46 – 54 12 50 600
55 – 63 11 59 649
64 - 72 5 68 340
73 - 81 2 77 154
2144

=  f pm = 2144 = 53.6
N 40

Media geométrica

La media geométrica es utilizada en series de datos como


tipos de interés anuales, inflación, etc., donde el valor de
cada año tiene un efecto multiplicativo sobre el de los años
anteriores.

29
Estadísticas Descriptivas

Para su cálculo se eleva cada valor al número de veces que


se ha repetido. Se multiplican todo estos resultados y al
producto final se le calcula la raíz "n", donde "n" es el total
de datos de la muestra.

4.2.2 Promedios de Posición

4.2.2.1 Mediana

Es el valor de la serie de datos que se sitúa justamente en el


centro de la muestra (un 50% de valores son inferiores y
otro 50% son superiores).

Datos Simples:

Para calcular la mediana se debe atender a las siguientes


reglas:
1- Cuando la cantidad de datos es impar o sea n es impar,
la mediana es el valor del elemento que está en el
centro de los datos odenados.
2- Cuando n es par o sea la cantidad de datos es par, la
mediana es la media de los dos valores que están en el
centro. O sea usted suma estos dos valores y los divide
entre dos.
Ejemplo 1:
Sea la serie 4, 8, 5, 3. 2.

30
Estadísticas Descriptivas

Se ordenan los datos: 2, 3, 4, 5 y 8. La mediana es el


número 4.
Ejemplo 2:
Sean los datos ordenados: 2, 5, 7, 9, 13, 27 la mediana
sería: (7 + 9)/2 = 8

Datos Agrupados

El cálculo de la mediana para datos agrupados se efectúa


mediante la siguiente fórmula:

Md= L1 + (N/2 - fa ) C donde,


fmediana

L1= Límite Real Inferior del intervalo que contiene la


Mediana.
N/2= N° total de datos divido entre dos
 f a= Sumatoria de las frecuencias por debajo de la clase
que contiene la mediana.
fmediana= Frecuencia del intervalo que contiene la clase
mediana.
C = Amplitud del Intervalo.
Para la distribución de frecuencias anterior tenemos:

N/2 = 40/2 = 20, luego tenemos que la posición del dato

número 20 cae en el intervalo que va de 46 a 54 por lo que

tenemos: Md= L1 + (N/2 - fa ) C

f mediana

31
Estadísticas Descriptivas

Md = 45.5 + ( 20- 10) 9


12
= 45.5 + 7.5
= 53

4.2.2.2 Modo o Moda


Datos simples
La moda de una serie de números es aquel o aquellos
valores que más se repiten o sea el valor más común.
Puede no existir en algunos casos y también puede existir
más de una moda.
Ejemplo:
En la series siguientes encontrar la moda:
a) 2, 4 6 , 8 , 10. No hay moda, no se repite ningún valor.
b) 2, 3, 3, 4, 5, 5, 6, 7. La moda es el 3 y el 5.
c) 4, 5, 5, 6, 7 , 9. La moda es el número 5.

Datos Agrupados.
La fórmula es la siguiente:
Moda = Li + 1 c
1 + 2 donde:
Li= Límite real inferior de la clase que contiene la moda.
1= Exceso de la frecuencia modal sobre la clase contigua
inferior.
2= Exceso de la frecuencia modal sobre la clase contigua
superior.

32
Estadísticas Descriptivas

C = tamaño del intervalo.


Ejemplo:
El intervalo que va de 46- 54 tiene frecuencia 12 y es la
más alta. Luego calculamos los valores de 1 y 2:
1 = 12 – 9 = 3 y 2 = 12 – 11 = 1
Por lo que tenemos:
Moda = Li + 1 . c
1 + 2
= 45.5 + 3 9
3+ 1
= 45.5 + 6.75
= 52.25

4.3 Relación entre los promedios


La Media:
Se utiliza con datos de intervalo o de razón. Su cálculo se efectúa
sin ordenar los datos. Sirve para realizar procedimientos estadísticos
como comparación de las medias a partir de varios conjuntos de
datos. No es útil cuando poseemos intervalos de clases abiertas.

La Mediana:
Es adecuado para usarse con datos ordenados; cuando la
distribución contiene clases abiertas y cuando existen valores
excepcionalmente grandes o pequeños.

33
Estadísticas Descriptivas

La Moda:
Puede utilizarse cuando la distribución presenta clases abiertas.
Su importancia radica en que puede ser utilizada para datos cualitativos
y también cuantitativos. Se usa menos que la mediana y la media y
presenta el inconveniente de que algunas veces no existe el valor modal
y otras veces todos los valores son la moda ya que ocurren el mismo
número de veces.

4.4 Medidas de Dispersión

Estudian la distribución de los valores de la serie, analizando si


estos se encuentran más o menos concentrados, o más o menos
dispersos.

4.4.1 Medidas de Dispersión Absolutas

4.4.1.1 El Rango

Mide la amplitud de los valores de la muestra y se calcula


por diferencia entre el valor más alto y el valor más bajo.

4.4.1.2 Varianza

Mide la distancia existente entre los valores de la serie y la


media. Se calcula como sumatoria de las diferencias al
cuadrado entre cada valor y la media, multiplicadas por el
número de veces que se ha repetido cada valor. La

34
Estadísticas Descriptivas

sumatoria obtenida se divide por el tamaño de la muestra


menos un valor (n-1).

Su fórmula para datos simples es:

S2 =  (Xi - )2
n-1

Para datos agrupados:

S2 =  fi (Xi - )2 Para el caso de varianza muestral.


n-1

La varianza siempre será mayor que cero. Mientras más se


aproxima a cero, más concentrados están los valores de la
serie alrededor de la media. Por el contrario, mientras
mayor sea la varianza, más dispersos están.

Ejemplo:

Dados los siguientes valores de la siguiente muestra


encontrar la Varianza: 4, 9, 8, 3, 6.

1- Primero calculamos la media

= 4 + 9 + 8+ 3 + 6 = 30 = 6
5 5
Después reemplazamos en la fórmula de la varianza muestral:

S2 = ( 4 - 6)2 + ( 9 - 6)2 + (8 - 6)2 + (3 - 6)2 + ( 6 - 6)2


4

35
Estadísticas Descriptivas

= 4 + 9 + 4 + 9 + 0 = 26 = 6.5
4 4

Obtenemos que la varianza muestral es S2 = 6.5

Datos Agrupados
Intervalo f pm f(pm- X)2 f(pm- X)2 f(pm- X)2
28 - 36 1 32 1(32-53.6)2 1 (466.56) 466.56
37 – 45 9 41 9(41-53.6)2 9 (158.76) 1428.84
46 – 54 12 50 12(50-53.6)2 12 (12.96) 155.52
55 – 63 11 59 11(59-53.6)2 11 (29.16) 320.76
64 - 72 5 68 5(68 – 53.6)2 5 (207.36) 1036.80
73 - 81 2 77 2(77 – 53.6)2 2 (547.56) 1095.12
4503.60

S2 =  fi ( pm - )2 = 4503.60 = 115.48
N–1 39

4.4.1.3 Error estándar o Desviación estándar

Se calcula como raíz cuadrada de la varianza.

Por lo que la desviación estándar del ejemplo anterior sería:

S=  6.5 = 2.55

4.2 Medidas de Dispersión Relativa


4.4.2.1 Coeficiente de Variación
Se calcula como cociente entre la desviación típica y la
media. La importancia del coeficiente de variación es que al
ser un porcentaje permite comparar el nivel de dispersión
de dos muestras; lo que no ocurre con la desviación típica,

36
Estadísticas Descriptivas

ya que viene expresada en las mismas unidas que los datos


de la serie.
El coeficiente de variación indica la importancia de la
desviación estándar en relación al promedio aritmético y
cuya definición se representa en la siguiente fórmula:

Coeficiente de
variación = Desviación estándar x 100 = S x 100
Media aritmética

4.5 Medidas de Asimetría


4.5.1 Coeficiente de Asimetría de Pearson
La medida más común de asimetría es el coeficiente de asimetría
de Pearson definidos por:
1- C. A = Media - Modo =  - Mo
x x

2- C. A= 3( Media - mediana ) = 3 (  - Md )
x x

1- En una distribución simétrica la media y mediana coinciden..

37
Estadísticas Descriptivas

2- La distribución también puede ser asimétrica, positiva o


negativa. Esto quiere decir que puede presentar un sesgo ya sea a
la derecha o a la izquierda, en estos casos las medidas de
tendencia central son desiguales.

3- Cuando la distribución es asimétrica hacia la derecha la media


es menor que la mediana y la mediana mayor que la moda..

4- Cuando la distribución es asimétrica hacia la izquierda la


media es menor que la mediana y que la moda. La moda posee
entonces el mayor valor.

38
Estadísticas Descriptivas

4.5.2 Coeficiente de asimetría basado en momentos


Los momentos se definen como medidas de potencias de variable.
Se consideran cuatro clases de momentos.
a- Momentos respecto a la variable.
b- Momentos respecto a la media.
c- Momentos respecto a un origen de trabajo.
d- Con respecto a un origen de trabajo tomados en
unidades de intervalo.

4.6 Medida de Apuntamiento o Curtosis


El Coeficiente de Curtosis analiza el grado de concentración que
presentan los valores alrededor de la zona central de la distribución
Según su grado de curtosis se definen 3 tipos de distribuciones:

Distribución mesocúrtica: presenta un grado de concentración medio


alrededor de los valores centrales de la variable (el mismo que presenta
una distribución normal).

39
Estadísticas Descriptivas

Distribución leptocúrtica: presenta un elevado grado de concentración


alrededor de los valores centrales de la variable.

Distribución platicúrtica: presenta un reducido grado de concentración


alrededor de los valores centrales de la variable.

40
Estadísticas Descriptivas

PRÁCTICA N°1
1- Indique en el espacio en blanco cuál serie es cualitativa y cuál cuantitativa:
a) Distribución de alumnos por nacionalidad_______________________.
b) Distribución de profesionales por sueldo _______________________.
c) Distribución de los empleados por mes de nacimiento______________.
d) Distribución de profesionales por estatura ______________________.
e) Distribución de alumnos por color de piel _______________________.

2- Señale si las variables que se presentan son discretas o continuas.


a) N° de hermanos por alumnos __________________
b) Peso en Kg ____________________
c) Sueldo Bruto ___________________
d) Compras de Jeans por marca ___________________
e) N° de accidentes de tránsito en Panamá _____________________

3- Una fábrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se


utiliza un test de aceptación del nuevo sabor y se aplica a treinta niños de
ambos sexos de 5 a 12 años de edad que viven en Llano Marín.
Población: _______________________________________
Muestra: ________________________________________

4 - Presente usted un ejemplo en el cual señale cuál es la población e indique


cual sería la muestra.

41
Estadísticas Descriptivas

PRÁCTICA N° 2

1-Los siguientes datos corresponden a los casos de Malaria registrados en EL


Salvador en cuatro zonas distintas: Zona 1, 22 casos ( 15 h, 7m); zona 2, 14
casos (8h, 6m); zona 3, 8 casos ( 3h , 5m); zona 4, 16 casos ( 10h, 6m).
Construya el cuadro estadístico y una gráfica de barras comparadas.

2- De 80 alumnos matriculados en una escuela, 48 son Kunas ( 24h, 24f), 12


Teribes (10h, 2f) , 16 Noble Guble(6h, 10f) y 4 son Emberá(3h, 1f). Construya
el cuadro estadístico y una gráfica de barras comparadas.

3- Señale los errores que presenta el cuadro estadístico, reestructurelo y


realice el gráfico que más se ajusta a los datos:
Tipo de sangre de los pacientes según enfermedad del Instituto
Oncológico Nacional. Año 1998.

Tipo de Sangre Total Enfermedad


Ulcera Péptica Cáncer Gástrico
Total....
200
O 98 55
A 38 47
B 17 10
Fuente: Universidad de Panamá, 2001.

42
Estadísticas Descriptivas

4- Se presenta a continuación la siguiente información:


Balance General de muertos y heridos graves en el año 2001 según tipos
penales.

Figura Penal Heridos Graves Muertos


Homicidio doloso 21 142
Robos con violencia o
Intimidación 85 14

Violaciones 44 6
Detención ilegal 49 3

Reestructure esta información en un cuadro estadístico y realice el gráfico que


usted estime es más conveniente para los datos presentados. Interprete en
forma sencilla la información presentada.

5- Señale los errores que contiene el cuadro y reestructurelo siguiendo los


pasos establecidos para la construcción de cuadros estadísticos.

Según sexo de población, 2000 estudiantes universitarios


Por lugar de procedencia en Panamá. Año 1998
Lugar de Procedencia Total Masculino Femenino
Urbana 240 100 140
Rural 360 200
Suburbana 1400 576 824
Total.... 2000 836
Fuente: Instituto Panameño de Turismo.

Práctica N°3

43
Estadísticas Descriptivas

1- En una encuesta aplicada a 40 detenidos que se encuentran en la Cárcel La


Joya se les preguntó que cuantos años de sentencia tienen que cumplir. Las
respuestas fueron las siguientes:
6 2 8 8 4 11 7 5 17 11
10 4 9 10 5 12 6 5 8 13
3 10 18 8 3 20 18 5 15 7
20 15 4 15 8 3 20 10 12 10
a) Agrupe estas cifras en una distribución de frecuencias que tenga cuatro
clases, grafique el Histograma e interprételo.

2- En relación al problema anterior en dicha encuesta también se les preguntó


a los detenidos su edad en años cumplidos, las respuestas son las
siguientes:
20 52 47 36 49 21 39 37 40 24
40 35 31 48 42 45 36 25 22 51
28 47 33 28 39 25 50 41 38 27
27 23 38 41 26 35 42 52 45 29
a) Agrupe estas cifras en una distribución de frecuencias, grafique el
polígono y la ojiva e interprételos.

3- En una clase se aplicó a niños con dificultades de aprendizaje una prueba de


lectura de 100 palabras, los resultados fueron los siguientes:
46 48 64 76 78 54 39 80 48 60 64 59
62 57 57 61 63 68 72 64 57 59 65 68
67 71 72 75 94 86 41 68 67 61 69 76
65 66 27 68 67 61

44
Estadísticas Descriptivas

a) Agrupe estos números en una distribución de frecuencias. Grafique el


Histograma y el Polígono

4- Los siguientes datos son las edades de una muestra de 25 vendedores


ambulantes de lotería en Natá y en Aguadulce.

Nata Aguadulce
23 63 25 22 38 43 26 30 27 23
56 31 30 56 30 35 31 25 27 48
25 48 25 27 35 34 45 36 38 23
38 26 40 39 30 35 44 24 33 40
40 32 40 38 33 28 23 31 37 28
a) Construya la distribución de frecuencias para las edades de los vendedores
de lotería de ambos distritos.
b) Construya el histograma, el polígono y la ojiva.

5- Dadas las siguientes puntuaciones:


112 73 126 82 92 115 95 84 68 100
72 92 128 104 108 76 140 119 98 85
69 76 118 132 96 91 81 113 115 94
97 86 127 134 100 102 80 98 106 106
107 73 124 83 92 81 106 75 95 119

a) Agrupe estos datos en una distribución de frecuencias.


b) Grafique el histograma y la ojiva más de.

45
Estadísticas Descriptivas

Práctica N°4

1- Dada la siguiente información calcule las medidas de tendencia central y de


dispersión.
Salarios Semanales de 100 Trabajadores no Calificados
Salarios Frecuencias
140 - 159 7
160 - 179 20
180 - 199 33
200 - 219 25
220 - 239 11
240 - 259 4

2- Se le aplicó un test de aptitud para medir los puntajes obtenidos por los dos
grupos de jóvenes:
Grupo 1: 1.0 7.5 4.5 5.0 2.0 2.5 3.5 6.0
Grupo 2: 6.0 7.5 8.0 7.0 6.5 6.0 5.5 5.0
Calcule las medidas de tendencia central y de dispersión para los dos grupos.

3- Características demográficas y de servicio social de 12 miembros de un


asilo

Edad Visitas al médico ingreso mensual género


84 5 $2347 M
71 7 2434 M
73 12 1636 F
87 4 1963 M
76 8 2358 F
69 9 1968 F
79 7 2683 M

46
Estadísticas Descriptivas

83 5 2434 M
78 7 1968 M
69 6 2434 F
88 12 1950 F
85 7 1500 F

Suponga que usted es un trabajador social en una agencia que ofrece servicios
de asistencia al anciano. Se le pide proporcionar algunas estadísticas
descriptivas para los archivos de la agencia durante un mes.
a) calcule la edad media, mediana y modal
b) calcule la media, mediana y moda de las visitas al médico y del ingreso
mensual.
c) ¿Qué porcentaje de la muestra del asilo son mujeres?, ¿ Qué porcentaje
de la muestra ha pasado la edad de 80 años?.

4- Un economista del Banco Mundial tiene datos sobre el consumo anual de


mariscos por familia, en kilogramos, de las dos regiones en que se divide su
país: Zona costera y zona central. Estos datos fueron recogidos en una
encuesta por muestreo. Para la zona central ya se han calculado algunas
medidas de posición obteniéndose: media aritmética = 8.4; Mo = 6.1 y
Mediana = 7.4. Se sabe además, que el número total de familias en la zona
central es de 200000 y que ellas representan un 40% de las familias del país.
Consumo Mensual Número de familias encuestadas
En Kilogramos Zona Central Zona Costera
1a3 25 6
4a6 100 75
7a9 88 50
10 a 12 40 30
13 a 15 22 20

47
Estadísticas Descriptivas

16 a 18 18 10
19 a 21 7 9
a) Realice una comparación gráfica entre las dos distribuciones incluidas.
Tome todas las providencias del caso para que la comparación sea
cómoda y válida.
b) ¿Dónde es más variable el consumo de mariscos, en la zona central o en
la zona costera?.

5- En un estudio se pregunta a 12 niños cuántas horas al día ven televisión.


Sus respuestas son las siguientes:
Niño 1 2 3 4 5 6 7 8 9 10
Horas TV 2 5 3 3.5 2 4 3 4 5 3
Encuentre las medidas de tendencia central y de dispersión. Calcule el
coeficiente de variación e interprete su resultado.

6- Dado el sistema de números:


a) 2, 2, 5, 7, 9, 9, 9, 10, 10, 11
b) 3, 5, 7, 10, 12, 13, 16 y 17
c) 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 8 y 9
Encuentre la mediana y la Moda.

7- Dada la siguiente distribución de frecuencias de datos agrupados de los


tiempos libres que dedicaron 80 estudiantes de una Universidad a distintas
actividades durante una semana de clases normal.
a) Calcule la media y la moda.
b) Calcule la varianza y la desviación estándar.

48
Estadísticas Descriptivas

Horas f
10-14 8
15-19 28
20-24 27
25-29 12
30-34 4
35-39 1

8- Construya la distribución de frecuencias correspondiente a los datos que se


refieren a los pesos en kilogramos de ventas de carne de res en una carnicería.

Pm fpm
35 140
42 378
49 588
56 392
63 252
70 210
77 77
a) Calcule la media, median, moda, varianza, desviación estándar y grafique
la ojiva.

49
Estadísticas Descriptivas

Bibliografía

Carrasquilla, Pedro: Manual para la confección de Gráficos


Estadísticos. Contraloría General de la República. Dirección de
Estadística y Censo. Tercera edición. 1990.

Contraloría General de la República. Dirección de


Estadística y Censo. Manual para la confección de
Cuadros Estadísticos. Tercera edición. 1990.

Daniel, Wayne. Estadística con aplicaciones a las


ciencias sociales y a la educación. McGraw-Hill.
Colombia, 1981

Glass y Stanley. Métodos estadísticos aplicados a las


ciencias sociales. Editorial Prentice-Hall. México. 1986.

Gómez B, Miguel. Elementos de Estadística Descriptiva:


Editorial Universidad Estatal a Distancia. San José, Costa
Rica. 1999.

Levin, Jack. Fundamentos de Estadística en la


Investigación Social. Editorial Harla. México, 1979.

Pagano, Robert. Estadística para las Ciencias del


Comportamiento. Internacional Thomson Editores.
México, 1999.

Peña; Romo. Introducción a la Estadística para las


Ciencias Sociales. McGraw-Hill. ESPAÑA ,1999.

Ritchey, Ferris. Estadística para las Ciencias Sociales.


McGraw-Hill. México, 2001.

50

También podría gustarte