Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Organización y Presentación de Datos (Tema II)

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 33

Fundamentos de Estadística (Est-110)

Prof. Gercy Mateo


CONTENIDO
Organización y Presentación de Datos

Objetivos Generales

Al terminar de estudiar este tema, el estudiante podrá:

1. Organizar datos originales en una distribución de frecuencias.


2. Presentar la distribución de frecuencias en un histograma, un polígono de
frecuencia, un polígono de frecuencia acumulada.
3. Presentar datos utilizando gráficos de barras, de sectores , de líneas , etc.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
 Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Una
colección de datos se conoce como conjunto de datos; una sola observación es un dato
puntual.
 Para que los datos sean útiles, necesitamos organizar nuestras observaciones de modo
que podamos distinguir patrones y llegar a conclusiones lógicas.
 Organizar los datos tiene como fin permitirnos ver rápidamente algunas de las
características de los datos recogidos. Buscamos cosas como el alcance (los valores
mayor y menor), patrones evidentes, alrededor de qué valores tienden a agruparse los
datos, qué valores aparecen con más frecuencia, etc. Cuanta más información de este
tipo podamos obtener de una muestra, mejor entenderemos la población de la cual
proviene, y mejor será nuestra toma de decisiones.

Es importante cumplir con algunas normas relativas a la construcción de una tabla de frecuencias
cuantitativa, pues la no aplicación de las mismas puede conducir a graves errores de cálculo durante la
etapa siguiente de análisis y posteriormente en la etapa de conclusiones e interpretaciones.
RAZON
Es el cociente entre dos números o cantidades.

Ejemplo:

Así por ejemplo, si A y B son dos números, la razón entre esos dos números viene definida
de la manera siguiente:
𝐴 (𝑒𝑠 𝑒𝑙 𝑎𝑛𝑡𝑒𝑐𝑒𝑑𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑎𝑧ó𝑛)
𝑅𝑎𝑧ón =
𝐵 (𝑒𝑠 𝑒𝑙 𝑐𝑜𝑛𝑠𝑒𝑐𝑢𝑒𝑛𝑡𝑒 𝑑𝑒 𝑙𝑎 𝑟𝑎𝑧ó𝑛)
Ejemplo: Si un vehículo A recorre una determinada distancia a una velocidad de 80
kilómetros por hora, mientras que otro vehículo B lo hace a 32 kilómetros por hora,
entonces, la razón de A respecto a B, es: A / B = 80 / 32 = 2.5; lo cual quiere decir que la
velocidad de A fue 2.5 veces la de B, o que, A recorrió 2.5 Kilómetros por cada kilometro
recorrido por el auto B. La cantidad B es la base de comparación y para efectos de cálculo
se hizo igual a la unidad; por lo tanto también puedo afirmar que cuando B recorre 1
kilómetro, A ha recorrido 2.5 kilómetros.
PORCENTAJE
Es una medida sencilla que se obtiene al multiplicar por 100 el cociente entre dos números.
Es importante señalar que los porcentajes, ¨son simplemente casos especiales del
concepto más general de las proporciones¨, siendo una proporción la igualdad de dos
razones. (Introducción a la estadística elemental aplicada. Tomo I. César Familia), pág. 282

Ejemplo:

 Según el ejemplo de la diapositiva anterior, la velocidad de A respecto a B será: (80 /


32)*100 =250; lo cual significa que la velocidad de A fue el 250% de la velocidad de B.
Como la cantidad B es la base de comparación y para efectos de cálculo se hizo igual a
100, entonces puedo también afirmar, que por cada 100 kilómetros de distancia
recorridos por B, la distancia recorrida por A es de 250 kilómetros.

En el caso de la proporción, suponga que una venta tiene un 30% de descuento; esto
sígnifica, que de cada 100 pesos se le descontarán 30 pesos, es decir:

30 450
= Se lee ¨30 es a 100, como 450 es 1500¨
100 1500
TASA
Es una razón donde dividendo y divisor se refieren a valores diferentes.

Dependiendo de la naturaleza de los datos que se relacionan, las tasas más usuales pueden
ser calculadas para datos de tipo financiero, o datos de tipo socio-demográfico.

Las tasas para datos de tipo demográfico son utilizadas para medir el comportamiento de los
eventos demográficos, los cuales se presentan a través de estadísticas vitales-demográficas
que expresan la estructura y composición de la población y eventos asociados a la mismas
tales como nacimientos, defunciones, matrimonios, divorcios, salud-enfermedad.

Desde el punto de vista demográfico, es una razón donde el dividendo es la cantidad de


casos favorables a un evento dado y el divisor es la población que habita la comunidad
donde aconteció dicho evento (provincia, municipio, barrio, sector, país) en un tiempo o
periodo determinado. Generalmente se simboliza mediante la expresión siguiente:
𝐴 Donde,
𝑇𝑎𝑠𝑎 = ×𝐿
𝑁𝑡 A = Frecuencia del hecho o evento con determinado atributo
Nt= Población de una comunidad (provincia, municipio, etc.) en un tiempo t.
L= Constante que puede ser igual a 100; 1,000; 10,000 etc., dependiendo de la cantidad de casos
que forman el hecho o evento (A) y la cantidad de casos que forma la población.

Conviene aclarar que la población utilizada como denominador , se toma a la mitad del periodo (si se trata de un año, se toma al 1ro. De julio de cada año).
TASA
• Tasa de fecundidad en madres de cierto grupo de edad, respecto a la población de
mujeres en dicho grupo de edad.
• Tasa de desempleo, que relaciona el número de desempleados, respecto al denominador
que en éste caso es la población económicamente activa.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
 Clase (C): son cada uno de los grupos que definen una distribución de frecuencias.
Cada clase contiene un límite inferior y otro superior.
 Clase Abierta: es aquella que no tiene límites determinados. Ej.: > 24
 Límites de Clase: son los valores que determinan a una clase.
✓ Límite Inferior (Li): es el que está a la izquierda de la clase.
✓ Limite Superior (Ls): es el que está a la derecha de la clase.

 Marca de Clase o Punto Medio (Xi): es el valor que representa a una clase. Es el valor
que está en el centro de la clase.
𝐿𝑖 + 𝐿𝑠
𝑥𝑖′ =
2
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS

1.) Rango o recorrido, que simbolizamos por R y que equivale a la diferencia entre el mayor y
el menor valor del conjunto.
R = Xmáximo - Xmínimo
2.) Número de Clases (K), el número de clase en una distribución de frecuencias es algo
arbitrario. Algunos autores recomiendan el uso de entre 5 y 20 clases, otros recomiendan
entre 5 y 15. Muy pocas clases no revelaran ningún detalle sobre los datos y demasiadas
clases serían tan confuso como la misma lista de datos originales. Por razones de
conveniencia, puede utilizarse un número mayor o menor de clases. El número de clases,
puede también determinarse, aplicando la regla de STURGES pero ésta no es de obligatoria
utilización. La fórmula de Sturges es la siguiente:
K=1+3.322 log n
3.) Intervalo de Clase (IC), es el rango de valores encontrados dentro de una clase. Se
determina dividiendo el rango entre el número de clase.

R
IC= K = , o lo que es lo mismo… Xmáximo - Xmínimo
1+3.322 log n
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Ejercicio:
 Los datos a continuación corresponden a datos brutos sobre edades de profesores,
Distrito escolar 10-03 RD, agosto de 2012. (Sin ordenar).

77 18 63 84 38 54 50 59
¿Que nos dicen estos datos?
54 56 36 26 50 34 44 41 ¿Reflejan algún patrón?
58 58 53 51 62 43 52 53 ¿Puede usted tomar alguna decisión en
63 62 62 65 61 52 60 60 base a esta distribución?
45 66 83 71 63 58 61 72

18 41 50 53 58 61 63 71 ¿Que nos dicen estos datos? La edad


más baja de los profesores es 18 años,
26 43 51 54 58 61 63 72 y la más alta es 84 años.
34 44 52 54 59 62 63 77 ¿Reflejan algún patrón? No
36 45 52 56 60 62 65 83 ¿Puede usted tomar alguna decisión en
base a esta distribución? No
38 50 53 58 60 62 66 84
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
2do. Tomando en cuenta las definiciones anteriores, realizamos los siguientes
cálculos:
18 41 50 53 58 61 63 71
26 43 51 54 58 61 63 72
1) Rango o recorrido: 34 44 52 54 59 62 63 77
36 45 52 56 60 62 65 83
R = Xmáximo - Xmínimo = 84-18= 66 38 50 53 58 60 62 66 84
n es igual al número
de observaciones

2) Número de Clases (K):


K=1+3.322 log n = 1+(3.322 *1.60)=1+5.315= 6.315, aproximadamente 6

3) Intervalo de Clase:

IC= R = 66 = 11
K 6
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
3ro. Tomando estas medidas en cuenta, elaboramos la Distribución de Frecuencias:
Distribución de Frecuencia:
Es práctica común hacer que el límite inferior de la primera clase sea uno ligeramente
menor o igual que la primera o más baja observación, y hacer que todas las clases tengan
el mismo ancho o amplitud.
…..obsérvese que no se traslapan, es decir, no hay duda del sitio en que se encontrara
cada valor.
…..Los intervalos de clase desiguales ofrecen problemas al representarse en forma gráfica.
Sin embargo, en algunos casos pueden ser necesarios intervalos desiguales de clase, para
evitar un gran número de clases vacías, o casi vacías.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
18 41 50 53 58 61 63 71
26 43 51 54 58 61 63 72
34 44 52 54 59 62 63 77
[18-29) 18,26 2 36 45 52 56 60 62 65 83
[29-40) 34,36,38 3 ❖ El corchete indica que el valor 18 38 50 53 58 60 62 66 84
esta incluido en el intervalo.
[40-51) 41,43,44,45,50,50 6
❖ El paréntesis, indica que el valor 29
[51-62) 51,52,52,53,53,54,54,56,58,58,58,59,60,60,61,61 16
no esta incluido en el intervalo.
[62-73) 62,62,62,63,63,63,65,66,71,72 10
[73-84) 77,83,84 3

➢ Una distribución de frecuencias es una tabla en la que se organizan los datos en


clases, es decir, en grupos de valores que describen una característica de los datos.
➢ Una distribución de frecuencias muestra el número de observaciones del conjunto de
datos que caen en cada una de las clases.
➢ Una distribución de frecuencia relativa expresa la frecuencia en una clase como
una fracción o un porcentaje del número total de observaciones.
➢ Una frecuencia acumulada ¨Menor que¨ se construye sumando las frecuencias de
cada clase. Una frecuencia acumulada ¨Mas que¨ se forma restando las frecuencias
de las clases anteriores.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Li fi fri Fa (-) Fa (+) Fra (-) Fra (+) fr Fra(-) Fra(+)
1 [18-29) 2 0.05 2 40 0.05 1.00 2/40=0.05 2/40=0.05 40/40=1.00
2 [29-40) 3 0.08 5 38 0.13 0.95 3/40=0.08 5/40=0.13 38/40=0.95
3 [40-51) 6 0.15 11 35 0.28 0.88 6/40=0.15 11/40=0.28 35/40=0.88
16/40=0.40 27/40=0.68 29/40=0.73
4 [51-62) 16 0.40 27 29 0.68 0.73
10/40=0.25 37/40=0.93 13/40=0.33
5 [62-73) 10 0.25 37 13 0.93 0.33 3/40=0.08 40/40=1.00 3/40=0.08
6 [73-84) 3 0.08 40 3 1.00 0.08
Total 40 1.00 - - - -

fi = 16, Significa que, 16 profesores tienen entre 51 y 61 años.


fri = 0.40, significa que, un 40% de los profesores tienen entre 51 y 61 años.
Fa (-) = 27, significa que, 27 profesores tienen menos de 62 años.
Fa (+) = 29, significa que, 29 profesores tienen 51 o más años.
Fra (-) = 0.68, significa que, el 68% de los profesores tienen menos de 73 años.
Fra (+)= 0.73, significa que, el 73% de los profesores tienen 51 o más años.
ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Li fi fri Fa (-) Fa (+) Fra (-) Fra (+)
[18-29) 2 0.05 2 40 0.05 1.00
[29-40) 3 0.08 5 38 0.13 0.95
[40-51) 6 0.15 11 35 0.28 0.88
[51-62) 16 0.40 27 29 0.68 0.73
[62-73) 10 0.25 37 13 0.93 0.33
[73-84) 3 0.08 40 3 1.00 0.08
Total 40 1.00 - - - -

Li ′
=
+ Punto medio o
[18-29) 23.5
Marca de clase:
[29-40) 34.5 (18+29)/2=23.5
[40-51) 45.5 (29+40)/2=34.5
[51-62) 56.5
[62-73) 67.5 (40+51)/2=45.5
[73-84) 78.5 …
Total -


ORGANIZACIÓN Y PRESENTACIÓN DE DATOS
Un aspecto de gran importancia que debemos subrayar en este proceso, es el que trata sobre la
relación que presenta la regla de Sturges con el redondeo del valor fraccionario del intervalo de
clase o amplitud (IC). Cuando la fracción de dicho intervalo es menor que la mitad de la unidad,
el valor entero del intervalo no se incrementa, lo que NO da oportunidad de incluir el valor mayor
de la distribución de frecuencias. Como es el caso de la situación a) 1ra. situación; el valor
máximo es 80 años, y debido a que se eliminaron las fracciones que acompañaban al valor
entero antes de su redondeo queda fuera. Igualmente, sucede con los intervalos que arrojan
como resultado un valor entero, es decir, que no tienen cifras decimales (caso b, 2da.
situación). Estas situaciones dan lugar a que la última clase de la distribución de frecuencias
posea un intervalo desigual a los demás, ya que debemos incluir las observaciones faltantes.

(Introducción a la estadística elemental aplicada. Tomo I. César Familia), pág. 151


Distribución de frecuencias cualitativa
A un grupo de 15 estudiantes universitarios se les
pregunto sobre su carrera.

Pedagogía Ingeniería Pedagogía


Pedagogía Administración Administración Dividimos cada valor de la
frecuencia absoluta entre el
Mercadeo Ingeniería Administración
total de observaciones (n=15)
Administración Mercadeo Pedagogía
Contabilidad Mercadeo Pedagogía

Organizamos los datos de acuerdo a la carrera Multiplicamos la frecuencia relativa


Fecuencia Frecuencia Frecuencia por 100 (0.33*100=33%).
Carrera
Absoluta (fi) Relativa (fri) Porcentual
Pedagogía 5 0.33 33%
Administración 4 0.27 27%
Contabilidad 1 0.07 7%
Ingeniería 2 0.13 13%
Mercadeo 3 0.20 20%
Total 15 1.00 100%

Contamos el número de
repeticiones de cada una
de las carreras.
TIPOS DE PRESENTACIÓN DE DATOS
➢ Presentación Textual: esta es la forma escrita habitual de presentar un documento o
informe.
➢ Presentación Tabular (Cuadros o tablas estadísticas): Consiste en la disposición de
datos en filas y columnas.
➢ Presentación grafica.
➢ Presentación semi-tabular.
TIPOS DE PRESENTACIÓN DE DATOS
Cuadros o tablas estadísticas
Consiste en la disposición de datos en filas y columnas.
➢ Características de un cuadro estadístico:
✓ Para que un cuadro sea de fácil interpretación debe poseer algunas características tales
como:
1. Titulo
En pocas palabras el titulo expresa el contenido del cuadro, para que este sea
fácilmente entendido debe poseer dos condiciones básicas:
I. ser completo y
II. ser lo más breve y conciso posible.
Para que se considere completo debe poseer las siguientes características, que
permiten su fácil interpretación y análisis a saber:

¿Qué? Se refiere al objeto o sujeto del cuadro


¿Cómo? Indica la forma en como están clasificados los datos
¿Dónde? Indica el país, región, continente a que pertenecen los datos
¿Cuándo? Se refiere a la dimensión del tiempo a que están reflejados los datos
TIPOS DE PRESENTACIÓN DE DATOS
Cuadros o tablas estadísticas
REPÚBLICA DOMINICANA: Nacimientos registrados por
año de ocurrencia, según grupo de edad de la madre al Titulo
momento del nacimiento de hijo (a), 2001-2014

Edad de la madre al momento del Año de ocurrencia Encabezado


nacimiento del hijo (a) 2001 2014
Total 188,844 138,224
Menor a 15 años 2,725 397
15-19 38,672 21,589
20-24 58,892 44,548
Columna Matriz

25-29 45,160 35,347


30-34 25,772 22,850 Cuerpo
35-39 10,442 9,653
40-44 2,661 2,058
45-49 495 157
50 años y más 262 129 *
No especificada 3,763 1,496
Fuente: Datos registrados en las Oficialías del Estado
Civil de la República Dominicana
* Menor cantidad de nacimientos Notas aclaratorias
TIPOS DE PRESENTACIÓN DE DATOS
Representación de Tallo y Hoja
Hasta este momento, se mostró como organizar datos en una distribución de frecuencias a
fin de resumir los datos originales en forma significativa. Una desventaja de este enfoque
hacia la investigación de datos, es la perdida de información por efectuar los conteos. Por
ejemplo, no está clara, a partir de la distribución de las edades de los profesores la forma
en que se distribuyen dichas edades en el grupo 40-51. ¿Están agrupados muy cerca de
los 40 años o se distribuyen de manera más o menos uniforme a través de toda la clase?
Una técnica que compensa la perdida de información que ocurre al resumir datos
originales, se denomina representación de tallo y hoja. Para elaborar tal representación se
utilizan las edades de los excursionistas, se remplaza una marca por el último digito de la
edad de un excursionista. Las edades de los seis excursionistas de la clase de 40-51,
aparecen entonces como:
TIPOS DE PRESENTACIÓN DE DATOS
Representación de Tallo y Hoja
Una técnica que compensa la perdida de información que ocurre
al resumir datos originales, se denomina representación de tallo y 4 1 3 4 5
hoja. Para elaborar tal representación se utilizan las edades de los 5 0 0
profesores, se remplaza una marca por el último digito de la edad
de un profesor. Las edades de los diez profesores de la clase de
Tallo
40-51, aparecen entonces como: Hojas

Distribución completa
1 8
[18-29) 18,26 2 6
[29-40) 34,36,38 3 4 6 8
4 1 3 4 5
[40-51) 41,43,44,45,50,50
5 0 0 1 2 2 3 3 4 4 6 8 8 8 9
[51-62) 51,52,52,53,53,54,54,56,58,58,58,59,60,60,61,61 6 0 0 1 1 2 2 2 3 3 3 5 6
[62-73) 62,62,62,63,63,63,65,66,71,75 7 1 5 7
[73-84) 77,83,84 8 3 4
TIPOS DE PRESENTACIÓN DE DATOS
Presentación gráfica
El uso cualquiera de los gráficos depende de:

✓ El tipo de variable que se está estudiando.


✓ De la referencia del investigador.

Igual que los cuadros, las gráficas deben poseer algunas características que faciliten
su interpretación y su análisis.
 Titulo.
 Grafico propiamente dicho.
 Escala.
 Leyenda o símbolo.
 Fuentes.
TIPOS DE PRESENTACIÓN DE DATOS
Presentación gráfica
El tipo de gráfico a utilizar depende de la información y de cómo se quiera
presentarla. A continuación se explican los principales tipos de gráficos y sus
propósitos.

 Circular: Utilizado cuando se desea mostrar la relación entre las partes de un todo.
 Barras: Se utiliza para comparar valores en un punto dado del tiempo.
 Columnas: Similar al gráfico de barras; es usado para enfatizar la diferencia entre
diferentes valores.
 Líneas: Permite enfatizar la evolución y el cambio de distintos valores en el tiempo.
Superficie: Similar al de líneas; es útil para hacer notar la cantidad de cambios en los
valores graficados.
TIPOS DE PRESENTACIÓN DE DATOS
Presentación gráfica

Los gráficos más importantes son los que se detallan a continuación y


pueden representarse en cifras absolutas o relativas:
A. BARRAS SIMPLES. Estos pueden ser en valores absolutos o relativos. Igualmente las
barras pueden ser verticales u horizontales. Para datos cualitativos se prefieren las
barras horizontales.
B. BARRAS COMPONENTES. Estas implican que las barras son acumulativas, es decir la
barra total se refiere a un todo y las barras parciales son las partes que conforman el
todo.
C. BARRAS COMPUESTAS. Estas, implican que el todo está conformado por un conjunto
de barras contiguas.
D. LINEAL SIMPLE. Consiste en una línea que representa una variable en un sistema de
coordenadas y muestra una tendencia a través del tiempo. Se usa para series de
tiempo. El eje de las abscisas se destina para la variable tiempo.
TIPOS DE PRESENTACIÓN DE DATOS
Presentación gráfica

E. LINEAL COMPUESTO. Es un conjunto de líneas representadas en un sistema de


coordenadas. Cada línea marca la tendencia a través del tiempo de una variable
específica.
F. LINEAL DE SILUETAS. Es un gráfico lineal simple, pero adicionalmente existe una línea
horizontal que representa el promedio de la variable durante el período representado.
G. CIRCULAR. Consiste en un círculo que representa un todo y los sectores circulares que
se refieren a las partes constitutivas del todo.
TIPOS DE PRESENTACIÓN DE DATOS
TIPOS DE PRESENTACIÓN DE DATOS
TIPOS DE PRESENTACIÓN DE DATOS
Presentación grafica

Edades de excursionistas, Agencia de viajes RD, Republica Dominicana, agosto de


2019
16
15
14

12

10 10

6
5 4
4
3
2 2
1
0
15-24 25-34 35-44 45-54 55-64 65-74 75-84
Fuente: Departamento de estadística RD
TIPOS DE PRESENTACIÓN DE DATOS
Presentación grafica
REPÚBLICA DOMINICANA: Carrera universitaria
Edades de excursionistas, Agencia de viajes RD, que estudia o estudió, 2010
Republica Dominicana, agosto de 2012
16 Educación Comercial y
15 369,117
Administración
14
Protección del Medio
383
12 Ambiente
10
10 Formación de Personal
150,796
Docente y Ciencias de la…
8
Derecho 106,673
6 5
4
4 3 Artes 26,620
2
2 1
0 100,000 200,000 300,000 400,000
0
15-24 25-34 35-44 45-54 55-64 65-74 75-84
Fuente: IX Censo de Población y Vivienda 2010
Fuente: Departamento de estadística RD - República Dominicana
Ejercicios:

1) Un conjunto de datos contiene 100 observaciones; la más grande es 315 y la mas pequeña
es 56.
a) ¿Cuantas clases debería tener la tabla de frecuencias?
b) ¿Cuál es el intervalo de clase?
c) ¿Cuáles son los límites y puntos medios de cada clase?

2) En estudio reciente sobre 500 graduados en administración de empresas, el salario inicial


mas alto que se reportó fue de $27,500 dólares y el más bajo fue de $19,000 dólares. Usted
desea crear la tabla de frecuencias para analizar y comparar estos datos con las ofertas de
trabajo que usted ha recibido.
a)¿Cuántas clases pondrá en su tabla de frecuencias?
b)¿Cuál es el intervalo de clase?
c)¿Cuáles son los límites y puntos medios de cada clase?
BIBLIOGRAFÍA
1) Estadística para Administración y Economía

 Autor: Richard I. Levin, David S. Rubín

 Séptima Edición

2) Estadística Aplicada a los Negocios y la Economía

 Autor: Allen l. Webster

 Tercera Edición

3) Estadistica para Administracion y Economía

 David R. Anderson, Dennis J. Sweeney, Thomas A. Williams

 10a. Edición

4) Estadística para Administración y Economia

 Robert D. Mason

 Douglas A. Lind, 7ma. Edición.

5) Introducción a la estadística elemental aplicada.

 César Familia

 Tomo I.

6) Estadística Básica

 Carlos Custodio

 5ta. edición
Gracias!!!

También podría gustarte