Modulo 1
Modulo 1
Modulo 1
ESTADISTICA DESCRIPTIVA.
INTRODUCCION
Historia
Proviene del griego y significa ciencia del Estado
Origen de la ciencia estuvo ligado a la actividad del
gobierno o del poder político
En sus comienzos tenía como función registrar
características o acontecimientos de interés para los
gobernantes de un territorio concreto
La estadística moderna tiene su origen en el Cálculo de las
probabilidades que nace en el siglo XVII como teoría
Matemática de los juegos de azar y la Estadística o ciencia
del Estado que estudia la descripción de los datos.
Actualmente y conjuntamente con el computador se
convierte en un instrumento de análisis poderoso para todo
tipo de investigación
¿Ramas de la estadística?
La Estadística es la ciencia, con base matemática, referente a
la recolección, análisis e interpretación de datos, que busca
explicar condiciones regulares en fenómenos de tipo aleatorio.
Descriptiva
•Sistematización, recogida, ordenación y presentación de los
datos referentes a un fenómeno que presenta variabilidad o
incertidumbre para su estudio metódico, con objeto de
Probabilidad
deducir las leyes que rigen esos fenómenos,
Inferencia
•y poder de esa forma hacer previsiones sobre los mismos, tomar
decisiones u obtener conclusiones.
Áreas de Aplicación de la Estadística
• Variables:
– son las características o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad,
peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presión,
grosor, diámetro, ...
• Datos:
– son los valores que toma la variable en cada
caso.
Tipos de datos
• Cualitativos: son datos que solo toman valores asociados
a las cualidades o atributos, clasificándolos en una de
varias categorías, es decir, no son valores numéricos. Ej:
– Sexo: f/m.
– Hábito de fumar: Fumador/No fumador
– Color de ojos: negro, azul, marrón, …
– Religión: católica, evangélica, …
– Estado civil: soltero, casado, divorciado,…
Tipos de datos
• Cuantitativos: provienen de variables que pueden
medirse, cuantificarse o expresarse numéricamente.
Ejemplos:
– Peso
– Edad
– Estatura
– Presión
– Humedad
– Intensidad de un sismo
– Cantidad de hermanos
Escalas de medida
• Tipos de variables cuantitativas:
– Discretas: es aquella que solo puede tomar un
número finito o infinito numerable de valores.
Ejemplo: cantidad de hermanos.
– Continuas: es la variable que puede tomar
cualquier valor en una escala continua.
Ejemplo: cantidad de líquido contenido en un
recipiente.
Escalas de medida
• Escala Nominal.
Variables Cualitativas
• Escala Ordinal.
• Escala de Intervalos.
Variables
.
Escalas de medida
• Escala nominal: los datos se pueden
agrupar en categorías que no mantienen
una relación de orden entre si, por lo
tanto no están definidas las operaciones
lógicas (>, <, , ) sino solo las de
igualdad o diferencia.
• Ejemplos: color de ojos, sexo,
profesión, estado civil, religión.
Escalas de medida
• Escala ordinal: existe un cierto orden o
jerarquía entre las categorías (>, <, , ).
• Ejemplos: grados militares, organigrama de
una empresa, escalafón de los profesores
universitarios, grados de disnea, estadiaje
de un tumor.
Escalas de medida
• Escala de Intervalos: valores numéricos de las variables y
además de las relaciones de orden (>, <, , ), se pueden
establecer distancias, es decir, tienen sentido las
operaciones de suma y resta. Tiene dos propiedades:
– Existe una unidad de medida que se mantiene constante para
todos los valores que toma la variable.
– Existe un valor patrón u origen relativo que no significa la
ausencia de valor en la variable.
de Temperatura, calificación de
intervalo examen, etc.
Numéricas de razón
Estatura, peso, distancia, etc.
o relación
Algunas poblaciones pueden proporcionar
los cuatro tipos de datos
POBLACIÓN CONTINUO DISCRETO NOMINAL ORDINAL
• Multivariantes o pluridimensionales:
recogen información sobre tres ó más
características. (Ej: edad, estatura y peso de
los alumnos de una clase).
PRESENTACION GRAFICA
Las tablas estadísticas o de frecuencias y las representaciones gráficas son
dos maneras equivalentes de presentar la información.
7
Género Frec. 6
5
Hombre 4 4
3
Mujer 6 1
0
Hombre Mujer
Nota al pie
FUENTE:
Tabla de Frecuencias: Tipo I
k = [3.3 * log n] + 1
Ejemplo: Para n = 34, usar: Clases Número de
emisiones
k = [3, 3 · log 34] + 1 = [3. 3 * 1.5] + 1 = 4.9 + 1 = 6 7.5 - 9.0 3
clases 9.1 - 10.6 9
Amplitud = 8.7/ 6 = 1.45. Por lo que tomaremos 10.7 - 12.2 10
12.3 - 13.8 9
intervalos de amplitud 1.5
13.9 - 15.4 2
Con estas recomendaciones tendremos la siguiente 15.5 - 17.0 1
tabla: Total 34
NOTACIONES PARA REPRESENTAR
INTERVALOS
Tabla de Frecuencias
Para descubrir como se “reparten” los datos entre las clases,
consideraremos las frecuencias (que representan el número de
repeticiones de un dato u observación).. Los datos cuantitativos discretos
se organizan en tablas, llamadas Tablas de Distribución de
Frecuencias. tipos de frecuencias:
a)frecuencias absolutas: es el número de veces que aparece dicho
valor de la variable y se representa por fi.
b)frecuencias relativas: es el cociente entre la frecuencia absoluta y el
tamaño de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por fa, se puede acumular, en la tabla estadística) en
orden ascendente (fa↑) o descendente (fa↓)
d) frecuencia relativa acumulada: al igual que en el caso anterior se
calcula como el cociente entre la frecuencia absoluta acumulada dividido
por el tamaño de la muestra (N) y la denotaremos por fra.
Tabla de Frecuencias
Consideremos el ejemplo de las 34 observaciones de los niveles de emisión
de azufre en una planta industrial. La Tabla de Distribución de Frecuencia
será:
Suma parcial de
Frecuencia / Total las frecuencias
relativas
Niveles de Frecuencia Frecuencia Frecuencia Frecuencia
Azufre absoluta absoluta relativa relativa
acumulada acumulada
7.5 - 9.0 3 3 0,09 0,09
9.1 - 10.6 9
+ 12 0,26 0,35
10.7 - 12.2 10
+ 22 0,29 0,65
12.3 - 13.8 9 31 0,26 0,91
13.9 - 15.4 2 33 0,06 0,97
15.5 - 17.0 1 34 0,03 1,00
Total 34 1,00
Diagrama de barras
Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y sus áreas son
iguales o proporcionales a sus frecuencias.
Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa
continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable
Polígono de frecuencias
Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos
medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al igual que el histograma,
para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se
utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se
usa cuando se quiere mostrar en el mismo gráfico más de una distribución.
Diagrama de sectores o gráfico circular
Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de
una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de
cada sector con la frecuencia correspondiente a la clase en cuestión. Si los 360º del círculo representan el 100
% de los datos clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para
un sector dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
Pictogramas Gráfico de líneas u ojiva
Los pictogramas son gráficos similares a los En este tipo de gráfico, al igual que el histograma y
gráficos de barras, pero empleando un dibujo en el polígono de frecuencias el objetivo es representar
una determinada escala para expresar la unidad de distribuciones de frecuencias de variables
medida de los datos. Se utiliza un dibujo cuantitativas continuas, pero sólo para frecuencias
relacionado con el tema, para representar cierta acumuladas.
cantidad de frecuencias. Este tipo de gráfica atrae se representan los valores de los datos en dos ejes
la atención por los dibujos, pero la desventaja es cartesianos ortogonales entre sí.
que se lee en forma aproximada. Se pueden usar para representar: una serie o más
series
Gráfico de Tallo y Hoja
Es una gráfica usada para datos cuantitativos.. Representa una forma
alternativa de visualizar los datos. Ej.: 50, 57, 59, 60, 65, 66, 67, 68, 69, 69, 70,
70, 71, 71, 72, 72, 73, 74, 74, 75, 76, 77, 77, 78, 78, 79, 79, 79, 80, 80, 81, 82,
83, 83, 83, 84, 84, 84, 85, 86, 90, 91, 92, 93, 93, 94, 95, 97, 101, 102
5 : 079
6 : 0567899
7 : 001122344567788999
Ramas Hojas
8 : 001233344456
9 : 01233457
10 : 12
En el gráfico obtenido se observa que un 20% de los defectos en las piezas se deben a rasguños
superficiales y ruptura, pues ambos representan aproximadamente un 80% de los defectos, por lo
tanto centrándose la empresa solo en esos 2 defectos se reduciría en un 80% el número de ellos
Niveles de Medición y Procedimientos
Estadísticos