Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Modulo 1

Descargar como ppt, pdf o txt
Descargar como ppt, pdf o txt
Está en la página 1de 39

MODULO 1

ESTADISTICA DESCRIPTIVA.
INTRODUCCION
Historia
Proviene del griego y significa ciencia del Estado
Origen de la ciencia estuvo ligado a la actividad del
gobierno o del poder político
En sus comienzos tenía como función registrar
características o acontecimientos de interés para los
gobernantes de un territorio concreto
La estadística moderna tiene su origen en el Cálculo de las
probabilidades que nace en el siglo XVII como teoría
Matemática de los juegos de azar y la Estadística o ciencia
del Estado que estudia la descripción de los datos.
Actualmente y conjuntamente con el computador se
convierte en un instrumento de análisis poderoso para todo
tipo de investigación
¿Ramas de la estadística?
La Estadística es la ciencia, con base matemática, referente a
la recolección, análisis e interpretación de datos, que busca
explicar condiciones regulares en fenómenos de tipo aleatorio.
Descriptiva
•Sistematización, recogida, ordenación y presentación de los
datos referentes a un fenómeno que presenta variabilidad o
incertidumbre para su estudio metódico, con objeto de
Probabilidad
deducir las leyes que rigen esos fenómenos,
Inferencia
•y poder de esa forma hacer previsiones sobre los mismos, tomar
decisiones u obtener conclusiones.
Áreas de Aplicación de la Estadística

• El uso de la Estadística es muy amplio. Resulta difícil


nombrar un área en la cual no se emplee.
• Los métodos estadísticos han encontrado aplicación en:
– Gobierno
– Negocios
– Ciencias Sociales
– Ingeniería
– Ciencias Física y Naturales
– Control de Calidad
– Procesos de Manufactura
– Muchos otros campos de la actividad intelectual.
Que entendemos por estadística
descriptiva e inferencial.

• Estadística Descriptiva: Método de


recolectar, organizar, resumir y presentar
los datos con el fin de describir
apropiadamente sus diversas
características.
• Estadística inferencial: Métodos usados para
determinar algo acerca de la población,
basado en una muestra.
CONCEPTOS FUNDAMENTALES
POBLACION MUESTRA

INDIVIDUOS DATO (valor):


NÚMERO
VARIABLES PALABRA
SIMBOLO
(características)
Población
Se clasifica en dos categorías:
Finita: Es aquella que incluye una cantidad limitada contable
de observaciones, individuos o medidas. Siempre que sea
posible alcanzar (contar) el número total de todas las posibles
mediciones, se considera como finita la población.

Infinita: Es aquella que incluye un gran conjunto de


observaciones o mediciones que no pueden alcanzarse por
conteo. Al menos, hipotéticamente, no existe límite en cuanto
al número de observaciones que el experimento puede
generar.
Datos Univariantes y Multivariantes
• Univariantes o unidimensionales: sólo recogen
información sobre una característica (Ej: edad de los
alumnos de una clase).
• Bivariantes o bidimensionales: recogen información
sobre dos características de la población. (Ej: edad y
estatura de los alumnos de una clase).
• Plurivariantes o pluridimensionales: recogen
información sobre tres o más características (por
ejemplo: edad, altura y peso de los alumnos de una
clase).
Tipos de datos y escalas de medida

• Variables:
– son las características o lo que se estudia de
cada individuo de la muestra. Ej: sexo, edad,
peso, estatura, color de ojos, estado civil,
temperatura, cantidad de nacimientos, presión,
grosor, diámetro, ...
• Datos:
– son los valores que toma la variable en cada
caso.
Tipos de datos
• Cualitativos: son datos que solo toman valores asociados
a las cualidades o atributos, clasificándolos en una de
varias categorías, es decir, no son valores numéricos. Ej:
– Sexo: f/m.
– Hábito de fumar: Fumador/No fumador
– Color de ojos: negro, azul, marrón, …
– Religión: católica, evangélica, …
– Estado civil: soltero, casado, divorciado,…
Tipos de datos
• Cuantitativos: provienen de variables que pueden
medirse, cuantificarse o expresarse numéricamente.
Ejemplos:
– Peso
– Edad
– Estatura
– Presión
– Humedad
– Intensidad de un sismo
– Cantidad de hermanos
Escalas de medida
• Tipos de variables cuantitativas:
– Discretas: es aquella que solo puede tomar un
número finito o infinito numerable de valores.
Ejemplo: cantidad de hermanos.
– Continuas: es la variable que puede tomar
cualquier valor en una escala continua.
Ejemplo: cantidad de líquido contenido en un
recipiente.
Escalas de medida
• Escala Nominal.
Variables Cualitativas
• Escala Ordinal.
• Escala de Intervalos.
Variables

• Escala de Razón o Proporción. Cuantitativas

.
Escalas de medida
• Escala nominal: los datos se pueden
agrupar en categorías que no mantienen
una relación de orden entre si, por lo
tanto no están definidas las operaciones
lógicas (>, <, , ) sino solo las de
igualdad o diferencia.
• Ejemplos: color de ojos, sexo,
profesión, estado civil, religión.
Escalas de medida
• Escala ordinal: existe un cierto orden o
jerarquía entre las categorías (>, <, , ).
• Ejemplos: grados militares, organigrama de
una empresa, escalafón de los profesores
universitarios, grados de disnea, estadiaje
de un tumor.
Escalas de medida
• Escala de Intervalos: valores numéricos de las variables y
además de las relaciones de orden (>, <, , ), se pueden
establecer distancias, es decir, tienen sentido las
operaciones de suma y resta. Tiene dos propiedades:
– Existe una unidad de medida que se mantiene constante para
todos los valores que toma la variable.
– Existe un valor patrón u origen relativo que no significa la
ausencia de valor en la variable.

• Ejemplo: temperatura, nivel de ruido,


movimientos sísmicos.
Escalas de medida
• Escala de razón o proporción: es la más
completa y general de todas las escalas. Se
caracteriza porque los valores de la
variable son números entre los cuales,
además de las relaciones de orden (>, <, ,
) y distancia (+,-), se pueden establecer
múltiplos y proporciones.
• Ejemplos: peso, altura, volumen…
Escala de
Variables medición Ejemplos

nominal Sexo: masculino, femenino


Categóricas
Nivel socioeconómico:
ordinal Bajo, Medio y Alto

de Temperatura, calificación de
intervalo examen, etc.
Numéricas de razón
Estatura, peso, distancia, etc.
o relación
Algunas poblaciones pueden proporcionar
los cuatro tipos de datos
POBLACIÓN CONTINUO DISCRETO NOMINAL ORDINAL

Ratas de Peso Número de Color: negro, Calidad del


Laboratorio edad crías por rata blanco, gris nido:
excelente,
bueno,
regular, malo
Automóviles Peso Número de Colores Tamaño
longitud defectos
Datos Univariantes y Multivariantes

• Multivariantes o pluridimensionales:
recogen información sobre tres ó más
características. (Ej: edad, estatura y peso de
los alumnos de una clase).
PRESENTACION GRAFICA
Las tablas estadísticas o de frecuencias y las representaciones gráficas son
dos maneras equivalentes de presentar la información.
7
Género Frec. 6

5
Hombre 4 4
3

Mujer 6 1
0
Hombre Mujer

Las dos exponen ordenadamente la información recogida en una muestra.


Los gráficos tienen que dar una visión general y no una imagen detallada de un
conjunto de datos.
Las presentaciones detalladas se deben reservar para las tablas.
Una tabla, gráfico o expresión matemática que dé las probabilidades con que una
variable aleatoria toma diferentes valores, se llama distribución de la variable aleatoria.
FORMAS DE PRESENTACION DE LA
INFORMACION
Introduce las cifras o datos dentro del texto. Es muy
Textual usada en artículos de periódicos o revistas y en
informes.

Semitabular También es muy usada en informes y revistas o


periódicos. En este caso, los datos o cifras se presentan
separados del texto, después de dar una breve explicación
sobre el tema.
Tabular
Cuadro No 1
TITULO
(nota introductoria)

¿Qué son los datos?, Columna Matriz Encabezados


¿cuándo y dónde se
recolectaron, cómo y bajo    
que criterios de
clasificación Columna Matriz Cuerpo Cuerpo

Nota al pie
FUENTE:
Tabla de Frecuencias: Tipo I

Cuando hay pocas observaciones e


inexistencia de valores repetidos, no se
precisan tablas. Solo hay que anotarlas
de manera ordenada en filas o
columnas, por ejemplo si tenemos una
muestra de obreros que trabajan en una
construcción en los últimos 5 meses:
5, 8, 16, 38, 45
Tabla de Frecuencias: Tipo II
Cuando hay muchas observaciones,
pero la variable toma pocos valores
2 1 2 2 1 2 4 2 1 1
repetidos Se presentan en tablas con 2 3 2 1 1 1 3 4 2 2
dos columnas . Por ejemplo, si
preguntamos el número de habitaciones 2 2 1 2 1 1 1 3 2 2
para dormir que hay por vivienda en los
inmuebles de un barrio popular
3 2 3 1 2 4 2 1 4 1
obtenemos la siguiente tabla: 1 3 4 3 2 2 2 1 3 3
Cantidad Número de
de cuartos viviendas Podemos observar que la variable
1 16 toma valores comprendidos entre 1
2 20 y 4, por lo que precisaremos una
3 9 tabla en la que resumamos estos
datos quedando la siguiente tabla:
4 5
Total 50
Tabla de Frecuencias: Tipo III
Observación Nivel Observación Nivel
Cuando Hay muchas observaciones y la variable 1 10,6 18 12,4
toma muchos valores distintos; se hace necesario 2 12,5 19 9,1
3 11,1 20 7,8
agrupar en intervalos los valores de la variable. 4 9,2 21 11,3
Durante un periodo de tiempo se realizaron 34 5 11,5 22 12,3
mediciones diarias de los niveles de emisión de 6 9,9 23 9,7
7 11,9 24 12,0
oxido de azufre (en toneladas) en una planta 8 11,6 25 11,8
industrial, obteniéndose los siguientes datos: 9 14,9 26 12,7
10 12,5 27 11,4
La variable estadística tiene un recorrido = max – 11 12,5 28 9,3
12 12,3 29 8,6
min = 16.5 – 7.8 = 8.7, por lo que sí queremos hacer 13 12,2 30 8,5
una tabla con estos datos tendremos que tomar 14 10,8 31 10,1
15 16,5 32 12,4
intervalos. Si se dispone de n datos muestrales, se 16 15,0 33 11,1
suele usar la regla de “Sturges”: 17 10,3 34 10,2

k = [3.3 * log n] + 1
Ejemplo: Para n = 34, usar: Clases Número de
emisiones
k = [3, 3 · log 34] + 1 = [3. 3 * 1.5] + 1 = 4.9 + 1 = 6 7.5 - 9.0 3
clases 9.1 - 10.6 9
Amplitud = 8.7/ 6 = 1.45. Por lo que tomaremos 10.7 - 12.2 10
12.3 - 13.8 9
intervalos de amplitud 1.5
13.9 - 15.4 2
Con estas recomendaciones tendremos la siguiente 15.5 - 17.0 1
tabla: Total 34
NOTACIONES PARA REPRESENTAR
INTERVALOS
Tabla de Frecuencias
Para descubrir como se “reparten” los datos entre las clases,
consideraremos las frecuencias (que representan el número de
repeticiones de un dato u observación).. Los datos cuantitativos discretos
se organizan en tablas, llamadas Tablas de Distribución de
Frecuencias. tipos de frecuencias:
a)frecuencias absolutas: es el número de veces que aparece dicho
valor de la variable y se representa por fi.
b)frecuencias relativas: es el cociente entre la frecuencia absoluta y el
tamaño de la muestra. La denotaremos por fri
c) frecuencias absoluta acumulada: es el número de veces que ha
aparecido en la muestra un valor menor o igual que el de la variable y lo
representaremos por fa, se puede acumular, en la tabla estadística) en
orden ascendente (fa↑) o descendente (fa↓)
d) frecuencia relativa acumulada: al igual que en el caso anterior se
calcula como el cociente entre la frecuencia absoluta acumulada dividido
por el tamaño de la muestra (N) y la denotaremos por fra.
Tabla de Frecuencias
Consideremos el ejemplo de las 34 observaciones de los niveles de emisión
de azufre en una planta industrial. La Tabla de Distribución de Frecuencia
será:
Suma parcial de
Frecuencia / Total las frecuencias
relativas
Niveles de Frecuencia Frecuencia Frecuencia Frecuencia
Azufre absoluta absoluta relativa relativa
acumulada acumulada
7.5 - 9.0 3 3 0,09 0,09
9.1 - 10.6 9
+ 12 0,26 0,35
10.7 - 12.2 10
+ 22 0,29 0,65
12.3 - 13.8 9 31 0,26 0,91
13.9 - 15.4 2 33 0,06 0,97
15.5 - 17.0 1 34 0,03 1,00
Total 34 1,00

Suma parcial de las La suma debe ser 1 Este valor


Suma de las
frecuencias
Frecuencias absolutas siempre es 1
Ejemplo 1
• ¿Cuántos viviendas tienen Número de Personas por vivienda
menos de 2 personas?
–frec. Viv. sin cuartos
+ Número de Frecuencia Frecuencia Frecuencia
frec. Viv. con 1 cuarto personas absoluta relativa relativa
= 419 + 255 acumulada
= 674 viviendas
0 419 27,8 27,8
1 255 16,9 44,7
• ¿Qué porcentaje de viviendas
tiene 6 personas o menos? 2 375 24,9 69,5 >50%
–97,3% 3 215 14,2 83,8
4 127 8,4 92,2
• ¿Qué número de personas es 5 54 3,6 95,8
tal que al menos el 50% de 6 24 1,6 97,3
las viviendas tiene una
cantidad inferior o igual a ese 7 23 1,5 98,9
valor? ocho + 17 1,1 100,0
–2 personas Total 1509 100,0
Representaciones Gráficas
• Unos de los medios más conocidos para la
presentación y análisis de la información
estadística
• Permiten una visión clara, rápida y atractiva
• Debe constar de un sistema de coordenadas,
escala, título de escala, título, fuente y leyenda
• No existen reglas estrictas para su elaboración
GRÁFICOS
La información contenida en las tablas de frecuencias resulta más accesible y fácil de
interpretar si se representan por medio de gráficos estadísticos.

Diagrama de barras

Se usa fundamentalmente para representar distribuciones de frecuencias de una variable cualitativa o


cuantitativa discreta ( o sea, no agrupada en intervalos) y, ocasionalmente, en la representación de series
cronológicas o históricas. Uno de los ejes sirve para inscribir las frecuencias, ya sean absolutas o
relativas (%), y el otro para la escala de clasificación utilizada.
Histograma

Está formado por rectángulos, cuyas bases corresponden con los intervalos de clase y sus áreas son
iguales o proporcionales a sus frecuencias.
Este gráfico se usa para representar una distribución de frecuencias de una variable cuantitativa
continua. Habitualmente se representa la frecuencia observada en el eje Y, y en el eje X la variable
Polígono de frecuencias

Es una línea poligonal que une los vértices superiores de las barras de un diagrama de barras, o los puntos
medios de las bases superiores de los rectángulos de un histograma. Se utiliza, al igual que el histograma,
para representar distribuciones de frecuencias de variables cuantitativas continuas, pero como no se
utilizan barras en su confección sino segmentos de recta, de ahí el nombre de polígono. Habitualmente se
usa cuando se quiere mostrar en el mismo gráfico más de una distribución.
Diagrama de sectores o gráfico circular

Gráfico circular: Se usa, fundamentalmente, para representar distribuciones de frecuencias relativas (%) de
una variable cualitativa o cuantitativa discreta. En este gráfico se hace corresponder la medida del ángulo de
cada sector con la frecuencia correspondiente a la clase en cuestión. Si los 360º del círculo representan el 100
% de los datos clasificados, a cada 1% le corresponderán 3,6º. Luego, para obtener el tamaño del ángulo para
un sector dado bastaría con multiplicar el por ciento correspondiente por 3,6º (por simple regla de tres).
Pictogramas Gráfico de líneas u ojiva

Los pictogramas son gráficos similares a los En este tipo de gráfico, al igual que el histograma y
gráficos de barras, pero empleando un dibujo en el polígono de frecuencias el objetivo es representar
una determinada escala para expresar la unidad de distribuciones de frecuencias de variables
medida de los datos. Se utiliza un dibujo cuantitativas continuas, pero sólo para frecuencias
relacionado con el tema, para representar cierta acumuladas.
cantidad de frecuencias. Este tipo de gráfica atrae  se representan los valores de los datos en dos ejes
la atención por los dibujos, pero la desventaja es cartesianos ortogonales entre sí. 
que se lee en forma aproximada. Se pueden usar para representar:  una serie o más
series
Gráfico de Tallo y Hoja
Es una gráfica usada para datos cuantitativos.. Representa una forma
alternativa de visualizar los datos. Ej.: 50, 57, 59, 60, 65, 66, 67, 68, 69, 69, 70,
70, 71, 71, 72, 72, 73, 74, 74, 75, 76, 77, 77, 78, 78, 79, 79, 79, 80, 80, 81, 82,
83, 83, 83, 84, 84, 84, 85, 86, 90, 91, 92, 93, 93, 94, 95, 97, 101, 102
5 : 079
6 : 0567899
7 : 001122344567788999
Ramas Hojas
8 : 001233344456
9 : 01233457
10 : 12

El uso del “Tallo y Hoja” es exactamente igual al del Histograma, la única


diferencia está en que del “Tallo y Hoja” se pueden recuperar los datos
muestrales, pero de un histograma no se puede hacer. En este ejemplo el “Tallo
y Hoja” es asimétrico a la izquierda, no tiene mucha variabilidad ni “datos
perdidos o alejados”.
DIAGRAMA DE PARETO
Es una representación gráfica que permite localizar el problema principal y ayuda a
localizar la causa más importante de éste (ventas, costos, seguridad, etc.).
También se conoce como “Diagrama ABC” o “Diagrama 20-80”. Su fundamento
parte de considerar que un pequeño porcentaje de las causas, el 20%, producen la
mayoría de los efectos, el 80%. Se trataría pues de identificar ese pequeño
porcentaje de causas “vitales” para actuar prioritariamente sobre él.
EJEMPLO: Se desea construir un DP para el caso de la fabricación de un producto
“W”.

En el gráfico obtenido se observa que un 20% de los defectos en las piezas se deben a rasguños
superficiales y ruptura, pues ambos representan aproximadamente un 80% de los defectos, por lo
tanto centrándose la empresa solo en esos 2 defectos se reduciría en un 80% el número de ellos
Niveles de Medición y Procedimientos
Estadísticos

También podría gustarte