Modulometodosestadisticos USS
Modulometodosestadisticos USS
Modulometodosestadisticos USS
DE MTODOS ESTADSTICOS
Autor: Msc. Csar A. Zatta Silva
Universidad Seor de Sipan
2011-I
INTRODUCCIN
Contenido
Semana 1
Semana 2
Semana 3
Semana 4
Semana 5
Semana 6
Semana 7
Semana 8
Semana 9
Semana 10
Semana 11
Semana 12
Semana 13
Semana 14
Semana 15
Semana 16
Semana 1
ESTADSTICA
La Estadstica es la ciencia que nos ofrece un conjunto de mtodos y tcnicas para: Recolectar,
Resumir, Procesar, Presentar , Analizar e Interpretar un conjunto de datos, con la finalidad de
conocer el problema, proyectar su comportamiento y colaborar en la toma de decisiones sobre
dicho problema.
Otra definicin: La estadstica es una rama de las matemticas, constituye uno de los idiomas
esenciales para comunicarse en el mundo universal de la ciencia y la tecnologa. Aquellos
profesionales que no conozcan Estadstica tendrn serias dificultades para ser expertos en su
respectivo campo cientfico.
Importancia
Los mtodos estadsticos tradicionalmente se utilizan para propsitos descriptivos, para
organizar y resumir datos numricos. La estadstica descriptiva, por ejemplo trata de la
tabulacin de datos, su presentacin en forma grfica o ilustrativa y el clculo de medidas
descriptivas.
Ahora bien, las tcnicas estadsticas se aplican de manera amplia en mercadotecnia, contabilidad,
control de calidad y en otras actividades; estudios de consumidores; anlisis de resultados en
deportes; administradores de instituciones; en la educacin; organismos polticos; mdicos; y por
otras personas que intervienen en la toma de decisiones
Mtodo que sigue la Estadstica
Recolectar
Resumir y Ordenar
Procesar
ESTADISTICA
Tomar decisiones
Analizar e Interpretar
Presentar
4.2 Variable Cuantitativa: Comprende aquellos conceptos que s pueden ser expresados
en forma numrica porque corresponde a criterios de cantidad. Pueden ser:
v. c. Discretas Son variables que toman valores que se expresan en nmeros enteros. Es
el resultado del proceso de conteo. Ejm. Nmero de empleados, Nmero de habitaciones,
Total de alumnos, etc.
v.c. Continuas Son aquellas variables que sus cantidades se expresan con nmeros
reales, es decir, tienen parte fraccionaria. Son el resultado del proceso de medicin. Ejm.
Ingresos totales mes de julio, costo de servicio diario del hotel, toneladas embarcadas,
etc.
Ejemplos:
El alumno deber identificar las variables para las unidades de estudio siguiente
*UNIDAD DE ESTUDIO: Estudiante
Variables: Peso, edad, talla, tipo de sangre, color de ojos, ingreso familiar, nmero de hermanos,
etc.
*UNIDAD DE ESTUDIO: Empresa
Variables: Ventas, ganancias, nmero de trabajadores, nmero de computadoras, gastos en
publicidad, etc.
Prctica Calificada N 01
A. Determina la poblacin y la muestra, y la variable de los siguientes ejemplos:
1. Tiempo dedicado a las tareas domsticas por los hombres y las mujeres que trabajan fuera
del hogar en Lambayeque
2. Estudios que quieren hacer las alumnas y los alumnos del Colegio Manuel Pardo al
terminar la Educacin Secundaria
3. Intencin de voto en unas elecciones municipales
4. Horas que dedican a ver televisin los estudiantes de educacin primaria del colegio San
Jos
5. Nmero de aparatos de radio que hay en los hogares chiclayanos
6. Se quiere realizar un estudio para determinar la cantidad promedio de huevos que ponen
los pinginos hembras en el perodo reproductivo en Puerto Maldonado.
7. Se quiere determinar la audiencia de cierto programa televisivo de televisin de aire.
8. Se requiere determinar el grado de afectacin que tuvo la salmonella en las gallinas
provenientes de las granjas del empresario Gonzales
9. Se quiere estimar el grado de aceptacin que tiene la mermelada de carambola en la zona
oeste de Chiclayo
B. De las siguientes variables, determinar cules son cualitativas y cuales son cuantitativas
discretas o cuantitativas continuas
1. Precio del pollo
2. Angulo de inclinacin de los puentes
3. Grado de instruccin de los postulantes
4. Color de ojos de las finalistas
5. Peso promedio de las bolsas
6. Nmero de taxis que ingresan por hora a Chiclayo
7. Comida favorita
8. Nmero de goles marcados por la seleccin
9. Profesin que te gusta
CASO N 02
Un proveedor de servicios de lnea blanca desea saber cul es la marca preferida de cocinas de
las amas de casa pertenecientes a la ciudad de Chiclayo. Para llevar a cabo esta investigacin,
selecciona a 120 amas de casa que fueron escogidas segn la zona de la ciudad de Chiclayo.
Unidad de estudio
Variable de estudio
Poblacin
Muestra
CASO N 03
Un investigador de mercado quiere saber cul es la marca de detergente que ms se utiliza o ms
prefieren las amas de casa de la ciudad de Chiclayo. Para llevar a cabo esta investigacin
selecciona una muestra de 504 amas de casa que fueron escogidas segn zona o urbanizacin de
la ciudad de Chiclayo.
Unidad de estudio
Amas de casa
Variable de estudio
Marca de detergente (tipo cualitativa nominal)
Poblacin
Amas de casa de la ciudad de Chiclayo
Muestra
504 amas de casa
CASO N 04:
El Ingeniero de Produccin de Cerveza Cristal en Motupe, dentro de su evaluacin diaria, desea
saber si el brix (grado de azcar), porcentaje de alcohol, tiempo de maduracin, etc, han
cumplido con las parmetros de calidad en la produccin del fin de semana.
Unidad de estudio
Cerveza
Variable de estudio
Brix, porcentaje de alcohol, tiempo maduracin
(cuantitativa)
Poblacin
Produccin de cerveza del fin de semana
Muestra
Produccin de cerveza de un da
CASO N 05:
Un investigador social desea saber cules son las caractersticas socio demogrficas que influyen
en el rendimiento acadmico de los Estudiantes de la Universidad Seor de Sipan, de la
especialidad de Ingeniera Agroindustrial matriculados en el 2 Semestre-Ao 2006.
Unidad de estudio
Estudiante
Variable de estudio
Caractersticas socio demogrficas
Poblacin
Estudiantes matriculados de Ing. Agroindustrial de la USS
(cualitativa)
Muestra
Alumnos matriculados del 2 semestre
CASO N 06:
El gerente del Grifo San Luis ubicado en el ovalo est haciendo un estudio de factibilidad para
determinar si es conveniente la instalacin de un nuevo servidor de gasolina en dicho
establecimiento. Para realizar este estudio toma informacin sobre el tiempo que se demora en
dar el servicio y el tiempo que demora en llegar el usuario (automvil).
Unidad de estudio
Usuario de automvil
Variable de estudio
Tiempo en dar el servicio y tiempo llegar usuario
(cuantitativa)
Poblacin
Todos los clientes del grifo
Muestra
Algunos clientes del grifo
CASO N 07
Un investigador de mercado quiere saber cul es la marca de jabones que ms se utiliza o ms
prefieren las empleadas de casa de la ciudad de Tarapoto. Para llevar a cabo esta investigacin
selecciona una muestra de 610 empleadas que fueron escogidas segn zona o urbanizacin de la
ciudad de Tarapoto.
Unidad de estudio
Variable de estudio
Poblacin
Muestra
Semana 2
Frecuencia
Absoluta ( fi )
Frecuencia
Relativa ( hi)
08
09
10
11
12
13
14
TOTAL
1
2
4
4
5
6
8
30
0.03
0.07
0.13
0.13
0.17
0.20
0.27
1.00
Frecuencia Acumulada
Absoluta
Relativa
(Fi)
(Hi)
1
0.03
3
0.10
7
0.23
11
0.36
16
0.53
22
0.73
30
1.00
k =
1 + 3.322 log n
Marca de Clase
Xi
[ 5.2 6.1 )
[ 6.1 7.0 )
[ 7.0 7.9 )
[ 7.9 8.8 )
[ 8.8 9.7 )
[ 9.7 10.6 )
TOTAL
5.65
6.55
7.45
8.35
9.25
10.15
Frecuencia
Absoluta
fi
Frecuencia
Relativa
hi
Frec. Acumul.
Absoluta
Fi
Frec. Acumul.
Relativa
Hi
3
5
9
7
5
3
32
0.094
0.156
0.281
0.219
0.156
0.094
1.000
3
8
17
24
29
32
0.094
0.250
0.531
0.750
0.906
1.000
: 9 das
: 17 das
: 29 das
: 53.1%
: 46.9 %
Polgono de Frecuencias: Es la lnea que une los puntos medios de los lados superiores (marcas
de clase) de un histograma. Los puntos o vrtices del polgono de frecuencias estn situados, por
tanto, en las marcas de clase, ya que estos corresponden a los puntos medios de los intervalos.
USO DE MS EXCEL
Construccin tablas tipo A en EXCEL: Para variables cualitativas y cuantitativas discretas
Color
Azul
Rojo
Verde
Negro
Blanco
f
F
=contar.si($B$2:$H$11;B14) 21
16
13
8
12
f
= Frecuencia (datos; grupos)
= Frecuencia (B2:H8; D22:D28)
B2:H8
Todos los datos
D22:D28 La columna de datos del lmite superior
Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se
emplean para tener una representacin visual de la totalidad de la informacin. Los grficos
estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente
los hechos esenciales y compararlos con otros.
TIPOS DE GRFICOS
Grficos de barras verticales
Representan valores usando trazos verticales, aislados o separados unos de otros, segn la
variable a graficar sea discreta o continua. Pueden usarse para comparar y representar: una serie;
dos o mas series
Grficos de lneas
En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales
entre s. Estos grficos se utilizan para representar valores con grandes incrementos entre s. Se
pueden usar para representar una serie, dos o ms series.
Grficos circulares
Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en
forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor
valor, segn lo que se desee destacar. Pueden ser: En dos dimensiones o tres dimensiones
Grficos de reas
En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un
perodo de tiempo. Pueden ser para representar una, dos o ms series; en dos dimensiones o en tres
dimensiones.
PRACTICA CALIFICADA N 02
USANDO EL PAQUETE O SOFTWARE RESPECTIVO, RESOLVER LOS SIGUIENTES EJERCICIOS
1. Qu es frecuencia absoluta?
2. Cmo se obtiene:
2.1 La frecuencia acumulada?
2.2 La frecuencia relativa?
2.3 La frecuencia relativa acumulada
3. En una distribucin de frecuencias se pueden establecer conclusiones porcentuales,
utilizando solamente la frecuencia relativa? Por qu?
4. Por qu se recurre al agrupamiento en distribuciones de frecuencias por intervalos?
5. Cmo se determina el nmero de intervalos y la amplitud de ellos?
6. Qu es una marca de clase?
7. La siguiente tabla relaciona las ausencias al trabajo de 50 obreros, durante el mes de
octubre, en la fbrica de confecciones "La Unin".
1
3
1
4
2
0
2
1
0
4
2
4
0
2
2
1
2
1
3
1
3
0
0
2
3
1
3
0
0
1
4
1
1
0
2
3
2
2
2
1
2
0
1
5
0
5
2
3
2
2
extremos)?
9. Peso de los sacos de aj pprika que fueron cosechados en los primeros 50 das de
produccin de la empresa Exporta SAC
Semana 3
Asociado a la unidad de medida, deben establecerse los criterios sobre las condiciones en las cuales
se ha de efectuar la toma de la informacin.
5. DETERMINACIN DE LA POBLACIN Y DE LA MUESTRA
Estadsticamente, la poblacin se define como un conjunto de individuos o de objetos que poseen
una o varias caractersticas comunes. No se refiere esta definicin nicamente a los seres vivientes;
una poblacin puede estar constituida por los habitantes de un pas o por los peces de un estanque,
as como por los establecimientos comerciales de un barrio o las unidades de vivienda de una
ciudad.
Existen desde el punto de vista de su manejabilidad poblaciones finitas e infinitas. Aqu el trmino
infinito no est siendo tomado con el rigor semntico de la palabra; por ejemplo, los peces dentro de
un estanque son un conjunto finito; sin embargo, en trminos estadsticos, puede ser considerado
como infinito.
Muestra es un subconjunto de la poblacin a la cual se le efecta la medicin con el fin de estudiar
las propiedades del conjunto del cual es obtenida.
En la prctica, estudiar todos y cada uno de los elementos que conforman la poblacin no es
aconsejable, ya sea por la poca disponibilidad de recursos, por la homogeneidad de sus elementos,
porque a veces es necesario destruir lo que se est midiendo, por ser demasiado grande el nmero de
sus componentes o no se pueden controlar; por eso se recurre al anlisis de los elementos de una
muestra con el fin de hacer inferencias respecto al total de la poblacin.
Existen diversos mtodos para calcular el tamao de la muestra y tambin para tomar los elementos
que la conforman, pero no es el objetivo de este curso estudiarlos. Diremos solamente que la muestra
debe ser representativa de la poblacin y sus elementos escogidos al azar para asegurar la objetividad
de la investigacin.
6. LA RECOLECCIN
Una de las etapas ms importantes de la investigacin es la recoleccin de la informacin, la cual ha
de partir, a menos que se tenga experiencia con muestras anlogas, de una o varias muestras piloto en
las cuales se pondrn a prueba los cuestionarios y se obtendr una aproximacin de la variabilidad de
la poblacin, con el fin de calcular el tamao exacto de la muestra que conduzca a una estimacin de
los parmetros con la precisin establecida.
El establecimiento de las fuentes y cauces de informacin, as como la cantidad y complejidad de las
preguntas, de acuerdo con los objetivos de la investigacin son decisiones que se han de tomar
teniendo en cuenta la disponibilidad de los recursos financieros, humanos y de tiempo y las
limitaciones que se tengan en la zona geogrfica, el grado de desarrollo, la ausencia de tcnica, etc.
Es, entonces, descubrir dnde est la informacin y cmo y a qu "costo" se puede conseguir; es
determinar si la encuesta se debe aplicar por telfono, por correo, o si se necesitan agentes directos
que recojan la informacin; establecer su nmero ptimo y preparar su entrenamiento adecuado.
7. CRITICA, CLASIFICACIN Y ORDENACIN
Despus de haber reunido toda la informacin pertinente, se necesita la depuracin de los datos
recogidos. Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin
por parte de quien depura para poder detectar falsedades en las respuestas, incomprensin a las
preguntas, respuestas al margen, amn de todas las posibles causas de nulidad de una pregunta o
nulidad de todo un cuestionario.
Separado el material de "desecho" con la informacin depurada se procede a establecer las
clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen los cruces
necesarios entre las preguntas, se ordenan las respuestas y se preparan los modelos de tabulacin de
las diferentes variables que intervienen en la investigacin.
El avance tecnolgico y la popularizacin de los computadores hacen que estas tareas, manualmente
dispendiosas, puedan ser realizadas en corto tiempo.
8. LA TABULACIN
Una tabla es un resumen de informacin respecto a una o ms variables, que ofrece claridad al lector
sobre lo que se pretende describir; para su fcil interpretacin una tabla debe tener por lo menos: Un
titulo adecuado el cual debe ser claro y conciso.
La Tabla propiamente dicha con los correspondientes subttulos internos y la cuantificacin de los
diferentes tems de las variables, y las notas de pie de cuadro que hagan claridad sobre situaciones
especiales de la tabla, u otorguen los crditos a la fuente de la informacin.
9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma adecuada. Los
cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado con las variables que se van
a presentar y la forma de hacerlo. No es aconsejable saturar un informe con tablas y grficos
redundantes que, antes que claridad, crean confusin.
Adems la eleccin de determinada tabla o grfico para mostrar los resultados, debe hacerse no slo
en funcin de las variables que relaciona, sino del lector a quien va dirigido el informe.
10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que convierten las especulaciones
de primera mano en aseveraciones cuya confiabilidad puede ser evaluada y ofrecer una premisa
medible en la toma de una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la determinacin de los
parmetros y estadsticos muestrales para las estimaciones e inferencias respecto a la poblacin, el
ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de establecer y redactar las
conclusiones definitivas.
11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros estudiosos del mismo
problema a quienes se les puede aportar informacin, conocimientos y otros puntos de vista acerca
de l.
FUENTES DE INFORMACIN
Unidades Estadsticas: Elementos componentes de la poblacin estudiada.
Ejemplo: personal de una empresa, habitantes del distrito de Oyotn, etc.
La poblacin en una investigacin debe ser definida con precisin.
FUENTES DE INFORMACIN
PRIMARIAS
SECUNDARIAS
Se subdividen
en:
Observacin Directa:
Cuando el investigador toma
directamente los datos de la poblacin.
Ejm: un cientfico realiza
un experimento.
Observacin Indirecta:
Cuando los datos no son obtenidos
directamente por el investigador.
Usa un cuestionario u otro medio
para obtener los datos.
Debe realizar una encuesta
Por ejemplo:
Como ves el estado actual del Instituto?
Muy Bien
.. 5
Bien
.. 4
Regular
.. 3
Mal
.. 2
Muy Mal
.. 1
No sabe/No contesta .. 0
EJEMPLO
DE
CUESTIONARIO
REPASO:
Semana 4
1. MEDIA ARITMETICA:
Se conoce comnmente como promedio. La media aritmtica se calcula como la suma de todos los
valores que toma la caracterstica en estudio dividida por el nmero total de unidades experimentales
observadas. En smbolos:
Como ejemplo, consideremos 10 pacientes de edades 21 aos, 32, 15, 59, 60, 61, 64, 60, 71, y 80.
_
x = 21+32+15+59+60+61+64+60+71+80 = 52.3 aos
10
Interpretacin: La edad media de estos pacientes es de: 52.3 aos
Un investigador social est interesado en conocer el nmero promedio de hijos en una muestra de 10 familias
entrevistadas para una encuesta en particular. Luego de efectuar el trabajo de recoleccin de datos, el listado
de las familias con su correspondiente nmero de hijos se form la siguiente tabla:
Familia No
Nmero de Hijos
1
2
2
4
3
4
4
3
5
4
6
3
7
3
8
3
9
6
10
3
Con esta informacin se construye la tabla de frecuencias de la siguiente manera:
Nmero de Hijos (Xj)
Frecuencia (fj)
Xjfj
2
1
2
3
5
15
4
3
12
6
1
6
Total
10
35
_
Luego: x = 35 = 3.5
10
Interpretacin:
La familia promedio proporcionada por la encuesta es aquella que presenta entre 3 y 4 hijos; el valor 3,5 es el
resultado matemtico del clculo de la media aritmtica pero no es un valor posible de la variable por su
propia definicin.
Cuando se agrupan datos continuos en intervalos de clase, se pierde la informacin original. Luego, para
solucionar este problema, Yi se calcula como el promedio entre los extremos de cada intervalo, es decir Yi
representa el punto medio del intervalo de clase.
Ejemplo:
Calcular la media aritmtica de la longitud de 100 tornillos fabricados por una mquina.(Tabla 1)
Luego:
_
Y = Yi fi = 1014,0 = 10,14 mm
N
100
Por otro lado el nmero de datos n = 15, siendo el nmero de datos impar se elige el dato que se encuentra a
la mitad, una vez ordenados los datos, en este caso es 1.
0, 1, 1, 1, 1, 1, 1, 1, 2, 2, 3, 3, 3 4, 4
Mediana
Interpretacin: El nmero mediano de hijos para estos empleados es 1.
Ejemplo 2:
Las calderas de una planta de energa de vapor a alta presin tuvieron las siguientes eficiencias en porcentajes:
90,3 - 91,6 - 90,9 - 90,4 - 90,3 - 91,0 - 87,9 - 89,4
El tamao de la muestra, n=8, nmero par. Luego los ordenamos y la mediana es la semisuma de los valores
centrales o sea el promedio de esos valores.
87,9 - 89,4 - 90,3 - 90,3 - 90,4 - 90,9 - 91,0 - 91,6
Mediana = 90,3 + 90,4 = 90,35
2
Interpretacin: El nmero mediano de eficiencia en porcentaje de las calderas de una planta de energa es de
90,35 % aunque el mismo no sea un valor posible de la variable.
La mediana es 8
Interpretacin: El 50 % de los 19 empleados faltan menos de 8 das y el 50% restante ms de 8 das.
Ejemplo 2: Supongamos que la siguiente tabla corresponde a la vida til en horas de 100 vlvulas
Esto nos indica que la mediana se encuentra entre el lugar 50 y el lugar 51. Pero, qu valores ocupan esos
lugares?
Por lo explicado anteriormente, desde el lugar 38 y hasta el lugar 57, hay valores 39. Luego el valor nmero
50 y el valor nmero 51 son 39. Entonces:
Mediana = 39 + 39 = 39
2
Si los datos estn agrupados en intervalo de clase, veamos cmo se calcula la mediana
Ejemplo: Tenemos los siguientes datos agrupados en una Tabla de Frecuencia que representan los montos de
40 prstamos personales, en dlares, en una compaa financiera de consumidores. (Tabla N 4)
3. MODA: (Mo)
La moda es el valor que aparece con mayor frecuencia, es decir, el que ocurre ms frecuentemente.
Se dice que cuando un conjunto de datos tiene una moda la muestra es unimodal, cuando tiene dos modas
bimodal, cuando la muestra contiene ms de un dato repetido se dice que es multimodal y un ltimo caso es
cuando ningn dato tiene una frecuencia, en dicho caso se dice que la muestra es amodal.
Moda para datos no agrupados
Si tenemos datos sin agrupar, la encontramos fcilmente observando cul es el valor que ms se repite.
Ejemplos:
1.- Determinar la moda del siguiente conjunto de datos:
a).- 1, 2, 3, 3, 4 , 5, 6, 7, 7, 3, 1, 9, 3
Respuesta: La moda de este conjunto de datos es igual a 3 y si considera unimodal.
b).- 1, 2, 3, 4, 4, 5, 2, 1, 3, 4, 2, -3, 4, 6, 3, 3
Respuesta: Las modas de este conjunto de datos son 3 y 4 ya que ambas tienen la ms alta frecuencia, por lo
que la muestra es bimodal
c).- 1, 2, 3, 4, 5, 6, 7, 8, 9
Respuesta: La muestra no contiene ningn dato repetido por lo que se considera que la muestra es amodal.
En datos agrupados en tablas simples de frecuencias, nos fijamos que valor corresponde a la
mayor frecuencia absoluta. En la siguiente tabla
En este ejemplo, la mayor frecuencia absoluta es 4, que corresponde al valor 10. Luego la Moda es
10.
Interpretacin: La cantidad de das ms frecuente que los empleados faltan por enfermedad es 10.
En datos agrupados en intervalos de clases, existen varios mtodos para calcular la Moda. Cada
mtodo puede darnos un valor diferente, pero aproximado, para un mismo conjunto de datos.
Se puede hallar de la siguiente manera:
* Cuando se trata de cuartiles para datos agrupados continuos, se aplica la frmula de interpolacin:
PERCENTILES:
Los percentiles de una distribucin, como su nombre lo indica, son valores de la variable, que
dividen al conjunto de datos (ordenados de menor a mayor) en cien partes iguales.
Los percentiles tienen el mismo significado y la misma forma de clculo que los cuartiles. As,
cuando se habla del percentil 15 se quiere expresar que es el valor de la variable que deja el 15% de
los datos a su izquierda y el 85 % de los mismos a su derecha o lo que es lo mismo decir que es el
valor de la variable que deja al 15 % de los datos por debajo de l y el 85% por encima.
Se puede emplear la siguiente frmula:
Prctica Calificada N 04
1. Qu es una medida de tendencia central?
2. Cules son las principales medidas de tendencia central?
3. Defina: media aritmtica mediana y moda.
4. Cundo se utiliza la media aritmtica ponderada?
5. Enuncie las propiedades de la media aritmtica
6. Para cada informacin de los ejercicios del captulo 3, calcular e interpretar la media aritmtica, la
mediana y la moda.
7.
Nmero de
das
0-5
5 - 10
10 - 15
15 - 20
20 - 25
25 - 30
3
6
5
8
2
3
10. Las edades de 50 de los directores ejecutivos de las mejores corporaciones de la nacin reportadas
aparecen en la siguiente tabla de frecuencias. Calcule e interprete la media, la mediana y la moda.
Adems, calcule e interprete: Q1 y P15.
Edades
Frecuencias
50 y menos de 55
8
55 y menos de 60
13
60 y menos de 65
15
65 y menos de 70
70 y menos de 75
75 y menos de 80
10
3
1
11. Una granja ganadera registr durante febrero el nacimiento de 29 terneros, cuyos pesos al nacer
(en kilogramos) fue el siguiente:
22,31,33,34,35,36,37,38,38,39,40,40,40,41,41,42,42,42,42,42,43,43,44,45,46,46,46,46,50
12. Los datos anteriores al ser dispuestos en una tabla de distribucin de frecuencias se obtuvieron en
la siguiente tabla resultante.
Estadstica
Colegio24hs
Colegio24hs
2004
Semana 5
MEDIDAS DE DISPERSIN
Las medidas de dispersin muestran la variabilidad de una
distribucin, indicando por medio de un nmero la tendencia de
los datos a dispersarse respecto al valor central o media. Cuanto
mayor sea ese valor, mayor ser la variabilidad, cuanto menor sea,
ms homognea ser a la media. As se sabe si todos los casos son
parecidos o varan mucho entre ellos.
1.
Xmn.
Ejemplo:
a. Para una muestra (1, 45, 50, 55, 100), el dato menor es 1 y el dato mayor es 100. Sus valores se
encuentran en un rango de:
Rango = 100 1 = 99
b. Hallar el rango de los conjuntos: x= 12, 6, 7, 3, 15, 10, 18, 5
y= 9, 3, 8, 8, 9, 8, 9, 18
En ambos casos, rango: 18 3 = 15; sin embargo si ordenamos se ven como sigue:
x = 3, 5, 6, 7, 10, 12, 15, 18
y = 3, 8, 8, 8, 9, 9, 9, 18
LA VARIANZA. (S2 2)
2.
Es una variable estadstica que mide la dispersin de los valores respecto a un valor central (media).
Especficamente, la varianza es una medida de que tan cerca o que tan lejos estn los diferentes
valores de su propia media aritmtica.
Cuando ms lejos estn las Xi de su propia media aritmtica, mayor es la varianza; cuando
ms cerca estn las Xi a su media menos es la varianza. La Varianza es el cuadrado de la
desviacin estndar
La variancia de los valores: (x1 x2 xk) que ocurren con las frecuencias (f1 f2 fk) es:
3.
La varianza a veces no se interpreta claramente, ya que se mide en unidades cuadrticas. Para evitar
ese problema se define otra medida de dispersin, la desviacin estndar, que se halla como la raz
cuadrada de la varianza. La desviacin estndar o desviacin tpica nos informa sobre la dispersin
de los datos respecto al valor de la media; cuanto mayor sea su valor, ms dispersos estarn los datos.
Desviacin Estndar: S = S2 = 2
(Es la raz cuadrada de la varianza)
4. COEFICIENTE DE VARIABILIDAD
Es una medida de variabilidad de los datos que se expresa en porcentaje, en la cual se compara la desviacin
estndar con el respectivo valor del promedio de los datos, se expresa en porcentaje:
Practica Calificada N 05
1. Cul es la utilidad de las medidas de dispersin?
2. Cules son las principales medidas de dispersin?
3. Cul es la medida adecuada para comparar la dispersin entre varias variables que posean
diferente magnitud o diferente unidad de medida?
4. Para cada una de las informaciones de las unidades 2 y 4 de las sesiones anteriores, calcular e
interpretar:
4.1 Rango
4.2 Desviacin media
4.3 Desviacin Estandar
4.4 Coeficiente de variabilidad
5. La tabla de frecuencias exhibe las edades de una muestra de 36 personas que asistieron a una pelcula:
Aos
8-13
14-19
20-25
13
26-31
32-37
Hallar:
a. La media
b. La varianza
c. La desviacin
6. La siguiente tabla muestra los coeficientes de inteligencia de 480 nios de una escuela elemental
C.I.
fi
70
4
74
9
78
16
82
28
86
45
90
66
94
85
98
72
102
54
106
38
110
27
114
18
118
11
122
5
126
2
Calcula:
a) El C.I. promedio de los nios estudiados
b) Su desviacin.
7. El entrenador de un equipo de baloncesto duda entre seleccionar a Elena o Mara. Los puntos
conseguidos por cada una, en una semana de entrenamiento fueron:
Elena
18
23
22
24
19
25
16
Mara
18
26
18
28
22
17
18
Semana 6
1. EXPERIMENTO ALEATORIO:
Es cualquier hecho o fenmeno cuyo resultado no puede predecirse antes de que suceda.
Ejemplo:
- Rendir un examen y observar su resultado
- Tirar una moneda y observar cual de las caras queda hacia arriba
- El lanzamiento de 2 dados paralelamente y observar el puntaje obtenido
- Elegir un cliente del restaurante y preguntar su opinin sobre el servicio recibido.
2. ESPACIO MUESTRAL:
Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa
comnmente con la letra S.
Ejemplos:
* En el experimento aleatorio de lanzar una moneda 3 veces
3. EVENTO O SUCESO:
Es un subconjunto de elementos que pertenecen al espacio muestral y que cumple una
caracterstica determinada. Ejemplos:
* Del espacio muestral, lanzamiento de un dado; el evento
A= puntaje obtenido es mayor de 3
A= [4,5,6]
* Al lanzar una moneda 3 veces, el evento de obtener por lo menos dos caras es:
E = [(C,C,C), (C,C,S), (C,S,C), (S,C,C)] ; tiene 4 elementos
* Al lanzar un par de dados, el evento la suma es igual a 7 ser:
4. PROBABILIDAD
Es una medida que expresa la tasa de ocurrencia de un evento a largo plazo. El valor de esta
medida est comprendido entre [0 y 1].
La probabilidad de que ocurra un evento A se define como el valor que corresponde al nmero de
casos favorables entre el nmero de casos posibles:
Ejemplos:
Si se lanza un dado, cual es la probabilidad de obtener un puntaje impar. Rpta. 0.5
De un juego de 52 naipes se extrae una carta al azar (aleatoria), cul es la probabilidad de obtener
un puntaje mayor de 9. Rpta. 0.3077
Si se lanza un dado 2 veces cul es la probabilidad de que:
- Se obtenga un puntaje igual a 8
- Se obtenga un puntaje <= a 4
- Se obtenga un puntaje < a 5 pero >= a 2
y = interseccin
Ejemplos:
1. De la urna que tienes a la derecha, sacamos una bola a azar y anotamos su nmero
a) Describe el espacio muestral. Cuntos casos tiene?
b) Describe los siguientes sucesos:
Bola Roja = A; Bola Verde = B; Bola Azul = C; Bola Roja con nmero
impar = D; Bola con nmero par = F
c) Calcula la probabilidad de cada uno de los sucesos anteriores
2. Cul es el espacio muestral correspondiente al lanzamiento de una moneda? Cul es la
probabilidad de cada una de las dos caras?
3. Si se lanza un dado, cul es la probabilidad de obtener un puntaje impar
4. Al extraerse una carta de un juego de 52 naipes, cual es la probabilidad de que sta sea de
color rojo o tenga un puntaje menor de 5.
5. En una encuesta aplicada a 50 estudiantes secundarios, 22 alumnos manifestaron inclinacin por la
Qumica, 28 por Estadstica y 10 alumnos por ambos cursos. Si se selecciona al azar a uno de estos
alumnos:
a) Cul es la probabilidad de que les guste Qumica o Estadstica?
b) De qu se incline por Qumica y Estadstica?
c) Qu no le guste ninguno de los 2 cursos?
6. En un saln de clase hay 15 alumnos y 24 alumnas, la tercera parte de los hombres y la mitad de
mujeres son de Chiclayo. Hallar la P[ ] de que sea alumno sea de Chiclayo; y de que sea alumna y
que haya nacido fuera de Trujillo.
TCNICAS DE CONTEO
Repaso de Factoriales
n! = 1x2x3x4xxn
0! = 1
1! = 1
PERMUTACIN Pn
Una permutacin es un conjunto de arreglos diferentes de n en n elementos de un total de n
Se lee: Pn = permutacin de n elementos.
Frmula:
Pn = n!
Ejemplo:
1. De cuntas formas diferentes se pueden sentar 3 personas ABC en 3 asientos consecutivos:
[ ABC, ACB, BAC, BCA, CAB, CBA ] P3 = 3! = 6
2. Cuntas juntas directivas diferentes se podran formar con las personas ABC y D, si dicha junta
tiene los cargos de Presidente, Vicepresidente, Secretario y Tesorero.
P4 = 4! = 24 juntas
COMBINACIN
m
C =
m!
n
(m-n)! n!
8
C3=
8! =
8!
(8-3)! 3! 5! 3!
VARIACIN
56 formas diferentes
m
V =
m!__
n
(m-n)!
Practica Calificada N 06
ACTIVIDAD N 1
A continuacin se describen varias situaciones. Contesta la pregunta, en cada caso, razonando las respuestas:
a) En una clase de 30 alumnos, 12 chicos y 18 chicas, cada uno escribe su nombre en una papeleta y la
introduce en una caja. Qu es ms probable que aparezca el nombre de una chica o de un chico?
b) Se lanza un dado cbico con las caras numeradas del 1 al 6. Qu es ms probable que salga el 5 o el 1?
c) Si lanzas una ficha cuyas caras son verde y rojo qu color esperas que salga?
ACTIVIDAD N 2
Indica el espacio muestral de los siguientes sucesos:
a) Obtener par, al lanzar un dado cbico con las caras numeradas del 1 al 6.
b) Lanzamos dos monedas al aire.
c) Obtener impar al lanzar un dado cbico.
ACTIVIDAD N 3
En cada uno de los siguientes experimentos aleatorios, diga cul es la probabilidad de que ocurra el suceso
que se indica:
a)
CESTA I
CESTA II
b) BOLSA I
BOLSA II
ACTIVIDAD N 4
Resolver:
1. Hallar la probabilidad de sacar por suma 4 o 11 al lanzar dos dados.
2. Una urna tiene 8 bolas rojas, 5 amarillas y 7 verdes. Se extrae una al azar, calcular la probabilidad de que:
Sea roja.
Sea verde.
Sea amarilla.
3. Se extrae aleatoriamente una baraja de un juego de 52 cartas. Cul es la probabilidad de que la carta
seleccionada?
a) Sea un as
b) Sea una carta negra un nmero menor de 5
c) Sea nmero 8 y de color rojo
4. De 100 personas que fueron consultadas sobre sus preferencias a la hora de realizar un deporte, 50
practicaban ftbol, 40 practicaban baloncesto y 30 practicaban ciclismo. Adems, 25 personas practicaban
futbol y baloncesto, 15 practicaban ftbol y ciclismo, y 12 practicaban baloncesto y ciclismo. Por ltimo, tan
slo 5 personas practicaban los tres deportes. El resto no sabe o no contesta.
a) Representa el diagrama de Venn correspondiente.
b) Calcula las siguientes probabilidades: P(practicar ftbol), P(practicar ftbol y baloncesto), P(practicar slo
ciclismo), P(practicar los tres deportes), P(practicar alguno de los tres deportes), P(no practicar ninguno de los
tres deportes.
Semana 7
PROBABILIDADES CONDICIONALES
Hasta ahora se ha estudiado la probabilidad absoluta de un evento, es decir sin relacionarlo uno con
otro. Sin embargo pudiera ser de inters calcular la probabilidad de que ocurra un evento de cierto
espacio muestral S a la luz de que otro evento de ese mismo espacio S ocurra.
Sean A y B dos eventos de un mismo espacio muestral S. La probabilidad condicional de A, dado
que ha ocurrido B (o viceversa), est dado por:
P[ A/B ] = probabilidad de que ocurra A habiendo sucedido B
P[ A/B ] = P[AB]
P[B]
= n (AB)
n(B)
Ejemplos:
1. En una empresa el 50% de trabajadores trabaja por la maana, el 30% lo hace por las tardes y el 20% tanto
en la maana como por la tarde; si se escoge aleatoriamente a un trabajador cualquiera:
a) Cual es la probabilidad de que trabaje en la maana si se conoce que labora en la tarde
b) Cual es la probabilidad de que trabaje por las tardes si se conoce que labora por la maana
SOLUCIN
A= labora en la maana . 50%
B= labora en la tarde .. 30%
A B = labora en los dos turnos 20%
a)
b)
2. De todos los alumnos que el ciclo pasado llevaron los cursos de Estadstica Aplicada y Matemtica I, se
tienen los siguientes datos:
El 20% desaprobaron Matemtica I
El 35% desaprobaron Estadstica Aplicada
El 10% desaprobaron ambos cursos
Si se escoge aleatoriamente a un alumno que lleva estos cursos, cual es la probabilidad de que este:
a) Haya sido desaprobado en Matemtica I conocindose que fue desaprobado en Estadstica Aplicada
b) Haya sido desaprobado en Estadstica Aplicada conocindose que fue desaprobado en Matemtica I
c) De que haya sido desaprobado en Matemtica I Estadstica Aplicada
SOLUCIN:
M = desaprob Matemtica I =20%
E = desaprob Estad. Aplicada =35%
M E = desaprobaron ambos cursos = 10
a)
b)
c) P[E UM] = P[E] + P[M] P[E M] = 35/100 + 20/100 10/100 = 9/20 = 45%
3. En la parte preferencial de un teatro solamente hay 120 asientos, los cuales son de 2 colores, azules o
negros; algunos son de madera y otros son metlicos. El resumen se presenta en el recuadro siguiente:
Asientos
Azul
Negro
Total
Metlicos
35
18
53
Madera
45
22
67
Total
80
40
120
Si se selecciona aleatoriamente uno de estos asientos, calcule la probabilidad de que este sea:
a) De color azul
b) De color negro metlico
c) El asiento elegido sea de madera
d) Sea de color azul si se sabe que es de metal
e) El asiento sea de madera si se sabe que es de color negro
f) El asiento no sea de color azul
SOLUCIN
A= Azul,
N=Negro,
M=Metlico,
Ma=Madera
TEOREMA DE BAYES
Es un caso particular de la probabilidad condicional.
Si A1, A2, A3, , An, son sucesos mutuamente excluyentes de los cuales al menos uno de los
sucesos Ai (i=1,2,3,,n) debe ocurrir y siendo B un suceso cualquiera del espacio muestral, la
probabilidad de que ocurra el suceso Ak habiendo ocurrido B se puede definir como:
P[Ak / B] = P[Ak] . P[B/Ak]
P[Ai] . P[B/Ai]
Ejemplo 1
1. En una empresa el 50% de trabajadores pertenecen al rea tcnica profesional, el 30% son
oficinistas y el 20% pertenecen al rea de personal de servicio; se sabe adems que el 8, 9 y 10% de
los tcnicos profesionales, oficinistas y personal de servicio respectivamente son provincianos.
a) Represente las condiciones enunciadas en un rbol de probabilidades
b) Si se selecciona al azar un trabajador, cual es la probabilidad de que este sea tcnico
profesional o personal de servicio.
c) Sea tcnico profesional si se conoce que es provinciano
d) Sea de personal de servicio si se sabe que es de la capital
SOLUCIN
T= tcnico profesional
O=oficinistas
S=personal servicio
P=provinciano
C=capital
a) rbol de probabilidades
b) P[T U S] = P[T] + P[S] P[T S] = 50/100 + 20/100 0 = 70/100 = 70%
c) P[T/P] = _________50/100 x 8/100_______________________
50/100x8/100 + 30/100x9/100 + 20/100x10/100
= 50 x 8_____________ = ___400
50x8 + 30x9 + 20x10 400+270+200
d) P[S/C] = P[S].P[C/S]
P[T].P[C/T] + P[O].P[C/O] + P[S].P[C/S]
= 20/100 . 90/100
50/100x92/100 + 30/100x91/100 + 20/100x90/100
= 1800
= 1800 / 9130 = 180/913 19.72 %
4600 + 2730 + 1800
Ejemplo 2
El 70% de los pacientes de un hospital son mujeres y el 20% de ellas son fumadoras. Por otro lado el
40% de los pacientes hombres son fumadores. Se elige al azar un paciente del hospital. Cul es la
probabilidad de que sea fumador?
Solucin
Ejemplo 3
Consideremos un control de calidad de una empresa en el cual se desea saber la probabilidad de que
un determinado artefacto tenga una vida til superior a las 1200hs. Para ello el dpto. de Control de
Calidad separa 500 unidades de la produccin y mide la vida til de cada unidad. Los resultados de
observan en la siguiente tabla:
Duracin(en hs)
Menos de 800
800 a 899
900 a 999
1000 a 1099
1100 a 1199
1200 a 1299
1300 a 1399
1400 a ms
Total
P(A) = 115 + 84 +41
500
Frec. Abs.(fi)
10
40
55
70
85
115
84
41
Frec. Relat.
2%
8%
11%
14%
17%
23%
17%
8%
500
100%
= 23% + 17% + 8%
= 48%
Prctica Calificada N 07
Ejercicio 1:
Tres mquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total de las piezas
producidas en una fbrica. Los porcentajes de produccin defectuosa de estas mquinas son del 3%,
4% y 5%.
a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.
b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de haber sido
producida por la mquina B.
c. Qu mquina tiene la mayor probabilidad de haber producido la citada pieza
Ejercicio 2:
Tras un estudio estadstico en una ciudad se observa que el 70% de los motoristas son varones y, de
estos, el 60% llevan habitualmente casco. El porcentaje de mujeres que conducen habitualmente con
casco es del 40%. Se pide:
a. Calcular la probabilidad de que un motorista elegido al azar lleve casco.
b. Se elige un motorista al azar y se observa que lleva casco. Cul es la probabilidad de que sea
varn?
Ejercicio 3:
En una ciudad, el 35% vota al partido A, el 45% vota al partido B y el resto se abstiene. Se sabe
adems que el 20% de los votantes de A, el 30% de los de B y el 15% de los que se abstienen, son
mayores de 60 aos. Se pide:
a. Hallar la probabilidad de que un ciudadano elegido al azar sea mayor de 60 aos.
b. Hallar la probabilidad de que un ciudadano mayor de 60 aos se haya abstenido.
Ejercicio 4:
Los alumnos de Primero de Biologa tienen que realizar dos pruebas, una terica y otra prctica. La
probabilidad de que un estudiante apruebe la parte terica es de 0.6, la probabilidad de que apruebe
la parte prctica es de 0.8 y la probabilidad de que apruebe ambas pruebas es 0.5.
a.
b.
c.
d.
Ejercicio 5:
El 35% de los crditos de un banco es para vivienda, el 50% para industrias y el 15% para consumo
diverso. Resultan fallidos el 20% de los crditos para vivienda, el 15% de los crditos para industrias
y el 70% de los crditos para consumo. Calcula la probabilidad de que se pague un crdito elegido al
azar.
Ejercicio 6:
El volumen de produccin en tres plantas diferentes de una fbrica es de 500 unidades en la primera,
1000 unidades en la segunda y 2000 en la tercera. Sabiendo que el porcentaje de unidades
defectuosas producidas en cada planta es del 1%, 0.8% y 2%, respectivamente, calcula la
probabilidad de que al seleccionar una unidad al azar sea defectuosa.
Ejercicio 7:
El 20% de los empleados de una empresa son ingenieros y otro 20% son economistas. El 75% de los
ingenieros ocupan un puesto directivo y el 50% de los economistas tambin, mientras que de los no
ingenieros y no economistas solamente el 20% ocupan un puesto directivo. Cul es la probabilidad
de que un empleado directivo elegido al azar sea ingeniero?
Semana 8
Variable Aleatoria
Definicin: Una variable aleatoria es una funcin definida sobre un espacio muestral a los
nmeros reales. Si ese espacio muestral especificado como dominio es numerable, decimos
que la variable es de tipo discreto, en caso contrario diremos que es de tipo continuo.
En el experimento de lanzar una moneda, una vez, definimos la variable aleatoria X: el
nmero de sellos obtenido.
FUNCIN DE PROBABILIDAD
Las variables aleatorias, transforman eventos del espacio muestral en eventos numricos, los
cuales desde luego, tienen asociada una probabilidad de ocurrencia.
1. Funcin de Probabilidad f(x)=p(X=x): Es una funcin definida sobre una variable aleatoria a los
reales en el intervalo [0,1] que cumple con los axiomas de la teora de la probabilidad.
Ejemplo:
En el Lanzamiento de una Moneda,
X: Nmero de Sellos
Ejemplo:
X es la Suma Obtenida en el Lanzamiento de dos Dados:
DISTRIBUCIN BINOMIAL
DISTRIBUCIN DE POISSON
La distribucin de Poisson es de gran utilidad cuando tenemos variables distribuidas a travs del
tiempo del espacio. Es el caso del nmero de llamadas que entran a una central telefnica en una
unidad de tiempo, la cantidad de personas que atiende un cajero en una hora, los baches por
kilmetro en una autopista, los artculos defectuosos que hay en un lote de produccin; amn de su
utilizacin como aproximacin binomial cuando p es muy cercano a cero, o n superior a 30. (p<0.1 ,
n>30).
La funcin de probabilidad de Poisson es:
Ejemplo:
Un cajero de un banco atiende en promedio 7 personas por hora, cual es la probabilidad de que un
una hora determinada:
1. Atienda menos de 5 personas
2. Atienda ms de 8 personas
3. Atienda ms de 5 pero menos de 8 personas
4. Atienda exactamente 7 personas
Consultando la tabla para la distribucin de Poisson:
Ejemplo:
En cierto ncleo poblacional, el 0.5% es portador del V.I.H. En una muestra de 80 personas, cual es
la probabilidad:
1. De que haya alguna persona portadora.
2. No haya personas portadoras.
Solucin:
DISTRIBUCIN NORMAL
Dada la caracterizacin propia de este modelo continuo, donde coinciden las medidas de tendencia
central, media, moda y mediana; la simetra respecto a estos parmetros y la facilidad de su
aplicacin hacen de la distribucin normal, una herramienta de uso comn, mxime que la mayora
de las variables econmicas y sociales se ajustan a una funcin normal.
La distribucin normal, tambin es til como aproximacin de los modelos binomial y poisson
expuestos anteriormente, y yendo un poco ms adelante, sustentados en el teorema del lmite
central podemos afirmar que, cuando el tamao de la muestra es lo suficientemente grande,
podemos asumir el supuesto de normalidad para una suma de variables.
La forma acampanada de la variable normal, resalta la perfeccin de esta curva definida por los
parmetros
Sin embargo, existen infinitas distribuciones normales, ya que por cada media aritmtica
varianza diferente se describe una funcin tambin diferente:
Las grficas de este tipo son muy corrientes: Hay pocos individuos en los
extremos y un aumento paulatino hasta llegar a la parte central del
recorrido, donde est la mayora de ellos.
DEFINICIN :
Es la distribucin ms importante en la estadstica.
Es una distribucin simtrica con respecto a su promedio, teniendo la media,
mediana y moda el mismo valor. El valor mximo ocurre cuando
U = Me = Mo
En el caso de la
Distribucin normal de
parmetros x y ,
dicha funcin viene dada
por:
<=
>=
Z=xu
Casos:
I.
P [xx] = P [ Z x u ]
a)
c)
..
Ver en tablas
Practica Calificada N 08
1. La probabilidad de que un visitante efecte una compra en un almacn, durante un
da dado es 0.8. Si al negocio entran 20 clientes, cul es la probabilidad de que el
almacn realice:
1.1 Exactamente 16 ventas?
1.2 Menos de 17 ventas?
1.3 Ms de 14 ventas?
1.4 Exactamente 5 ventas?
1.5 Cul es el nmero esperado de ventas?
2. Si un almacn tiene en promedio 5 ventas por hora. Cul es la probabilidad de que
en una hora determinada:
2.1 Haya exactamente 4 ventas?
2.2 Haya ms de 3 ventas?
2.3 No se efecten ventas?
3. Una de cada 10 personas mayores de 40 aos de una comunidad, sufren de
hipertensin. Se toma una muestra de 50 personas mayores de 40 aos.
Utilizando primero la distribucin binomial y luego la aproximacin a la distribucin
de Poisson, responder y comparar los resultados:
3.1 Cul es la probabilidad que haya ms de 4 hipertensos?
3.2 Cul es la probabilidad que haya exactamente 5hipertensos?
4. Un lote de arandelas tiene un dimetro normal con media 10 milmetros y
desviacin tpica 0.5 milmetros. Se toma una arandela al azar. Cul es la
probabilidad de que tenga un dimetro:
4.1 Superior a 10.5 milmetros?
4.2 Entre 9 y 11 milmetros?
4.3 Menos de 9 milmetros?
Semana 10
T E C N IC A S D E
MUESTREO
reas
Estratificado
Grupo
Por
Simple
Bola de Nieve
Por
Cuota
Por
Juicio
Por
Conveniencia
Por
Sistemtico
P ro b a b ils tic o
N o P r o b a b ils t ic o
TCNICAS NO PROBABILSTICAS:
Es aquella en la cual los elementos del conjunto poblacin no tienen la misma probabilidad
de ser seleccionado.
1. Por Conveniencia: Su principal debilidad es el nombre, ya que, para muchas personas el
nombre da a entender que se est haciendo la seleccin de las unidades de anlisis amaando
las respuestas, situacin que no es cierta, toma su nombre, debido a que se busca obtener una
representatividad de la poblacin consultando o midiendo unidades de anlisis que pueden ser
accesadas con relativa facilidad. Es uno de los muestreos con mayor uso, dado esa
particularidad.
2. Por Juicio: Se busca seleccionar a individuos que se juzga de antemano tienen un
conocimiento profundo del tema bajo estudio, por lo tanto, se considera que la informacin
aportada por esas personas es vital para la toma de decisiones. En el rea de vacunas
sintticas, el Dr. Patarroyo, es considerado una eminencia, luego sera un personaje ideal para
hablar sobre esa temtica. Si se utilizar un mtodo aleatorio, probablemente quedaran en la
muestra algunas personas con poco dominio sobre el tema en estudio.
TCNICAS PROBABILSTICA:
Es aquella mediante la cual cada uno de los elementos de la poblacin tienen la misma
oportunidad de ser seleccionados
Ejemplo Aplicativo
1. Una empresa decide premiar a sus trabajadores por el xito obtenido en la ltima campaa,
sorteando 10 pasajes entre ellos a la ciudad del Cuzco, incluyendo bolsa de viaje.
Haga la seleccin de los trabajadores favorecidos en forma aleatoria simple, utilizando una
tabla de nmeros aleatorios.
Punto de partida: Columna 8 y fila 5
Respuesta
Nmeros ledos en la tabla:
2. Efecte la seleccin de los 10 trabajadores del ejemplo anterior mediante un muestreo aleatorio
sistemtico. Escoja aleatoriamente entre los 8 primeros trabajadores a uno y luego seleccione los
restantes de tres en tres (contando a partir del primer trabajador seleccionado).
Punto de partida para seleccionar al primero: Columna 3 y fila 7.
Primer trabajador seleccionado es el nmero: .
Trabajadores restantes:
3. Supongamos que el dueo de la Empresa decide premiar a slo 15 trabajadores, pero en la
premiacin deben estar trabajadores de todas las reas en forma proporcional a la cantidad que
aparece en la lista.
Solucin
Tenemos la siguiente distribucin de trabajadores por seccin:
Jefatura
Of. de Auditora Interna
Of. de Asesora Jurdica
Of. de Planeamiento y Desarrollo
Secretara General
Of. de Administracin
3
8
5
7
6
6
Total
35
N Trabajadores
Porcentaje %
3
8
5
7
8.57
22.86
14.29
20.00
6
6
35
17.14
17.14
100
N Trabajador
Considerado
1
3
2
3
3
3
15
X : 8.57 * 15
X = 1.29 trabajador, equivale a 1
100
Una vez determinado el nmero a seleccionar en cada estrato, en cada uno de ellos se aplica
muestreo aleatorio simple.
TAMAO DE LA MUESTRA
El tamao de la muestra es el nmero de sujetos que componen la muestra
extrada de una poblacin, necesarios para que los datos obtenidos sean
representativos de la poblacin
Conceptos:
Parmetro:
Estadstico:
Caracterstica de la Poblacin
Caracterstica de la Muestra
Error Muestral
= 0.01
/2
/2
0.99
F(z) = 0.995
z = 2.58
* Nivel de Confianza
99%
98%
97%
96%
95%
94%
93%
92%
91%
90%
z = 2.58
z = 2.33
z = 2.17
z = 2.05
z = 1.96
z = 1.88
z = 1.81
z = 1.75
z = 1.70
z = 1.64
n = z2.p.q
Dnde:
N.z2.p.q
n=
(N-1).D2+z2.p.q
z: nivel de confianza
D: error aceptado/precisin requerida
p: probabilidad de xito que ocurra el suceso
q: probabilidad que no ocurra el suceso
NOTA1: Para poblacin finita, si el valor de n/N > 0.05; se debe corregir el tamao
de la muestra de la siguiente manera:
n = ____n____
(1 + n/N)
NOTA2: Si no se conoce el dato previo de p y q, se asume que cada uno de ellos vale
50%, es decir:
p = q = 0.50 = 50%
Cuando se supone p=q=0.50, se obtiene el mximo tamao de muestra, es
decir que para cualquier tamao de p y q, n sea menor.
n=
n = (z . / D) 2
N.z2. 2
__
(N-1).D2 + z2. 2
Dnde 2 = varianza
NOTA1: Para poblacin finita, si el valor de n/N > 0.05; se debe corregir el
tamao de la muestra de la siguiente manera:
n = ____n____
(1 + n/N)
NOMENCLATURA
n = Nmero de elementos de la muestra
N = Nmero de elementos de la poblacin o universo
P/Q = Probabilidades con las que se presenta el fenmeno.
Cuando el valor de P y de Q sean desconocidos o cuando la encuesta abarque
diferentes aspectos en los que estos valores pueden ser desiguales, es conveniente
tomar el caso ms adecuado, es decir, aquel que necesite el mximo tamao de la
muestra, lo cual ocurre para P = Q = 50, luego, P = 50 y Q = 50.
Z = Valor crtico correspondiente al nivel de confianza elegido
E = Margen de error permitido (determinado por el responsable del estudio).
Suponga que las estaturas de los hombres de cierto pas tienen distribucin normal con
desviacin estndar de 2.5 pulgadas. De qu tamao se debe tomar la muestra si se desea
determinar un intervalo de confianza del 95% para la media con un error de estimacin de
0.5?
Solucin
Datos:
= 2.5
n = (z. / D)2
z = 95% = 1.96
n = (1.96x2.5/0.5)2
D = 0.5
n = 96.04
n = 96 hombres
2.
3.
n = (z. /D)2
n = (1.64x1000/250)2
n = 43.03
n = 43 expedientes
n _ = 211
1 + 211
1500
185 estudiantes
Interpretacin: Se debe tomar en cuenta a 185 estudiantes para que el resultado tenga una
confianza del 95% y una precisin de 500$ ( un error no mayor a $500)
4.
Se desea estimar el peso promedio de 800 naranjas. Para ello se va a escoger aleatoriamente
cierto # de ellas. Se desea que el erro de estimacin sea mximo de 3 gr con una confianza
del 90%. Cuntas naranjas deben seleccionarse?. Suponga que la varianza es
aproximadamente de 144 gramos al cuadrado.
Solucin
Datos:
N = 800
n = N . z2 . 2_____
D = 3 grs
(N-1).D2 + z2. 2
z = 1.64
2 = 1.44
n = 800 . (1.64) 2 . (144)
799.(3)2 + (1.64)2.144
n = 40.885
n = 41 naranjas
39 naranjas
Interpretacin: Se debe considerar a 39 naranjas para que el peso promedio calculado tenga
una confianza del 90%, con un error mximo de 3 gramos.
5.
6.
El jefe de personal de una empresa desea realizar una encuesta para determinar la
proporcin de trabajadores que est a favor de un cambio en el horario de trabajo. Como es
imposible consultar a los 500 trabajadores en un lapso razonable, procede a escoger
aleatoriamente cierto # de trabajadores para entrevistarlos; determine el nmero de
trabajadores que debe entrevistarse si desea que la proporcin estimada presente un error
mximo del 5% y un nivel de confianza del 95%.
Solucin
Datos:
N = 500
n = N. z2 . p.q__
D = 0.05
(N-1).D2 + z2.p.q
z = 95% = 1.96
p = q = 0.50
n = 500 . (1.96) 2 . (0.50)2
499.(0.05)2 + (1.96)2.(0.50)2
n = 217.49
n = 217 trabajadores
En este caso se hace la comprobacin:
n = 217 = 0.434 > 0.05
N 500
Se debe corregir a:
1 + n_
N
n _ = 217
1 + 217
500
151 trabajadores
Interpretacin: Para que el porcentaje de trabajadores que estn a favor del cambio de
horario calculado tenga una confianza del 95% y un error no mayor al 5%, se deben
considerar como muestra 151 trabajadores.
7.
Un prospecto de comprador desea estimar el promedio de ventas por cliente (en $) en una
tienda de juguetes ubicada en un aeropuerto. Con base en datos de otras tiendas similares, se
estima que la desviacin estndar de ese tipo de ventas es de aprox. $32. Qu tamao de
muestra se debe utilizar como mnimo, se desea estimar las ventas promedio con un margen
de error de $8 y un intervalo de confianza del 99%?
Solucin
Datos:
= $32
n = (z. /D)2
D=8
n = ( 2.58 x 32 )2
z = 99% = 2.58
8
n = 107
Interpretacin: Para que el promedio de ventas calculado sea aceptado con un 99% de
confianza y un error que no sobrepase los 8 dlares, el tamao a considerar debe ser de 107
ventas.
El error generalmente no debe sobrepasar a un cuarto de la desviacin estndar, si
sobrepasa la muestra es pequea.
8.
p = 0.30
q = 0.70
D = 0.05
z = 1.64
n = (1.64)2 .(0.30).(0.70)
(0.05)2
n = 225.93
n = 226 estudiantes
Practica Calificada N 10
1. Queremos ajustar una mquina de refrescos de modo que el promedio del lquido dispensado quede
dentro de cierto rango. La cantidad de lquido vertido por la mquina sigue una distribucin normal con
desviacin estndar 015 decilitros. Deseamos que el valor estimado que se vaya a obtener comparado
con el verdadero no sea superior a 02 decilitros con una confianza del 95%.De qu tamao debemos
escoger la muestra?
2. Es necesario estimar entre 10.000 establos, el nmero de vacas lecheras por establo con un error de
estimacin de 4 y un nivel de confianza del 95%. Sabemos que la varianza es 1.000. Cuntos establos
deben visitarse para satisfacer estos requerimientos?
3. Una mquina llena cajas con cierto cereal. El supervisor desea conocer con un error de estimacin de
mximo 01 y un nivel de confianza del 90%, una media estimada del peso. Como la varianza era
desconocida se procedi a escoger una muestra piloto. Los resultados fueron los siguientes: 1102, 1114,
1078, 1159, 1158, 1119, 1171, 1127, 1093, 1094. Cuntas cajas debe escoger para que se cumplan
los requisitos propuestos?
4. Se desea conocer el peso promedio de una determinada clase de pescado con un error de estimacin de
002 y con un nivel de confianza del 99%. Por datos anteriores se sabe que el peso mnimo es 148 libras
y el mximo es de 247 libras.De qu tamao debe escoger la muestra? Suponga que los pesos de estos
pescados se distribuyen normalmente.
5. Se desea hacer una encuesta para determinar la proporcin de familias que carecen de medios
econmicos para atender los problemas de salud. Existe la impresin de que esta proporcin est prxima
a 035. Se desea determinar un intervalo de confianza del 95% con un error de estimacin de 005. De
qu tamao debe tomarse la muestra?
6. Un productor de semillas desea saber con un error de estimacin del 1% el porcentaje de semillas que
germinan en la granja de su competidor. Qu tamao de muestra debe tomarse para obtener un nivel de
confianza del 95
7. Se desea realizar una encuesta entre la poblacin juvenil de una determinada localidad para determinar
la proporcin de jvenes que estara a favor de una nueva zona de ocio. El nmero de jvenes de dicha
poblacin es N=2.000. Determinar el tamao de muestra necesario para estimar la proporcin de
estudiantes que estn a favor con un error de estimacin de 005 y un nivel de confianza del 95
8. Un bilogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un
estudio anterior de diez ciervos cazados mostr que la desviacin estndar de sus pesos es de 12.2
libras. Qu tan grande debe ser una muestra para que el bilogo tenga el 95% de confianza de que el
error de estimacin es a lo ms de 4 libras?
9. Una empresa elctrica fabrica focos que tienen una duracin aproximadamente normal con una
desviacin estndar de 40 horas. De qu tamao se necesita una muestra si se desea tener 96% de
confianza que la media real est dentro de 10 horas de la media real?
10. Suponga que en el ejercicio anterior se tiene una poblacin de 300 focos, y se desea saber de
que tamao debe de ser la muestra. El muestreo se realizar sin reemplazo.
11. En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canad,
se encuentra que 340 estn suscritas a HBO. Qu tan grande se requiere que sea una muestra si se
quiere tener 95% de confianza de que la estimacin de P est dentro de 0.02?
12. Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qu proporcin
del electorado conoce la opinin de ella, respecto al uso de fondos estatales para pagar abortos. Qu
tamao de muestra se necesita si se requiere un confianza del 95% y un error mximo de estimacin de
0.10?
Semana 11
Estimador
Es la regla o procedimiento, expresado en general por medio de una frmula, que se utiliza para
deducir la estimacin.
Estimacin
Es un valor especfico observado de un estimador, por lo que asigna uno o varios valores
numricos a un parmetro de una poblacin sobre la base de datos de muestra.
Tipos de estimacin
a) Estimacin puntual:
Consiste en un solo estadstico muestral que se usa para estimar el valor verdadero de un
parmetro de una poblacin que es desconocido.
Cuando usamos una estimacin puntual, sabemos que aunque usemos un mtodo bueno
de estimacin es prcticamente improbable que el valor de la estimacin coincida con el
verdadero valor del parmetro, as que sera conveniente acompaar nuestra estimacin
con alguna medida que nos permitiera expresar la cercana del estimador al parmetro.
Una solucin a ello no los brindan los estimadores por Intervalos de Confianza.
Conceptos bsicos
Nivel de Confianza
Est asociado con la probabilidad de que el intervalo de confianza contenga al parmetro de la
poblacin y es expresado en porcentaje. Los niveles de confianza que ms se utilizan son 90%,
95% y 99%.
Lo denotaremos por 1, donde es un valor tal que 0 1. Note que a medida que e
acerca a 0, 1se acerca a 1, sto significa que aumenta la probabilidad de que el intervalo
construido contenga al verdadero valor del parmetro que estamos estimando.
Nivel de Significacin:
Llamaremos as al valor de .
Lmites de Confianza
Son el lmite inferior y superior de un intervalo de confianza.
Muestra Grande: n 30
.z
Dnde:
z = distribucin normal
CASO II
.t
Dnde:
s = desviacin estndar
t = distribucin t-Student; se calcula usando el grado de confianza
y los grados de libertad.
Ejemplo:
Si = 95% (0.95) y n = 8
= 5% (0.05)
p = 0.95 + 0.025 = 0.975 (tambin se halla p = 1 - /2)
Grados de libertad: n-1 = 8 1 = 7
Con p = 0.975 y n =7 , se lleva a la tabla de la funcin de
distribucin t-Student, donde t = 2.447
(1,711)
(1.740)
Ejemplo 1
Se desea estimar la experiencia docente promedio de los profesores de cierta universidad, y para
tal efecto se toma una muestra de 8 de ellos, siendo los resultados de experiencia medidos en
aos los siguientes: ( = 95%)
{11,9,7,13,10,5,7,12} aos
Solucin
Hallamos
= (11+9+7+13+10+5+7+12)/8 = 9.25
2
S = (xi - )2 =(11-9.25)2 + (9-9.25)2 + (7-9.25)2 + + (12-9.25)2
n-1
7
S = 7.62 = 2.76
= 9.25
Usando:
2.76 . 2.447
8
+,
-,
+=1
Si tenemos que
Confianza
0.90 (90%)
0.95 (95%)
0.99 (99%)
0.10
0.05
0.01
/2
0.05
0.025
0.005
p= 1-/2
0.950
0.975
0.995
Ejemplo 2
Se tom una muestra aleatoria de 50 candidatos que se presentan a realizar la prueba de
suficiencia en el departamento de seleccin, donde se tiene una media de 150 puntos y una
desviacin de 63 puntos. Calcular el intervalo de confianza del 95%
Solucin
.z
n
= 150
= 63
= 150
63 . 1.96
50
150 + 14.369
164.369
150 14.369
135.631
Solucin
La estimacin puntual de es 2.6.
* El valor de z del 95% es 1.96, por lo tanto el intervalo lo calcularamos como:
2.6
[2.47,2.73]
Ejemplo 4
Extraemos una muestra de 61 estudiantes universitarios, ellos responden a una prueba de
inteligencia en la que alcanzan una media de 80 y una varianza de 100. Entre qu lmites se
hallar la verdadera inteligencia media de los estudiantes, a un nivel de confianza del 99%?
Solucin
1- = 0.99 = 0.01 1 - /2 = 0.995
2El tamao muestral es mayor que 30, por tanto buscamos en las tablas la
distribucin t de Student t0.995 (60) = 2.66
Sabemos que
10
61
Practica Calificada N 11
I.
ESTIMACION PUNTUAL
1.
2.
3.
4.
5.
II.
Los siguientes datos corresponden a los pesos (en kilogramos) de 15 hombres escogidos
al azar y que trabajan en una empresa: 72, 68, 63, 75, 84, 91, 66, 75, 86, 90, 62, 87, 77,
70,69. Estime el peso promedio y la desviacin estndar.
Entre los miembros de una comunidad se escogieron 150 personas al azar y se les
pregunt si estaban de acuerdo con los programas que el gobierno estaba desarrollando
para prevenir el consumo de drogas; la encuesta dio como resultado que 130 s estaban de
acuerdo. Estime la proporcin de los que estaban de acuerdo y el error estndar.
De las 50 aulas que tiene un edificio de la facultad de matemticas se escogieron al azar 5
y se determin el nmero de alumnos que haba en cada una de ellas en la primera hora
de clases. Estime el nmero de alumnos que hay en el edificio si todas las aulas se
encuentran ocupadas a esa hora, y si el numero de alumnos en cada una de las aulas
inspeccionadas fue: 24, 35, 16, 30, 28.
Teniendo en cuenta los datos del problema I, estime el error del peso promedio.
Teniendo en cuenta los datos del problema III, estime el error del nmero total de
estudiantes.
ESTIMACIN POR INTRVALOS
1. Una muestra aleatoria de 36 cigarrillos de una marca determinada dio un
contenido promedio de nicotina de 3 miligramos. Suponga que el contenido de
nicotina de estos cigarrillos sigue una distribucin normal con una desviacin
estndar de 1 miligramo.
a. Obtenga e interprete un intervalo de confianza del 95% para el verdadero
contenido promedio de nicotina en estos cigarrillos.
b. El fabricante garantiza que el contenido promedio de nicotina es de 2,9
miligramos, qu puede decirse de acuerdo con el intervalo hallado?
2. El tiempo(en minutos) que tardaron 15 operarios para familiarizarse con el manejo
de una mquina moderna adquirida por la empresa fue: 3,4, 2,8, 4,4, 2,5, 3,3, 4,
4,8, 2,9, 5,6, 5,2, 3,7, 3, 3,6, 2,8,4,8. Suponga que los tiempos se distribuyen
normalmente.
3. Determine e interprete un intervalo del 95% de confianza para el verdadero
tiempo promedio
4. el instructor considera que el tiempo promedio requerido por la poblacin de
trabajadores que recibe instruccin sobre esta m quina es superior a 5 minutos,
qu se puede decir de acuerdo con el intervalo hallado?
5. Se desea medir la diferencia entre dos categoras de empleados en la actividad de
seguros. Una est formada por personas con ttulo superior y la otra por personas
que slo tienen estudios secundarios. Tomamos una muestra de 45 empleados
entre los primeros y la media de ventas resulta ser 32. Tomamos 60 empleados del
segundo grupo y la media es 25. Suponga que las ventas de los dos grupos se
distribuyen normalmente con varianzas de 48 para los titulados superiores y 56
para los de estudios secundarios.
6. Calcule e interprete un intervalo del 90% de confianza para la verdadera
diferencia de las medias.
7. De acuerdo con el intervalo hallado, hay evidencia de que las medias sean
iguales?
8. Se registraron los siguientes datos, en minutos, que tardan algunos hombres y
mujeres en realizar cierta actividad en una empresa, los cuales fueron
seleccionados aleatoriamente.
HOMBRES MUJERES
n1=14
n2=25
Media=17
Media=19
Varianza=1,5 Varianza=1,8
9. Suponga que los tiempos para los dos grupos se distribuyen normalmente y que
las varianzas son iguales, aunque desconocidas.
10. Calcule e interprete un intervalo de confianza del 99% para la verdadera
diferencia de medias.
11. De acuerdo con el intervalo hallado, hay evidencia de que los dos tiempos
promedio son iguales?
12. Una fbrica desea saber la proporcin de amas de casa que preferiran una
aspiradora de su marca. Se toma al azar una muestra de 100 amas de casa y 20
dicen que les gustara la mquina. Calcule e interprete un intervalo del 95% de
confianza para la verdadera proporcin de amas de casa que preferiran dicha
aspiradora.
13. Se est considerando cambiar el procedimiento de manufactura de partes. Se
toman muestras del procedimiento actual as como del nuevo para determinar si
este ltimo resulta mejor. Si 75 de 1.000 artculos del procedimiento actual
presentaron defectos y lo mismo sucedi con 80 de 2.500 partes del nuevo,
determine un intervalo de confianza del 90% para la verdadera diferencia de
proporciones de partes defectuosas.
14. Un fabricante de bateras para automvil asegura que las bateras que produce
duran en promedio 2 aos con una desviacin estndar de 0,5 aos. Si cinco de
estas bateras tienen duracin 1,5, 2,5, 2,9, 3,2, 4 aos, determine un intervalo del
95% para la varianza e indique si es cierta la afirmacin del fabricante.
15. Tomando en cuenta los datos del problema IV, determine un intervalo del 90% de
confianza para el cociente de varianzas
Semana 12
Dentro del estudio de la inferencia estadstica, se describe como se puede tomar una muestra
aleatoria y a partir de esta muestra estimar el valor de un parmetro poblacional en la cual se
puede emplear el mtodo de muestreo y el teorema del valor central lo que permite explicar
como a partir de una muestra se puede inferir algo acerca de
una poblacin, lo cual nos lleva a definir y elaborar una
distribucin de muestreo de medias muestrales que nos permite
explicar el teorema del limite central y utilizar este teorema
para encontrar las probabilidades de obtener las distintas
medias maestrales de una poblacin.
Pero es necesario tener conocimiento de ciertos datos de la
poblacin como la media, la desviacin estndar o la forma de
la poblacin, pero a veces no se dispone de esta informacin.
En este caso es necesario hacer una estimacin puntual que es
un valor que se usa para estimar un valor poblacional. Pero una
estimacin puntual es un solo valor y se requiere un intervalo de valores a esto se denomina
intervalote confianza y se espera que dentro de este intervalo se encuentre el parmetro
poblacional buscado. Tambin se utiliza una estimacin mediante un intervalo, el cual es un
rango de valores en el que se espera se encuentre el parmetro poblacional
En nuestro caso se desarrolla un procedimiento para probar la validez de una aseveracin acerca
de un parmetro poblacional este mtodo es denominado Prueba de hiptesis para una muestra.
Definicin de HIPTESIS
Hiptesis es una aseveracin de una poblacin elaborado con el propsito de ponerla a prueba.
En el anlisis estadstico se hace una aseveracin, es decir, se plantea una hiptesis, despus se
hacen las pruebas para verificar la aseveracin o para determinar que no es verdadera.
Por tanto, la prueba de hiptesis es un procedimiento basado en la evidencia muestral y la teora
de probabilidad; se emplea para determinar si la hiptesis es una afirmacin razonable.
Tipos de Hiptesis
La premisa de la cual se parte sobre el comportamiento de la poblacin se conoce como la
hiptesis nula. Se le llama nula pues la misma generalmente indica, por ejemplo, que la media
poblacional es cero; que no hay diferencia entre los parmetros asociados a grupos en la
poblacin; o que el medicamento no es efectivo en la poblacin de pacientes.
La hiptesis nula se denota usualmente en smbolos por H0. El cero nos recuerda que se parte de
la premisa de que el efecto es nulo o que las diferencias entre los grupos es cero.
Al hacer investigaciones es usual pensar en una hiptesis de investigacin, tal como: demostrar
que el medicamento es efectivo; demostrar que hay una diferencia significativa en la ejecucin
en una prueba entre individuos que durmieron toda la noche e individuos que no durmieron, o
que unas plantas tratadas con hormonas crecen ms que el grupo control. Esta hiptesis, lo que el
investigador desea demostrar sobre la poblacin, se conoce como la hiptesis alternativa y se
denota por Ha.
En conclusin
Ejemplo 1
Una persona es arrestada y se le acusa de cometer algn crimen. Inicialmente, esta persona es
considerada inocente. Usando los datos o evidencia disponible el fiscal debe demostrar que sin
duda razonable, la persona en efecto cometi el crimen.
En el caso de un acusado, la hiptesis nula es que el individuo es inocente. Sin embargo, para
decidir que un individuo no es culpable, no basta con observar muchas acciones o evidencia
consistentes con su inocencia, las que por s solas generalmente no demuestran su inocencia. Por
el otro lado, observar comportamiento culposo permite llegar eventualmente a la decisin de
encontrar al individuo culpable, rechazando la hiptesis nula.
Ejemplo 2
Una maestra desea investigar si el refuerzo positivo a sus estudiantes les ayuda a obtener un
mejor desempeo en el prximo examen. Para esto divide aleatoriamente a sus estudiantes en
dos grupos. Al grupo A les felicita cuando hacen algo bien y les refuerza positivamente, mientras
que al grupo B les trata neutralmente. La metodologa de enseanza es la misma para ambos
grupos.
La hiptesis nula en este caso es que no hay diferencia entre los grupos en la puntuacin
promedio en la prueba, es decir, ambas medias son iguales: H0: A = B, lo cual se puede
escribir en forma equivalente H0: A - B = 0. La hiptesis alternativa contiene el resultado que
el maestro desea probar, que la puntuacin promedio del grupo A es mayor que la obtenida por
los estudiantes del grupo B, H0: A > B.
Tipos de errores
Cualquiera sea la decisin tomada a partir de una prueba de hiptesis, ya sea de aceptacin del
Ho o de la Ha, puede incurrirse en error:
Un error tipo I se presenta si la hiptesis nula Ho es rechazada cuando es verdadera y deba ser
aceptada. La probabilidad de cometer un error tipo I se denomina con la letra alfa
Un error tipo II, se denota con la letra griega se presenta si la hiptesis nula es aceptada
cuando de hecho es falsa y deba ser rechazada.
En cualquiera de los dos casos se comete un error al tomar una decisin equivocada.
En la siguiente tabla se muestran las decisiones que pueden tomar el investigador y las
consecuencias posibles.
Para que cualquier ensayo de hiptesis sea bueno, debe disearse de forma que minimice los
errores de decisin. En la prctica un tipo de error puede tener ms importancia que el otro, y as
se tiene a conseguir poner una limitacin al error de mayor importancia. La nica forma de
reducir ambos tipos de errores es incrementar el tamao de la muestra, lo cual puede ser o no ser
posible.
La probabilidad de cometer un error de tipo II denotada con la letra griega beta , depende de la
diferencia entre los valores supuesto y real del parmetro de la poblacin. Como es ms fcil
encontrar diferencias grandes, si la diferencia entre la estadstica de muestra y el correspondiente
parmetro de poblacin es grande, la probabilidad de cometer un error de tipo II, probablemente
sea pequea.
El estudio y las conclusiones que obtengamos para una poblacin cualquiera, se habrn apoyado
exclusivamente en el anlisis de una parte de sta. De la probabilidad con la que estemos
dispuestos a asumir estos errores, depender, por ejemplo, el tamao de la muestra requerida.
Las contrastaciones se apoyan en que los datos de partida siguen una distribucin normal.
En las pruebas de hiptesis para la media (), cuando se conoce la desviacin estndar ()
poblacional, o cuando el valor de la muestra es grande (30 o ms), el valor estadstico de prueba
es z y se determina a partir de:
En la prueba para una media poblacional con muestra pequea y desviacin estndar poblacional
desconocida se utiliza el valor estadstico t.
Distribucin muestral del valor estadstico z, con prueba de una cola a la derecha
Valor critico: Es el punto de divisin entre la regin en la que se rechaza la hiptesis nula y la
regin en la que no se rechaza la hiptesis nula.
Importante!
Regin Crtica o de Rechazo:
Una regin crtica o de rechazo es una parte de la curva de z o de la curva t donde se
rechaza H0.
La regin puede ser de una cola o de dos dependiendo de la hiptesis alterna.
Ejemplos
Para H1: > valor aceptado, la regin de rechazo est dada por:
(cola derecha, z t)
(cola izquierda, z t)
/2
(2-colas, z t)
Usuarios
Da
Usuarios Da
Usuario
356
11
305 21
429
427
12
413 22
376
387
13
391 23
328
510
14
380 24
411
288
15
382 25
397
290
16
389 26
365
320
17
405 27
405
350
18
293 28
369
403
19
276 29
429
10
329
20
417 30
364
Solucin: Se trata de un problema con una media poblacional: muestra grande y desviacin
estndar poblacional desconocida.
Paso 01: Seleccionamos la hiptesis nula y la hiptesis alternativa
Ho: 350
Ha: 350
Paso 02: Nivel de confianza o significancia 95%
0.05
Paso 03: Calculamos o determinamos el valor estadstico de prueba
De los datos determinamos: que el estadstico de prueba es t, debido a que el numero de muestras
es igual a 30, conocemos la media de la poblacin, pero la desviacin estndar de la poblacin es
desconocida, en este caso determinamos la desviacin estndar de la muestra y la utilizamos en
la formula reemplazando a la desviacin estndar de la poblacin.
372.8
9.56951578
Mediana
381
Moda
405
Desviacin estndar
52.4143965
Varianza de la muestra
2747.26897
Curtosis
0.36687081
Coeficiente de asimetra
0.04706877
Rango
234
Mnimo
276
Mximo
510
Suma
Cuenta
Nivel de confianza (95.0%)
11184
30
19.571868
Practica Calificada N 12
1. Una mquina llena botellas que contienen cierta vitamina; se supone que el peso promedio de
vitamina en cada botella es de 32 gramos, con desviacin estndar de 0,06 gramos. En una
comprobacin sistemtica para ver que la mquina funciona adecuadamente, se toman
aleatoriamente 46 botellas llenas y se advierte que contienen un promedio de 32,1 grs. A un nivel
de significacin de 0,05:
a) Se puede afirmar que la mquina funciona adecuadamente?
b) Se puede afirmar que la mquina est llenando un promedio mayor a 32 gramos con una
significacin de 1%?
2. Las cajas de cereal producidas en una fbrica deben contener un contenido de 16 onzas. Un
inspector tom una muestra que arroj los sgtes. pesos en onzas: 15.7, 15.7, 16.3, 15.8, 16.1,
15.9, 16.2, 15.9,15.8 y 15.6.
Indicar si es razonable que el inspector usando un nivel de significacin del 5%. Ordene se multe
al fabricante.
3. Los desechos industriales y la basura que se descargan en los ros absorben oxgeno y por lo
tanto reducen la cantidad de oxgeno disuelto disponible para los peces y otras formas de vida
acutica. El Ministerio del Ambiente requiere un mnimo de 5 partes por milln de oxgeno
disuelto para que el contenido de oxgeno sea suficiente para la vida acutica. Seis muestras de
oxgeno tomadas de un ro durante la estacin de poco agua tuvieron: 4.9, 5.1, 4.9, 5.0, 5.0 y 4.7
partes por milln de oxgeno disuelto (ppm) . Hay suficiente evidencia en los datos que
indiquen que el oxgeno disuelto es menor que 5 partes por milln? Haga la prueba usando una
significacin del 5%
4. Los desechos industriales y la basura que se descargan en los ros absorben oxgeno y por lo
tanto reducen la cantidad de oxgeno disuelto disponible por los peces y otras formas de vida
acutica. Un inspector de contaminacin sospecha que cierta comunidad est descargando
desperdicios semitratados en el ro. Para verificar su teora, obtuvo 5 muestras de agua del ro
seleccionadas al azar en una ubicacin anterior a la ciudad y otras 5 en una ubicacin posterior a
la ciudad. Las cantidades de oxgeno disuelto en partes por milln fueron:
Antes de la ciudad
4.8
5.2
5.0
4.9
5.1
Despus de la ciudad
5.0
4.7
4.9
4.8
4.9
Proporcionan los datos suficiente evidencia para concluir que el contenido medio de oxgeno en
las ubicaciones que estn despus de la ciudad es menor que el de las ubicaciones que estn antes
de la ciudad?. Use una significacin del 5%.
5. Dos mtodos para ensear a leer fueron aplicados a dos grupos de nios de escuela elemental
seleccionados al azar y se compararon sobre la base de una prueba de comprensin de lectura
administrada al final del perodo de aprendizaje. Las medias y varianzas muestrales calculadas a
partir de las puntaciones obtenidas en la prueba fueron:
Mtodo
N de nios en grupo
Promedio
Varianza
1
11
64
52
2
14
69
71
Con los datos proporcionados se podr afirmar que hay una diferencia significativa entre los
promedios obtenidos por cada mtodo?. Con el 5% de significacin
6. Se realiza un experimento para comparar los tiempos medios requeridos para la absorcin de
los medicamentos A y B. 10 personas seleccionadas al azar fueron asignadas a cada
medicamento. Cada persona recibi una dosis oral del medicamento correspondiente y se
observ el tiempo en minutos hasta que el medicamento lleg a un nivel especfico en la sangre.
Las medias y las varianzas para las dos muestras son los siguientes:
Medicamento A
Medicamento B
Xa = 27.2 min
Xb = 33.5 min
Sa = 16.36 min
Sb = 18.92 min
Proporcionan los datos suficiente evidencia para concluir que existe diferencia entre los tiempos
medios de absorcin para los 2 medicamentos?. Use significacin del 10%.
7. Los salarios en una industria particular tiene una distribucin normal con promedio de
$23.20 y una desviacin estndar de $4.5. Si una compaa en esta industria que emplea 40
trabajadores les paga en promedio $21.20, puede ser acusada esta compaa de pagar
salarios inferiores con un nivel de significacin del 1%?
8. Un fabricante de televisores afirma que en promedio el 90% de sus televisores de color no
necesita ninguna reparacin durante sus dos primeros aos funcionamiento. El IPC
selecciona una muestra aleatoria de 100 tv y encuentra que 15 de ellos necesitan alguna
reparacin durante sus 2 primeros aos de operacin. Presentan los datos evidencia
suficiente como para que el IPC pueda afirmar que el fabricante est mintiendo?. Considere
una significacin del 5%.
9. Un laboratorio farmacutico ha elaborado un medicamento para tratar la presin sangunea
alta. El laboratorio afirma que el medicamento efectivamente baja la presin en el 80% de los
casos. Si 175 de 225 pacientes tratados con el medicamento experimentaron una disminucin
sustancial de la presin sangunea. Concluira usted que el laboratorio ha exagerado a la
efectividad del medicamento?. Utilice un nivel de significacin de 0.01
10. El instituto de relaciones familiares informa que el 50% de los matrimonios que viven en la
localidad llegan a una corte de divorcios dentro de su primer ao de casados. Qu
conclusiones puede sacarse acerca de la valides de este informe si una muestra aleatoria de
400 matrimonios, solo 193 fueron a una corte de divorcios dentro de su primer ao de
casados?. Utilice una significacin del 1%.
11. Una firma de ventas con descuento est considerando la compra de una gran partida de
discos de un proveedor que afirma que en promedio, solo el 2% de losa discos tiene fallas. Al
examinar 400 de estos discos, la firma encuentra 15 imperfectos. Realizar la firma la
afirmacin del proveedor si exige una significacin del 5%?
12. Existe una diferencia en la proporcin de hombres universitarios versus mujeres
universitarias que fuman por lo menos una caja de cigarrillos al da? Una muestra de 500
alumnos de una universidad revel que 70 fumaban por lo menos una cajetilla por da. Una
muestra de 400 alumnas revel que 72 fumaban al menos una cajetilla de cigarros
diariamente. Al nivel de significacin de 0.05existe una diferencia entre la proporcin de
alumnos y alumnas que fuman por lo menos una cajetilla diaria, o la diferencia en las
proporciones puede ser atribuida a error de muestreo?
13.Se sabe que la desviacin tpica de las notas de cierto examen de Matemticas es 2,4. Para
una muestra de 36 estudiantes se obtuvo una nota media de 5,6. Sirven estos datos para
confirmar la hiptesis de que la nota media del examen fue de 6, con un nivel de confianza del
95%?
14. Un socilogo ha pronosticado, que en una determinada ciudad, el nivel de abstencin en las
prximas elecciones ser del 40% como mnimo. Se elige al azar una muestra aleatoria de 200
individuos, con derecho a voto, 75 de los cuales estaran dispuestos a votar. Determinar con
un nivel de significacin del 1%, si se puede admitir el pronstico.
15. Un informe indica que el precio medio del billete de avin entre Canarias y Madrid es, como
mximo, de 120 con una desviacin tpica de 40 . Se toma una muestra de 100 viajeros y
se obtiene que la media de los precios de sus billetes es de 128 .
Se puede aceptar, con un nivel de significacin igual a 0,1, la afirmacin de partida?
16. La duracin de las bombillas de 100 W que fabrica una empresa sigue una distribucin
normal con una desviacin tpica de 120 horas de duracin. Su vida media est garantizada
durante un mnimo de 800 horas. Se escoge al azar una muestra de 50 bombillas de un lote y,
despus de comprobarlas, se obtiene una vida media de 750 horas. Con un nivel de
significacin de 0,01, habra que rechazar el lote por no cumplir la garanta?
17. El control de calidad una fbrica de pilas y bateras sospecha que hubo defectos en la
produccin de un modelo de batera para telfonos mviles, bajando su tiempo de duracin.
Hasta ahora el tiempo de duracin en conversacin segua una distribucin normal con media
300 minutos y desviacin tpica 30 minutos. Sin embargo, en la inspeccin del ltimo lote
producido, antes de enviarlo al mercado, se obtuvo que de una muestra de 60 bateras el
medio de duracin en conversacin fue de 290 minutos. Suponiendo que ese tiempo sigue
siendo Normal con la misma desviacin tpica:
Se puede concluir que las sospechas del control de calidad son ciertas a un nivel de
significacin del 2%?
18. Se cree que el nivel medio de protombina en una poblacin normal es de 20 mg/100 ml de
plasma con una desviacin tpica de 4 miligramos/100 ml. Para comprobarlo, se toma una
muestra de 40 individuos en los que la media es de 18.5 mg/100 ml. Se puede aceptar la
hiptesis, con un nivel de significacin del 5%?
19. Las puntuaciones en un test que mide la variable creatividad siguen, en la poblacin general
de adolescentes, una distribucin Normal de media 11,5. En un centro escolar que ha
implantado un programa de estimulacin de la creatividad una muestra de 30 alumnos ha
proporcionado las siguientes puntuaciones:
11, 9, 12, 17, 8, 11, 9, 4, 5, 9, 14, 9, 17, 24, 19, 10, 17, 17, 8,
23, 8, 6, 14, 16, 6, 7, 15, 20, 14, 15.
A un nivel de confianza del 95% Puede afirmarse que el programa es efectivo?
Semana 13
SERIES TEMPORALES /
ANLISIS DE REGRESIN LINEAL
Toda institucin, ya sea la familia, la empresa o el
gobierno, necesita realizar planes para el futuro si
desea sobrevivir o progresar.
La planificacin racional exige prever los sucesos
del futuro que probablemente vayan a ocurrir.
La previsin se suele basar en lo ocurrido en el
pasado.
La tcnica estadstica utilizada para hacer
inferencias sobre el futuro teniendo en cuenta
lo ocurrido en el pasado es el ANLISIS DE
SERIES TEMPORALES.
SERIE TEMPORAL
Se define una serie temporal (tambin denominada histrica, cronolgica o de tiempo) como un
conjunto de datos, correspondientes a un fenmeno econmico, ordenados en el tiempo.
Ejemplos
N de accidentes laborales graves en las empresas de ms de 500 empleados de Lima, durante
los ltimos 5 aos.
Ventas de nuestra empresa en los ltimos 10 aos.
Cantidad de lluvia cada al da durante el ltimo trimestre.
Los datos son de la forma (yt, t) donde:
yt
Variable endgena o dependiente
t
Variable exgena o independiente
Nota: realmente slo hay una variable a estudiar que es yt. En el anlisis de regresin tenamos
dos variables (explicbamos una variable a partir de la otra). Aqu slo hay una variable
(explicamos una variable a partir de su pasado histrico).
Ejemplo
Los datos siguientes corresponden al nmero de contratos nuevos realizados por
las empresas de menos de 10 empleados, en Sevilla, durante el perodo 19962000.
LA TENDENCIA (T)
Es una componente de la serie temporal que refleja su evolucin a largo plazo.
Puede ser de naturaleza estacionaria o constante (se representa con una recta paralela al eje de
abscisas), de naturaleza lineal, de naturaleza parablica, de naturaleza exponencial, etc.
Ejemplo para la tendencia
yt=TCEA
Modelo Mixto :
yt=TCE+A
Cmo detectamos el modo en que interactan las componentes de una serie temporal?
Esquema aditivo o multiplicativo?
1) Calculamos 2 tipos de indicadores:
Ci= Y(i,t+1) / Y(i,t)
di=Y(i,t+1) / Y (i,t)
2) Calculamos los coeficientes de variacin para las series formadas por los dos
indicadores, y si:
CV Ci < CV di ------------- Esquema multiplicativo
CV di < CV Ci ------------- Esquema aditivo
EJEMPLO:
Segn la ECL, las horas no trabajadas por trimestre y trabajador entre 1992 y 1997
son:
Ajuste de Curvas:
Para hallar una ecuacin que relacione las variables, el primer paso es recoger datos que
muestren valores correspondientes de las variables bajo consideracin. Supongamos que X e Y
denotan la altura y peso de personas adultas; entonces una muestra de N individuos revelara las
alturas X1, X2, , XN y los pesos correspondientes Y1, Y2, , YN.
El prximo paso es marcar los puntos (X1, Y1), (X2, Y2), , (XN, YN) sobre un sistema de
coordenadas rectangulares.El conjunto de puntos se llama un diagrama de dispersin. Ejemplos:
Mnimos cuadrados
Es una tcnica de Anlisis numrico encuadrada dentro de la optimizacin matemtica, en la
que, dados un conjunto de pares se intenta encontrar la funcin que mejor se aproxime a los
datos (un "mejor ajuste"), de acuerdo con el criterio de mnimo error cuadrtico.
En su forma ms simple, intenta minimizar la suma de cuadrados de las diferencias ordenadas
(llamadas residuos) entre los puntos generados por la funcin y los correspondientes en los
datos.
Desde un punto de vista estadstico, un requisito implcito para que funcione el mtodo de
mnimos cuadrados es que los errores de cada medida estn distribuidos de forma aleatoria.
Tambin es importante que los datos recogidos estn bien escogidos, para que permitan
visibilidad en las variables que han de ser resueltas (para dar ms peso a un dato en particular,
vase mnimos cuadrados ponderados).
La tcnica de mnimos cuadrados se usa comnmente en el ajuste de curvas. Muchos otros
problemas de optimizacin pueden expresarse tambin en forma de mnimos cuadrados,
minimizando la energa o maximizando la entropa.
Y = ao + a1X
Al resolver simultneamente las ecuaciones, podemos hallar las constantes ao y a1 de las
frmulas:
2
a1 = N XY (X)( Y)
N X2 ( X)2
N X ( X)
Ejercicios:
1.0 1.5
2.0
2.5
1.46 2.14 2.63 2.99
3.0
3.32
3.5
3.69
4.2
4.44
Regresin Lineal
Teniendo ya conocimiento de la intensidad de la relacin entre las variables, manifestada a
travs del diagrama de dispersin, podemos ensayar el ajuste de un modelo estadstico que se
adapte mejor a las n observaciones; lo que lleva por nombre regresin.
Uno de los procedimientos muy comunes en el ajuste regresivo es el mtodo de los mnimos
cuadrados, que produce estimaciones con menor error cuadrtico promedio.
Ajuste Rectilneo (Mtodo de los Mnimos Cuadrados)
La forma general de una ecuacin de lnea recta es:
y = a + bx
donde:
X : Variable independiente
Y : Variable dependiente
a : Trmino independiente o intercepto
b : Coeficiente de X
Debemos establecer los parmetros a y b de la ecuacin para poder expresar los valores de
la variable Y en funcin de los valores de la variable X.
Ejemplo:
Se realiz un experimento con una balanza, colocando gradualmente peso en el platillo y
verificando la elongacin del resorte.
F
SOLUCIN
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
105
Elongacin
0
1,5575
1,2905
3,1539
4,2276
4,6604
5,2013
6,9964
7,0740
9,7069
10,4643
11,4457
11,8001
12,1885
14,7024
15,8981
15,0221
17,6232
18,9859
19,6699
19,7012
21,1213
De este grfico, podemos inferir que las variables tienen un comportamiento lineal.
Por lo tanto debemos encontrar la recta que mejor se ajuste a los datos.
Utilizamos el mtodo de los mnimos cuadrados para encontrar la recta.
3.
Elongacin
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
105
0
1,5575
1,2905
3,1539
4,2276
4,6604
5,2013
6,9964
7,0740
9,7069
10,4643
11,4457
11,8001
12,1885
14,7024
15,8981
15,0221
17,6232
18,9859
19,6699
19,7012
21,1213
X^2
0
25
100
225
400
625
900
1225
1600
2025
2500
3025
3600
4225
4900
5625
6400
7225
8100
9025
10000
11025
X*Y
0
7,7873
12,905
47,309
84,552
116,51
156,04
244,87
282,96
436,81
523,22
629,51
708,01
792,25
1029,2
1192,4
1201,8
1498
1708,7
1868,6
1970,1
2217,7
b = 0.204333921
Y = -0.1597 + 0.2043
Partiendo de esta ecuacin, vamos a inferir y hallar los valores de elongacin cuando el
peso es: 28, 72 y 110
Practica Calificada N 13
1. El crecimiento de los nios desde la infancia a la adolescencia generalmente sigue un patrn
lineal. Se calcul una recta de regresin mediante el mtodo de mnimos cuadrados con datos
de alturas de nias norteamericanas de 4 a 9 aos y el resultado fue: intercepto a=80 y
pendiente b=6. La variable dependiente y es la altura en cm y x es la edad en aos.
- Interprete los valores estimados del intercepto y de la pendiente.
- Cul ser la altura predicha de una nia de 8 aos.
- Cul ser la altura predicha de una mujer de 25 aos. Comente el resultado.
2. En 1991 se public un trabajo Diseando plantas en climas difciles en la revista Field
Crops Research, los datos usados en la investigacin son:
Duracin
92
Rendimiento 1,7
92
2,3
96
1,9
100
2,0
102
1,5
102
1,7
106
1,6
106
1,8
121
1,0
143
0,3
5. La tabla ms abajo presenta los datos sobre el nmero de cambios de aceite al ao (x) y el
costo de la reparacin (y, en miles de pesos) de una muestra aleatoria de 10 autos de una
cierta marca y modelo.
# cambios aceite
3
5
2
3
1
4
6
4
costo en miles de peso
150 150 250 200 350 200 50
125
- Haga un grfico de dispersin con los datos, verifique el supuesto de linealidad y valores
extremos.
- Encuentre la recta de regresin de mnimos cuadrados.
- Interprete los valores estimados del intercepto y de la pendiente.
- Estima cul ser el costo de reparacin de un auto que ha tenido 4 cambios de aceite.
- Si cambia x por y, obtendr la misma recta de regresin?
- Calcule el residuo para la primera observacin (x=3, y=150).
- Verifique los supuestos de la regresin lineal.
Semana 14
ANLISIS DE CORRELACIN/
TASAS Y NMEROS INDICE
CORRELACIN
En el anlisis conjunto para dos o ms variables es bsica la bsqueda del tipo y grado de la
relacin que pueda existir entre ellas, o si por el contrario, las variables sean independientes entre
s y la relacin que puedan mostrar se debe nicamente al azar, o a travs de terceras variables.
El sondeo del tipo y grado de la correlacin, parte desde la misma presuncin del investigador,
teniendo presente que la bsqueda de relaciones entre variables debe ser lgica, es decir
relacionar lo que sea razonable y no datos cuya asociacin sea desde cualquier punto de vista
absurda.
Para fortalecer el indicio de correlacin inicial, se grafica cada uno de los pares ordenados de las
variables (xi,yj) en un plano cartesiano, para observar la nube de puntos o diagrama de
dispersin, donde se advierte la tendencia o no, de la informacin representada.
A pesar de la ilustracin visual que ofrecen las grficas, solo podemos percibir la tendencia, mas
no el grado o fortaleza de la relacin, entre la variable independiente X y la variable
dependiente Y.
, donde:
Es una cantidad sin dimensiones, es decir no depende de las unidades empleadas. Por
ejemplo, si se est buscando hallar el coeficiente de correlacin entre el peso y la altura de los
nios en determinada ciudad, entonces el resultado ser el mismo independientemente de si el
peso de todos los nios se mide en Kilogramos o en gramos e independientemente de si la
altura de todos los nios se mide en metros o centmetros.
Si el coeficiente de correlacin es igual a -1, entonces hay una correlacin lineal negativa
perfecta, es decir que los datos se ajustan perfectamente a una recta de pendiente negativa, es
decir una recta que decrece, o sea que cuando x aumenta, entonces y disminuye.
En cualquier otro caso, para aceptar si hay una correlacin lineal aceptable, no hay ninguna
regla estricta. Normalmente, para aceptar la existencia de dicha correlacin, el coeficiente
debe ser mayor que 0,7 o menor que -0,7. En caso contrario, se suele rechazar la existencia de
correlacin lineal.
Lo nico que puede deducirse es que los datos no se ajustan a una recta.
Pero esto no significa que no haya relacin entre ellos dado que podran ajustarse a una
parbola o a cualquier otra curva. Slo se deduce que no hay correlacin lineal aunque
pudiera haber una correlacin no lineal.
Este es el gran inconveniente del coeficiente de correlacin lineal: no sirve para decidir si
hay o no una posible relacin entre dos variables, slo sirve para decidir si hay o no una
posible relacin lineal entre dos variables.
Y, en su caso, slo despus habr que decidir con que curva se intentan ajustar los datos.
Para resolver
Usando los ejercicios de anlisis de regresin de la semana anterior, se pide
calcular el Coeficiente de Correlacin y determinar la fuerza de la correlacin entre
variables.
TASAS e INDICES
Como ya se dijo, el anlisis de un fenmeno basado en las cifras absolutas, ofrece una idea
general de su tendencia o comportamiento; pero para efectos de establecer comparaciones
adecuadas del mismo fenmeno con otra regin, o su ocurrencia a travs del tiempo, se
utilizan ciertos indicadores denominados tasas e ndices.
Tasa
Una tasa es la resultante de una fraccin, en donde el numerador est contenido dentro del
denominador:
Ejemplos:
D = R_ * 1000
M
D: Tasa de desercin escolar.
R: Nmero de retiros durante el ao.
M: Nmero total de matriculados durante el ao
TE = PEAO * 1000
PEA
TN = N * 1000
P
Donde
TN : Tasa de natalidad
N : Nmero de nacidos vivos ocurridos en un periodo y rea dada
P : Poblacin total del rea a mitad del periodo.
TC = M * 1000
P
Donde:
TC : Tasa de nupcialidad.
M : Nmero de matrimonios efectuados en un periodo y rea dada.
P : Total de la poblacin a mitad del periodo.
Ejemplo:
El siguiente cuadro muestra la evolucin de la tasa de desempleo en Colombia, resultados
obtenidos de la encuesta nacional de hogares para los periodos comprendidos entre los aos
1.990 2.000
ndice
Un nmero ndice, como comnmente se le llama, es un indicador de los cambios relativos
de una o ms variables a travs del tiempo.
Entre las principales aplicaciones de los nmeros ndice, est la de establecer comparaciones
entre los indicadores de las diferentes zonas geogrficas, profesiones , grupos tnicos etc.
Para la construccin de un nmero ndice, se procede ante todo, a fijar el periodo de referencia o
"periodo base" de la serie temporal, teniendo presente que debe ser un periodo normal, esto es,
que no se hayan presentado situaciones fortuitas (guerras, terremotos, incendios u otro tipo de
imprevisto), que incidan en el valor de la variable para ese periodo.
Adems debe considerarse un periodo reciente que haga comparables los diferentes valores
de las variables consideradas.
ndice Simple
Un nmero ndice simple, es aquel que se calcula para una sola variable, dividiendo cada uno de
los valores de la serie cronolgica, por el valor correspondiente al "periodo base" previamente
definido.
1 ndice de Base Fija
Ip = Pn * 100, si la variable se refiere a precios
Po
Iq = Qn * 100, si la variable se refiere a cantidades
Qo
Ip : ndice de precios
Pn: Precio del artculo en el periodo n
P0 : Precio del artculo en el periodo base
Iq : ndice de cantidades
Qn : Cantidad del artculo en el periodo n
Q0 : Cantidad del artculo en el periodo base
En la primera tabla hemos calculado los ndices de precios simples, con base en 1995 y 1998
respectivamente, pero no se han tenido en cuenta las cantidades, mientras que en la segunda tabla
se han calculado los ndices de cantidades sin considerar los precios.
Calculemos, ahora los ndices del valor relativo, que considere tanto los precios como las
cantidades:
Valor relativo = Pn * Qn * 100
Po * Qo
Semana 15
Causas de variacin
Existen variaciones en todas las partes producidas en el proceso de manufactura. Hay dos fuentes
de variacin:
- variacin aleatoria se debe al azar y no se puede eliminar por completo.
- variacin asignable es no aleatoria y se puede reducir o eliminar.
Nota: la variacin puede cambiar y cambiar la forma, dispersin y tendencia central de la
distribucin de las caractersticas medidas del producto.
Diagramas de diagnstico
Controles o registros que podran llamarse "herramientas para asegurar la calidad de una
fbrica", esta son las siguientes:
o Hoja de control (Hoja de recogida de datos)
o Histograma
o Anlisis paretiano (Diagrama de pareto)
o Diagrama de Ishikawa: Diagrama de causa y efecto (Espina de Pescado)
o Estratificacin (Anlisis por Estratificacin)
o Diagrama de scadter (Diagrama de Dispersin)
o Grfica de control
La experiencia de los especialistas en la aplicacin de estos instrumentos o Herramientas
Estadsticas seala que bien aplicadas y utilizando un mtodo estandarizado de solucin de
problemas pueden ser capaces de resolver hasta el 95% de los problemas.
En la prctica estas herramientas requieren ser complementadas con otras tcnicas como son:
o La lluvia de ideas (Brainstorming)
o La Encuesta
o La Entrevista
o Diagrama de Flujo
o Matriz de Seleccin de Problemas, etc
QU PRETENDE EL CEC ?
REDUCIR LA VARIABILIDAD Y LA DISPERSIN
HACER LAS COSAS BIEN A LA PRIMERA
PREVENIENDO LOS FALLOS EN LUGAR DE CORREGIR SUS
EFECTOS.
LAS DECISIONES SE TOMAN EN FUNCIN DE DATOS Y NO DE
PERCEPCIONES SUBJETIVAS.
CORREGIR LOS PROCESOS DEFECTUOSOS EN VEZ DE LOS
PRODUCTOS/SERVICIOS DEFECTUOSOS
TRABAJO FINAL:
Presentacin de Proyecto Integrador: Diagnstico de Caso de Estudio con
Aplicacin de Mtodos Estadsticos