Trabajo Prueba de Corrida o Racha
Trabajo Prueba de Corrida o Racha
Trabajo Prueba de Corrida o Racha
Vice-Rectorado Acadmico
Coordinacin de Pregrado
Proyecto de Carrera: Ingeniera Industrial
Asignacin: Estadstica II
Integrantes:
Profesora:
Alba Jess C.I: 20.285.522
Liliana Salomn.
Longart Mara C.I: 21.248.717
Lpez Gilmar C.I:19.302.827
Rojas Ernesto C.I:
ndice
Pag
Introduccin
Prueba No Paramtrica
Definicin
Caractersticas de la Prueba no Paramtrica
Ventaja y Desventajas
Comparacin de las pruebas Paramtrica y no Paramtrica
4
4
5
6
Definicin
Caracterstica
Procedimiento Especficos
Estudio 1
12
Estudio 2
Estudio 3
Estudio 4
Conclusin
Bibliografia
2
INTRODUCCIN
Como ya se ha demostrado en el curso de estadstica I y por
consecuencia en el curso de estadstica II, la estadstica es considerada como el
conjunto de procedimientos utilizados para clasificar, calcular, analizar y resumir
los datos obtenidos de manera sistemtica.
Dentro de los principales anlisis estadsticos que se pueden llevar a
acabo se encuentran las pruebas estadsticas paramtricas y las pruebas
estadsticas no paramtricas.
Estas ltimas, son el principal objetivo de estudio en este trabajo, en
realidad son poco utilizadas a pesar de la potencia y certeza de sus resultados.
Normalmente se utilizan cuando no se dispone de informacin suficiente de la
poblacin de la cual se extrajeron los datos, careciendo entonces de un soporte
para la realizacin de una inferencia con base a una muestra observada.
Partiendo de la base de que algunos contrastes de hiptesis dependen del
supuesto de normalidad, muchos de estos contrastes siguen siendo
aproximadamente vlidos cuando se aplican a muestras muy grandes, incluso si la
distribucin de la poblacin no es normal. Sin embargo, muchas veces se da
tambin el caso de que, en aplicaciones prcticas, dicho supuesto de normalidad
no sea sostenible. Lo deseable entonces ser buscar la inferencia en contrastes
que sean vlidos bajo un amplio rango de distribuciones de la poblacin. Tales
contrastes se denominan no paramtricas.
PRUEBA NO PARAMTRICA
Las pruebas no paramtricas son aquellas que no presuponen una
distribucin de probabilidad para los datos, por ello se conocen tambin como de
distribucin libre. En la mayor parte de ellas los resultados estadsticos se derivan
nicamente a partir de procedimientos de ordenacin y recuento, por lo que su
base lgica es de fcil comprensin. Cuando trabajamos con muestras pequeas
(n < 10) en las que se desconoce si es vlido suponer la normalidad de los datos,
conviene utilizar pruebas no paramtricas, al menos para corroborar los resultados
obtenidos a partir de la utilizacin de la teora basada en la normal.
En estos casos se emplea como parmetro de centralizacin la mediana,
que es aquel punto para el que el valor de X est el 50% de las veces por debajo y
el 50% por encima.
Caractersticas:
Las pruebas experimentales son rpidas y fciles. Los clculos suelen ser
muy simples y, en condiciones caractersticas, los datos necesarios se
obtienen sin costos grandes.
Ventajas
1. Las Pruebas No paramtricas pueden ser aplicados a una amplia variedad
de situaciones porque ellos no tienen los requisitos rgidos de los mtodos
paramtricos correspondientes. En particular, los mtodos no paramtricos
no requieren poblaciones normalmente distribuidas.
2. Las pruebas no paramtricas pueden frecuentemente ser aplicados a datos
no numricos, tal como el gnero de los que contestan una encuesta.
3. Las pruebas no paramtricas usualmente involucran simples
computaciones que los correspondientes en los mtodos paramtricos y
son por lo tanto, ms fciles para entender y aplicar.
4. Se pueden usar con muestras pequeas
Desventajas
1. Los mtodos no paramtricos tienden a perder informacin porque datos
numricos exactos son frecuentemente reducidos a una forma cualitativa.
2. Las pruebas no paramtricas no son tan eficientes como las pruebas
paramtricas, de manera que con una prueba no paramtrica generalmente
se necesita evidencia ms fuerte (as como una muestra ms grande o
mayores diferencias) antes de rechazar una hiptesis nula.
3.
Prueba
Paramtrica
Prueba No
Paramtrica
Valor de
eficiencia de la
prueba
paramtrica con
poblacin normal
Pares
pareados Prueba t o Prueba Prueba del signo
0.63
de datos de la z
Prueba
de 0.95
muestra
Wilcoxon
de
rangos con signo
Dos
muestras Prueba t o Prueba Prueba
de 0.95
independientes
z
Wilcoxon
de
rangos sumados
Varias
muestras Anlisis
de Prueba
independientes
varianzas (Prueba Wallis
F)
Kruskal- 0.95
Correlacin
Correlacin lineal
Prueba
correlacin
rangos
Aleatorio
Ninguna
prueba Prueba Runs
paramtrica
de 0.91
de
No hay base para
comparacin
Prueba Wilcoxon
La prueba de Wilcoxon va a permitir contrastar la hiptesis de que una
muestra aleatoria procede de una poblacin con mediana M0. Adems, bajo el
supuesto de simetra este contraste se puede referir a la media, E(X). Esta prueba
es mucho ms sensible y poderosa que la prueba de los signos; ya que utiliza ms
informacin, pues no solo tiene en cuenta si las diferencias son positivas o
negativas, sino tambin su magnitud.
Prueba de Kruskal-Wallis
Para la comparacin de una misma variable cuantitativa en ms de tres
grupos. Es la prueba no paramtrica considerada ms potente para comparar >2
variables continuas independientes. Es el similar al test de ANOVA para un
factor.
8
Caractersticas:
La prueba de corrida o racha mide hasta que punto en una variable
dicotmica la observacin de uno de sus atributos puede influir en las
siguientes observaciones
Se observa la secuencia de un mismo atributo o cualidad.
Serie de datos en los que hay muchas o pocas rachas.
PROCEDIMIENTOS
u=
=
2
u
2n 1n2
+1
n1+ n2
2n 1n2 ( 2n1n 2n 1n 2 )
( n 1+n 2 )2( n1+ n21 )
Paso 6: Calcule Z
Z=
Ru
u
Paso 7: Anlisis :
Si Z>Za, entonces debera tener un comportamiento cclico y con
estacionalidad (sub mesclada)
Si Z < -Za, debera tener una pendiente.
Esta prueba es vlida para los casos en las cuales n 1 y n2 son grandes, al
menos > 10. Para muestras de pequeas de tamao, las tablas especiales deber
ser utilizadas.
12
13
ESTUDIO N 1
G G G G G G |D D| G G G G G G G G
G G |D D D |G G G G G G |D |G G G
G G G G G G| D D| G G G G G| D| G G
Pruebe la aleatoriedad de la secuencia al nivel de significancia
Datos
n1 D= 10
n2 G= 38
V= 11
v=
2 ( n 1 ) (n 2)
( n 1 ) (n2) +1=
v=
2 ( 10 ) (38)
( 10 )( 38) +1= 16.38
14
0.05
v=
v=
21038[2(1038)1038]
= 4.997
( 10+38 )2(10+381)
De manera que
=2.235
V=11
Z=
V v
v
Z=
1116.36
2.235
Anlisis
-2.61< -1.96 la hiptesis Ho se rechaza, las pruebas muestra que hay muy
pocas corridas, lo que indica un amontonamiento de laminas defectuosas, por lo
tanto existe un patrn en la produccin de laminas defectuosas. Se recomienda la
observacin posterior del proceso de produccin. Todo esto a un nivel de
significancia de 0.05
15
ESTUDIO N2
Se ajusta una mquina para despachar adelgazante de pintura acrlica en
un recipiente. Dira que la cantidad de adelgazante que est siendo despachada
por esta mquina vara aleatoriamente? Si los contenidos de los siguientes quince
recipientes se miden y se encuentra que son
3.6, 3.9, 4.1, 3.6, 3.8, 3,7, 3.4, 4.0, 3.8, 4.1, 3.9, 4.0, 3.8, 4.2 y 4.2
0.1
: 3.9
++++
n1: 6
n2: 7
Lo ubicamos en la tabla = 0.296
P= 2(P (V 6 cuando Ho es verdadera)
P= 0.592 > 0.1
Anlisis
Se acepta la hiptesis Ho que dice que la secuencia de mediciones varia
aleatoriamente.
16
Statgraphics
Pronsticos - Col_1
Datos/Variable: Col_1
Nmero de observaciones = 15
Indice Inicial = 1,0
Intervalo de Muestra = 1,0
Resumen de Pronsticos
Modelo de pronstico seleccionado: Caminata aleatoria
Nmero de pronsticos generados: 12
Nmero de periodos retenidos para validacin: 0
Periodo
de
Estadsti Estimaci
co
n
RMSE
0,310353
MAE
0,264286
MAPE
6,86597
ME
9,5162E17
MPE
0,303025
Periodo
de
Validaci
n
El StatAdvisor
Este procedimiento pronostica futuros valores de Col_1. Los datos cubren 15
periodos de tiempo. Actualmente, se ha seleccionado el modelo de una caminata
aleatoria. Este modelo asume que el mejor pronstico para datos futuros est
dado por el valor del ltimo dato disponible. Cada valor de Col_1 ha sido ajustado
de la siguiente forma, antes de ajustar el modelo:
Puede seleccionar un modelo diferente de pronsticos pulsando el botn
secundario del ratn y seleccionando Opciones de Anlisis.
Esta tabla tambin resume el desempeo del modelo actualmente seleccionado
en ajustar datos histricos. Se muestra:
(1) la raz del error cuadrado medio (RMSE)
(2) el error absoluto medio (MAE)
(3) el porcentaje de error absoluto medio (MAPE)
(4) el error medio (ME)
(5) el porcentaje de error medio (MPE)
17
Cada uno de los estadsticos est basado en los errores de pronstico unoadelante, los cuales son las diferencias entre los datos al tiempo t y el valor
pronosticado al tiempo t-1. Los primeros tres estadsticos miden la magnitud de
los errores. Un mejor modelo dara un valor ms pequeo. Los ltimos dos
estadsticos miden el bias. Un mejor modelo dara un valor ms cercano a 0.
Comparacin de Modelos
Variable de datos: Col_1
Nmero de observaciones = 15
Indice Inicial = 1,0
Intervalo de Muestra = 1,0
Modelos
(A) Caminata aleatoria
(B) Media constante = 3,86667
(C) tendencia curtva-S = exp(1,36882 + -0,0816043 /t)
(D) Promedio mvil simple de 3 trminos
(E) Suavizacin exponencial simple con alfa = 0,1665
Ajuste matemtico:
Periodo de Estimacin
Model RMSE MAE
MAPE ME
o
(A)
0,31035 0,26428 6,8659 9,5162E3
6
7
17
(B)
(C)
MPE
0,30302
5
0,22572 0,18222 4,7795 -1,18424E- 6
2
8
16
0,32814
8
0,22017 0,16647 4,3581 0,0055511 18
7
(D)
(E)
0,14716
6
0,22566 0,19444 5,0459 0,0222222 0,2857
8
4
5
0,23097 0,18995 4,9245 0,0489177 0,94808
2
8
9
4
Model RMSE
o
(A)
0,31035
3
(B)
0,22572
6
(C)
0,22017
7
(D)
0,22566
8
(E)
0,23097
2
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
OK
Clave:
RMSE = Root Mean Squared Error (Raz del Cuadrado Medio del Error)
RUNS = Prueba corridas excesivas arriba y abajo
RUNM = Prueba corridas excesivas arriba y abajo de la mediana
AUTO = Prueba de Box-Pierce para autocorrelacin excesiva
MEDIA = Prueba para diferencia en medias entre la 1 mitad y la 2 mitad
VAR = Prueba para diferencia en varianza entre la 1 mitad y la 2 mitad
OK = no significativo (p >= 0,05)
* = marginalmente significativo (0,01 < p <= 0,05)
** = significativo (0,001 < p <= 0,01)
*** = altamente significativo (p <= 0,001)
El StatAdvisor
Esta tabla compara los resultados de cinco diferentes modelos de pronsticos.
Puede cambiar cualquiera de los modelos pulsando el botn secundario del ratn
y seleccionando Opciones de Anlisis. Viendo las estadsticas del error, el modelo
con la menor raz cuadrada del error cuadrado medio (RMSE) durante el periodo
de estimacin del modelo es el modelo C. El modelo con el menor error medio
absoluto (MAE) es el modelo C. El modelo con el menor porcentaje del error
medio absoluto (MAPE) es el modelo C. Puede usar estos resultados para
seleccionar el modelo ms apropiado para sus necesidades.
La tabla tambin resume los resultados de cinco pruebas para determinar si cada
modelo es adecuado para los datos. Un OK significa que el modelo pasa la
prueba. Un * significa que no pasa la prueba al nivel de confianza del 95%. Dos
*'s significa que no pasa la prueba al nivel
19de confianza del 99%. Tres *'s significa
que no pasa la prueba al nivel de confianza del 99,9%. Note que el modelo
actualmente seleccionado, el modelo A, pasa 5 pruebas. Puesto que ninguna
prueba es estadsticamente significativa con un nivel de confianza del 95% o ms,
el modelo actual probablemente es adecuado para los datos.
20
ESTUDIO N3
El fabricante PQR sostiene que el tiempo de vida de un tipo de batera
que se fabrica es de ms de 250 horas. Un defensor de los
consumidores, que desea determinar si la afirmacin es justifica, mide
los tiempos de vida media de 24 de las bateras de la compaa.
Determine si los tiempo de vida de las muestra de la batera
producidas por el fabricante PQR son aleatorias. =0.05
271
253
264
230
216
295
198
262
211
275
288
252
282
236
294
225
291
243
284
253
272
219
224
268
:257.5
v=
2(12)(12)
( 12 ) (12) +1= 13
v=
21212[2(1212)1212]
= 5.739
(12+12 )2(12+121)
21
v=
2.396
Z=
1513
2.396 = 0,835
z 1 .96
. dado que
22
ESTUDIO N4
12 nios y 12 nias de 4 aos de edad observados durante
dos sesiones de juego de 15 minutos, el juego fu calificado
por incidencia y grado de agresin. con estos puntajes es
posible probar la hiptesis que hay diferencias sexuales en la
cantidad de agresin exhibida.
23
24
CONCLUSION
Las pruebas no paramtricas son procedimientos estadsticos para prueba
de hiptesis que no requieren de la suposicin de la normalidad de la poblacin de
la cual fue extrada la muestra y se pueden aplicar a datos de tipo cuantitativo y
cualitativo. Como ya sabemos hay diferentes tipos de pruebas no paramtricas
pero este trabajo se baso en la prueba de corrida o racha la cual es una secuencia
de sucesos observables de la interaccin entre elementos iguales.
25
BIBLIOGRAFIA
Es.scribd.com/doc./56657598/PRUEBA-DEALEATORIEDAD
26
Http:/Biblo.una.edu.ve/docu.7/base/Marc/texto/t34486
.pdf
www.ucm.es/info/socivmyt/paginas/D_departamento/
materiales/analisis_datosyMultivariable/19nparam_SP
SS.pdf
27