Foro 2 Estadistica Inferencial Aplicada

Estadística Inferencial Aplicada
Tronco Común FACS. Ciclo: 20-2

Licenciatura:
Nombre de la Clave de la
Estadística Inferencial Aplicada
asignatura: asignatura:
TCL018
Nombre del Periodo en el Del

Dr. Miguel Ángel Villegas Peña
profesor: que se imparte: 6/12/2021
Al 12
/12/2020
Semana 4
Marco teórico y ejemplos
1
Series de Tiempo
Series de tiempo Componentes de la serie de tiempo
Por serie de tiempo nos referimos a Supondremos que en una serie
datos estadísticos que se recopilan, . cuatro tipos básicos de
existen
observan o registran en intervalos de variación, los cuales sobrepuestos o
tiempo regulares (diario, semanal, actuando en concierto, contribuyen a
semestral, anual, entre otros). El los cambios observados en un
término serie de tiempo se aplica por período de tiempo y dan a la serie su
ejemplo a datos registrados en forma aspecto errático.
periódica que muestran, por ejemplo, Estas cuatro componentes son:
las ventas anuales totales de Tendencia secular
almacenes, el valor trimestral total de Variación estacional
contratos de construcción otorgados, Variación cíclica
el valor trimestral del PIB. Variación irregular.
2
Series de Tiempo
Series de tiempo
Supondremos, además, que existe una relación . multiplicativa entre estas
cuatro componentes; es decir, cualquier valor de una serie es el producto
de factores que se pueden atribuir a las cuatro componentes.
1. Tendencia secular: La tendencia secular o tendencia a largo plazo de
una serie es por lo común el resultado de factores a largo plazo. En
términos intuitivos, la tendencia de una serie de tiempo caracteriza el
patrón gradual y consistente de las variaciones de la propia serie, que se
consideran consecuencias de fuerzas persistentes que afectan el
crecimiento o la reducción de la misma, tales como: cambios en la
población, en las características demográficas de la misma, cambios en los
ingresos, en la salud, en el nivel de educación y tecnología. Las tendencias
a largo plazo se ajustan a diversos esquemas. Algunas se mueven
continuamente hacía arriba, otras declinan, y otras más permanecen igual
en un cierto período o intervalo de tiempo.
3
Series de Tiempo
Series de tiempo
2. Variación estacional: El componente de la serie de tiempo que
representa la variabilidad en los datos .debida a influencias de las
estaciones, se llama componente estacional. Esta variación corresponde a
los movimientos de la serie que recurren año tras año en los mismos
meses (o en los mismos trimestres) del año poco más o menos con la
misma intensidad. Por ejemplo: Un fabricante de albercas inflables espera
poca actividad de ventas durante los meses de otoño e invierno y tiene
ventas máximas en los de primavera y verano, mientras que los
fabricantes de equipo para la nieve y ropa de abrigo esperan un
comportamiento anual opuesto al del fabricante de albercas.
4
Series de Tiempo
3. Variación cíclica: Con frecuencia las series de tiempo presentan secuencias
alternas de puntos abajo y arriba de la línea de tendencia que duran más de un
año, esta variación se mantiene después de que .se han eliminado las variaciones o
tendencias estacional e irregular. Un ejemplo de este tipo de variación son los
ciclos comerciales cuyos períodos recurrentes dependen de la prosperidad,
recesión, depresión y recuperación, las cuales no dependen de factores como el
clima o las costumbres sociales.
4. Variación Irregular: Esta se debe a factores a corto plazo, imprevisibles y no
recurrentes que afectan a la serie de tiempo. Como este componente explica la
variabilidad aleatoria de la serie, es impredecible, es decir, no se puede esperar
predecir su impacto sobre la serie de tiempo. Existen dos tipos de variación
irregular:
a) Las variaciones que son provocadas por acontecimientos especiales, fácilmente
identificables, como las elecciones, inundaciones, huelgas, terremotos.
b) Variaciones aleatorias o por casualidad, cuyas causas no se pueden señalar en
forma exacta, pero que tienden a equilibrarse a la larga.
5
Series de Tiempo
Series de tiempo
Tendencia de una serie
1. Tendencia lineal de una serie viene dada .por el movimiento general a
largo plazo de la serie. La tendencia a largo plazo de muchas series de
negocios (industriales y comerciales), como ventas, exportaciones y
producción, con frecuencia se aproxima a una línea recta. Esta línea de
tendencia muestra que algo aumenta o disminuye a un ritmo constante. El
método que se utiliza para obtener la línea recta de mejor ajuste es el
Método de Mínimos Cuadrados.
2. Tendencia no lineal Cuando la serie de tiempo presenta un
comportamiento curvilíneo se dice que este comportamiento es no lineal.
Dentro de las tendencias no lineales que pueden presentarse en una serie
se encuentran, la polinomial, logarítmica, exponencial y potencial, entre
otras.
6
Series de Tiempo
Series de tiempo
Ejemplo.
Aplicar el método de
promedios móviles para el
pronóstico de ventas de
gasolina a partir de la
siguiente información: Se
considerará el promedio móvil
a partir de las tres
observaciones más recientes.
En este caso se utilizará la
siguiente ecuación:
Resumen de cálculos para

promedios móviles de tres
semanas
7
Series de Tiempo
Promedios móviles ponderados: Para mostrar el uso de éste método, se
utilizará la primera parte del ejemplo anterior de la venta de gasolina. El
método consiste en asignar un factor de ponderación distinto para cada dato.
Generalmente, a la observación o dato más reciente a partir del que se quiere
hacer el pronóstico, se le asigna el mayor peso, y este peso disminuye en los
valores de datos más antiguos. En este caso, para pronosticar las ventas de la
cuarta semana, el cálculo se realizaría de la siguiente manera:
Puede observarse que el dato más alejado (correspondiente a la primera
semana) tiene el factor de ponderación más pequeño, el siguiente tiene un
factor de ponderación del doble que el primero y el dato más reciente (que
corresponde a la tercera semana) tiene un factor de ponderación del triple del
primero. Los pronósticos para las diversas semanas se presentan en la
siguiente tabla. En todos los casos, la suma de los factores de ponderación
debe ser igual a uno. Te das cuenta que ya no puedes usar más el factor de
ponderación porque ya término en la unidad por ejemplo 1/6 + 2/6+3/6 =
6/6 = 1
8
Series de Tiempo
Series de
Semana Valor de la serie de tiempo Pronosticó de la i –
tiempo
(Miles de galones) ésima semana con
Nota: para el
promedios móviles
21.33 usa un
para 3 años.
factor 9 ya que
1 17 ------------------
es la suma de
2+3+4 = 2 21 ------------------
(Recuerda que 3 19 ------------------
son 3 años) 4 23 19.33
Para el 19.83 5 18 21.22
usa un factor 6 16 19.91
12 ya que es la 7 20 18.53
suma de 8 18 18.11
3+4+5 = 12 y 9 22 18.05
así 10 20 20.08
sucesivamente 11 15 20.07
12 22 18.76
9
Modelos
Métodos no paramétricos.
Las pruebas de hipótesis de variables se miden en la escala
nominal. Recuerde, que un nivel de medición nominal implica
que los datos solo se clasifican en categorías, y estas no
reconocen un orden particular. El propósito de estas pruebas es
determinar si un conjunto de frecuencias observadas, f0, tiene
una diferencia significativa con un conjunto correspondiente de
frecuencias esperadas, fe. De igual forma, si le interesa la
relación entre dos características como la edad de un individuo
con su preferencia musical, deberá ordenar los datos de una
tabla de contingencia y un estadístico de pruebas. En estos tipos
de problemas no es necesario hacer suposiciones acerca de la
forma de la población.
10
Modelos
A continuación analizaremos datos no paramétricos. Para realizar

estas pruebas no necesitas hacer ninguna suposición acerca de la
distribución de la población. En ocasiones, se usa el término pruebas
libres de distribución. Además, no requiere que las respuestas estén
clasificadas u ordenadas, así que deben ser medidas con una escala
ordinal, de intervalo o de razón. Un ejemplo de clasificación es el
título de ejecutivo. Los ejecutivos corporativos se clasifican como
asistente de la vicepresidencia, vicepresidente, vicepresidente senior
y presidente. Un vicepresidente se clasifica más alto que su
asistente, un vicepresidente senior se clasifica más alto que un
vicepresidente, etc.
11
Modelos
Entonces se consideran 5 pruebas sin distribución y coeficiente de

correlación de los rangos de Spearman. Las pruebas son: de signo,
de la media, de los rangos con signos de Wilcoxon, de las sumas de
los rangos Wilcoxon y el análisis de la variancia por rangos de
Kruskal-Wallis.
12
Prueba de los signos
La prueba de los signos se basa en el signo de una diferencia entre

dos observaciones relacionadas. En general, se designa con una
signo más (+) una diferencia positiva, y con un signo menos (-), una
negatividad. Por ejemplo, una dietista quiere ver si disminuirá el
nivel de colesterol de una persona si la dieta se complementa con
cierto mineral. Ella selecciona una muestra de 20 obreros mayores
de 40 años de edad y mide nivel de colesterol. Después de los 20
sujetos toman el mineral durante seis semanas, vuelven a medir su
nivel de colesterol; si disminuyo se registra un signo “+”. Se
aumentó, se registra un signo “-“. Si no hay cambio, se registra cero
(y esa persona sale del estudio). En el caso de la prueba de los
signos, no interesa la magnitud de la diferencia si no solo la
dirección de ella.
La prueba de los signos tiene muchas soluciones. Una es para
experimentos de “antes/después”.
13
Para ilustrar este punto, suponga la evaluación de un programa
nueva de afinación de automóviles. Se registra el número de millas
de recorridas por galón de gasolina antes de la afinación y de una
después de esta. Si la afinación no es eficaz, es decir, si no tuvo
efecto en el desempeño casi la mitad de los automóviles probados
presentarían una disminución de las millas por galón, la otra mitad,
un aumento. Se asigna “+” a un aumento y “-“a una disminución.
Un experimento sobre la presencian de un producto ilustra otro uso

de las pruebas del signo. Taster´s choice vende dos clases de café en
un frasco de 4 onzas: descafeinado y normal. Su departamento de
investigación de mercado quiere determinar si los bebedores de café
prefieren descafeinado o normal, y para saberlo les dan dos tazas
de café sin ninguna marca y a cada uno se le pregunto cuál prefiere.
La preferencia por café descafeinado se codifica “+” y la presencia
por el regular “-“.
14
En ciertos sentido los datos están en un nivel ordinar debido a que los
bebedores de café dan a su bebida preferida a un rango más alto,
mientras que el otro tipo de café queda en el rango más bajo. Aquí una
vez más si la población de consumidores de café no tiene una
preferencia, se debe esperar que la muestra de los consumidores
prefiera café descafeinado y la otra mitad, normal.
Un ejemplo ayudara a mostrar mejor la aplicación de la prueba de los
signos. A continuación se presenta un experimento de “antes/después”.
Ejemplo
El director de sistema de información de Samuelson Chemicals
recomendó implementar un programa de capacitación para gerentes
en la planta. El objetivo es aumentar los conocimientos de
computación en los departamentos de nómina contabilidad y
producción.
15
Se seleccionó de forma aleatoria una muestra de 15 gerentes de los 3

departamentos. Un panel de expertos clasifico a cada uno de acuerdo
con sus conocimientos en computación. Se clasificaron como sobre
saliente, excelente, bueno, regular o deficiente. (Consulte la tabla 6).
Después del programa de capitación de tres meses, del mismo panel
de un experimento el sistema de información calificó a cada gerente
una vez más. Las dos clasificaciones (antes y después) aparecen con el
signo de la diferencia. Un signo “+” indica una mejora, y un signo “-“,
que la competencia del gerente con la base de datos declinó después
del programa de capacitación.
16
Tabla 6 nivel de competencias antes y después antes del programa de

capacitación
17
Lo que interesa saber es que si el programa de capacitación de la planta
aumento eficacia de los gerentes en el uso de la base de datos de
compañía. Es decir, ¿los gerentes son más competentes después del
programa de capacitación que antes?
Utiliza el procedimiento de prueba de hipótesis de 5 pasos.
Paso 1: formule de hipótesis nula y alternativa
Ho: π ≤ 0.50 No hay aumento del conocimiento en el uso de la base de
datos como resultado del programa de capacitación en la planta.
Ho: π ˃ 0.50 Existe un aumento del conocimiento en el uso de la bases
de datos de los gerentes después del programa de capacitación.
18
• El símbolo π es la proporción de la población con una característica
particular. Si no se rechaza la hipótesis nula, se indica que el
programa de capacitación no produjo ningún cambio en el nivel de
competencia en realidad disminuyo. Si se rechaza la hipótesis nula se
indica que la competencia de los gerentes aumento como resultado
de programa de capacitación.
• El estadístico de pruebas sigue la distribución de probabilidad
binominal. Es apropiado debido a que la prueba de los signos cumple
con todas las suposiciones binominales, que son las siguientes:
• Solo hay dos resultados: “éxito” o “fracaso”. Un gerente aumento sus
conocimientos (éxito) o no.
• Por cada intento, se supone que la probabilidad de éxito es 0.50. así,
la probabilidad de un éxito es la misma en todos los intentos (en este
caso, los gerentes).
• El número total de intentos es fijo (15 en este experimento).
• Cada intento es independiente. Este significa, por ejemplo que el
desempeño de Arthur Seiple en el curco de tres meses no se relaciona
con el desempeño de Sandy Gumpp.
19
• Paso 2: seleccione un nivel de significancia. Elija un nivel de 0.10
• Paso 3: decida sobre el estadístico de pruebas. Es el número de los
signos más que resulten del experimento.
• Paso 4: formule una regla de decisión. En el curso de capacitación se
inscribieron 15 gerentes, pero el nivel de conocimientos de Andy no
mostró aumento ni reducción. (Consulte la tabla 6). Por lo tanto, se
eliminó el estudio debido a que no pudo incluir en ningún grupo,
entonces n=14. A partir de la tabla de distribución de probabilidad
binominal proporcionada en los contenidos de esta semana, para
una n de 14 y una probabilidad de 0.50, se presenta la distribución de
probabilidad binominal en la tabla. El número de éxitos aparece en la
columna 1, las probabilidades de éxito columna 2, y las probabilidades
acumuladas en la 3. Para llegar a las probabilidades acumuladas,
sume las probabilidades de éxito de la columna 2 desde la parte
inferior. Con fines de ilustración para obtener la probabilidad
acumulada de 11 o más éxitos, sume
0.000+0.001+0.006+0.022=0.029.
20
Esta es una prueba de una cola debido a que la hipótesis alternativa

proporciona una dirección. La desigualdad (>) apunta hacia la
derecha. Por lo tanto la región de rechazo esta la cola de superior o
derecha. Si el signo de desigualdad apuntara hacia la cola izquierda
(<), la región de rechazo estaría en la cola inferior o izquierda. Si ese
fuera el caso, sumaria las probabilidades de la columna 2 hacia abajo
para obtener las probabilidades acumuladas en la columna 3.
Recuerde que se seleccionó el nivel de significación de 0.10. Para
llegar a la regla a la regla de decisión para este problema, sé recurre a
las probabilidades acumuladas en las tablas 2, columna 3. Se lee de
abajo hacia arriba hasta llegar a la probabilidad acumulada más
cercana, pero sin exceder el nivel de significancia (0.10). Esa
probabilidad acumulada es 0.090. El número de éxito (signo más) que
corresponde a 0.090 en la columna 1 es 10. Por lo tanto la regla de
decisión es: si el número de signos más en la muestra es 10 o mayor,
se rechaza la hipótesis nula y se acepta la hipótesis alternativa.
21
Para repasar: se suman las probabilidades de abajo así arriba por que la
dirección de desigualdad (>) es hacia la derecha, lo que indica que la región
de rechazo está en la cola superior. Si el número de signos más y la muestra
es 10 o mayor, se rechaza la hipótesis nula; de lo contrario no se rechaza H0.
La representación de la región de rechazo aparece en la gráfica 1.
¿Qué procedimiento se sigue en el caso de una prueba de dos colas? Se
combina (suman) las probabilidades de éxito y las dos colas hasta estar lo
más cerca posible de nivel de significancia deseado (α) sin sobrepasarlo. En
este ejemplo, α es 0.10. La probabilidad de tres o menos éxitos es 0.029,
determinada mediante 0.000 + 0.001+0.006+0.022. La probabilidad de 11 o
más éxitos también es 0.029. Se suma las dos probabilidades, 0.029 +0.029,
se obtienes 0.058. Esto es lo más cercano que se puede estar de 0.10 sin
sobre pasarlo. Si hubiera incluido las probabilidades de 4 y 10 éxitos,
0.090+0.090, en total sería 0.180, que excede 0.10. Por lo tanto, la regla de
decisión en el caso de una prueba de dos colas sería rechazada la hipótesis
nula si hay 3 o menos signos más, u 11 o más signos más.
22
Tabla 7 distribución de probabilidad binominal para n=14, π=50
23
Grafica 1 distribución binominal n=14, α=0.50
24
Paso 5: Tome una decisión respecto a la hipótesis nula. Once de los

catorces gerentes en el curso de capacitación aumentaron su
competencia para las bases de datos. El numero 11 está en la región
de rechazo, que inicia en 10, por lo tanto, se rechazó H0. Conclusión:
el curso de capacitación de 3 meses fue eficaz; incrementa la
competencia de los gerentes.
25
Prueba de rangos con signo de Wilcoxon
para muestras dependientes.
Prueba de rangos con signo de
Wilcoxon para muestras
dependientes.
La prueba t por pares (o apareada) tiene dos requisitos. Primero, las
muestras deben ser independientes. Recuerden que las muestras
dependientes se caracteriza por una medición, algún tipo de
intervención y luego otra medición por ejemplo, una compañía inicio
un programa de “bienestar” al inicio del año. Se inscribieron 20
personas en la parte de reducción del peso del programa. Para
comenzar, se pesaron todos los participantes. Luego se pusieron a
dieta, hicieron ejercicio, etc., para reducir de peso. Al final del
programa, que duró 6 meses, todos los participantes se pasaron de
nuevo. La diferencia entre sus pesos al inicio y al final del programa
es la variable de interés. Observe que hay una medición, un
intervención y luego otra medición.
26
Wilcoxon para muestras dependientes.
El segundo requisito de la prueba t por pares es que la distribución de la

diferencia siga la distribución normal de probabilidad. En el ejemplo
sobre el bienestar de la compañía esto requiere que las diferencias
entre los pesos de los 20 participantes sigan la distribución normal de la
probabilidad. En ese caso, dicha suposiciones es razonable. Sin
embargo, hay casos en que interesaran las diferencias entre
observaciones independientes y no se podrá suponer que la distribución
de la diferencia se aproxima a una distribución normal. Con frecuencia
encontrar problemas con la suposiciones de normalidad cuando el nivel
de medición en las muestras se ordinal, en lugar de intervalo o de
razón. Por ejemplo, suponga que hoy, en la clínica 3, hay 10 pacientes
en cirugía, la supervisora de enfermería pide a las enfermeras Benner y
Jurris que califiquen a cada uno de los pacientes en una escala del 1 al
10 de acuerdo con la dificultad de los cuidados que deben recibir. La
distribución de las diferencias entre las calificaciones quizá no se
aproxime a la distribución normal, por lo que no sería adecuado a la
prueba t por pares.
27
En 1945, Frank Wilcoxon desarrollo una prueba no paramétrica, con
base en las diferencias entre nuestras dependientes, que no requiere
las suposiciones de normalidad. Esta prueba de denomina pruebas de
rangos con signo Wilcoxon. En el siguiente ejemplo se dan los
detalles de su aplicación.
• Ejemplo.
Fricker´s es una cadena de restaurantes familiares ubicada sobre todo
el sureste de Estados Unidos, que ofrece un menú muy completo,
pero su especialidad es de pollo. Hace poco, Bernie Frick, propietario
y fundador elabora un nuevo sabor con especies para la salsa en la
que se cocina el pollo. Antes de reemplazar el sabor actual quiere
realizar alguna pruebas para estar seguro de que los comensales les
guste más este nuevo sabor.
28
Para iniciar Bernie seleccione una muestra aleatoria de 15 clientes. A
cada cliente de la muestra le da una pieza de pollo actual y le pide que
califique su sabor en una escala de 1 a 20. Un valor cercano a 20 indica
que al participante le gusto el sabor, el tanto que una calificación cerca
de 1 indica que no le gusto el sabor. Luego, los mismos 15 participantes
les da una muestra de pollo con el nuevo sabor a especies y una vez
más le pide calificar su sabor e una escala de 1 a 20. Los resultados
aparecen en la siguiente tabla. ¿Es razonable concluir que el sabor a
especies es el preferido? Utiliza un nivel de significancia de .05.
Tabla 8
29
Solución.
La muestra es dependientes o están relacionadas. Es decir a los
participantes se les pide calificar los dos sabores de pollos. Por lo
tanto, si calcula la diferencia entre la clasificación del sabor a
especias y la del sabor actual, el valor resultante muestra que la
cantidad de participantes favorecen un sabor en comparación con
el otro. Si elige restar la calificación del sabor actual a la calificación
del sabor a especias, un resultado positivo es la “cantidad” con que
los participantes prefieren el sabor a especias. Las diferencias
negativas de las calificaciones indican que el participante prefirió el
sabor actual. Debido a la naturaleza un tanto subjetiva de las
calificaciones, no hay seguridad de que la distribución de las
diferencias siga la distribución normal, por lo que conviene utilizar la
prueba de rangos con el signo de Wilcoxon no paramétrica.
30
• Como es habitual, emplea el procedimiento de prueba de
hipótesis en 5 pasos. La hipótesis nula es que no hay diferencias
entre las calificaciones de los sabores del pollo. Es decir, la misma
cantidad de participantes dio una clasificación alta al sabor actual
y al sabor a especias. L hipótesis alternativa es que las
calificaciones son más altas para el sabor a especias. De manera
más formal:
• H0: No hay diferencia entre las calificaciones de los dos sabores
• H1: Las calificaciones son más altas para el sabor a especias.
• Se trata de una prueba de una cola. ¿Por qué? Porque Bernie
Frick, propietario de Fricker´s, cambiara el sabor de pollo solo si
los participantes en la muestra indican que la población de
clientes le gusta más el nuevo sabor. El nivel de significancia de la
prueba es de 0.05, como se indicó antes.
• Los pasos para realizar la prueba de rangos con signo de Wilcoxon
son los siguientes:
31
1.-Calcule la diferencia entre la clasificación del sabor a especias y la
del sabor actual de cada participante. Por ejemplo, la clasificación
del sabor a especias de Arquette fue de 14, y el del sabor actual de
12, por lo que la diferencia es 2. Para Jones, la diferencia es -8,
determinada mediante 8-16, y para Fish es 4, determinada por 6-2.
Las diferencias de todos los participantes aparecen en la columna 4
de la tabla 9.
2.-En el análisis posterior solo se considera las diferencias positivas y
negativas. Es decir, si la diferencia entre las calificaciones del sabor
es 0, ese participante se elimina de un análisis posterior y se reduce
el número de integrantes de la muestra. De la tabla 3 Hall, el sexto
participante, califico el sabor a especias y al actual con 16. Por lo
tanto, se lo elimina del estudio y se reduce del tamaño útil de la
muestra 15 a 14.
3.-Determina las diferencias absolutas de los valores calculados en
la columna 4. Recuerde que la diferencia absoluta ignora el signo de
la diferencia. Las diferencias absolutas se muestras en la columna 5.
32
4.-Luego, orden las diferencias absolutas de menor a mayor.

Arquette, el primer participante, califico al pollo con especias con 14
y la actual con 12. La diferencia de 2 en las 2 calificaciones del
sabor es la diferencia absoluta menor, por lo cual se le asigna un
rango de 1. La siguiente diferencia mayor es 3, de Miller, por lo que
se le asigna un rango de 2.
Las otras diferencias se ordenan de manera similar. Hay tres
participantes que calificaron la diferencia entre los sabores con 8. Es
decir, Jones, Badenhop y Sundar tuvieron una diferencia de 8 entre
la calificación del sabor a especias y la del sabor actual para
resolver este problema, promedie estas calificaciones y anote la
calificación promedio de cada uno. Esta situación comprende las
clasificaciones de 5, 6 y 7, de modo de que a los tres participantes se
les asigna la calificación de 6. Es la misma situación de los
participantes con la diferencia de 9. Las clasificaciones
comprendidas son 8, 9 y 10, de manera de que a estos participantes
se les asigna una clasificación de 9.
33
Tabla 9 Clasificación de los sabores actual y de especias
34
5.- A cada clasificación asignada en la columna 6 se le da el mismo
signo que tenía en la diferencial original, y los resultados se
reportan en la columna 7. Por ejemplo, el segundo participante
tiene una diferencia de -8 y un rango de 6. Este valor se coloca en la
sección R de la columna 7.
6.- Se obtiene los totales de las columnas R+ y R-. Las sumas de los
rangos positivos es 75 y la suma de los rangos negativos es 30. La
menor de las dos sumas de los rangos se utilizan como el estadístico
de prueba y se conoce como T.
En los Contenidos Semanales en la tabla aparecen los valores
críticos de la prueba de rangos con el signo Wilcoxon una parte de
esa tabla se muestra a continuación. La fila α se utiliza para pruebas
de una cola, y la fila 2α para pruebas de dos colas. En este caso
desea demostrar que a los clientes les gusta más el sabor a
especias, que es una prueba de una cola, por lo que seleccionar la
fila α. Elija el nivel de significancia 0.05 y valla haya la columna con
el encabezado 0.05. Baje por la columna hasta la fila donde n es 14.
35
(Recuerde que una persona califico igual a ambos sabores y fue
eliminada del estudio; entonces, el tamaño útil de la muestra es 14)
El valor de la intersección es 25, por lo que el valor critico es 25. La
regla de decisión es realizar la hipótesis nula si el menor de los
totales de los rangos es 25 o menor. El valor que se obtuvo de la
tabla de valores T de Wilcoxon es el valor mayor en la región de
rechazo. En otras palabras la regla de decisión es rechazar H0 si la
menor de las dos sumas de los rangos es 25 o menor. En este caso,
la suma menor de rango es 30; en consecuencia, la decisión es no
rechazar la hipótesis nula no es posible concluir que hay una
diferencia entre las calificaciones del sabor actual el sabor a
especias. El señor Frick no demostró que los clientes prefirieran el
nuevo sabor el probable que continúe el sabor actual y no cambie el
sabor a especias.
36
Tabla de la prueba de rangos con el signo Wilcoxon.
37
Prueba de Wilcoxon de la suma de rangos de muestras
independientes.
Un procedimiento diseñado para determinar si dos muestras
independientes provienen de poblaciones equivalentes es la prueba
de Wilcoxon de la suma de rangos.
Esta prueba se basa en la suma de los rangos. Los datos se clasifican
como si las observaciones fueran parte de una sola muestra. Si la
hipótesis nula es verdadera los rangos tendrán una distribución casi
uniforme entre las dos muestras, y la suma de los rangos de las dos
muestras será casi igual. Es decir los rangos bajo, medio y alto
deberán dividirse en forma equitativa entre las dos muestras. Si la
hipótesis alternativa es verdadera una de las muestras tendrá
mayor cantidad de rangos bajos y por lo tanto una suma de rangos
menor. La otra muestra tendrá mayor cantidad de rangos altos, por
lo que la suma de rangos será mayor. Si cada una de las muestras
contiene al menos 8 observaciones se utiliza la distribución normal
estándar como estadístico de prueba.
38
La fórmula es:
𝒏 (𝒏 +𝒏 +𝟏)
𝑾− 𝟏 𝟏 𝟐
𝟐
Prueba de Wilcoxon de la suma de rangos. Z=
𝒏𝟏 𝒏𝟐 (𝒏𝟏 + 𝒏𝟐 +𝟏)
𝟏𝟐
Donde:
• “n1” Es el número de observaciones de la primera muestra.
• “n2” Es el número de observaciones de la segunda muestra.
• “W” Es la suma de los rangos de la primera población.
Ejemplo
Dan Thompson, presidente de CEO Airlines hace poco observó un aumento
del número de personas que no llegan a tomar los vuelos que salen de
Atlanta. Su interés principal es determinar si hay más personas que no se
presentan a tomar los vuelos que salen de Atlanta en comparación con los
vuelos que salen de Chicago. Una muestra de 9 vuelos de Atlanta y 8 de
Chicago aparecen en la tabla 10. Con un nivel de significancia de 0.05. ¿Es
posible concluir que hay más personas que no se presentan a tomar los
vuelos que salen de Atlanta? 39
Tabla 10 Número de personas que no se presentan a los vuelos
programados.
Atlanta Chicago
11 13
15 14
10 10
18 8
11 16
20 9
24 17
22 21
25
40
Solución Si el número de personas que no se presentan a tomar los
vuelos es el mismo en Atlanta que en Chicago, ambas poblaciones
serán casi iguales. Si el número de personas que no se presentan no
es el mismo, las dos sumas de los rangos serán muy diferentes.
Thompson considera que más personas pierden su vuelo en Atlanta.
Por ello, es adecuada una prueba de una cola, con la región de
rechazo en la cola derecha. Las hipótesis nulas y alternativas son:
H’0: la distribución de la población de personas que no se
presentan en la misma o menor en Atlanta que en Chicago.
H1: La distribución de la población de las personas que no se
presentan en Atlanta es mayor que en Chicago.
41
El estadístico de una prueba sigue la distribución normal de
estándar con un nivel de significancia de 0.05, se determina de la
tabla del Área bajo la curva normal en los contenidos semanales,
que el valor crítico de Z es 1.65. La hipótesis nula se rechaza si el
valor calculado de z es mayor de 1.65.
La hipótesis alternativa es que hay más personas que no se
presentan en Atlanta, lo que significa que la distribución se ubica a
la derecha de la distribución de Chicago. Los detalles de la
asignación del rango aparecen en la tabla 11.
Se clasificaron las clasificaciones de ambas muestras como si fueran
un solo grupo. El vuelo de Chicago con solo 8 personas que no se
presentaron tuvo la menor cantidad, por lo que se le asignó un
rango de 1, al vuelo de Chicago con 9 personas ausentes, un rango
de 2, y así en lo sucesivo. El vuelo de Atlanta con 25 personas que no
se presentaron es el mayor por lo que se le asigna el mayor rango.
17.
42
También hay dos cosas de rangos iguales. Hay un vuelo de Atlanta y
un vuelo de Chicago a los que no se presentaron 10 personas, y dos
vuelos de Atlanta con 11 asientos vacíos. ¿Cómo manejar estos
empates? La solución es promediar los rangos y asignar el rango
promedio a los dos vuelos. En el caso que comprende 10 personas
que no se presentaron los rangos comprendidos son 3 y 4 seguidos
la medida de estos rangos es 3.5, por lo que se asigna un rango de
3.5 a los dos vuelos de Atlanta y Chicago con 10 personas que no se
presentaron.
43
Tabla 11 Números de rango de las personas que no se presentaron a los
vuelos programados.
44
La suma de rangos de los vuelos de Atlanta es 96.5 este es el valor

de “W” en la sustitución de la siguiente formula, recuerde que en la
tabla 10 hay 9 vuelos que salen de Atlanta y 8 de Chicago por lo que
n1= 9 y n2= 8, calculamos “Z” a partir de la formula.
𝒏 (𝒏 +𝒏 +𝟏) 𝟗(𝟗+𝟖+𝟏)
𝑾− 𝟏 𝟏 𝟐 𝟗𝟔.𝟓−
𝟐 𝟐
Z= = = 1.49
𝒏𝟏 𝒏𝟐 (𝒏𝟏 +𝒏𝟐+𝟏) 𝟗 (𝟖)(𝟗+𝟖+𝟏)
𝟏𝟐 𝟏𝟐
Con el valor z calculado (1.49) es menor que 1.65, no se rechaza la

hipótesis nula. La evidencia no muestra una diferencia entre las
distribuciones de los números de personas que no se presentaron. Es
decir, parece que el número de personas que pierden el vuelo es el
mismo en Atlanta que en Chicago. El valor p es 0.0681, que se
encontró al determinar el área a la derecha de 1.49 (0.5000-
0.4319), indica el mismo resultado.
45
Conclusión
Al emplear la prueba de Wilcoxon de la suma de los rangos, pueden
enumerar las poblaciones en cualquier orden. Sin embargo una vez que haga
una elección, W deben ser la suma de los rangos identificados como la
población 1. Si, en el ejemplo de las personas que no se presentaron a los
vuelos, la población de Chicago se identificara como número 1, la dirección de
la hipótesis alternativa cambiaria, pero el valor absoluto de Z aun sería el
mismo.
H0: la distribución de la población de personas que no se presentaron en
Chicago es la misma o mayor que en Atlanta
H1: la distribución de la población de personas que no se presentaron en
chicago es menor que en Atlanta
El valor calculado de Z es -1.49, determinado por:
𝒏 (𝒏 +𝒏 +𝟏) 𝟖(𝟖+𝟗+𝟏)
𝑾− 𝟏 𝟏 𝟐 𝟓𝟔.𝟓−
𝟐 𝟐
Z= = = -1.49
𝒏𝟏 𝒏𝟐 (𝒏𝟏 +𝒏𝟐+𝟏) 𝟖 (𝟗)(𝟖+𝟗+𝟏)
𝟏𝟐 𝟏𝟐
De esta manera podemos observar que no hay una diferencia entre los
números habituales de personas que no se presentaron en Chicago y Atlanta.
46
Prueba de Kruskal-Wallis: análisis de la
varianza por rangos
Prueba de Kruskal-Wallis: análisis de la
varianza por rangos
El procedimiento del análisis de la varianza (ANOVA) se proporciona
con la igualdad de las medidas de varias poblaciones. Los datos
estaban en un nivel de intervalo o razón. Asimismo, se supuso que
las poblaciones seguían la distribución normal de probabilidad y que
sus desviaciones estándar eran iguales. ¿Qué sucede si los datos
están a escala ordinal y/o las poblaciones no siguen la distribución
normal? En 1952, W. H. Kruskal y W.A. Wallis reportaron una prueba
no paramétrica que solo requería datos de nivel original
(clasificados). No se requieren suposiciones acerca de la forma de
las poblaciones. A la prueba se le conoce como análisis en una
dirección de la varianza por rangos de Kruskal-Wallis.
Para la aplicación de la prueba de Kruskal-Wallis, las muestras
seleccionadas de la población deben ser independientes. Por
ejemplo, si selecciona o entrevista muestrea de tres grupos
(Ejecutivos, personal y supervisores) las respuestas de un grupo
(ejecutivos) no deben por ningún motivo influir en las respuestas de
los demás.
47
Prueba de Kruskal-Wallis
Para calcular el estadístico de prueba de Kruskal-Wallis,
1) se cambian todas las muestras,

2) se ordenan los valores combinados de bajo a alto
3) los valores ordenados se remplazan por rangos, partir de 1 para el
valor menor.
Ejemplo
El hospital System of the Carolinas opera 3 hospitales en el área de Great
Charlotte: St. Luke´s Memorial, en el lado poniente de la ciudad, Swedish
Medical Center, al sur, y el Piedmont Hospital en el lado este. El director
de administración está preocupado acerca del tiempo de espera de los
pacientes con lesiones de tipo deportivo, que no ponen en peligro la vida,
y que llegan durante las tardes entre semana a los tres hospitales.
Específicamente, ¿existe una diferencia en los tiempos de espera de los 3
hospitales?
48
Solución
Para averiguarlo, el director
selecciona una muestra
aleatoria de pacientes en los
3 hospitales y determino el
tiempo, en minutos, en que
entra un hospital y en el
momento en que termina el
tratamiento. Los tiempos en
minutos se reportan a
continuación.
Tabla 12 Tiempos de espera
de los pacientes en sala de
urgencias en el Sistema Tabla 12
Hospitalarios de las
Carolinas
49
En la Tabla 12 observamos que el tiempo de espera más corto, 35

minutos, es el 5to paciente muestreado en el Piedmont Hospital. El
tiempo más largo, 107 minutos, le toco al séptimo paciente muestreado
en el Swedish Medical Center.
Como, esta prueba exige 3 requisitos, debemos verificar que los tenga:
1.- Las muestras deben ser de poblaciones independientes

2.- Las varianzas de la población deben ser iguales
3.- Las muestras deben ser de poblaciones normales.
En este caso, las muestras provienen de poblaciones independientes, que

son los tres hospitales. Pero suponga que no quiere asumir que hay una
varianza igual en los tiempos de espera en los tres hospitales o que estos
tiempos de espera sigue en una distribución de probabilidad normal. Así
que no se puede utilizar esta técnica.
50
El primer paso en la prueba de la hipótesis es formular la hipótesis nula y

alternativa.
H0: La distribuciones de las poblaciones de los tiempos de espera son

iguales para los 3 hospitales.
H1: No todas las distribuciones de las poblaciones son iguales.
El director de administración selecciono un nivel de significancia de 0.05.

El estadístico de prueba de Kruskal-Wallis se designa como “H” y su
fórmula es:
Formula de prueba de kruskal - Wallis
𝟏𝟐 ∑𝑹𝟏 ² ∑𝑹𝟐 ² ∑𝑹𝒌 ²

H= + + ⋯……. − 𝟑 (𝒏 + 𝟏)
𝒏 𝒏+𝟏 𝒏𝟏 𝒏𝟐 𝒏𝒌
51
Con k-1 grados de libertad (k es el número de poblaciones), donde:
∑ R1, ∑ R2……. ∑ Rk Son las sumas de los rangos de la muestra 1, 2,…..k
respectivamente.
n1, n2,……nk Son los tamaños de las muestras 1, 2,……k respectivamente.
n, es el numero combinado de observaciones de todas las muestras.
En este ejemplo hay 3 poblaciones: una población de tiempos de espera

de pacientes en St. Luke´s Memorial, otra de pacientes Swedish Medical
Center, y una tercera de los pacientes de Piedmont Hospital. Por lo tanto,
hay k-1, es decir 3-1 =2 grados de libertad. Consulte la tabla de ji
cuadrada de los valores críticos en los contenidos de la semana.
El valor critico de dos grados de libertad y el nivel de significancia de 0.05

es 5.991. No rechace H0 si el valor calculado del estadístico de prueba H es
menor o igual a 5.991. Rechace H0 si el valor calculado H es mayor que
5.991 y acepte H1.
52
El paso siguiente es determinar el valor estadístico de prueba.

Remplacemos los tiempos de espera en los tres hospitales por sus rangos
correspondientes. Considerando los tiempos de espera como una sola
población, el paciente Piedmont con un tiempo de espera de 35 minutos
aguardó el tiempo más corto y, por lo tanto, se le otorga el rango más
bajo.
Hay dos pacientes que esperaron 38 minutos, uno en St. Luke´s y el otro
en Piedmont. Para resolver este empate, se otorga a cada paciente un
rango de 2.5, calculando mediante (2+3)/2. El proceso continua con todos
los tiempos de espera. El más largo es de 107 minutos, y ese paciente
Swedish Medical Center recibe un rango de 21. La tabla 13 muestra las
calificaciones, los rangos y la suma de los rangos en cada una de los tres
hospitales.
53
𝟏𝟐 ∑𝑹𝟏 𝟐 ∑𝑹𝟐 𝟐 ∑𝑹𝟑 𝟐
H= + + −𝟑 𝒏+𝟏
𝒏 𝒏+𝟏 𝒏𝟏 𝒏𝟐 𝒏𝟑
𝟏𝟐 𝟓𝟖.𝟓 𝟐 𝟏𝟐𝟎 𝟐 𝟓𝟐.𝟓 𝟐

H= + + − 𝟑 𝟐𝟏 + 𝟏 = 5.38
𝟐𝟏 𝟐𝟏+𝟏 𝟕 𝟖 𝟔
Como el valor calculado de H (5.38) es menor que el valor critico de 5.991, no se rechaza la hipótesis nula. No
hay evidencia suficiente para concluir que existe una diferencia entre tiempos de espera en los tres hospitales.
Tabla 13: Tiempos de espera, rangos y suma

de rangos en el Hospital System of the
Carolinas
54
Correlación por orden de Rango
Recuerde que”r” mide la asociación entre dos variables en escala de un
intervalo o de razón. Por ejemplo, el coeficiente de correlación reporta el
vínculo entre el salario de ejecutivos y sus años de experiencia, o entre el
número de millas de un embarque tiene que recorrer y el número de días que
tarda en llegar a su destina.
Charles Spearman, estadístico británico, introdujo una medida para
correlacionar datos de nivel ordinar. Esta medida permite describir la relación
entre conjunto de datos clasificados. Por ejemplo, a dos miembros del
personal en la Office of Research de la University of the Valley se les pide
clasificar 10 propuestas de investigación de la facultad con fines de
recolección de fondos. Aquí interesa estudiar la relación entre las
clasificaciones de los dos miembros del personal. Es decir, ¿los empleados
califican las mismas propuestas como las más valiosas y las menos valiosas
para los fondos? El coeficiente de correlación para rangos de Spearman,
denotado 𝑟𝑠 proporciona una medida de la asociación.
55
El coeficiente de correlación por rangos se calcula mediante la siguiente
formula.
Coeficiente de correlación por rangos de Spearman
𝟔 ∑𝒅 𝟐
𝒓𝒔 = 𝟏 −
𝒏(𝒏𝟐 − 𝟏)
Donde
d es la diferencia entre los rangos por cada par.
n es el número de observaciones por pares.
Al igual que el coeficiente de correlación, el coeficiente de correlación por
rangos adopta cualquier valor en un intervalo de −1.00 𝑎 1.00. Un valor
de −1.00 indica una correlación negativa perfecta, y un valor de 1.00 una
correlación positiva perfecta entre los rangos. Una correlación de rangos de
0 indica que no hay asociación entre los rangos. Correlaciones de rangos de
− 0.84 𝑦 0.80 indican una asociación fuerte, pero la primera indica una
relación inversa entre los rangos, y la última, una relación directa.
56
Ejemplo
Lorranger Plasttics, Inc, contrata a gerentes en capacitación provenientes de
universidades de Estados Unidos. A cada aspirante el reclutador le asigna
una calificación durante la entrevista en el campus. Esta calificación es una
expresión del potencial futuro y varia de 0 a 200; la calificación más alta
indica más potencial. Si el aspirante es contratado por Lorrenger, ingresa a
un programa de capacitación en la planta. Al terminarlo, recibe otra
calificación compuesta con base en pruebas, opiniones de líderes de grupo y
de personal de entrenamiento, cuyo rango va de 0 a 100. Nuevamente, una
calificación más alta indica un mayor potencial.
57
Ejemplo
La calificación en el campus y las calificaciones en la planta aparecen en la
tabla 14.
.
Tabla 14 Calificaciones en el campus y en la capacitación en planta de recién graduados de la universidad
58
Ejemplo
Determine la asociación entre las calificaciones en el campus y en la

planta. ¿Los resultados que obtienen mayores calificaciones en la
entrevista en el campus obtienen también las puntuaciones más altas
durante su entrenamiento en la planta?
Solución
Realizamos un diagrama de dispersión el cual muestra la asociación entre

las calificaciones del campus y de la planta. Es claro que existe una
asociación directa o positiva entre ambas calificaciones
.
59
60
El coeficiente de correlación de rangos de Spearman utiliza los rangos de
las calificaciones y no las calificaciones en sí. Esto es correlaciona los
rangos y no las calificaciones lo cual reduce el efecto de que la puntuación
que obtuvo Bobko sea mucho más alta que las otras. }
Para calcular el coeficiente de correlación de rangos se clasifican primero

las variables de baja a alta. Comenzamos con las calificaciones en el
campus. La calificación más baja fue 48 la de Ginny Alvear quien recibió el
rango 1. La siguiente calificación más baja fue 78 la de Jack Davison por lo
que se le dio el rango 2. Hubo dos graduados con puntuación de 83.
El empate se resuelve al dar a cada uno un rango de 3.5 que es el

promedio de los rangos 3 y 4. El más alto en el campus fue Jack Bobko
con 193 el cual recibió el mayor rango de 12.
61
Se sigue el mismo procedimiento
con las calificaciones obtenidas en
la planta. De nuevo Ginny Alvear
obtuvo la puntuación más baja, 36
así que su rango en la planta es 1.
Hubo 3 puntuaciones de 45. La
media de los 3 rangos empatados
es 3 calculado mediante (2+3+4)/3
= 3 así que cada uno de estos
reclutas recibió un rango en la
planta de 3 en la tabla 15 se
ilustra lo anterior además, de los
cálculos para determinar rs.
Tabla 15 cálculos necesarios para
determinar el coeficiente de
correlación de rangos (rs).
62
El coeficiente de correlación por rangos de Spearman es de 0.785,

determinado de la siguiente forma:
𝟔 ∑𝒅 𝟐
𝒓𝒔 = 𝟏 −
𝒏(𝒏𝟐 − 𝟏)
𝟔(𝟔𝟏.𝟓)
𝒓𝒔 = 𝟏 − 𝟏𝟐(𝟏𝟐𝟐 −𝟏) = 1 – 0.215 = 0.785
El valor de 0.785 indica una asociación positiva fuerte entre las

calificaciones del reclutador en el campus y las del personal de
capacitación. Los graduados que recibieron calificaciones altas del
reclutador en el campus también fueron los que recibieron
calificaciones altas del personal de capacitación. Se concluye que
existe una asociación entre ambos grupos de calificaciones.
63
Conceptos básicos del marco
Conceptos básicos del marco
El presente documento contiene el glosario de términos básicos que te

permitirán comprender los conceptos que habitualmente se manejan
en la Estadística inferencial
Series de Tiempo
Por serie de tiempo nos referimos a datos estadísticos que se recopilan,

observan o registran en intervalos de tiempo regulares (diario, semanal,
semestral, anual, entre otros). El término serie de tiempo se aplica por
ejemplo a datos registrados en forma periódica que muestran, por
ejemplo, las ventas anuales totales de almacenes, el valor trimestral total
de contratos de construcción otorgados, el valor trimestral del PIB.
64
Componentes de la serie de tiempo
Componentes de la serie de tiempo
Supondremos que en una serie existen cuatro tipos básicos de variación,

los cuales sobrepuestos o actuando en concierto, contribuyen a los
cambios observados en un período de tiempo y dan a la serie su aspecto
errático. Estas cuatro componentes son: Tendencia secular, variación
estacional, variación cíclica y variación irregular.
Supondremos, además, que existe una relación multiplicativa entre estas

cuatro componentes; es decir, cualquier valor de una serie es el producto
de factores que se pueden atribuir a las cuatro componentes.
65
1. Tendencia secular: La tendencia secular o tendencia a largo plazo de una serie es por
lo común el resultado de factores a largo plazo. En términos intuitivos, la tendencia de
una serie de tiempo caracteriza el patrón gradual y consistente de las variaciones de la
propia serie, que se consideran consecuencias de fuerzas persistentes que afectan el
crecimiento o la reducción de la misma, tales como: cambios en la población, en las
características demográficas de la misma, cambios en los ingresos, en la salud, en el
nivel de educación y tecnología. Las tendencias a largo plazo se ajustan a diversos
esquemas. Algunas se mueven continuamente hacía arriba, otras declinan, y otras más
permanecen igual en un cierto período o intervalo de tiempo.
2. Variación estacional: El componente de la serie de tiempo que representa la
variabilidad en los datos debida a influencias de las estaciones, se llama componente
estacional. Esta variación corresponde a los movimientos de la serie que recurren año
tras año en los mismos meses (o en los mismos trimestres) del año poco más o menos
con la misma intensidad. Por ejemplo: Un fabricante de albercas inflables espera poca
actividad de ventas durante los meses de otoño e invierno y tiene ventas máximas en
los de primavera y verano, mientras que los fabricantes de equipo para la nieve y ropa
de abrigo esperan un comportamiento anual opuesto al del fabricante de albercas.
66
3. Variación cíclica: Con frecuencia las series de tiempo presentan
secuencias alternas de puntos abajo y arriba de la línea de tendencia que
duran más de un año, esta variación se mantiene después de que se han
eliminado las variaciones o tendencias estacional e irregular. Un ejemplo de
este tipo de variación son los ciclos comerciales cuyos períodos recurrentes
dependen de la prosperidad, recesión, depresión y recuperación, las cuales
no dependen de factores como el clima o las costumbres sociales.
4. Variación Irregular: Esta se debe a factores a corto plazo, imprevisibles y
no recurrentes que afectan a la serie de tiempo. Como este componente
explica la variabilidad aleatoria de la serie, es impredecible, es decir, no se
puede esperar predecir su impacto sobre la serie de tiempo. Existen dos
tipos de variación irregular: a) Las variaciones que son provocadas por
acontecimientos especiales, fácilmente identificables, como las elecciones,
inundaciones, huelgas, terremotos. b) Variaciones aleatorias o por
casualidad, cuyas causas no se pueden señalar en forma exacta, pero que
tienden a equilibrarse a la larga.
67

1. Tendencia lineal de una serie viene dada por el movimiento general a
largo plazo de la serie. La tendencia a largo plazo de muchas series de
negocios (industriales y comerciales), como ventas, exportaciones y
producción, con frecuencia se aproxima a una línea recta. Esta línea de
tendencia muestra que algo aumenta o disminuye a un ritmo
constante. El método que se utiliza para obtener la línea recta de
mejor ajuste es el Método de Mínimos Cuadrados.
2. Tendencia no lineal Cuando la serie de tiempo presenta un

comportamiento curvilíneo se dice que este comportamiento es no lineal.
Dentro de las tendencias no lineales que pueden presentarse en una serie
se encuentran, la polinomial, logarítmica, exponencial y potencial, entre
otras.
68
Estadística no paramétrica
Estadística no paramétrica
La estadística no paramétrica es una rama de la estadística inferencial que

estudia las pruebas y modelos estadísticos cuya distribución subyacente no
se ajusta a los llamados criterios paramétricos. Su distribución no puede
ser definida a priori, pues son los datos observados los que la determinan.
La utilización de estos métodos se hace recomendable cuando no se puede
asumir que los datos se ajusten a una distribución conocida, cuando el
nivel de medida empleado no sea, como mínimo, de intervalo.
69
Prueba de los Signos
Prueba de los Signos

Prueba cualquier tipo de diferencias entre un par de datos relacionados. Se
utiliza en el caso que se tengan datos en forma nominal (como opiniones o
preferencias). Esta prueba se aplica en los siguientes casos:
Investigación de mercados
Preferencias hacia cierto producto
El objetivo de esta prueba es determinar si existe alguna preferencia de
entre dos opciones a elegir.
Procedimiento para aplicar la prueba de Signos

Paso 1. Se ofrece a las personas que emitirán su preferencia a que elijan de
entre las dos opciones ofrecidas.
Paso 2. Con estos datos se asigna un signo positivo a una de las opciones y
un signo negativo a la otra opción. Cada vez que la persona elija una opción
se registra el correspondiente signo positivo o negativo.
70
Paso 3. Se registra el tamaño de la muestra (n), el cual deberá ser mayor
de 20 y tomando en cuenta que si hay "empates", es decir, gente que no se
decidió por ninguna de las dos opciones, éstos se deben restar de la
muestra original.
Paso 4. Se registran el número de signos positivos (x) y el número de signos

negativos.
Paso 5. Se establecen la Hipótesis Nula (Ho) y la Hipótesis Alternativa (H1),

en los siguientes términos:
Ho: "No hay preferencia determinada hacia alguna de las dos opciones"
H1:"Si existe una preferencia hacia alguna de las dos opciones ofrecidas"
71
Paso 6. Determinar la región de
Aceptación de Rechazo y la
región de rechazo.
Esto se realiza mediante el nivel
de significancia y la Tabla de
Valores bajo la curva normal
(valores de Z).
Con este valor se busca en el
cuerpo de la Tabla de Valores
Bajo la Curva Normal y se
encuentra el valor de Z que
determina la frontera entre las
Regiones de Aceptación y de
Rechazo.
72
Paso 7.
Calcular Z
Para encontrar el valor de la Z
calculada se necesitan los siguientes
datos:
n = número de signos positivos =
número de éxitos = número de veces
que una persona elige una opción
particular
μ=0.50 n
73
Paso 8. Ubicar el valor calculado de Z
Si Z calculada es mayor al valor Z de Tablas o si Z es menor al valor de -Z
de Tablas, entonces Z calculada cae en la Región de Rechazo y por
consecuencia se rechaza la Hipótesis Nula; en caso contrario, la Z
calculada cae en la Región de Aceptación y la Hipótesis Nula se acepta.
Paso 9. Se formula una conclusión respecto al estudio en cuestión, en

los siguientes términos:
a) Si la Hipótesis Nula es Aceptada.
"No hay evidencias de que exista preferencia hacia alguna de las dos
opciones"
b) Si la Hipótesis Nula es Rechazada.
¡Si existe preferencia hacia alguna de las dos opciones ofrecidas!
74
Prueba de los rangos con signo de Wilcoxon
Prueba de los rangos con signo de Wilcoxon

La prueba de los rangos con signo de Wilcoxon es una prueba no
paramétrica para comparar el rango medio de dos muestras relacionadas
y determinar si existen diferencias entre ellas. Se utiliza como alternativa
a la prueba t de Student cuando no se puede suponer la normalidad de
dichas muestras. Debe su nombre a Frank Wilcoxon, que la publicó en
1945. Es una prueba no paramétrica de comparación de dos muestras
relacionadas y por lo tanto no necesita una distribución específica. Usa
más bien el nivel ordinal de la variable dependiente. Se utiliza para
comparar dos mediciones relacionadas y determinar si la diferencia entre
ellas se debe al azar o no (en este último caso, que la diferencia sea
estadísticamente significativa).
Se utiliza cuando la variable subyacente es continua pero no se presupone
ningún tipo de distribución particular.
75
Correlación por rangos
Correlación por rangos

En estadística, el coeficiente de correlación de Spearman, ρ
(rho) es una medida de la correlación (la asociación o
interdependencia) entre dos variables aleatorias continuas. ...
La tau de Kendall es un coeficiente de correlación por rangos,
inversiones entre dos ordenaciones de una distribución
normal bivariante.
76
Bibliografía
Bibliografía
Antonio., N. (2010). Probabilidad y estadística para ingeniería
y ciencias. Mc Graw Hill.
Devore, J. L. (2004). Probabilidad y estadística para ingeniería
y ciencias. Thomson.
Mendenhall, W. (1997). Probabilidad y estadística para
ingeniería y ciencias. Pearson.
Navidi, W. C. (2006). Estadística para ingenieros. Mc Graw
Hill. .
Ojeda, R. L. (2007). Probabilidad y Estadística básica para
ingenieros. Ecuador.Sánchez., O. (2000). Probabilidad y
Estadística. México: Mc Graw Hill. .
77

Foro 2 Estadistica Inferencial Aplicada

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Foro 2 Estadistica Inferencial Aplicada

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Foro 2 Estadistica Inferencial Aplicada

Cargado por

Copyright:

Formatos disponibles

Estadística Inferencial Aplicada

Tronco Común FACS. Ciclo: 20-2

Nombre del Periodo en el Del

Resumen de cálculos para

A continuación analizaremos datos no paramétricos. Para realizar

Entonces se consideran 5 pruebas sin distribución y coeficiente de

La prueba de los signos se basa en el signo de una diferencia entre

Un experimento sobre la presencian de un producto ilustra otro uso

Se seleccionó de forma aleatoria una muestra de 15 gerentes de los 3

Tabla 6 nivel de competencias antes y después antes del programa de

Esta es una prueba de una cola debido a que la hipótesis alternativa

Tabla 7 distribución de probabilidad binominal para n=14, π=50

Grafica 1 distribución binominal n=14, α=0.50

Paso 5: Tome una decisión respecto a la hipótesis nula. Once de los

El segundo requisito de la prueba t por pares es que la distribución de la

4.-Luego, orden las diferencias absolutas de menor a mayor.

La suma de rangos de los vuelos de Atlanta es 96.5 este es el valor

Con el valor z calculado (1.49) es menor que 1.65, no se rechaza la

1) se cambian todas las muestras,

En la Tabla 12 observamos que el tiempo de espera más corto, 35

1.- Las muestras deben ser de poblaciones independientes

En este caso, las muestras provienen de poblaciones independientes, que

El primer paso en la prueba de la hipótesis es formular la hipótesis nula y

H0: La distribuciones de las poblaciones de los tiempos de espera son

El director de administración selecciono un nivel de significancia de 0.05.

Formula de prueba de kruskal - Wallis

𝟏𝟐 ∑𝑹𝟏 ² ∑𝑹𝟐 ² ∑𝑹𝒌 ²

En este ejemplo hay 3 poblaciones: una población de tiempos de espera

El valor critico de dos grados de libertad y el nivel de significancia de 0.05

El paso siguiente es determinar el valor estadístico de prueba.

𝟏𝟐 𝟓𝟖.𝟓 𝟐 𝟏𝟐𝟎 𝟐 𝟓𝟐.𝟓 𝟐

Tabla 13: Tiempos de espera, rangos y suma

Tabla 14 Calificaciones en el campus y en la capacitación en planta de recién graduados de la universidad

Determine la asociación entre las calificaciones en el campus y en la

Realizamos un diagrama de dispersión el cual muestra la asociación entre

Para calcular el coeficiente de correlación de rangos se clasifican primero

El empate se resuelve al dar a cada uno un rango de 3.5 que es el

El coeficiente de correlación por rangos de Spearman es de 0.785,

El valor de 0.785 indica una asociación positiva fuerte entre las

El presente documento contiene el glosario de términos básicos que te

Por serie de tiempo nos referimos a datos estadísticos que se recopilan,

Supondremos que en una serie existen cuatro tipos básicos de variación,

Supondremos, además, que existe una relación multiplicativa entre estas

Tendencia de una serie

2. Tendencia no lineal Cuando la serie de tiempo presenta un

La estadística no paramétrica es una rama de la estadística inferencial que

Prueba de los Signos

Procedimiento para aplicar la prueba de Signos

Paso 4. Se registran el número de signos positivos (x) y el número de signos

Paso 5. Se establecen la Hipótesis Nula (Ho) y la Hipótesis Alternativa (H1),

Paso 9. Se formula una conclusión respecto al estudio en cuestión, en

Prueba de los rangos con signo de Wilcoxon

Correlación por rangos

También podría gustarte