Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Trabajo Final de Auditoria Integral

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 50

Universidad Nacional de

Tumbes
ESCUELA DE POSGRADO

MODULO:

ESTADISTICA APLICADA Y TECNICAS DE MUESTREO

DOCENTE:

Dr. Gaspar Chavez

INTEGRANTES:

o Mayta Urias, Graciela.


o Prado Ramírez, Anjelline Analí
o Ramos Saldarriaga, Sebastian Alexander

TUMBES - PERÚ
INTRODUCCIÓN

La determinación del tamaño muestral en una investigación es de vital importancia, tanto

para caracterizar la distribución de la variable, como para fijar el grado de precisión del

estudio. El propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestral

cuando se efectúa un estudio de carácter cuantitativo (limitado al uso de un muestreo

aleatorio simple, unietápico y fijo).

En el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como

ser la estimación estadística y el análisis de experimentos, que requieren de información

precisa sobre las variables consideradas, y que es obtenida a partir de la muestra

representativa de la respectiva población.


ÍNDICE

1. MEDIA....................................................................................................................................4

2. MEDIANA................................................................................................................................6

3. MODA.....................................................................................................................................9

4. VARIANZA.............................................................................................................................10

5. DESVIACIÓN ESTÁNDAR.......................................................................................................27

6. COEFICIENTE DE VARIACIÓN................................................................................................28

7. DISTRIBUCIÓN BINOMIAL.....................................................................................................30

8. DISTRIBUCIÓN NORMAL.......................................................................................................32

9. PRUEBA DE RANGO MULTIPLE (DUNCAN)............................................................................35

10. PRUEBA DE HIPOTESIS......................................................................................................41

11. CASO PRÁCTICO......................................................................................................................45

BIBLIOGRAFÍA...............................................................................................................................46
1. MEDIA

Es el valor promedio de un conjunto de datos numéricos, calculada como la suma de un

conjunto de valores dividida entre el número total de valores.

Algunas características de la media son:

 Considera todas las puntuaciones


 El numerador de la fórmula es la cantidad de valores
 Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra,
para obtener la Media de un conjunto solo tienes que seguir estos sencillos pasos:
 Determine el conjunto de valores que buscas promediar.
 Suma los valores para obtener el total
 Haz el conteo de la cantidad de valores en el conjunto.
 Divide la suma del conjunto entre la cantidad de números.

Fórmula:

Ejemplo de Media:
En una tienda mayorista se quiere calcular el promedio de ventas que realizaron los

empleados durante el mes. Para calcular la media se realiza lo siguiente:

Interpretación: Las ventas promedio de los empleados que realizaron durante el mes de 8.

Ejemplo de Media:

Calcular la media de: 8,9,10,11,16,17,6

N= 7 (el número de datos)

Aplico la fórmula:
2. MEDIANA

La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores, es

decir que, al ordenar los números de menor a mayor, éste se encuentra justamente en medio

entre los que están por arriba.

Algunas características de la media son:

 Las operaciones para calcular el valor son muy sencillas de realizar.


 La medida no depende de los valores de las variables, solamente de su orden.
 Generalmente, los valores son enteros.
 Se puede calcular, aunque los números que se encuentren arriba y abajo no tengan
límites.  

Como sacar la Mediana

Los pasos para sacar la mediana son:

1. Ordena todos los números del más pequeño al más grande.


2. Encuentra el número del medio del conjunto.

 Si tienes una cantidad impar: Tacha el número al final de la izquierda, después el primero a
la derecha, y repite el proceso hasta quedarte con un número, que será la mediana. 
 Si tienes una cantidad par, al final quedarás con dos números en el centro. Súmalos y
divídelos entre 2 para obtener la mediana.

Ejemplo de Mediana

La cantidad de valores es impar.

Si se tienen los valores: 9,5,4,2,7,

se ordenan: 2, 4, 5, 7, 9.

El elemento de en medio es el 5, ya que se encuentra dos valores por encima y dos valores

por debajo.

La cantidad de valores es par.

Si se tienen los valores 9,5,4,2,

se ordenan: 2,4,5,9.

En este caso se toman los dos valores centrales 5 y 4, la mediana es el promedio de

ambos: 9

Ejemplo de Mediana
N° EDAD Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.
1 22
2 28 Primero, arregle los números en orden ascendente.
3 35
4 59 {3, 5, 8, 10, 24, 36, 79, 255}
5 25
6 60 Hay 8 números en el conjunto -- un número par. Así, encuentre el
7 27
8 22 promedio de los dos números medios, 10 y 24.
9 57
(10 + 24)/2 = 34/2 = 17
10 25
11 50 Así, la mediana es 17.
12 28
Ejemplo de Mediana
13 26
14 23
Determinar la mediana de las edades de los maestrantes en auditoría
15 27
16 29 integral de la UNT, al inicio del ii módulo (15/10/2021)
17 26
18 25
19 40
20 42
21 37
22 32
Interpretación: La edad del 50% de los maestrantes de Auditoria Integral al inicio del II

curso de la maya curricular es menor igual a 27 años y del 50% es mayor a dicha edad.

Ejemplo de Mediana

Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.

Solución:

Ordenamos los datos de menor a mayor: 4, 6, 7, 7, 11.

Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.

El valor de la mediana es: Me = 7.

Ejemplo de Mediana

En un examen calificado del 0 al 10, 3 personas obtuvieron 5 de nota, 5 personas

obtuvieron 4 de nota, y 2 personas obtuvieron 3 de nota. Calcular la mediana.

Solución:

Primero hacemos una lista de las notas obtenidas: 5, 5, 5, 4, 4, 4, 4, 4, 3, 3.

Ahora ordenamos los datos de menor a mayor: 3, 3, 4, 4, 4, 4, 4, 5, 5, 5.

Como el número de datos es par (10), entonces nos enfocamos en los 2 valores centrales: 3,

3, 4, 4, 4, 4, 4, 5, 5, 5.

Finalmente, encontramos la media de estos 2 valores centrales:


Si al momento de calcular la mediana, ordenas los datos en forma decreciente o

descendente, obtendrás el mismo resultado que al hacerlo de forma creciente o ascendente.

3. MODA

La moda es el valor que aparece más dentro de un conglomerado. En un grupo puede haber

dos modas y se conoce como bimodal, y más de dos modas o multimodal cuando se repiten

más de dos valores; se llama amodal cuando en un conglomerado no se repiten los valores.

Por último, se conoce como moda adyacente cuando dos valores continuos tienen la misma

cantidad de repeticiones. En este caso se saca el promedio de ambos.

Las principales características de la moda son:

 Es una muestra muy clara


 Las operaciones para determinar el resultado son muy fáciles de elaborar
 Los valores que se presentan pueden ser cualitativos y cuantitativos

Como sacar la Moda

Los pasos para obtener la moda de un conjunto son:

 Escribe todos los números del conjunto.


 Encuentra el número o los números (en los casos bimodales o multimodales) que
aparezcan más veces.

Ejemplo de Moda
Ejemplo de Moda

Calcular la moda de los siguientes datos: 11, 6, 7, 7, 4.

Podemos ver que el valor que más se repite es el 7, ya que tiene una frecuencia absoluta de

2, por lo tanto, Mo = 7

4. VARIANZA

Análisis de varianza con dos factores o dos vías.

Es un diseño que pretende controlar algunos factores extraños (fuentes exógenas) de

variación, eliminando con ello la variación del CME (coeficiente medio del error).

El factor es una variable cualitativa pero como se dice dos factores son 2 variables

cualitativas, en un modelo de dos factores los efectos de interés son tres: los dos efectos

principales (uno por cada factor) y el efecto en la interacción de ambos factores.

Este diseño tiende a producir una mejor estimación de la varianza verdadera del error y

conduce a una prueba de hipótesis más poderosa en lo que respecta a la capacidad de

detectar diferencias entre medias de tratamiento.


CARACTERÍSTICAS:

INTERFERENCIA ENTRE LOS FACTORES:

En el análisis de 2 factores se tiene:

 La hipótesis nula referida a un factor afirma que las medias de las poblaciones definidas
por los niveles del factor son iguales.
 La hipótesis alternativa al efecto de una interacción afirma que tal efecto es nulo o
diferente.

SIN INTERACCIÓN:

Se amplía la percepción para contemplar una nueva posible fuente de variación se supone 3

fuentes para la misma:

 Se da entre tratamientos
 Se produce entre bloques
 La aleatoria

Los pasos son los siguientes:

1. Planteamiento de las hipótesis


2. Obtener la media de cada tratamiento, la media de cada bloque y la media general de
todos los datos.

Tratamientos Total de Media de


Bloques 1 2 … c bloques bloques
y 11 y 12 y 1c t 1. y 1.
1 …
2 y 21 y 22 … y 2c t 2. y 2.
… … … … … …
R y r1 y r2 … y rc t r. y r.

Total de Tratamientos t .1 t .2 … t .c t..= gran total


Media de
Tratamientos y .1 y .2 …   y .c y ..= gran media
3. Obtener la suma de cuadrados

SCT. La suma de cuadrados de la variación total.

SCA. La suma de cuadrados de la variación entre tratamientos.

SCE. La suma de cuadrados de la variación del error, o aleatoria.

SCB. La suma de cuadrados de la variación entre bloques.

El modelo se convierte en:

SCT = SCA + SCB + SCE


La suma de cuadrados total se obtiene calculando, para cada elemento de la matriz, el

cuadrado de la diferencia entre ese dato y la media global:

j k
T2
SCT    x2 
j 1 k 1 N

La suma de cuadrados de tratamientos y bloques se obtiene elevando al cuadrado las

diferencias entre cada uno de los promedios de columnas (tratamientos) y filas (bloques) y

el promedio global para, luego, multiplicar cada una de estas diferencias al cuadrado por el

tamaño de muestra y, finalmente, sumando todos estos productos:


k
Tk2 T 2
SCA    para los tratamientos.
k 1 N k N
1 j 2 T2
SCB   T j  para los bloques.
k j 1 N

La suma de cuadrados del error.

SCE  SCT  SCA  SCB

4. Obtener los promedios de los cuadrados tanto los tratamientos como los bloques,
dividiendo en ambos casos los grados de libertad de los tratamientos y los de los bloques:

Los promedios de cuadrados de tratamientos (CMA)

SCA
CMA 
K 1

Los promedios de cuadrados de bloques (CMB)

SCB
CMB 
K 1

Y, además, obtener el promedio de los cuadrados del error. Se obtiene dividiendo la suma

de cuadrados del error entre el número de tratamientos menos 1 multiplicado por el número

de bloques menos 1.

SCE
CME 
( J  1)( K  1)

5. Obtener los valores de F. Tanto los empíricos para los tratamientos y bloques Aquí
veremos el nivel de significancia en la tabla.

CMA
F para los tratamientos.
CME
CMB
F para los bloques.
CME

REGLA DE DECISIÓN:

F Calculada< f critica Acepta H 0


F Calculada> f critica Rechaza H 0

6. Resumen para el análisis de varianza:

Excel y ANOVA de dos factores

En el menú Complementos de Excel, en el submenú “Análisis de datos” se incluye una

herramienta denominada “Análisis de varianza de dos factores con una sola muestra por

grupo” que realiza todas las operaciones detalladas.

Nótese, de nuevo, que a lo que en este texto se denomina “2 vías”, Excel lo llama “dos

factores” (si ya está cargada esta herramienta, la puede encontrar en el menú Herramientas).

Recuerda:

En las pruebas ANOVA de 2 vías se tienen 4 posibilidades:

1. No se rechaza ninguna de las hipótesis nulas.

2. Se rechaza la hipótesis de tratamientos iguales, pero no la de bloques iguales.

3. Se rechaza la hipótesis de bloques iguales, pero no la de tratamientos iguales.

4. Se rechazan ambas.

Ejemplo 1:
Una empresa que asegura automóviles tiene 2 agencias en la ciudad para atender llamados

de siniestros. En el cuadro siguiente se muestran los datos de los llamados atendidos por las

2 agencias y para los diferentes días de la semana. ¿Se puede decir que hay diferencia entre

los llamados atendidos por las 2 agencias o por el día de la semana en que ocurren? Use un

nivel de significación de 0.05.

AGENCIAS
TOTAL DE MEDIA DE BLOQUES
DIAS (Bloques) Agencia
Agencia 2 BLOQUES (j) (j)
1
Lunes 52 42 94 47
Martes 47 51 98 49
Miércoles 54 53 107 53.5
Jueves 45 49 94 47
Viernes 50 57 107 53.5
Sábado 53 52 105 52.5
Domingo 47 45 92 46
TOTAL
GRAN TOTAL
TRATAMIENTOS
T=697
(k) 348 349  
MEDIA
GRAN MEDIA=
TRATAMIENTOS
49.79
(k) 49.71 49.86  

SOLUCION:

PRIMER PASO:

Para los días: (BLOQUES)

H o :  L   M   MI   J  V   S   D
H1 : por lo menos una de las medias poblacionales de los bloques es diferente a otras.

Para las agencias: (TRATAMIENTO)

H o : 1  2

H1 : por lo menos una de las medias poblacionales de los tratamientos es diferente a otras.
SEGUNDO PASO:

Para los días: (BLOQUES)

T1  94 T2  98 T3  107 T4  94 T5  107 T6  105 T7  92


T  8836
1
2
T2  9604
2
T 2
3  11449 T 2
4  8836 T5  11449
2
T6  11025
2
T7 2  8464

Para las agencias: (TRATAMIENTO)

T1  348 T2  349
T12  121104 T2 2  121801

n1  7 n1  7
GLOBAL:

T=697 T 2=485809 N=14


j k

 X
j 1 k 1
2
 522  47 2  542  ...  452  34925

T 2 485809
= =34700.64
N 14

TERCER PASO:
j k
T2
SCT    x  2
 34925  34700.64  224.36
j 1 k 1 N

k
Tk2 T 2 121104 121801
SCA       34700.64  0.0742
k 1 nk N 7 7
1 j 2 T2 1
SCB   T j  N = 2 (8836  9604  11449  8836  11449  11025  8464)  34700.64  130.86
k j 1

SCE  SCT  SCA  SCB


SCE  224.36  0.0742  130.86  93.43
El modelo se convierte en:

SCT = SCA + SCB + SCE

SCT=0.0742+130.86+93.43=224.36

CUARTO PASO:

SCA 0.0742 SCB 130.86


CMA    0.0742 CMB    21.81
K 1 2 1 J 1 7 1

SCE 93.43
CME    15.57
( J  1)( K  1) (7  1)(2  1)

QUINTO PASO:

CMA 0.0742
F =  0.004766
CME 15.57
La F crítica es 5.99 ya que en la tabla de distribución F, 1 grado de libertad para el numerador (número de tratamientos menos 1) y
6 para el denominador (número de tratamientos menos 1 por número de bloques menos 1)

CMB 21.81
F   1.4
CME 15.57
La F critica es 4.15 ya que en la tabla de distribución F, 6 grado de libertad para el numerador (número de bloques menos 1) y
6 para el denominador (número de tratamientos menos 1 por número de bloques menos 1)

REGLA DE DECISIÓN:

F Calculada< f critica Acepta H 0


F 0.004766 <f 5.99 Acepta H 0

F Calculada< f critica Acepta H 0


F 1.40< f 4.15 Acepta H 0
SEXTO PASO

Grados de
Suma de
Fuente de Variación libertad
Cuadrados
Cuadrado Medio Cociente F
(gl)
Entre grupos de 3-1
tratamientos(A) SCA=0.0742  CMA=0.0742 F=0.004766

Entre grupos de Bloques 6-1


(B) SCB=130.68  CMB=21.81 F=1.40
Error de muestreo € (7-1)(2-1) SCE=93.43  CME=15.57  

14-1
Total (T) SCT=224.36    
INTERPRETACION: Con un 95% de confianza se puede decir que no hay
diferencia entre los llamados atendidos por las agencias y por el día de las
semanas.

 Ejemplo 2:

Una revista especializada en automóviles hace pruebas de eficiencia en el


consumo de combustible de los modelos compactos de 3 fabricantes de
automóviles. Hace las pruebas en 3 tipos de terreno: ciudad, terreno montañoso y
terreno llano con poco tráfico. ¿Consideraría que hay evidencia de diferencia en el
consumo de combustible de los carros y en los diferentes tipos de terreno? use un
nivel de confianza de 0.05.

FABRICANTES
TERRENOS TOTAL DE MEDIA DE
Fabricante Fabricante Fabricante
(Bloques) BLOQUES BLOQUES
1 2 3
Ciudad 14.00 12.50 13.10 39.6 13.2
Montaña 15.30 14.50 14.20 44 14.67
Plano 16.10 15.60 16.00 47.7 15.9
TOTAL
GRAN
TRATAMIENTO 45.4 42.6 43.3
TOTAL=131.3
S  
MEDIA
GRAN
TRATAMIENTO 15.13 14.20 14.43  
MEDIA=14.59
S
SOLUCION:

PRIMER PASO:

Para los Terrenos: (BLOQUES)

H o : c   M   p
H1 : por lo menos una diferencia en los terrenos.

Para los fabricantes: (TRATAMIENTO)

H o : 1  2  3

H1 : por lo menos una diferencia en el consumo de los carros

SEGUNDO PASO:

Para los terrenos: (BLOQUES)

T1  39.6 T2  44 T3  47.7
T1  1568.16
2
T2  1936
2
T 23  2275.29

Para los fabricantes: (TRATAMIENTO)

T1  45.4 T2  42.6 T3 =43.3


T12  2061.16 T2 2  1814.76 T32 =1874.89

n1  3 n1  3 n1  3

GLOBAL:

T=131.3 T 2=17239.69 N=9

j k

 X
j 1 k 1
2
 142  15.32  16.12  ...  16 2  1928.41

TERCER PASO:
j k
T2 17239.69
SCT    x2   1928.41   12.89
j 1 k 1 N 9
k
Tk2 T 2 2061.16 1814.76 1874.89 17239.69
SCA         1.42
k 1 nk N 3 3 3 9
1 j 2 T2 1 17239.69
SCB   T j  = (1568.16  1936  2275.29)   10.96
k j 1 N 3 9

SCE  SCT  SCA  SCB


SCE  12.89  1.42  10.96  0.51

El modelo se convierte en:

SCT = SCA + SCB + SCE

SCT=1.42+10.96+0.51

SCT= 12.89

CUARTO PASO:

SCA 1.42 SCB 10.96


CMA    0.71 CMB    3.65
K 1 3 1 J 1 3 1

SCE 0.51
CME    0.1275
( J  1)( K  1) (3  1)(3  1)

QUINTO PASO:

CMA 0.71
F   5.57
CME 0.1275
La F crítica es 6.94 ya que en la tabla de distribución F, 2 grado de libertad para el numerador (número de tratamientos menos 1) y
4 para el denominador (número de tratamientos menos 1 por número de bloques menos 1)
CMB 3.65
F   28.63
CME 0.1275
La F critica es 6.94 ya que en la tabla de distribución F, 2 grado de libertad para el numerador (número de bloques menos 1) y
4 para el denominador (número de tratamientos menos 1 por número de bloques menos 1)

REGLA DE DECISIÓN:
F Calculada< f critica Acepta H 0
F 5.57< f 6.94 Acepta H 0

F Calculada> f critica Rechaza H 0


F 28.63> f 6.94 Rechaza H 0
SEXTO PASO

Grados de
Suma de
Fuente de Variación libertad
Cuadrados
Cuadrado Medio Cociente F
(gl)

Entre grupos de 3-1


tratamientos(A) SCA=1.42  CMA=0.71 F=5.57

Entre grupos de Bloques 3-1


(B) SCB=10.96  CMB=3.65 F=28.63

(3-1)(3-1)
Error de muestreo € SCE=0.51  CME=0.1275  

9-1
Total (T) SCT=12.89    

INTERPRETACIÓN: con un 95% de confianza se puede concluir que no hay una

diferencia entre el consumo de combustible de los carros pero si existe una diferencia en los

diferentes tipos de terrenos.

CON INTERACCIÓN

En este último apartado se desarrollará el ANOVA con 1 fuente más de variación:

 Producir variación por la interacción entre los tratamientos y los bloques.

Se agrupa la nomenclatura de tratamientos y bloques, para llamar a las 2 variables

independientes “factores” con el propósito de facilitarla, ya que ahora se hablará

de una fuente adicional de variación (de sumas de cuadrados): la de la interacción.


Grados de cuadrado
fuente de variación suma de cuadrados (SC) cociente (F)
Libertad (GL) medio(CM)
k
T 2k T 2 SCA
SCA= ∑ − CMA=
k −1 nJ nJ K−1
Entre de Grupos de CMA
 F =
Tratamientos (A)  K-1     CME
SCB CMB
CMB = F=
Entre de Grupos de J −1 CME
Tratamientos o J-1 T 2J T 2
J
SCB= ∑ −
bloques (B)   J =1 nK N    
J k n 2
1
 SCI= ∑∑
n J =1 k=1 (∑ )i=1
x – SCA –
 CMI =
CMI
F=
CME
interacción (entre) (J-1)(K-1) T2 SCI
SCB -
factores ( A y B ) (I)   N (J −1)( K −1)  

JK (n-1) SSE
 CME =
Error de Muestreo (E)    SCE= SCT – SCA - SCB - SCI JK (n−1)  
n J k
2 T2
SCT= ∑ ∑ ∑ X −
i=1 J−1 k−1 N

Total (T)  N-1      

Ejemplo 1:

Para evaluar el efecto que tienen las proteínas, los carbohidratos y las grasas

en el crecimiento de los ratones, se realizó un experimento con grupos de 3

ratones recién nacidos, de 3 razas distintas, a los que se les administró una

dieta rica en cada uno de los nutrientes y se obtuvieron los siguientes

resultados:
  DIETA RICA EN
TOTAL DE
Grasas( pes proteínas( MEDIA
carbohidratos(peso BLOQUES
  o en peso en BLOQUES
en gramos) (J)
gramos) gramos)
25 35 12    
Grupo de
27 38 10 220 25.44
ratones 1
28 36 9    
28 38 15    
Grupo de
30 41 13 247 27.44
ratones 2
31 39 12    
18 25 8    
Grupo de
19 27 7 155 17.22
ratones 3
20 25 6    
TOTAL
TRATAMIENTO 226 304 92 GRAN
S (K) TOTAL=622  
GRAN
33.777777
25.1111111 10.22 MEDIA=
8
MEDIA   23.03

Con un nivel de significación de 0.01 realice un análisis de varianza con interacción.

Solución:

PRIMER PASO:

Para los bloques (ratones)

H 0  1   2  3
H1  por lo menos una diferencia en los ratones

Para los tratamientos (dietas ricas en grasa, proteínas y carbohidratos)

H 0  u1  u2  u3
H1  por lo menos una diferencia en cada una dieta de los nutrientes

Para la interacción

H 0  no existe interaccion entre los ratones y las dietas


H1  si existe interaccion entre los ratones y las dietas
SEGUNDO PASO:

Obtener las medias del factor A y factor B, y de la combinación de factores

Para los ratones: (BLOQUES)

T1  220 T2  247 T3  155


T12  48400 T2 2  61009 T 23  24025

Para las dietas: (TRATAMIENTO)

T1  226 T2  304 T3 =92


T12  51076 T2 2  92416 T32 =8464

n1  3 n1  3 n1  3

GLOBAL:

T=622 T 2=386884 N=27

j k

 X
j 1 k 1
2
 (25  27  28) 2  (28  30  31) 2  ...  (8  7  6) 2  52306

2
T 386884
= =14329.04
N 27

TERCER PASO:

Obtener la suma de cuadrados total, del factor A, el factor B, y de su interacción

j k
T2
SCT    x 
2
 17470  14329.04  3140.90
j 1 k 1 N
T 2k T 2 51076 92416 8464
k
SCA= ∑ − = 3( 3) + 3 (3) + 3 (3) = 2554.96
k −1 nJ nJ

J
T 2J T 2 48400 61009 24025
SCB= ∑ − = 3 (3) + 3(3) + 3(3) – 14329.04= 496.96
J =1 nK N

J k n 2
1 T2 1
SCI= ∑ ∑
n J =1 k=1 ( )
∑x
i=1
– SCA – SCB -
N
= 3 (52306)-2554.96-496.96-14329.04

= 54.37

SCE  SCT-SCA-SCB-SCI

SCE  3140.96-2554.96-496.96-54.37
SCE= 34.67

CUARTO PASO:

Obtener los grados de libertad y los promedios cuadrados de los factores y su interacción

n= 3 k= 3 j= 3

Grados de libertad para el factor A

A: número de factores A menos 1

A: 3-1= 2

SCA 2554.96
CMA    1277.48
K 1 3 1

Grados de libertad para el factor B

B= número de factores B menos 1


B= 3-1= 2

SCB 496.96
CMB    248.48
J 1 3 1

Grados de libertad de la interacción entre los 2 factores = número de factores de A menos

1, multiplicando por el número de factores de B menos 1= (3-1) (3-1)= 4

SCI 54.37
CMI    13.59
( J  1)( K  1) (2)(2)

Grados de libertad del error (variación aleatoria) = [(número de factores A) (número de

factores B) (número de réplicas menos 1)]= 3(3) (3-1)=18

SCE 34.67
CME    1.926
JK (n  1) 3(3)(2)

QUINTO PASO:

CMA 1277.48
F   663.28 para los tratamientos
CME 1.926

El valor crítico de la F, con dos grados de libertad para el numerador y 18 para el

denominador es 8.10, ya que P (F ≥ 8.10|gln = 2, gld = 18) = 0.01.

CMB 248.48
F   129.01 para los bloques
CME 1.926

El valor crítico de la F, al igual que con el factor A, con 2 grados de libertad para el

numerador y 18 para el denominador es 8.10, ya que P (F ≥ 8.10|gln = 2, gld = 18=0.01

CMI 13.59
F   7.056 para la interacción entre los tratamientos y los bloques
CME 1.926
El valor crítico de la F, con 4 grados de libertad para el numerador, y 18 para el

denominador es 4.43, ya que P (F ≥ 4.43|gln = 4, gld = 18) = 0.01.

SEXTO PASO:

Interpretación: Como el valor empírico de F, 663.28, es mayor que este valor crítico de

8.10, se rechaza la hipótesis nula referente a las grasas, proteínas y carbohidratos y se

concluye que la media de las ricas dietas en proteínas en los 3 grupos de ratones no son

todas iguales.

 Como el valor empírico de F, 129.01, es mayor que este valor crítico de 8.10, se rechaza la
hipótesis nula referente a los grupos de ratones y se concluye que la media de las ricas
dietas en grasas, proteínas y carbohidratos de los 3 grupos de ratones no son todas
iguales.
 Como el valor empírico de F, 7.056, es mayor que este valor crítico de 4.43, se rechaza la
hipótesis nula referente a la interacción y se concluye que sí existe interacción entre la
dieta de las proteínas y los grupos de ratones.

5. DESVIACIÓN ESTÁNDAR

La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para
variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una
medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su
media aritmética, expresada en las mismas unidades que la variable. Se caracteriza por ser el
estadígrafo de mayor uso en la actualidad. Se obtiene mediante la aplicación de la siguiente
fórmula:
Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente

de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en

gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de

ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520)

gramos respectivamente. Por lo que su media es:

La varianza sería:

Por lo tanto la desviación estándar sería:

Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con

una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta

información le permite al gerente determinar cuánto es el promedio de perdidas causado

por el exceso de peso en los empaques y le da las bases para tomar los correctivos

necesarios en el proceso de empacado.


6. COEFICIENTE DE VARIACIÓN

El Coeficiente de Variación es una medida de dispersión que permite el análisis de las

desviaciones de los datos con respecto a la media y al mismo tiempo las dispersiones que

tienen los datos dispersos entre sí.Es una excelente herramienta de Comparación de eventos

y permite tomar decisiones estadísticas de cualquier situación de la vida cotidiana.

El coeficiente de Variación es una medida de dispersión relativa, no tiene unidades, se

define como el cociente de la desviación estándar (o típica) y la media

DESVIACION ESTANDAR
cv =
MEDIA

Se presenta en su forma relativa, se encuentra simplemente sustituyendo valores o en su

forma porcentual se multiplica por 100.

DESVIACION ESTANDAR
cv = ∗100
MEDIA

En la vida cotidiana debemos tomar decisiones y usualmente lo hacemos comparando

información. Las comparaciones de datos dispersos son muy útiles como lo veremos en el

siguiente ejemplo.

Los pesos de los toros de Lidia de una ganadería se distribuyen con una media  = 500 kg

y una desviación típica σ = 40 kg.

Los pesos de los perros de una exposición canina tiene una media  = 20 kg y una

desviación típica σ = 10 kg.

La desviación típica de los pesos de la manada de toros bravos (40kg) es superior a la de los

perros (10kg). Sin embargo, los 40 kg son poca cosa para el enorme tamaño de los toros (es
decir los toros de esa manada son muy parecidos en peso), mientras que 10 kg es mucho en

relación con el peso de un perro. En casos como este, la desviación típica no es una medida

adecuada para comparar dispersiones. Por ello, definimos un nuevo parámetro estadístico.

Se considera que los datos de este ejemplo los toros y lo perros representan poblaciones.

 σ cv 40
Para los perros: cv = =0.08 8%
Toros 50 40 8% 500
0 10
Para los toros: cv = =0.5050 %
Perros 20 10 50% 20

De este modo si se aprecia claramente que la variación de los pesos de los perros (50%) es

mucho mayor que la de los pesos de los toros (8%).

7. DISTRIBUCIÓN BINOMIAL

La distribución binomial es una distribución de probabilidad discreta que mide el número

de éxitos si la variable es una variable aleatoria discreta, es decir, sólo puede tomar los

valores 0, 1, 2, 3, 4,..., n   suponiendo que se han realizado    n    pruebas. En las empresas

tenemos muchas situaciones donde se espera que ocurra o no un evento específico. Éste,

sólo puede ser de éxito o fracaso.  Por ejemplo, en la producción de una pieza, ésta puede

salir buena o defectuosa. Para situaciones como éstas se utiliza la distribución binomial.  

Formula:

n
F (x) = P (X=x) = C x * p x∗¿

Donde: n!
C nx = x ! ( n−x ) !

P: probabilidad de éxito

q: probabilidad de fracaso
n: número de ensayos

x: número de éxitos en “n” ensayos

Ejemplo:

¿Qué probabilidad hay de obtener al menos un seis al realizar seis lanzamientos

consecutivos de un dado?

Sea el suceso A: obtener un seis al lanzar un dado

La probabilidad de A, sería p= 1/6.

Sea la variable X ~ número de seises obtenidos en los seis lanzamientos

B (n=6, p=1/6).

6 1 1 6
P( x ≤ 1) = 1- P(x=0) = 1[ ( )( ) ( )
0
∗ °∗ 1− ] = 0,665
6 6

En una cafetería, la probabilidad de que a un cliente nuevo le guste la hamburguesa es de

0.8. Si durante una semana llegan 5 clientes nuevos. ¿Cuál es la probabilidad de que solo a

2 de ellos les guste la hamburguesa?

P: 0.8 probabilidad de éxito

n: 5 clientes nuevos

x: 0,1,2,3,4,5

n!
F (x) = P (X=x) = C nx * p x∗¿ Donde:C nx =
x ! ( n−x ) !

F (2) = P (X=2) = C 52 * 0.82∗¿ 5!


C 52 = 2! ( 5−2 ) !

F (2) = P (X=2) = 10 * 0.82∗0.23


120
F (2) = P (X=2) = 0.51 5.12% C 52 = 2 ( 6 ) =10
En una cafetería la probabilidad de que a 2 clientes nuevos durante una semana les guste la

hamburguesa es de 0.0512 o 5.12%

8. DISTRIBUCIÓN NORMAL

La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre

(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más

profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más

comúnmente, como la "campana de Gauss". La distribución de una variable normal está

completamente determinada por dos parámetros, su media y su desviación estándar,

denotadas generalmente por µ y ơ. Con esta notación, la densidad de la normal viene dada

por la ecuación:

−1
1 2
¿¿
F(x)= ∗e
√ 2 π∗σ
Donde:

X: probabilidad de x (e = 2.71828...)

µ: media (π= 3,141592…)

ơ: desviación estándar

Para encontrar las probabilidades o cantidad de datos entre determinados valores de la

variable, se calcula el área bajo la curva normal, que se encuentra en la tabla z o tabla de

áreas bajo la curva normal estandarizada.

LA DISTRIBUCIÓN NORMAL ESTÁNDAR


La distribución normal estándar, es aquella distribución normal que tiene una media igual a

cero, y una desviación estándar igual a uno. Veamos la función densidad normal

estandarizada, que trabaja con la variable estandarizada z en el eje horizontal.

FÓRMULA:

x−μ
N (µ;ơ) =
σ
Z: valor de tabla z

µ: media

ơ: desviación estándar (sigma) valor esperado

Por ejemplo, si se desea encontrar la probabilidad de que la variable estandarizada z, tome

un valor entre 0 y 1,50; hay que encontrar el área bajo la curva entre z = 0  y  z = 1,50.

Para calcular el valor de esta área, se utiliza la tabla z y se busca el valor de 1,50:
Como vemos, el valor del área bajo la curva es de 0,4332, y esa sería la probabilidad de que

la variable estandarizada z, tome un valor comprendido entre 0 y 1,50.

Si tenemos una variable aleatoria continua X con una distribución normal no estandarizada,

con media igual a 10 y desviación estándar igual a 1, y el problema pide calcular la

probabilidad de que la variable X tome un valor entre 10 y 11,50, hay que estandarizar los

valores de la variable X aplicando la fórmula de z:

x−μ
Z=
σ

11.50−10 1.50
z= 1
=
1
=1.50

Ahora, veamos la gráfica de esta distribución normal:


Y usando la tabla z, se calcula el área bajo la curva. Cuando z es igual a 1,50, el área bajo la

curva es de 0,4332.
Podemos concluir que la probabilidad de que la variable estandarizada z, tome un valor

comprendido entre 10 y 11,50 es de 0,4332.

9. PRUEBA DE RANGO MULTIPLE (DUNCAN)

DEFINICIÒN:

La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia entre

pares de medias después que se ha rechazado la hipótesis nula en el análisis de varianza.

Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos"

(Duncan los llama rangos significativos mínimos) dados por la fórmula:

Donde p toma valores entre 2 y K (K es el número de tratamientos), d se obtiene de la tabla

T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.

Donde

N−I es el punto crítico del rango estudentizado basado en la comparación de la media

mayor y la menor de p medias. Los valores críticos qαp;p,ν , para p = 2, 3, · · · , I, se

presentan en la Tabla VII del Apéndice C para los niveles de significación de

comparaciones individuales α = 0,01 y α = 0,05.

R es la varianza residual con N − I grados de libertad.

α : es el nivel de significación conjunto relativo a p medias consecutivas; es decir, es la

probabilidad de rechazar erróneamente al menos una de las p − 1 comparaciones

independientes asociadas a las medias consideradas.

Dicho nivel de significación está relacionado con el nivel de significación α, de una

comparación individual, a través de la ecuación αp = 1 − (1 − α) p−1.


VENTAJAS:

 Se utiliza para efectuar comparaciones multiples entre dos medias de tratamientos del
experimento.
 El número de comparaciones con D tratamientos es (t(t-1))/2.
 Cuando el número de repeticiones es igual en los tratamientos, los cálculos son más
precisos que cuando se tiene diferente número de repeticiones por tratamiento.
 F- calculando en el análisis de varianza puede ser o no significativo.
 La prueba de DUNCAN permite comparar tratamientos no relacionados, es decir todos los
tratamientos contra todos a fin de establecer un orden de méritos.

DESVENTAJAS:

 Tienen el inconveniente cuando se cuenta con un alto número de tratamientos, dado que
el nivel de significancia α se modifica en función a ellos.
 No debe utilizarse cuando las varianzas son heterogéneas. Lehmann y Shaffer (1977)
argumenta que dicha prueba no debe utilizarse porque la derivación de las tasas de error
dependen de una condición de monotocidad en los datos (siempre crecen o decren; pero
no oscilan); la cual no se presenta en datos reales.

APLICACIÒN DE LA PRUEBA DE DUNCAN:

 Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos
por el gobierno para el control de desechos de fabricación, pero quisiera determinar cuál
es la situación de las otras tres. Para el efecto se toman cinco muestras de los líquidos
residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los
resultados del experimento aparecen en la siguiente tabla.

A B C D
1.65 1.7 1.4 2.1
1.72 1.85 1.75 1.95
1.5 1.46 1.38 1.65
1.35 2.05 1.65 1.88
1.6 1.8 1.55 2
xi 7.82 8.86 7.73 9.58 Y..=33.99
Xi 1.56 1.77 1.55 1.92

a) Realizar el ANOVA e interpretar el resultado.


b) Realizar la Prueba de DUNCAN , cuando α = 0.05.

SOLUCIÒN:
Datos: n=4 r=5

n.r = 20

Ho: μA = μB = μC = μD

H1: Al menos la media de un contaminante de una de las plantas es diferente.

Calculamos las Sumas de los cuadrados:

1ª Factor Correcciòn

Y .. 2 (33.99)2
FC =  =57.766
n.r 20

2ª Calculamos las Sumas de cuadrado

SCT = (Σ y 2ij) – FC  [(1.65)2 +( 1.72)2 …..+(2.0)2 ]- FC


= 58.7213 – 57.7660
SCT = 0.9553
3ª Calculamos la Suma de cuadrados entre grupos.

Σ y 2i .
SCE=( ) r
−FC

(7.82)2+(8.86)2 +(7.73)2 +( 9.58)2


SCE= [ 5 ]
− FC

291.1813
SCE = −57.7660
5
SCE = 0.4703
4ª Sumas de cuadrados dentro de grupos.

SCD = SCT – SCE


SCD = 0.9553 – 0.4703
SCD = 0.4850
Luego se completa la tabla ANOVA.
Ftabl
FV SC GL CM Fo
a α
ENTRE 0.156 SIGNIFICANT
GRUPOS 0.4703 3 8 5.17 3.24 E
DENTRO 0.030
GRUPOS 0.485 16 3
TOTAL 0.9553 19

INTERPRETACIÒN: Con un nivel de significancia del 5% se concluye que existe

diferencia significativa entre las 4 plantas con respecto a los contaminantes de los desechos

de las Fabricas

Como Fo > Ft Se va a rechazar la Hipótesis Nula , entonces decimos que es Significativa;

por lo que pasamos a realizar las pruebas de Comparaciòn Multiples, en este caso la Prueba

de DUNCAN.

- Procedimiento de la Prueba de DUNCAN:

1ª. Se calcula el Error estándar de la media.

S ý = (√ CMD
r )

= (√ 0.0303
5 )
= 0.0778

2ª Ordenar las Medias: (De Mayor a Menor)

D 1.92…. (IV)
B 1.77… (III)
A 1.56… (II)
C 1.55… (I)
Procedimiento:

1ª. Se calcula el Error estándar de la media.

St́ = (√ CMD
r )
= (√ 0.0303
5 )
= 0.0778

2ª Ordenar las Medias: (De Mayor a Menor)

D 1.92…. (IV)

B 1.77… (III)

A 1.56… (II)

C 1.55… (I)

3ª Ubicar en la tabla correspondiente los Valores de Rango Significativamente

Standarizados (RSS)

Lo cual se va a tomar desde la segunda media mayor.

(TABLA DE DUNCAN)
4ª . Se calculan los Rangos menos significativos (Rp), los cuales se escriben al frente de los
Rangos anteriores y se calculan mediante la siguiente Fórmula.
Rp = ( S ý ¿ × ( RSS )

 Rp = 0.778 ×2.998
Rp = 0.23 …….. (I) C
 Rp = 0.778 ×3.144
Rp = 0.24 ……(II) A
 Rp = 0.778 ×3.235
Rp = 0.25 …. (IV) D

Se elabora una tabla de entrada para realizar las comparaciones entre Grupos (Plantas).

(I) C (II) A (III) B (IV) D


1.55 1.56 1.77 1.92
D IV 1.92 0.37 > 0.25 0.36 > 0.15 < -
0.24 0.23
0.21 <
B III 1.77 0.22 < 0.24 0.23 -  
A II 1.56 0.01 < 0.23 -    
C I 1.55 -      

DÓNDE:

  SIGNIFICATIVA
  NO SIGNIFICATIVA

INTERPRETACIÓN:

 La planta D es significativamente diferente de la media de un contaminante de la Planta C


y A.
 La planta B es No significativamente diferente de la media de un contaminante a la Planta
C y A.
 La planta A es No significativamente diferente de la media de un contaminante con la
Planta C y A.

10. PRUEBA DE HIPOTESIS

Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una

afirmación acerca de una población dependiendo de la evidencia proporcionada por una

muestra de datos.

Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis

nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo

general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La

hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de

acuerdo con la evidencia proporcionada por los datos de la muestra.

Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis

nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel de

significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.


Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas

para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de

hipótesis, establecemos la hipótesis nula como lo que queremos desaprobar. Puesto que

establecemos el nivel de significancia para que sea pequeño antes del análisis (por lo

general, un valor de 0.05 funciona adecuadamente), cuando rechazamos la hipótesis nula,

tenemos prueba estadística de que la alternativa es verdadera. En cambio, si no podemos

rechazar la hipótesis nula, no tenemos prueba estadística de que la hipótesis nula sea

verdadera. Esto se debe a que no establecimos la probabilidad de aceptar equivocadamente

la hipótesis nula para que fuera pequeña.

Entre las preguntas que se pueden contestar con una prueba de hipótesis están las

siguientes:

 ¿Tienen las estudiantes de pregrado una estatura media diferente de 66 pulgadas?


 ¿Es la desviación estándar de su estatura igual a o menor que 5 pulgadas?
 ¿Es diferente la estatura de las estudiantes y los estudiantes de pregrado en promedio?
 ¿Es la proporción de los estudiantes de pregrado significativamente más alta que la
proporción de las estudiantes de pregrado?

Formas de probar una hipótesis

1. Establecer un intervalo de confianza para el parámetro bajo el supuesto de la hipótesis


nula.
2. Con un estadístico de prueba (t, F, Q).
3. Con la probabilidad asociada al estadístico de prueba.
Fundamentalmente nos interesan los siguientes estimadores:

 La media muestral ¯xx¯ es un estimador de la media poblacional μμ.

 El desvío estándar muestral ss es un estimador del desvío estándar poblacional σσ

 La proporción muestral ^pp^, es un estimador de la proporción poblacional pp.

APLICACIÒN DE LA PRUEBA DE HIPÓTESIS


En un análisis realizado por el jefe del área de cobranzas a concluido que el saldo de las
cuentas por cobrar tiene un promedio de s/4,200, además se sabe que dichos saldos
tienen una desviación estándar de s/ 900; para actualizar la estimación se eligieron 100
Cuentas por cobrar del mes de octubre las cuales alcanzaron un promedio de s/ 4,000.

a) Prueba de hipótesis de que el promedio ha disminuido significativamente con α=0,05.


b) Determinar el intervalo del 95% de confianza para la media µ de las cuentas de cobrar.

DATOS: µo = 4200
Ơ = 900

x ̅ = 4000

α = 0.05

1 – α = 0.95

H. GENERAL: El saldo promedio de las cuentas por cobrar del mes de octubre ha

disminuido.

a) PROCEDIMIENTO DE PRUEBA

1. Ho = µ ≥ 4,200

H1 = µ < 4,200

2. α = 0,05

3. F.P. (caso 1)
4.

-2.22

-3 -2 -1 0 1 2 3
-1.64

rechazo Ho punto crítico aceptación Ho

5.

= -0.22 Valor observado

6. Decisión: se rechaza la Ho a un nivel de significancia del 0.05.

Conclusión: Los datos dan suficiente evidencia para concluir que el saldo

promedio de las cuentas por cobrar al mes de octubre ha disminuido

significativamente.

b) INTERVALO DE CONFIANZA DEL 95%

= 3823.6
= 4176.4

----> El intervalo del 95% de confianza es

Interpretación: Se

estima con un 95% de confianza que el

verdadero saldo promedio de las cuentas por

cobrar esta entre 3,823.60 y 4,176.40 soles.


Otros Conceptos Estadísticos:

Probabilidad: frecuencia esperada de un fenómeno aleatorio basándose en la experiencia

Población: son los elementos que se analizan para realizar cálculos de probabilidad

Muestra: son los casos de una población que se estudian en un estudio probabilístico

Muestreo: técnicas de obtención de muestras en una población

Media: valor promedio que toman los sucesos de un fenómeno aleatorio

Moda (Mo) : es el valor que se da con mayor frecuencia en una muestra de datos

Mediana (Me): valor que deja la mitad de los sucesos ordenados a cada lado

Desviación Estándar o Típica (σ): medida del grado de dispersión de los resultados

obtenidos 

Varianza (σ2): se calcula elevando al cuadrado la desviación típica

Percentiles (Pn): valor del elemento que es mayor que un porcentaje de la muestra

Deciles (Dn): valor del elemento que es mayor a un porcentaje (tomado por grupos de 10%)

Cuartiles (Qn): valor del elemento que es mayor a un porcentaje (tomado por grupos de

25%)

Quintiles (Qn): valor del elemento que es mayor a un porcentaje (tomado por grupos de

20%)

Variable Aleatoria: función que asigna un valor numérico a cada elemento de una muestra

aleatoria

Función de Probabilidad: función (P) que asigna a cada valor (xi) una probabilidad (pi)

Función de Distribución: función que indica la probabilidad de obtener un valor ≤ a un

suceso

Esperanza Matemática: valor medio que se puede esperar de un fenómeno aleatorio

Distribución binomial: es una distribución de sucesos cuya probabilidad es fija


Distribución normal o de Gauss: distribución que toma valores continuos no discretos

11. CASO PRÁCTICO

Se ha generado una base de datos en Excel el cual se pasarán a desarrollar los temas

tratados en la asignatura de la Maestría de Auditoría Integral.


BIBLIOGRAFÍA

https://www.matematicas10.net/2015/12/ejemplos-de-mediana.html
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-
median-mode
https://www.tusclasesparticulares.com.ec/questions/matematica/como-se-
calcula-la-moda
https://www.matematicas10.net/2015/12/ejemplos-de-mediana.html
https://support.zendesk.com/hc/es/articles/4408839402906
https://matemovil.com/media-mediana-y-moda-ejemplos-y-ejercicios/
https://proyectodescartes.org/EDAD/materiales_didacticos/EDAD_2eso_estadi
stica-JS-LOMCE/2esoquincena13.pdf
https://unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investigacio
n/IF_JUNIO_2012/IF_CALDERON%20OTOYA_FCA/capitulo%206%20y%207.pdf

También podría gustarte