Trabajo Final de Auditoria Integral

Universidad Nacional de
Tumbes
ESCUELA DE POSGRADO
MODULO:
ESTADISTICA APLICADA Y TECNICAS DE MUESTREO
DOCENTE:
Dr. Gaspar Chavez
INTEGRANTES:
o Mayta Urias, Graciela.

o Prado Ramírez, Anjelline Analí
o Ramos Saldarriaga, Sebastian Alexander
TUMBES - PERÚ
INTRODUCCIÓN
La determinación del tamaño muestral en una investigación es de vital importancia, tanto
para caracterizar la distribución de la variable, como para fijar el grado de precisión del
estudio. El propósito de este artículo es ofrecer ayuda en el cálculo del tamaño muestral
cuando se efectúa un estudio de carácter cuantitativo (limitado al uso de un muestreo
aleatorio simple, unietápico y fijo).
En el cual se utilizan métodos estadísticos inferenciales como medios para el análisis, como
ser la estimación estadística y el análisis de experimentos, que requieren de información
precisa sobre las variables consideradas, y que es obtenida a partir de la muestra
representativa de la respectiva población.

ÍNDICE
1. MEDIA....................................................................................................................................4
2. MEDIANA................................................................................................................................6
3. MODA.....................................................................................................................................9
4. VARIANZA.............................................................................................................................10
5. DESVIACIÓN ESTÁNDAR.......................................................................................................27
6. COEFICIENTE DE VARIACIÓN................................................................................................28
7. DISTRIBUCIÓN BINOMIAL.....................................................................................................30
8. DISTRIBUCIÓN NORMAL.......................................................................................................32
9. PRUEBA DE RANGO MULTIPLE (DUNCAN)............................................................................35
10. PRUEBA DE HIPOTESIS......................................................................................................41
11. CASO PRÁCTICO......................................................................................................................45
BIBLIOGRAFÍA...............................................................................................................................46
1. MEDIA
Es el valor promedio de un conjunto de datos numéricos, calculada como la suma de un
conjunto de valores dividida entre el número total de valores.
Algunas características de la media son:
 Considera todas las puntuaciones

 El numerador de la fórmula es la cantidad de valores
 Cuando hay puntuaciones extremas, no tiene una representación exacta de la muestra,
para obtener la Media de un conjunto solo tienes que seguir estos sencillos pasos:
 Determine el conjunto de valores que buscas promediar.
 Suma los valores para obtener el total
 Haz el conteo de la cantidad de valores en el conjunto.
 Divide la suma del conjunto entre la cantidad de números.
Fórmula:
Ejemplo de Media:
En una tienda mayorista se quiere calcular el promedio de ventas que realizaron los
empleados durante el mes. Para calcular la media se realiza lo siguiente:
Interpretación: Las ventas promedio de los empleados que realizaron durante el mes de 8.
Ejemplo de Media:
Calcular la media de: 8,9,10,11,16,17,6
N= 7 (el número de datos)
Aplico la fórmula:
2. MEDIANA
La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores, es
decir que, al ordenar los números de menor a mayor, éste se encuentra justamente en medio
entre los que están por arriba.
Algunas características de la media son:
 Las operaciones para calcular el valor son muy sencillas de realizar.

 La medida no depende de los valores de las variables, solamente de su orden.
 Generalmente, los valores son enteros.
 Se puede calcular, aunque los números que se encuentren arriba y abajo no tengan
límites.
Como sacar la Mediana
Los pasos para sacar la mediana son:
1. Ordena todos los números del más pequeño al más grande.

2. Encuentra el número del medio del conjunto.
 Si tienes una cantidad impar: Tacha el número al final de la izquierda, después el primero a
la derecha, y repite el proceso hasta quedarte con un número, que será la mediana.
 Si tienes una cantidad par, al final quedarás con dos números en el centro. Súmalos y
divídelos entre 2 para obtener la mediana.
Ejemplo de Mediana
La cantidad de valores es impar.
Si se tienen los valores: 9,5,4,2,7,
se ordenan: 2, 4, 5, 7, 9.
El elemento de en medio es el 5, ya que se encuentra dos valores por encima y dos valores
por debajo.
La cantidad de valores es par.
Si se tienen los valores 9,5,4,2,
se ordenan: 2,4,5,9.
En este caso se toman los dos valores centrales 5 y 4, la mediana es el promedio de
ambos: 9
Ejemplo de Mediana
N° EDAD Encuentre la mediana del conjunto {3, 10, 36, 255, 79, 24, 5, 8}.
1 22
2 28 Primero, arregle los números en orden ascendente.
3 35
4 59 {3, 5, 8, 10, 24, 36, 79, 255}
5 25
6 60 Hay 8 números en el conjunto -- un número par. Así, encuentre el
7 27
8 22 promedio de los dos números medios, 10 y 24.
9 57
(10 + 24)/2 = 34/2 = 17
10 25
11 50 Así, la mediana es 17.
12 28
Ejemplo de Mediana
13 26
14 23
Determinar la mediana de las edades de los maestrantes en auditoría
15 27
16 29 integral de la UNT, al inicio del ii módulo (15/10/2021)
17 26
18 25
19 40
20 42
21 37
22 32
Interpretación: La edad del 50% de los maestrantes de Auditoria Integral al inicio del II
curso de la maya curricular es menor igual a 27 años y del 50% es mayor a dicha edad.
Ejemplo de Mediana
Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.
Solución:
Ordenamos los datos de menor a mayor: 4, 6, 7, 7, 11.
Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.
El valor de la mediana es: Me = 7.
Ejemplo de Mediana
En un examen calificado del 0 al 10, 3 personas obtuvieron 5 de nota, 5 personas
obtuvieron 4 de nota, y 2 personas obtuvieron 3 de nota. Calcular la mediana.
Solución:
Primero hacemos una lista de las notas obtenidas: 5, 5, 5, 4, 4, 4, 4, 4, 3, 3.
Ahora ordenamos los datos de menor a mayor: 3, 3, 4, 4, 4, 4, 4, 5, 5, 5.
Como el número de datos es par (10), entonces nos enfocamos en los 2 valores centrales: 3,
3, 4, 4, 4, 4, 4, 5, 5, 5.
Finalmente, encontramos la media de estos 2 valores centrales:

Si al momento de calcular la mediana, ordenas los datos en forma decreciente o
descendente, obtendrás el mismo resultado que al hacerlo de forma creciente o ascendente.
3. MODA
La moda es el valor que aparece más dentro de un conglomerado. En un grupo puede haber
dos modas y se conoce como bimodal, y más de dos modas o multimodal cuando se repiten
más de dos valores; se llama amodal cuando en un conglomerado no se repiten los valores.
Por último, se conoce como moda adyacente cuando dos valores continuos tienen la misma
cantidad de repeticiones. En este caso se saca el promedio de ambos.
Las principales características de la moda son:
 Es una muestra muy clara

 Las operaciones para determinar el resultado son muy fáciles de elaborar
 Los valores que se presentan pueden ser cualitativos y cuantitativos
Como sacar la Moda
Los pasos para obtener la moda de un conjunto son:
 Escribe todos los números del conjunto.

 Encuentra el número o los números (en los casos bimodales o multimodales) que
aparezcan más veces.
Ejemplo de Moda
Ejemplo de Moda
Calcular la moda de los siguientes datos: 11, 6, 7, 7, 4.
Podemos ver que el valor que más se repite es el 7, ya que tiene una frecuencia absoluta de
2, por lo tanto, Mo = 7
4. VARIANZA
Análisis de varianza con dos factores o dos vías.
Es un diseño que pretende controlar algunos factores extraños (fuentes exógenas) de
variación, eliminando con ello la variación del CME (coeficiente medio del error).
El factor es una variable cualitativa pero como se dice dos factores son 2 variables
cualitativas, en un modelo de dos factores los efectos de interés son tres: los dos efectos
principales (uno por cada factor) y el efecto en la interacción de ambos factores.
Este diseño tiende a producir una mejor estimación de la varianza verdadera del error y
conduce a una prueba de hipótesis más poderosa en lo que respecta a la capacidad de
detectar diferencias entre medias de tratamiento.

CARACTERÍSTICAS:
INTERFERENCIA ENTRE LOS FACTORES:
En el análisis de 2 factores se tiene:
 La hipótesis nula referida a un factor afirma que las medias de las poblaciones definidas
por los niveles del factor son iguales.
 La hipótesis alternativa al efecto de una interacción afirma que tal efecto es nulo o
diferente.
SIN INTERACCIÓN:
Se amplía la percepción para contemplar una nueva posible fuente de variación se supone 3
fuentes para la misma:
 Se da entre tratamientos
 Se produce entre bloques
 La aleatoria
Los pasos son los siguientes:
1. Planteamiento de las hipótesis

2. Obtener la media de cada tratamiento, la media de cada bloque y la media general de
todos los datos.
Tratamientos Total de Media de

Bloques 1 2 … c bloques bloques
y 11 y 12 y 1c t 1. y 1.
1 …
2 y 21 y 22 … y 2c t 2. y 2.
… … … … … …
R y r1 y r2 … y rc t r. y r.
Total de Tratamientos t .1 t .2 … t .c t..= gran total

Media de
Tratamientos y .1 y .2 … y .c y ..= gran media
3. Obtener la suma de cuadrados
SCT. La suma de cuadrados de la variación total.
SCA. La suma de cuadrados de la variación entre tratamientos.
SCE. La suma de cuadrados de la variación del error, o aleatoria.
SCB. La suma de cuadrados de la variación entre bloques.
El modelo se convierte en:
SCT = SCA + SCB + SCE

La suma de cuadrados total se obtiene calculando, para cada elemento de la matriz, el
cuadrado de la diferencia entre ese dato y la media global:
j k
T2
SCT    x2 
j 1 k 1 N
La suma de cuadrados de tratamientos y bloques se obtiene elevando al cuadrado las
diferencias entre cada uno de los promedios de columnas (tratamientos) y filas (bloques) y
el promedio global para, luego, multiplicar cada una de estas diferencias al cuadrado por el
tamaño de muestra y, finalmente, sumando todos estos productos:

k
Tk2 T 2
SCA    para los tratamientos.
k 1 N k N
1 j 2 T2
SCB   T j  para los bloques.
k j 1 N
La suma de cuadrados del error.
SCE  SCT  SCA  SCB
4. Obtener los promedios de los cuadrados tanto los tratamientos como los bloques,
dividiendo en ambos casos los grados de libertad de los tratamientos y los de los bloques:
Los promedios de cuadrados de tratamientos (CMA)
SCA
CMA 
K 1
Los promedios de cuadrados de bloques (CMB)
SCB
CMB 
K 1
Y, además, obtener el promedio de los cuadrados del error. Se obtiene dividiendo la suma
de cuadrados del error entre el número de tratamientos menos 1 multiplicado por el número
de bloques menos 1.
SCE
CME 
( J  1)( K  1)
5. Obtener los valores de F. Tanto los empíricos para los tratamientos y bloques Aquí
veremos el nivel de significancia en la tabla.
CMA
F para los tratamientos.
CME
CMB
F para los bloques.
CME
REGLA DE DECISIÓN:
F Calculada< f critica Acepta H 0

F Calculada> f critica Rechaza H 0
6. Resumen para el análisis de varianza:
Excel y ANOVA de dos factores
En el menú Complementos de Excel, en el submenú “Análisis de datos” se incluye una
herramienta denominada “Análisis de varianza de dos factores con una sola muestra por
grupo” que realiza todas las operaciones detalladas.
Nótese, de nuevo, que a lo que en este texto se denomina “2 vías”, Excel lo llama “dos
factores” (si ya está cargada esta herramienta, la puede encontrar en el menú Herramientas).
Recuerda:
En las pruebas ANOVA de 2 vías se tienen 4 posibilidades:
1. No se rechaza ninguna de las hipótesis nulas.
2. Se rechaza la hipótesis de tratamientos iguales, pero no la de bloques iguales.
3. Se rechaza la hipótesis de bloques iguales, pero no la de tratamientos iguales.
4. Se rechazan ambas.
Ejemplo 1:
Una empresa que asegura automóviles tiene 2 agencias en la ciudad para atender llamados
de siniestros. En el cuadro siguiente se muestran los datos de los llamados atendidos por las
2 agencias y para los diferentes días de la semana. ¿Se puede decir que hay diferencia entre
los llamados atendidos por las 2 agencias o por el día de la semana en que ocurren? Use un
nivel de significación de 0.05.
AGENCIAS
TOTAL DE MEDIA DE BLOQUES
DIAS (Bloques) Agencia
Agencia 2 BLOQUES (j) (j)
1
Lunes 52 42 94 47
Martes 47 51 98 49
Miércoles 54 53 107 53.5
Jueves 45 49 94 47
Viernes 50 57 107 53.5
Sábado 53 52 105 52.5
Domingo 47 45 92 46
TOTAL
GRAN TOTAL
TRATAMIENTOS
T=697
(k) 348 349
MEDIA
GRAN MEDIA=
TRATAMIENTOS
49.79
(k) 49.71 49.86
SOLUCION:
PRIMER PASO:
Para los días: (BLOQUES)
H o :  L   M   MI   J  V   S   D
H1 : por lo menos una de las medias poblacionales de los bloques es diferente a otras.
Para las agencias: (TRATAMIENTO)
H o : 1  2
H1 : por lo menos una de las medias poblacionales de los tratamientos es diferente a otras.
SEGUNDO PASO:
Para los días: (BLOQUES)
T1  94 T2  98 T3  107 T4  94 T5  107 T6  105 T7  92

T  8836
1
2
T2  9604
2
T 2
3  11449 T 2
4  8836 T5  11449
2
T6  11025
2
T7 2  8464
Para las agencias: (TRATAMIENTO)
T1  348 T2  349
T12  121104 T2 2  121801
n1  7 n1  7
GLOBAL:
T=697 T 2=485809 N=14

j k
 X
j 1 k 1
2
 522  47 2  542  ...  452  34925
T 2 485809
= =34700.64
N 14
TERCER PASO:
j k
T2
SCT    x  2
 34925  34700.64  224.36
j 1 k 1 N
k
Tk2 T 2 121104 121801
SCA       34700.64  0.0742
k 1 nk N 7 7
1 j 2 T2 1
SCB   T j  N = 2 (8836  9604  11449  8836  11449  11025  8464)  34700.64  130.86
k j 1

SCE  224.36  0.0742  130.86  93.43
SCT=0.0742+130.86+93.43=224.36
CUARTO PASO:
SCA 0.0742 SCB 130.86

CMA    0.0742 CMB    21.81
K 1 2 1 J 1 7 1
SCE 93.43
CME    15.57
( J  1)( K  1) (7  1)(2  1)
QUINTO PASO:
CMA 0.0742
F =  0.004766
CME 15.57
La F crítica es 5.99 ya que en la tabla de distribución F, 1 grado de libertad para el numerador (número de tratamientos menos 1) y
6 para el denominador (número de tratamientos menos 1 por número de bloques menos 1)
CMB 21.81
F   1.4
CME 15.57
La F critica es 4.15 ya que en la tabla de distribución F, 6 grado de libertad para el numerador (número de bloques menos 1) y
REGLA DE DECISIÓN:

F 0.004766 <f 5.99 Acepta H 0

F 1.40< f 4.15 Acepta H 0
SEXTO PASO
Grados de
Suma de
Fuente de Variación libertad
Cuadrados
Cuadrado Medio Cociente F
(gl)
Entre grupos de 3-1
tratamientos(A) SCA=0.0742 CMA=0.0742 F=0.004766
Entre grupos de Bloques 6-1

(B) SCB=130.68 CMB=21.81 F=1.40
Error de muestreo € (7-1)(2-1) SCE=93.43 CME=15.57
14-1
Total (T) SCT=224.36
INTERPRETACION: Con un 95% de confianza se puede decir que no hay
diferencia entre los llamados atendidos por las agencias y por el día de las
semanas.
 Ejemplo 2:
Una revista especializada en automóviles hace pruebas de eficiencia en el

consumo de combustible de los modelos compactos de 3 fabricantes de
automóviles. Hace las pruebas en 3 tipos de terreno: ciudad, terreno montañoso y
terreno llano con poco tráfico. ¿Consideraría que hay evidencia de diferencia en el
consumo de combustible de los carros y en los diferentes tipos de terreno? use un
nivel de confianza de 0.05.
FABRICANTES
TERRENOS TOTAL DE MEDIA DE
Fabricante Fabricante Fabricante
(Bloques) BLOQUES BLOQUES
1 2 3
Ciudad 14.00 12.50 13.10 39.6 13.2
Montaña 15.30 14.50 14.20 44 14.67
Plano 16.10 15.60 16.00 47.7 15.9
TOTAL
GRAN
TRATAMIENTO 45.4 42.6 43.3
TOTAL=131.3
S
MEDIA
GRAN
TRATAMIENTO 15.13 14.20 14.43
MEDIA=14.59
S
SOLUCION:
PRIMER PASO:
Para los Terrenos: (BLOQUES)
H o : c   M   p
H1 : por lo menos una diferencia en los terrenos.
Para los fabricantes: (TRATAMIENTO)
H o : 1  2  3
H1 : por lo menos una diferencia en el consumo de los carros
SEGUNDO PASO:
Para los terrenos: (BLOQUES)
T1  39.6 T2  44 T3  47.7
T1  1568.16
2
T2  1936
2
T 23  2275.29
Para los fabricantes: (TRATAMIENTO)
T1  45.4 T2  42.6 T3 =43.3

T12  2061.16 T2 2  1814.76 T32 =1874.89
n1  3 n1  3 n1  3
GLOBAL:
T=131.3 T 2=17239.69 N=9
j k
 X
j 1 k 1
2
 142  15.32  16.12  ...  16 2  1928.41
TERCER PASO:
j k
T2 17239.69
SCT    x2   1928.41   12.89
j 1 k 1 N 9
k
Tk2 T 2 2061.16 1814.76 1874.89 17239.69
SCA         1.42
k 1 nk N 3 3 3 9
1 j 2 T2 1 17239.69
SCB   T j  = (1568.16  1936  2275.29)   10.96
k j 1 N 3 9

SCE  12.89  1.42  10.96  0.51
SCT=1.42+10.96+0.51
SCT= 12.89
CUARTO PASO:
SCA 1.42 SCB 10.96

CMA    0.71 CMB    3.65
K 1 3 1 J 1 3 1
SCE 0.51
CME    0.1275
( J  1)( K  1) (3  1)(3  1)
QUINTO PASO:
CMA 0.71
F   5.57
CME 0.1275
La F crítica es 6.94 ya que en la tabla de distribución F, 2 grado de libertad para el numerador (número de tratamientos menos 1) y
CMB 3.65
F   28.63
CME 0.1275
La F critica es 6.94 ya que en la tabla de distribución F, 2 grado de libertad para el numerador (número de bloques menos 1) y
REGLA DE DECISIÓN:
F 5.57< f 6.94 Acepta H 0
F Calculada> f critica Rechaza H 0

F 28.63> f 6.94 Rechaza H 0
SEXTO PASO
Grados de
Suma de
Fuente de Variación libertad
Cuadrados
Cuadrado Medio Cociente F
(gl)
Entre grupos de 3-1

tratamientos(A) SCA=1.42 CMA=0.71 F=5.57
Entre grupos de Bloques 3-1

(B) SCB=10.96 CMB=3.65 F=28.63
(3-1)(3-1)
Error de muestreo € SCE=0.51 CME=0.1275
9-1
Total (T) SCT=12.89
INTERPRETACIÓN: con un 95% de confianza se puede concluir que no hay una
diferencia entre el consumo de combustible de los carros pero si existe una diferencia en los
diferentes tipos de terrenos.
CON INTERACCIÓN
En este último apartado se desarrollará el ANOVA con 1 fuente más de variación:
 Producir variación por la interacción entre los tratamientos y los bloques.
Se agrupa la nomenclatura de tratamientos y bloques, para llamar a las 2 variables
independientes “factores” con el propósito de facilitarla, ya que ahora se hablará
de una fuente adicional de variación (de sumas de cuadrados): la de la interacción.

Grados de cuadrado
fuente de variación suma de cuadrados (SC) cociente (F)
Libertad (GL) medio(CM)
k
T 2k T 2 SCA
SCA= ∑ − CMA=
k −1 nJ nJ K−1
Entre de Grupos de CMA
F =
Tratamientos (A) K-1 CME
SCB CMB
CMB = F=
Entre de Grupos de J −1 CME
Tratamientos o J-1 T 2J T 2
J
SCB= ∑ −
bloques (B) J =1 nK N
J k n 2
1
SCI= ∑∑
n J =1 k=1 (∑ )i=1
x – SCA –
CMI =
CMI
F=
CME
interacción (entre) (J-1)(K-1) T2 SCI
SCB -
factores ( A y B ) (I) N (J −1)( K −1)
JK (n-1) SSE
CME =
Error de Muestreo (E) SCE= SCT – SCA - SCB - SCI JK (n−1)
n J k
2 T2
SCT= ∑ ∑ ∑ X −
i=1 J−1 k−1 N
Total (T) N-1
Ejemplo 1:
Para evaluar el efecto que tienen las proteínas, los carbohidratos y las grasas
en el crecimiento de los ratones, se realizó un experimento con grupos de 3
ratones recién nacidos, de 3 razas distintas, a los que se les administró una
dieta rica en cada uno de los nutrientes y se obtuvieron los siguientes
resultados:
DIETA RICA EN
TOTAL DE
Grasas( pes proteínas( MEDIA
carbohidratos(peso BLOQUES
o en peso en BLOQUES
en gramos) (J)
gramos) gramos)
25 35 12
Grupo de
27 38 10 220 25.44
ratones 1
28 36 9
28 38 15
Grupo de
30 41 13 247 27.44
ratones 2
31 39 12
18 25 8
Grupo de
19 27 7 155 17.22
ratones 3
20 25 6
TOTAL
TRATAMIENTO 226 304 92 GRAN
S (K) TOTAL=622
GRAN
33.777777
25.1111111 10.22 MEDIA=
8
MEDIA 23.03
Con un nivel de significación de 0.01 realice un análisis de varianza con interacción.
Solución:
PRIMER PASO:
Para los bloques (ratones)
H 0  1   2  3
H1  por lo menos una diferencia en los ratones
Para los tratamientos (dietas ricas en grasa, proteínas y carbohidratos)
H 0  u1  u2  u3
H1  por lo menos una diferencia en cada una dieta de los nutrientes
Para la interacción
H 0  no existe interaccion entre los ratones y las dietas

H1  si existe interaccion entre los ratones y las dietas
SEGUNDO PASO:
Obtener las medias del factor A y factor B, y de la combinación de factores
Para los ratones: (BLOQUES)
T1  220 T2  247 T3  155

T12  48400 T2 2  61009 T 23  24025
Para las dietas: (TRATAMIENTO)
T1  226 T2  304 T3 =92

T12  51076 T2 2  92416 T32 =8464
n1  3 n1  3 n1  3
GLOBAL:
T=622 T 2=386884 N=27
j k
 X
j 1 k 1
2
 (25  27  28) 2  (28  30  31) 2  ...  (8  7  6) 2  52306
2
T 386884
= =14329.04
N 27
TERCER PASO:
Obtener la suma de cuadrados total, del factor A, el factor B, y de su interacción
j k
T2
SCT    x 
2
 17470  14329.04  3140.90
j 1 k 1 N
T 2k T 2 51076 92416 8464
k
SCA= ∑ − = 3( 3) + 3 (3) + 3 (3) = 2554.96
k −1 nJ nJ
J
T 2J T 2 48400 61009 24025
SCB= ∑ − = 3 (3) + 3(3) + 3(3) – 14329.04= 496.96
J =1 nK N
J k n 2
1 T2 1
SCI= ∑ ∑
n J =1 k=1 ( )
∑x
i=1
– SCA – SCB -
N
= 3 (52306)-2554.96-496.96-14329.04
= 54.37
SCE  SCT-SCA-SCB-SCI
SCE  3140.96-2554.96-496.96-54.37
SCE= 34.67
CUARTO PASO:
Obtener los grados de libertad y los promedios cuadrados de los factores y su interacción
n= 3 k= 3 j= 3
Grados de libertad para el factor A
A: número de factores A menos 1
A: 3-1= 2
SCA 2554.96
CMA    1277.48
K 1 3 1
Grados de libertad para el factor B
B= número de factores B menos 1

B= 3-1= 2
SCB 496.96
CMB    248.48
J 1 3 1
Grados de libertad de la interacción entre los 2 factores = número de factores de A menos
1, multiplicando por el número de factores de B menos 1= (3-1) (3-1)= 4
SCI 54.37
CMI    13.59
( J  1)( K  1) (2)(2)
Grados de libertad del error (variación aleatoria) = [(número de factores A) (número de
factores B) (número de réplicas menos 1)]= 3(3) (3-1)=18
SCE 34.67
CME    1.926
JK (n  1) 3(3)(2)
QUINTO PASO:
CMA 1277.48
F   663.28 para los tratamientos
CME 1.926
El valor crítico de la F, con dos grados de libertad para el numerador y 18 para el
denominador es 8.10, ya que P (F ≥ 8.10|gln = 2, gld = 18) = 0.01.
CMB 248.48
F   129.01 para los bloques
CME 1.926
El valor crítico de la F, al igual que con el factor A, con 2 grados de libertad para el
numerador y 18 para el denominador es 8.10, ya que P (F ≥ 8.10|gln = 2, gld = 18=0.01
CMI 13.59
F   7.056 para la interacción entre los tratamientos y los bloques
CME 1.926
El valor crítico de la F, con 4 grados de libertad para el numerador, y 18 para el
denominador es 4.43, ya que P (F ≥ 4.43|gln = 4, gld = 18) = 0.01.
SEXTO PASO:
Interpretación: Como el valor empírico de F, 663.28, es mayor que este valor crítico de
8.10, se rechaza la hipótesis nula referente a las grasas, proteínas y carbohidratos y se
concluye que la media de las ricas dietas en proteínas en los 3 grupos de ratones no son
todas iguales.
 Como el valor empírico de F, 129.01, es mayor que este valor crítico de 8.10, se rechaza la
hipótesis nula referente a los grupos de ratones y se concluye que la media de las ricas
dietas en grasas, proteínas y carbohidratos de los 3 grupos de ratones no son todas
iguales.
 Como el valor empírico de F, 7.056, es mayor que este valor crítico de 4.43, se rechaza la
hipótesis nula referente a la interacción y se concluye que sí existe interacción entre la
dieta de las proteínas y los grupos de ratones.
5. DESVIACIÓN ESTÁNDAR
La desviación estándar o desviación típica (σ) es una medida de centralización o dispersión para
variables de razón (ratio o cociente) y de intervalo, de gran utilidad en la estadística descriptiva.
Se define como la raíz cuadrada de la varianza. Junto con este valor, la desviación típica es una
medida (cuadrática) que informa de la media de distancias que tienen los datos respecto de su
media aritmética, expresada en las mismas unidades que la variable. Se caracteriza por ser el
estadígrafo de mayor uso en la actualidad. Se obtiene mediante la aplicación de la siguiente
fórmula:
Para comprender el concepto de las medidas de distribución vamos a suponer que el gerente
de una empresa de alimentos desea saber que tanto varían los pesos de los empaques (en
gramos), de uno de sus productos; por lo que opta por seleccionar al azar cinco unidades de
ellos para pesarlos. Los productos tienen los siguientes pesos (490, 500, 510, 515 y 520)
gramos respectivamente. Por lo que su media es:
La varianza sería:
Por lo tanto la desviación estándar sería:
Con lo que concluiríamos que el peso promedio de los empaques es de 507 gramos, con
una tendencia a variar por debajo o por encima de dicho peso en 12 gramos. Esta
información le permite al gerente determinar cuánto es el promedio de perdidas causado
por el exceso de peso en los empaques y le da las bases para tomar los correctivos
necesarios en el proceso de empacado.

6. COEFICIENTE DE VARIACIÓN
El Coeficiente de Variación es una medida de dispersión que permite el análisis de las
desviaciones de los datos con respecto a la media y al mismo tiempo las dispersiones que
tienen los datos dispersos entre sí.Es una excelente herramienta de Comparación de eventos
y permite tomar decisiones estadísticas de cualquier situación de la vida cotidiana.
El coeficiente de Variación es una medida de dispersión relativa, no tiene unidades, se
define como el cociente de la desviación estándar (o típica) y la media
DESVIACION ESTANDAR
cv =
MEDIA
Se presenta en su forma relativa, se encuentra simplemente sustituyendo valores o en su
forma porcentual se multiplica por 100.
DESVIACION ESTANDAR
cv = ∗100
MEDIA
En la vida cotidiana debemos tomar decisiones y usualmente lo hacemos comparando
información. Las comparaciones de datos dispersos son muy útiles como lo veremos en el
siguiente ejemplo.
Los pesos de los toros de Lidia de una ganadería se distribuyen con una media  = 500 kg
y una desviación típica σ = 40 kg.
Los pesos de los perros de una exposición canina tiene una media  = 20 kg y una
desviación típica σ = 10 kg.
La desviación típica de los pesos de la manada de toros bravos (40kg) es superior a la de los
perros (10kg). Sin embargo, los 40 kg son poca cosa para el enorme tamaño de los toros (es
decir los toros de esa manada son muy parecidos en peso), mientras que 10 kg es mucho en
relación con el peso de un perro. En casos como este, la desviación típica no es una medida
adecuada para comparar dispersiones. Por ello, definimos un nuevo parámetro estadístico.
Se considera que los datos de este ejemplo los toros y lo perros representan poblaciones.
 σ cv 40
Para los perros: cv = =0.08 8%
Toros 50 40 8% 500
0 10
Para los toros: cv = =0.5050 %
Perros 20 10 50% 20
De este modo si se aprecia claramente que la variación de los pesos de los perros (50%) es
mucho mayor que la de los pesos de los toros (8%).
7. DISTRIBUCIÓN BINOMIAL
La distribución binomial es una distribución de probabilidad discreta que mide el número
de éxitos si la variable es una variable aleatoria discreta, es decir, sólo puede tomar los
valores 0, 1, 2, 3, 4,..., n suponiendo que se han realizado n pruebas. En las empresas
tenemos muchas situaciones donde se espera que ocurra o no un evento específico. Éste,
sólo puede ser de éxito o fracaso. Por ejemplo, en la producción de una pieza, ésta puede
salir buena o defectuosa. Para situaciones como éstas se utiliza la distribución binomial.
Formula:
n
F (x) = P (X=x) = C x * p x∗¿
Donde: n!
C nx = x ! ( n−x ) !
P: probabilidad de éxito
q: probabilidad de fracaso
n: número de ensayos
x: número de éxitos en “n” ensayos
Ejemplo:
¿Qué probabilidad hay de obtener al menos un seis al realizar seis lanzamientos
consecutivos de un dado?
Sea el suceso A: obtener un seis al lanzar un dado
La probabilidad de A, sería p= 1/6.
Sea la variable X ~ número de seises obtenidos en los seis lanzamientos
B (n=6, p=1/6).
6 1 1 6
P( x ≤ 1) = 1- P(x=0) = 1[ ( )( ) ( )
0
∗ °∗ 1− ] = 0,665
6 6
En una cafetería, la probabilidad de que a un cliente nuevo le guste la hamburguesa es de
0.8. Si durante una semana llegan 5 clientes nuevos. ¿Cuál es la probabilidad de que solo a
2 de ellos les guste la hamburguesa?
P: 0.8 probabilidad de éxito
n: 5 clientes nuevos
x: 0,1,2,3,4,5
n!
F (x) = P (X=x) = C nx * p x∗¿ Donde:C nx =
x ! ( n−x ) !
F (2) = P (X=2) = C 52 * 0.82∗¿ 5!

C 52 = 2! ( 5−2 ) !
F (2) = P (X=2) = 10 * 0.82∗0.23

120
F (2) = P (X=2) = 0.51 5.12% C 52 = 2 ( 6 ) =10
En una cafetería la probabilidad de que a 2 clientes nuevos durante una semana les guste la
hamburguesa es de 0.0512 o 5.12%
8. DISTRIBUCIÓN NORMAL
La distribución normal fue reconocida por primera vez por el francés Abraham de Moivre
(1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elaboró desarrollos más
profundos y formuló la ecuación de la curva; de ahí que también se la conozca, más
comúnmente, como la "campana de Gauss". La distribución de una variable normal está
completamente determinada por dos parámetros, su media y su desviación estándar,
denotadas generalmente por µ y ơ. Con esta notación, la densidad de la normal viene dada
por la ecuación:
−1
1 2
¿¿
F(x)= ∗e
√ 2 π∗σ
Donde:
X: probabilidad de x (e = 2.71828...)
µ: media (π= 3,141592…)
ơ: desviación estándar
Para encontrar las probabilidades o cantidad de datos entre determinados valores de la
variable, se calcula el área bajo la curva normal, que se encuentra en la tabla z o tabla de
áreas bajo la curva normal estandarizada.
LA DISTRIBUCIÓN NORMAL ESTÁNDAR

La distribución normal estándar, es aquella distribución normal que tiene una media igual a
cero, y una desviación estándar igual a uno. Veamos la función densidad normal
estandarizada, que trabaja con la variable estandarizada z en el eje horizontal.
FÓRMULA:
x−μ
N (µ;ơ) =
σ
Z: valor de tabla z
µ: media
ơ: desviación estándar (sigma) valor esperado
Por ejemplo, si se desea encontrar la probabilidad de que la variable estandarizada z, tome
un valor entre 0 y 1,50; hay que encontrar el área bajo la curva entre z = 0 y z = 1,50.
Para calcular el valor de esta área, se utiliza la tabla z y se busca el valor de 1,50:
Como vemos, el valor del área bajo la curva es de 0,4332, y esa sería la probabilidad de que
la variable estandarizada z, tome un valor comprendido entre 0 y 1,50.
Si tenemos una variable aleatoria continua X con una distribución normal no estandarizada,
con media igual a 10 y desviación estándar igual a 1, y el problema pide calcular la
probabilidad de que la variable X tome un valor entre 10 y 11,50, hay que estandarizar los
valores de la variable X aplicando la fórmula de z:
x−μ
Z=
σ
11.50−10 1.50
z= 1
=
1
=1.50
Ahora, veamos la gráfica de esta distribución normal:

Y usando la tabla z, se calcula el área bajo la curva. Cuando z es igual a 1,50, el área bajo la
curva es de 0,4332.
Podemos concluir que la probabilidad de que la variable estandarizada z, tome un valor
comprendido entre 10 y 11,50 es de 0,4332.
9. PRUEBA DE RANGO MULTIPLE (DUNCAN)
DEFINICIÒN:
La Prueba del Rango múltiple Duncan es otra prueba para determinar la diferencia entre
pares de medias después que se ha rechazado la hipótesis nula en el análisis de varianza.
Este procedimiento emplea los valores de la tabla T-9 y consiste en calcular varios "rangos"
(Duncan los llama rangos significativos mínimos) dados por la fórmula:
Donde p toma valores entre 2 y K (K es el número de tratamientos), d se obtiene de la tabla
T-9 y el CMError se obtiene de la tabla de ANDEVA respectiva.
Donde
N−I es el punto crítico del rango estudentizado basado en la comparación de la media
mayor y la menor de p medias. Los valores críticos qαp;p,ν , para p = 2, 3, · · · , I, se
presentan en la Tabla VII del Apéndice C para los niveles de significación de
comparaciones individuales α = 0,01 y α = 0,05.
R es la varianza residual con N − I grados de libertad.
α : es el nivel de significación conjunto relativo a p medias consecutivas; es decir, es la
probabilidad de rechazar erróneamente al menos una de las p − 1 comparaciones
independientes asociadas a las medias consideradas.
Dicho nivel de significación está relacionado con el nivel de significación α, de una
comparación individual, a través de la ecuación αp = 1 − (1 − α) p−1.

VENTAJAS:
 Se utiliza para efectuar comparaciones multiples entre dos medias de tratamientos del
experimento.
 El número de comparaciones con D tratamientos es (t(t-1))/2.
 Cuando el número de repeticiones es igual en los tratamientos, los cálculos son más
precisos que cuando se tiene diferente número de repeticiones por tratamiento.
 F- calculando en el análisis de varianza puede ser o no significativo.
 La prueba de DUNCAN permite comparar tratamientos no relacionados, es decir todos los
tratamientos contra todos a fin de establecer un orden de méritos.
DESVENTAJAS:
 Tienen el inconveniente cuando se cuenta con un alto número de tratamientos, dado que
el nivel de significancia α se modifica en función a ellos.
 No debe utilizarse cuando las varianzas son heterogéneas. Lehmann y Shaffer (1977)
argumenta que dicha prueba no debe utilizarse porque la derivación de las tasas de error
dependen de una condición de monotocidad en los datos (siempre crecen o decren; pero
no oscilan); la cual no se presenta en datos reales.
APLICACIÒN DE LA PRUEBA DE DUNCAN:
 Una empresa tiene cuatro plantas y sabe que la planta A satisface los requisitos impuestos
por el gobierno para el control de desechos de fabricación, pero quisiera determinar cuál
es la situación de las otras tres. Para el efecto se toman cinco muestras de los líquidos
residuales de cada una de las plantas y se determina la cantidad de contaminantes. Los
resultados del experimento aparecen en la siguiente tabla.
A B C D
1.65 1.7 1.4 2.1
1.72 1.85 1.75 1.95
1.5 1.46 1.38 1.65
1.35 2.05 1.65 1.88
1.6 1.8 1.55 2
xi 7.82 8.86 7.73 9.58 Y..=33.99
Xi 1.56 1.77 1.55 1.92
a) Realizar el ANOVA e interpretar el resultado.

b) Realizar la Prueba de DUNCAN , cuando α = 0.05.
SOLUCIÒN:
Datos: n=4 r=5
n.r = 20
Ho: μA = μB = μC = μD
H1: Al menos la media de un contaminante de una de las plantas es diferente.
Calculamos las Sumas de los cuadrados:
1ª Factor Correcciòn
Y .. 2 (33.99)2
FC =  =57.766
n.r 20
2ª Calculamos las Sumas de cuadrado
SCT = (Σ y 2ij) – FC  [(1.65)2 +( 1.72)2 …..+(2.0)2 ]- FC

= 58.7213 – 57.7660
SCT = 0.9553
3ª Calculamos la Suma de cuadrados entre grupos.
Σ y 2i .
SCE=( ) r
−FC
(7.82)2+(8.86)2 +(7.73)2 +( 9.58)2

SCE= [ 5 ]
− FC
291.1813
SCE = −57.7660
5
SCE = 0.4703
4ª Sumas de cuadrados dentro de grupos.
SCD = SCT – SCE

SCD = 0.9553 – 0.4703
SCD = 0.4850
Luego se completa la tabla ANOVA.
Ftabl
FV SC GL CM Fo
a α
ENTRE 0.156 SIGNIFICANT
GRUPOS 0.4703 3 8 5.17 3.24 E
DENTRO 0.030
GRUPOS 0.485 16 3
TOTAL 0.9553 19
INTERPRETACIÒN: Con un nivel de significancia del 5% se concluye que existe
diferencia significativa entre las 4 plantas con respecto a los contaminantes de los desechos
de las Fabricas
Como Fo > Ft Se va a rechazar la Hipótesis Nula , entonces decimos que es Significativa;
por lo que pasamos a realizar las pruebas de Comparaciòn Multiples, en este caso la Prueba
de DUNCAN.
- Procedimiento de la Prueba de DUNCAN:
1ª. Se calcula el Error estándar de la media.
S ý = (√ CMD
r )
= (√ 0.0303
5 )
= 0.0778
2ª Ordenar las Medias: (De Mayor a Menor)
D 1.92…. (IV)
B 1.77… (III)
A 1.56… (II)
C 1.55… (I)
Procedimiento:
1ª. Se calcula el Error estándar de la media.
St́ = (√ CMD
r )
= (√ 0.0303
5 )
= 0.0778
2ª Ordenar las Medias: (De Mayor a Menor)
D 1.92…. (IV)
B 1.77… (III)
A 1.56… (II)
C 1.55… (I)
3ª Ubicar en la tabla correspondiente los Valores de Rango Significativamente
Standarizados (RSS)
Lo cual se va a tomar desde la segunda media mayor.
(TABLA DE DUNCAN)
4ª . Se calculan los Rangos menos significativos (Rp), los cuales se escriben al frente de los
Rangos anteriores y se calculan mediante la siguiente Fórmula.
Rp = ( S ý ¿ × ( RSS )
 Rp = 0.778 ×2.998
Rp = 0.23 …….. (I) C
 Rp = 0.778 ×3.144
Rp = 0.24 ……(II) A
 Rp = 0.778 ×3.235
Rp = 0.25 …. (IV) D
Se elabora una tabla de entrada para realizar las comparaciones entre Grupos (Plantas).
(I) C (II) A (III) B (IV) D

1.55 1.56 1.77 1.92
D IV 1.92 0.37 > 0.25 0.36 > 0.15 < -
0.24 0.23
0.21 <
B III 1.77 0.22 < 0.24 0.23 -
A II 1.56 0.01 < 0.23 -
C I 1.55 -
DÓNDE:
SIGNIFICATIVA
NO SIGNIFICATIVA
INTERPRETACIÓN:
 La planta D es significativamente diferente de la media de un contaminante de la Planta C

y A.
 La planta B es No significativamente diferente de la media de un contaminante a la Planta
C y A.
 La planta A es No significativamente diferente de la media de un contaminante con la
Planta C y A.
10. PRUEBA DE HIPOTESIS
Una prueba de hipótesis es una regla que especifica si se puede aceptar o rechazar una
afirmación acerca de una población dependiendo de la evidencia proporcionada por una
muestra de datos.
Una prueba de hipótesis examina dos hipótesis opuestas sobre una población: la hipótesis
nula y la hipótesis alternativa. La hipótesis nula es el enunciado que se probará. Por lo
general, la hipótesis nula es un enunciado de que "no hay efecto" o "no hay diferencia". La
hipótesis alternativa es el enunciado que se desea poder concluir que es verdadero de
acuerdo con la evidencia proporcionada por los datos de la muestra.
Con base en los datos de muestra, la prueba determina si se puede rechazar la hipótesis
nula. Usted utiliza el valor p para tomar esa decisión. Si el valor p es menor que el nivel de
significancia (denotado como α o alfa), entonces puede rechazar la hipótesis nula.

Un error común de percepción es que las pruebas estadísticas de hipótesis están diseñadas
para seleccionar la más probable de dos hipótesis. Sin embargo, al diseñar una prueba de
hipótesis, establecemos la hipótesis nula como lo que queremos desaprobar. Puesto que
establecemos el nivel de significancia para que sea pequeño antes del análisis (por lo
general, un valor de 0.05 funciona adecuadamente), cuando rechazamos la hipótesis nula,
tenemos prueba estadística de que la alternativa es verdadera. En cambio, si no podemos
rechazar la hipótesis nula, no tenemos prueba estadística de que la hipótesis nula sea
verdadera. Esto se debe a que no establecimos la probabilidad de aceptar equivocadamente
la hipótesis nula para que fuera pequeña.
Entre las preguntas que se pueden contestar con una prueba de hipótesis están las
siguientes:
 ¿Tienen las estudiantes de pregrado una estatura media diferente de 66 pulgadas?

 ¿Es la desviación estándar de su estatura igual a o menor que 5 pulgadas?
 ¿Es diferente la estatura de las estudiantes y los estudiantes de pregrado en promedio?
 ¿Es la proporción de los estudiantes de pregrado significativamente más alta que la
proporción de las estudiantes de pregrado?
Formas de probar una hipótesis
1. Establecer un intervalo de confianza para el parámetro bajo el supuesto de la hipótesis

nula.
2. Con un estadístico de prueba (t, F, Q).
3. Con la probabilidad asociada al estadístico de prueba.
Fundamentalmente nos interesan los siguientes estimadores:
 La media muestral ¯xx¯ es un estimador de la media poblacional μμ.
 El desvío estándar muestral ss es un estimador del desvío estándar poblacional σσ
 La proporción muestral ^pp^, es un estimador de la proporción poblacional pp.
APLICACIÒN DE LA PRUEBA DE HIPÓTESIS

En un análisis realizado por el jefe del área de cobranzas a concluido que el saldo de las
cuentas por cobrar tiene un promedio de s/4,200, además se sabe que dichos saldos
tienen una desviación estándar de s/ 900; para actualizar la estimación se eligieron 100
Cuentas por cobrar del mes de octubre las cuales alcanzaron un promedio de s/ 4,000.
a) Prueba de hipótesis de que el promedio ha disminuido significativamente con α=0,05.

b) Determinar el intervalo del 95% de confianza para la media µ de las cuentas de cobrar.
DATOS: µo = 4200
Ơ = 900
x ̅ = 4000
α = 0.05
1 – α = 0.95
H. GENERAL: El saldo promedio de las cuentas por cobrar del mes de octubre ha
disminuido.
a) PROCEDIMIENTO DE PRUEBA
1. Ho = µ ≥ 4,200
H1 = µ < 4,200
2. α = 0,05
3. F.P. (caso 1)
4.
-2.22
-3 -2 -1 0 1 2 3
-1.64
rechazo Ho punto crítico aceptación Ho
5.
= -0.22 Valor observado
6. Decisión: se rechaza la Ho a un nivel de significancia del 0.05.
Conclusión: Los datos dan suficiente evidencia para concluir que el saldo
promedio de las cuentas por cobrar al mes de octubre ha disminuido
significativamente.
b) INTERVALO DE CONFIANZA DEL 95%
= 3823.6
= 4176.4
----> El intervalo del 95% de confianza es
Interpretación: Se
estima con un 95% de confianza que el
verdadero saldo promedio de las cuentas por
cobrar esta entre 3,823.60 y 4,176.40 soles.

Otros Conceptos Estadísticos:
Probabilidad: frecuencia esperada de un fenómeno aleatorio basándose en la experiencia
Población: son los elementos que se analizan para realizar cálculos de probabilidad
Muestra: son los casos de una población que se estudian en un estudio probabilístico
Muestreo: técnicas de obtención de muestras en una población
Media: valor promedio que toman los sucesos de un fenómeno aleatorio
Moda (Mo) : es el valor que se da con mayor frecuencia en una muestra de datos
Mediana (Me): valor que deja la mitad de los sucesos ordenados a cada lado
Desviación Estándar o Típica (σ): medida del grado de dispersión de los resultados
obtenidos
Varianza (σ2): se calcula elevando al cuadrado la desviación típica
Percentiles (Pn): valor del elemento que es mayor que un porcentaje de la muestra
Deciles (Dn): valor del elemento que es mayor a un porcentaje (tomado por grupos de 10%)
Cuartiles (Qn): valor del elemento que es mayor a un porcentaje (tomado por grupos de
25%)
Quintiles (Qn): valor del elemento que es mayor a un porcentaje (tomado por grupos de
20%)
Variable Aleatoria: función que asigna un valor numérico a cada elemento de una muestra
aleatoria
Función de Probabilidad: función (P) que asigna a cada valor (xi) una probabilidad (pi)
Función de Distribución: función que indica la probabilidad de obtener un valor ≤ a un
suceso
Esperanza Matemática: valor medio que se puede esperar de un fenómeno aleatorio
Distribución binomial: es una distribución de sucesos cuya probabilidad es fija

Distribución normal o de Gauss: distribución que toma valores continuos no discretos
11. CASO PRÁCTICO
Se ha generado una base de datos en Excel el cual se pasarán a desarrollar los temas
tratados en la asignatura de la Maestría de Auditoría Integral.

BIBLIOGRAFÍA
https://www.matematicas10.net/2015/12/ejemplos-de-mediana.html
https://www.varsitytutors.com/hotmath/hotmath_help/spanish/topics/mean-
median-mode
https://www.tusclasesparticulares.com.ec/questions/matematica/como-se-
calcula-la-moda
https://www.matematicas10.net/2015/12/ejemplos-de-mediana.html
https://support.zendesk.com/hc/es/articles/4408839402906
https://matemovil.com/media-mediana-y-moda-ejemplos-y-ejercicios/
https://proyectodescartes.org/EDAD/materiales_didacticos/EDAD_2eso_estadi
stica-JS-LOMCE/2esoquincena13.pdf
https://unac.edu.pe/documentos/organizacion/vri/cdcitra/Informes_Finales_Investigacio
n/IF_JUNIO_2012/IF_CALDERON%20OTOYA_FCA/capitulo%206%20y%207.pdf

Trabajo Final de Auditoria Integral

Cargado por

Copyright:

Formatos disponibles

Trabajo Final de Auditoria Integral

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Trabajo Final de Auditoria Integral

Cargado por

Copyright:

Formatos disponibles

Universidad Nacional de

ESTADISTICA APLICADA Y TECNICAS DE MUESTREO

Dr. Gaspar Chavez

o Mayta Urias, Graciela.

La determinación del tamaño muestral en una investigación es de vital importancia, tanto

cuando se efectúa un estudio de carácter cuantitativo (limitado al uso de un muestreo

aleatorio simple, unietápico y fijo).

ser la estimación estadística y el análisis de experimentos, que requieren de información

precisa sobre las variables consideradas, y que es obtenida a partir de la muestra

representativa de la respectiva población.

9. PRUEBA DE RANGO MULTIPLE (DUNCAN)............................................................................35

10. PRUEBA DE HIPOTESIS......................................................................................................41

11. CASO PRÁCTICO......................................................................................................................45

Es el valor promedio de un conjunto de datos numéricos, calculada como la suma de un

conjunto de valores dividida entre el número total de valores.

Algunas características de la media son:

 Considera todas las puntuaciones

empleados durante el mes. Para calcular la media se realiza lo siguiente:

Calcular la media de: 8,9,10,11,16,17,6

N= 7 (el número de datos)

La mediana es un conjunto es un valor que se encuentra a la mitad de los otros valores, es

entre los que están por arriba.

Algunas características de la media son:

 Las operaciones para calcular el valor son muy sencillas de realizar.

Como sacar la Mediana

Los pasos para sacar la mediana son:

1. Ordena todos los números del más pequeño al más grande.

La cantidad de valores es impar.

Si se tienen los valores: 9,5,4,2,7,

La cantidad de valores es par.

Si se tienen los valores 9,5,4,2,

En este caso se toman los dos valores centrales 5 y 4, la mediana es el promedio de

Calcular la mediana de los siguientes datos: 11, 6, 7, 7, 4.

Ordenamos los datos de menor a mayor: 4, 6, 7, 7, 11.

Ahora tomamos el dato que se encuentra al centro: 4, 6, 7, 7, 11.

El valor de la mediana es: Me = 7.

En un examen calificado del 0 al 10, 3 personas obtuvieron 5 de nota, 5 personas

obtuvieron 4 de nota, y 2 personas obtuvieron 3 de nota. Calcular la mediana.

Primero hacemos una lista de las notas obtenidas: 5, 5, 5, 4, 4, 4, 4, 4, 3, 3.

Ahora ordenamos los datos de menor a mayor: 3, 3, 4, 4, 4, 4, 4, 5, 5, 5.

Finalmente, encontramos la media de estos 2 valores centrales:

descendente, obtendrás el mismo resultado que al hacerlo de forma creciente o ascendente.

cantidad de repeticiones. En este caso se saca el promedio de ambos.

Las principales características de la moda son:

 Es una muestra muy clara

Como sacar la Moda

Los pasos para obtener la moda de un conjunto son:

 Escribe todos los números del conjunto.

Calcular la moda de los siguientes datos: 11, 6, 7, 7, 4.

Análisis de varianza con dos factores o dos vías.

Es un diseño que pretende controlar algunos factores extraños (fuentes exógenas) de

principales (uno por cada factor) y el efecto en la interacción de ambos factores.

conduce a una prueba de hipótesis más poderosa en lo que respecta a la capacidad de

detectar diferencias entre medias de tratamiento.

INTERFERENCIA ENTRE LOS FACTORES:

En el análisis de 2 factores se tiene:

fuentes para la misma:

Los pasos son los siguientes: