Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Trabajo Final Estadistica

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 52

Facultad de Ingeniería

VULNERABILIDAD DE LA SEGURIDAD INFORMATICA


EN LIMA METROPOLITANA 2022

DOCENTE: MARY LUZ MENESES


ROMAN

INTEGRANTES:

- RAMOS MILLA, CESAR ALONSO U18214811

- IZAGUIRRE COLACHAGUA, JHONATAN STEVE U20213349

- QUISPE ISUIZA, JOSE CARLOS U20214790

- QUISPE SONCCO, RONALDO U21228346

- AYALA BEDON NILS, JAIR U19217224

2022
CAPITULO-1
1. ANTECEDENTES/ DESCRIPCIÓN DEL PROYECTO
2. PROBLEMA CENTRAL DEL PROYECTO
3. OBJETIVOS GENERALES / ESPECÍFICOS
CAPITULO–2
1. CONCEPTOS ESTADÍSTICOS
2. VARIABLES Y TIPO DE VARIABLES
3. MUESTRA ESTADISTICA Y TIPO DE MUESTREO
4. GRAFICOS Y TABLAS ESTADISTICOS POR VARIABLES
5. MEDIDAS DE TENDENCIA CENTRAL/ DISPERSION
6. DISTRIBUCION
7. INTERVALO DE CONFIANZA
CAPITULO-3
1. PRUEBA DE HIPOTESIS ESTADISTICA Y ANALISIS DE
DATOS
2. PRUEBA NO PARAMETRICAS
3. BONDAD DE AJUSTE
4. REGRESION LINEAL SIMPLE
5. INTERVALO DE CONFIANZA Y PREDICCION
6. COEFICIENTE DE CORRELACION (r)
7. COEFICIENTE DE DETERMINACION ( R2)
8. REGRECION LINEAL MULTIPLE
9. CONCLUCIONES
10. RECOMENDACIONES
11. ANEXO
12. ENLACE

CAPITULO-1
1. ANTECEDENTES/ DESCRIPCIÓN DEL PROYECTO
Este proyecto recoge los fundamentos de los ataques de ingeniería social en

los sistemas informáticos. Los ataques cibernéticos se clasificaron como el

quinto riesgo más alto en 2021 y se convirtieron en el nuevo estándar para los

sectores público y privado El objetivo principal es lograr comprender su

naturaleza y ser capaces de valorarlos como la amenaza que representan en

los trabajadores de la Municipalidad Distrital de Independencia. Por tal de

conseguir el objetivo se realizan pruebas de concepto para valorar el riesgo,

cambiando a menudo la perspectiva a la del atacante. A raíz de este proyecto,

se espera formar una base, para que en un futuro sea posible incrementar la

seguridad de dichos equipos informáticos con tecnologías de prevención,

detección e intercepción de estos ataques, proponiendo la `Interacción

Humano-Computador Segura´ como punto de partida. (Alvarado p.1)

2. PROBLEMA CENTRAL DEL PROYECTO

Sobre los acontecimientos ocurridos en varios ámbitos de este problema se puede

tener como caso los robos y la piratería a través de ello se debe instalar el programa

requerido para evitar ciertos inconvenientes en las redes o la mejor manera de evitar

aquellos sucesos. Se debe tener en cuenta la seguridad de las redes como algo

primordial en el día a día y al no tener una seguridad premeditada podría terminar en

situaciones poco deseables, ya que seguro a más de uno ha pasado por estos

dilemas, por ende, se requiere una mejor seguridad ante estas causalidades. Las

personas necesitan saber el riesgo de que se corre al tener la iniciativa de entrar o

crear una cuenta para un beneficio propio o compañía, la cual de por si trae riegos

ante cualquier tipo de hacker o piratería, que tanto se ha estado presentando en

nuestros tiempos y que seguirá de esta manera por muchos años más, siendo así el

tema y trabajo presentado en este proyecto.


3. OBJETIVOS GENERALES / ESPECÍFICOS

1. Como objetivo se quiere tener como resultado las cantidades y


porcentajes exactos o aproximados de los problemas en cuanto los
robos por las redes sociales y la piratería.
2. Encontrar la manera más práctica y segura posible para los sujetos
que tienen información en el espacio Internet.
3. Explicar las barras obtenidas de las catástrofes ocasionadas por los
robos.
4. Dar la mejor explicación con los datos y fórmulas presentadas en
clase para una mejor referencia a los sucesos explicados.

CAPITULO–2

1. CONCEPTOS ESTADÍSTICOS

• Población: personas mayores de edad con cuentas de correo

electrónico en Perú abril-mayo 2022

• Muestra: 100 personas mayores de edad con cuentas de correo

electrónico en Perú abril-mayo 2022

• Unidad de Análisis: 1 persona mayor de edad con una cuenta de

correo electrónico en Perú abril-mayo 2022

2. VARIABLES Y TIPO DE VARIABLES

Variables Tipo de variable

Edad Cuantitativa continua

Genero Cualitativa Nominal

Qué medida es mejor para la seguridad ante un robo Cualitativa Nominal


informático
Aceptas las cookies de cada página a la que entras Cualitativa Nominal

Actualiza su información personal Cualitativa Nominal

Está de acuerdo que las empresas opten por la Cualitativa Nominal


seguridad de sus datos

Has sido víctima de una estafa virtual Cualitativa Nominal

Lee los términos y condiciones cuando crea una cuenta Cualitativa Nominal
para empresa

Sabe que permisos le da a una empresa sobre su Cualitativa Ordinal


información personal al aceptar los términos y
condiciones

Conoce lo que es una VPN(Virtual Private Network) Cualitativa Nominal

Realiza transacciones utilizando una VPN (Virtual Cualitativa Nominal


Private Network)

En cuantas empresas tienes registrado tus datos Cualitativa Ordinal


actualmente

3. MUESTRA ESTADISTICA Y TIPO DE MUESTREO

MUESTRA ESTADISTICA

Se tomó una muestra de la población de estudiantes de la universidad

tecnológica del Perú, encuestando a 100 personas al azar, para la

extracción de datos fundamentales que nos ayudaran con la presente

investigación en el año 2022.

MUESTRA ESTADISTICA

Se utilizó muestreo probabilístico por convivencia


4. MUESTRA ESTADISTICA Y TIPO DE MUESTREO

4.1 GENERO (VARIABLE CUALITATICA NOMINAL)

¿Cuál es tu género? fi hi
Masculino 61 61,0
Femenino 39 39,0
Total general 100
100

GRÁFICO N°01: Distribución de 100 encuestados

¿CUAL ES TU GENERO?
80
Percent

60
40
20
0
Masculino Femenino
¿CUAL ES TU GENERO?

Fuente: Base de datos recogido por los estudiantes

A partir de la tabla se observa que la mayoría de encuestados es masculino (61.0%) y lo

que resta son femeninas (39.0%).

4.2 EDAD (VARIABLE CUANTITATIVA DISCRETA)

Edad Fi Fi xi Xi Fi*Xi
18-23 77 77 20,5% 1578,5
25,5%
23-28 12 89 25,5% 46 306
%
28-33 6 95 30,5% 183
76,5%
33-38 5 100 23.5% 177,5
100%
Total 100 2245
general
GRÁFICO N°02: Distribución de 100 encuestados

EDAD
90
80
70
60
50
40
30
20
10
0
18-23 23-28 28-33 33-38

Fuente: Base de datos recogido por los estudiantes

A partir del presente grafico estadístico, podemos decir que la gran parte de los encuestados

tienen edades entre 18-23 (77%) y además podemos decir que la minoría de los encuestados

tiene de 33-38(5%).

4.3 ¿QUE MEDIDAS CREEN PARA UNA MEJOR SEGURIDAD EN CASO DE


UN ROBO INFORMATICO? (VARIABLE CUANTITATIVA NOMINAL)

¿QUE MEDIDAS fi Fi hi Hi
CREEN PARA UNA
MEJOR SEGURIDAD
EN CASO DE UN ROBO
INFORMATICO?
programas especializados en 74 74 74,0% 74,0%
seguridad

tener cuentas ocultas 26 100 26,0% 100%


Total general 100 100%

GRÁFICO N°03: Distribución de 100 encuestados


¿QUE MEDIDAS CREEN PARA
80
70
UNA74.0MEJOR SEGURIDAD EN
60
50
CASO DE UN ROBO INFORMA-
TICO?
Percent

40
30
20 26.0
10
0
programas especializados en seguridad tener cuentas ocultas
¿QUE MEDIDAS CREEN PARA UNA MEJOR SEGURIDAD EN CASO DE UN ROBO INFORMATICO?

Fuente: Base de datos recogido por los estudiantes

A partir de los datos recolectados en el presente grafico podemos darnos cuenta que la

mayoría de los encuestados (74%) han elegido programas especializados en seguridad y la

demás parte de los encuestados han elegido, tener en cuentas ocultas (26%).

4.4 ¿ACEPTAS LOS COOQUIES DE CUALQUIER PAGINA A LA QUE


INGRESAS? (VARIABLE CUANTITATIVA NOMINAL).

Aceptas los fi Fi hi Hi
cooquies de
cualquier página a la
que ingresas?
si 41 41 41,0% 42,0%
no 59 100 59,0% 100,o%

Total 100 100,0%

GRÁFICO N°04: Distribución de 100 encuestados

Aceptas los cooquies de cualquier


página a la que ingresas?
80
60
Percent

40
20
0
si no
Aceptas los cooquies de cualquier página a la que ingresas?
Fuente: Base de datos recogida por los estudiantes.

Siguiendo el grafico estadístico, nos podemos dar cuenta que la gran mayoría de los

encuestados, entre hombres y mujeres, han elegido “NO” (54%) y siendo casi la mitad han

elegido “SI” (46%).

4.5 ¿ACTUALIZAS TUS DATOS SEGUIDAMENTE? (VARIABLE


CUANTITATIVA NOMINAL).

Actualizas tus datos Fi Fi hi Hi


seguidamente?
Si 46 46 46,0% 46,0%
no 54 100 54,0% 100,0%

Total 100 100,0%

GRÁFICO N°05: Distribución de 100 encuestados

Actualizas tus datos segui-


damente?

60
Percent

40
SI No
Actualizas tus datos seguidamente?

Fuente: Base de datos recogida por los estudiantes.

Siguiendo el grafico estadístico, nos podemos dar cuenta que la gran mayoría de los

encuestados, entre hombres y mujeres, han elegido “NO” (54%) y siendo casi la mitad han

elegido “SI” (46%).

4.6 ¿ESTAS DE ACUERDO QUE LAS EMPRESAS OPTEN POR LA

SEGURIDAD DE SUS DATOS? (VARIABLE CULITITATIVA NOMINAL

¿ESTAS DE ACUERDO Fi Fi hi Hi
QUE LAS EMPRESAS
OPTEN POR LA
SEGURIDAD DE SUS
DATOS?
Si 82 82 82,0% 82,0%
no 18 100 18,0% 100,0%

Total 100 100,0%

GRÁFICO N°06: Distribución de 100 encuestados

¿ESTAS DE ACUERDO QUE LAS EM-


PRESAS OPTEN POR LA SEGURIDAD
DE SUS DATOS?
100
Percent

50
0
si no
¿ESTAS DE ACUERDO QUE LAS EMPRESAS OPTEN POR LA SEGURIDAD DE SUS DATOS?

Fuente: Base de datos recogida por los estudiantes.

A partir de la gráfica estadística presuntamente elaborada, podemos sacar una conclusión.

El 82% de los encuestados han ido por la opción “SI” y el 18% por la opción “NO.

4.7 ¿TE HAN ESTAFADO VIRTUALMENTE? (VARIABLE CUALITATIVA


NOMINAL).

¿TE HAN ESTAFADO Fi Fi hi Hi


VIRTUALMENTE?
Si 15 15 15,0% 15,0%

no 85 100 85,0% 100,0%

Total 100 100,0%

GRÁFICO N°07: Distribución de 100 encuestados


¿TE HAN ESTAFADO VIR-
TUALMENTE?
100
80
60
Percent

40
20
0
si no
¿TE HAN ESTAFADO VIRTUALMENTE?

Fuente: Base de datos recogida por los estudiantes.

A partir del grafico estadístico nos podemos percatar que la menor parte de los

encuestados ha marcado la opción “SI” (15%) y la gran mayoría a marcado la opción “NO”

(85%).

4.8 AL MOMENTO DE CREAR UNA CUENTA PARA EMPRESAS. ¿LEES


LOS TÉRMINOS DE CONDICIÓN? (VARIABLE CUALITATIVA NOMINAL).

AL MOMENTO DE CREAR Fi Fi hi Hi
UNA CUENTA PARA
EMPRESAS. ¿LEES LOS
TÉRMINOS DE CONDICIÓN?
Si 45 45 45,0% 45,0%
no 55 100 55,0% 100,0%
Total 100 100,0%

GRÁFICO N°08: Distribución de 100 encuestados


AL MOMENTO DE CREAR UNA
CUENTA PARA EMPRESAS. ¿LEES
LOS TÉRMINOS DE CONDICIÓN?
60
50
40
Percent

30
20
10
0
si no
AL MOMENTO DE CREAR UNA CUENTA PARA EMPRESAS. ¿LEES LOS TÉRMINOS DE
CONDICIÓN?

Fuente: Base de datos recogida por los estudiantes.

A partir del cuadro estadístico nos podemos dar cuenta que la gran mayoría opto por la

opción “NO” (55%) y la otra parte de los encuestados marco la opción “SI” (45%).

4.9 (VARIABLE CUALITATIVA NOMINAL) ¿SABE QUE PERMISOS DAS


SOBRE TU INFORMACION A UNA EMPRESA?

¿SABE QUE PERMISOS DAS Fi Fi xi Xi


SOBRE TU INFORMACION A UNA
EMPRESA?
SI LO SE 25 25 25,5% 25,0%
TAL VEZ 61 86 61,0% 61,0
%
PARA NADA 14 100 14,0% 100,0%
Total general 100 100,0%

GRÁFICO N°09: Distribución de 100 encuestados

¿SABE QUE PERMISOS DAS


SOBRE TU INFORMACION A
UNA EMPRESA?
80
60
Percent

40
20
0
si lo se tal vez para nada
¿SABE QUE PERMISOS DAS SOBRE TU INFORMACION A UNA EMPRESA?
Fuente: Base de datos recogida por los estudiantes.

Según el presente grafico estadístico, nos podemos dar cuenta que la gran mayoría de los
encuestados, entre hombres y mujeres, han escogido la opción “TAL VEZ” (61%) y que la
menoría de los encuestados ha escogido la opción “PARA NADA” (14%), dejándonos por
ultimo a los que han escogido “SI LO SÈ” (25%).
4.10 (VARIABLE CUALITATIVA NOMINAL) ¿SABES LO QUE ES UN VPN?

¿Sabes lo que es un VPN? Fi Fi hi Hi


Si 53 53 53,0% 53,0%
no 47 100 47,0% 100,0%
Total 100 100,0%

GRÁFICO N°10: Distribución de 100 encuestados

¿Sabes lo que es un VPN?


54
52
50
Percent

48
46
44
si no
¿Sabes lo que es un VPN?

Fuente: Base de datos recogida por los estudiantes.

Según el presente grafico estadístico nos podemos dar cuenta que la gran mayoría de los

encuestados se ha ido por la opción “SI” (53%) y la otra parte marco la opción “NO” (47%)

4.11 ¿REALIZAS TRANSACCIONES USANDO VPN? (VARIABLE


CUALITATIVA NOMINAL).

¿Realizas transacciones Fi Fi hi Hi
utilizando VPN?
A veces 25 25 25,0% 25,0%
Nunca 75 100 75,0% 100,0%

Total 100 100,0%

GRÁFICO N°11: Distribución de 100 encuestados

¿Realizas transacciones utilizando


VPN?
80
60
Percent

40
20
0
a veces nunca
¿Realizas transacciones utilizando VPN?

Fuente: Base de datos recogida por los estudiantes

Según el grafico estadístico nos podemos dar cuenta fácilmente que la mayoría de los

encuestados “Nunca” ha realizado una transacción utilizando VPN (75%) y además que

solo el 25% de los encuestados ha hecho una transacción

4.12 ¿EN CUANTAS EMPRESAS TIENES REGISTRADO TUS DATOS


ACTUALMENTE? (VARIABLE CUALITATIVA ORDINAL).

¿EN CUANTAS EMPRESAS fi Fi xi Xi Fi*Xi


TIENES REGISTRADO TUS
DATOS ACTUALMENTE?
1 33 33 33% 1 33
2 28 28 61% 2 56
3 15 15 76% 3 45
4 24 24 100 4 96
Total general 100 230

GRÁFICO N°12: Distribución de 100 encuestados


¿EN CUANTAS EMPRESAS TIENES REGISTRADO TUS DATOS
ACTUALMENTE?
35
30
25
20
15
10
5
0
1 2 3 4

Fuente: Base de datos recogida por los estudiantes

A partir del grafico estadístico presuntamente elaborado, nos podemos dar cuenta que el
33% de los encuestados tienen registrado sus datos en una empresa, además solo el 15%
tiene sus datos registrados en 3 empresas.

5.- MEDIDAS DE TENDENCIA CENTRAL / DISPERSION


5.1) EDAD (VARIABLE CUANTITATIVA DISCRETA)

MODA
1. Mo=Li+A(α1/ (α1+ α2))
2. Mo=18+5(77/77+65)
3. Mo=20.71=21
EL ingreso más frecuente en la edad de las personas encuestadas es de 21
años
MEDIANA
1. Me=LI+A((n/2 - Fi-1)/fi)
2. Me=18+5((50-0)/77)
3. ME=21.2=21
El 50% de los encuestados tiene una edad menor a 21 años
MEDIA
n
1. X=( ∑ xi∗fi)/n
i=1
2. X=2245/100
3. X=22.45=23
El promedio de edades de los encuestados es de 23 años
VARIANZA
n
1. S =∑ ( ( x−X ) )/n-1
2 2

i=1
2. S =248.21/99
2

3. S2=2.5072
DESVIACION ESTANDAR
S=1.584
5.2 ) ¿EN CUANTAS EMPRESAS TIENES REGISTRADO TUS DATOS
ACTUALMENTE? (VARIABLE CUANTITATIVA).

MODA
EL ingreso más frecuente en el número de empresas registrado es de 1
empresa
MEDIANA
Me= 2
El 50% de los encuestados tienen sus datos registrados en menos de 2
empresas
MEDIA
n
1. X=( ∑ xi∗fi)/n
i=1
2. X=230/100
3. X=2.3=2
El promedio de empresas registradas por los encuestados es de 2 empresas
VARIANZA
n
1. S2=∑ ( ( x−X ) )/n-1
2

i=1
2. S2=5.16/99
3. S2=0.052
DESVIACION ESTANDAR
S=0.228

6. DISTRIBUCION
6.1) DISTRIBUCION DE MEDIA CON VARIANZA CONOCIDA
Se supone que la edad de las personas distribución normal de media 22.45
y desviación estándar de edad es 1.58. Se toma una muestra al azar de 100
de los operarios encuestados y se calcula la media. ¿Cuál es la
probabilidad de que esta media este entre 18 y 33?

Solución:
Datos

x −u
Z=
u=22.45 σ
√n
P ( 19≤ x ≤ 34 )=P ( x ≤ 34 )−P ( x ≤ 19)
𝜎=1.58
N=100

( ) ( )
34−33 19−33
P ( 19≤ x ≤ 34 )=P z ≤ −P z ≤
1.58 1.58
√ 100 √100
P ( 19≤ x ≤ 34 )=P ( z ≤ 6.32 )−P ( z ≤−25.31 )
P ( 19≤ x ≤ 34 )=0.99−0.09
P ( 19≤ x ≤ 34 )=0.90
Conclusión: La probabilidad es de 90 porciento

6.2) DISTRIBUCION DE MEDIA CON VARIANZA DESCONOCIDA

Se realiza una encuesta, sobre la cantidad de empresas enlazadas a una


empresa, se ajusta a una distribución normal donde la media muestral es
2.3 de 4 y la desviación estándar es 0.228, la investigación fue realizada a
100 personas. ¿Cuál es la probabilidad de que la media sea menor a 2,3?

Solución:

Datos
x−u
T (n−1)=
u=4 σ
√n
n=100
𝜎 =0.228
X=2.3

( )
2.3−4
P ( x ≤ 2.3 )=P z ≤
0.228
√100

P ( x ≤ 2.3 )=P ( z ≤−74.56 )

P ( T 99 ) ←74.56
Conclusión:
La probabilidad que la media muestral sea menor a 2.3 es 0.05%

6.3) DISTRIBUCIÓN DE LA DIFERENCIA DE MEDIAS PARA VARIANZA


CONOCIDA

Una encuesta realizada sobre qué edad tienen se obtuvo una media de 23
en los hombres y 19 en las mujeres. Una encuesta a 100 personas donde
61 son hombres y 39 son mujeres arrojo una desviación estándar de 4.3 en
hombres y una desviación estándar de 1.7 en mujeres. Obtener una
probabilidad de que la edad de las mujeres es mayor en 2 años a la edad
de los hombres

Solución:
Población
σ2= σ2
u1=22 u 2=21
MUESTRA
HOMBRES MUJERES
N1=61 N2=39
S1=4.3 S2=1.7

P ( X ̅ 1> X ̅ 2+2 ) =P(X ̅ 1−X ̅ 2>2)


2 ( 61−1 ) ( 4.3)2 +(39−1)(1.7)2
S P= =12.44
61+39−2

P ( X 1−X 2>2 )=P ¿


1−P ( t< 1.38 )=1−0.995=0.005
La probabilidad de que la edad de las mujeres sea 2 años más que los
hombres es de 0.005 porciento

6.4) DISTRIBUCION DE LA PROPORCION


Un estudio nos revela que las personas que tiene el error de no leer los
términos y condiciones de una empresa es del 7%.Para ello se hace una
muestra de 100 personas .Calcular la probabilidad de que haya más de un
10% en las 100 personas.

Solución:
Datos:

Π=0.07
N=100
P=0.1
p−π 0.1−0.07
P( Z> = )

√ π ( 1−π )
n √ 0.07 ( 0.93 )
100

1−P ( Z ≤ 1.18 )=1−0.88=0.22


Conclusión: con 10 porciento se puede decir la probabilidad de errores es
de 0.22

7. INTERVALO DE CONFIANZA
7.1 INTERVALO DE CONFIANZA DE LA MEDIA MUESTRAL CON
VARIANZA CONOCIDA

Se ha obtenido una muestra de 100 personas sobre la vulnerabilidad de la


seguridad informática en lima metropolitana. Si se sabe por medio de la
encuesta que la desviación de los datos registrados a una es 1.58. La media la
muestra es de 22.45. Encuentre el intervalo de confianza de 95%
Datos: 𝜇 = 𝜎 = 1.58 𝑛 = 100 x=

22.45
1,96∗1,58 1,96∗1,58
22,45− ≤ u ≤22,45+
√100 100

IC: 22,14032≤ 𝜇 ≤22,75968


Con un nivel de confianza del 95%, el promedio es 22,1403 a
22,7596

7.3 INTERVALO DE CONFIANZA PARA LA VARIANZA

A un grupo de 100 personas, se les encuesto acerca de que, se


obtiene S2=2.5072, construya un IC del 95% para la varianza
poblacional.

Datos:

n=100 Nc=95% - Z: 1.96 q=1-0.41=0.59

0.41− (1.96 )
√ ( 0.41 )( 0.59 )
100
<u> 0.41+(1.96) √
(0.41)(0.59)
100
0.31<u> 0.54
Interpretación: Con un nivel de confianza al 95%, la proporción de
personas que están a favor es 31% al 54%

CAPITULO 3
1. PRUEBA DE HIPOTESIS ESTADISTICA Y ANALISIS DE
DATOS

1.1) PRUEBA DE HIPOTESIS PARA LA MEDIA POBLACIONAL

a) Un estudio afirman que el promedio de personas en el Perú que registran


sus datos de empresas para protegerlos es de 3, cuya distribución es
normal. Una muestra hecha a 100 personas mediante una encuesta da un
promedio de 2.3 con una desviación estándar de 0.228. ¿Se contradice los
datos hechos por el estudio a un nivel de significancia del 5%?

Solución:

Datos
𝑢=3 PASO4
s = 0.228
𝑛 = 100
𝑥̅ = 2.3

Paso 1

H0: u = 3
H1: u ≠ 3

Paso 2

α=0.05

Paso 3

x−u
Z c=
S
√n
2.3−3
Zc= =−30.7
0.228
√ 100

b) Un estudio revelo que las edades de las personas que opinan sobre la
vulnerabilidad informática es de 21 tomados desde 18 a 38 años. Si una
encuesta a 100 personas se obtuvo un promedio de 22.45 con una
desviación estándar de 1.584. Se desea saber si la media hecha por el
estudio es mayor a la encuesta con un nivel de significancia del 5%

Solución:

Datos

u= 23
s= 1.584
n=100
𝑥̅ = 22.45

Paso 1

H0: u ≤ 21
H1: u > 21
Paso 2

α=0.05

Paso 3

x−u
Z c=
S
√n
22.45−21
Zc= =9.15
1.584
√ 100

1.2) PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS

a) Prueba de hipótesis para la diferencia de medias con σ 2


desconocida e iguales
Una encuesta realizada a 61 hombres y 39 mujeres sobre la seguridad
informática dio los siguientes resultados. La media de los hombres fue de
22 años con una desviación estándar de 4.3 y de 20 años las mujeres con
una desviación estándar de 1.7. Se desea probar con un nivel de
significancia del 5 por ciento que la media de los hombres es mayor a la de
las mujeres encuestadas. Considere que σ2 son iguales.

Solución:

Datos

Población
σ2= σ2
Muestra
HOMBRES MUJERES
N1=61 N2=39
𝑥̅ =22 𝑥̅ =20
S1=4.3 S2=1.7

Paso 1

H0: u1 ≤ u2
H1: u1 > u2
Paso 2
α=0.05

Paso 3: Estadístico de Prueba

gl: n1+n2-2

2 ( 61−1 ) ( 4.3)2 +(39−1)(1.7)2


Sp = =12.44
61+39−2

( 22−20 )−( 0)
T C=

√ 12.44 (
1 +1
¿ )=2.77 ¿
61 39

b) Prueba de hipótesis para la diferencia de medias con σ 2 conocida y


diferentes

En una encuesta realizada a 100 personas sobre en cuantas empresas


tenían registrados sus datos en lima metropolitana. Donde 52 son de lima
norte y 48 de lima centro. El promedio de personas que han registrado sus
datos en lima norte es de 6, mientras que el promedio en centro es de 4.
Las desviaciones estándar. Supongamos que la desviación estándar
poblacional para lima norte y centro son 2.80 y 1.27 respectivamente.
¿Existe evidencia de que el promedio de personas que tienen registrado
sus datos en lima centro es menor que en lima sur?
Solución:
Población
Lima norte Lima centro
𝜎1 = 2.80 𝜎2=1.27
Muestra
Lima norte Lima centro
N1=52 N2=48
𝑥̅=6 𝑥̅=4

Paso 1

H0: u1 ≤ u2
H1: u1 > u2

PASO 2

α=0.05

PASO 3: Estadístico de prueba

6−4−(0)
ZC = =4.65


2 2
2.80 1.27
( + )
52 48
1.3) PRUEBA DE HIPOTESIS PARA LA PROPORCION

Un estudio nos revela que las personas que tiene el error de no leer los
términos y condiciones de una empresa es del 75%.Para ello se hace una
muestra de 100 personas donde 55 están de acuerdo en dicha proposición.
Aun nivel de significancia del 0.05 ¿Se sigue cumpliendo con dicha
proposición?
Solución

Datos:

N=100
P=x/n=55/100=0.55
π=75%=0.75

PASO 1

H0: π ≥ 0.75
H1: π < 0.75

PASO 2

α=0.05

PASO 3
p−π 0.55−0.75
Z c= = =−4.62

√ π (1−π)
n √ 0.75(0.25)
100

1.4) PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCION

En una encuesta realizada para saber en cuál de las empresas tienen


registrado sus datos obtuvimos lo siguiente, 17 de 28 personas tienen sus
datos en la empresa A y 7 de 33 personas en la empresa. Con un nivel de
significancia del 5%. ¿Se puede concluir que la empresa A tiene más datos
registrados que la empresa B?

Solución:

DATOS
EMPRESA A EMPRESA B
N1=28 N2=33
P1=x1/N1=17/28=0.607 P2=x2/N2=7/33=0.212
P1=0.607 P2=0.212

x1 + x2 17+ 7 24
P= = =
N 1 + N 2 28+ 33 61
P=0.393
PASO 1

H0: π1 ≤ π2
H1: π1 > π2

PASO 2
α=0.05

PASO 3

P1 + P2−(π 1−π 2) 0.607+ 0.212−( 0)


Z cal= = =6.53

√ 1 1
P(1−P)( + )
N1 N2 √ 1 1
0.393(1−0.393)( + )
28 33

1.5) PRUEBA DE HIPOTESIS PARA LA VARIANZA

Se realiza una encuesta sobre la estafa virtual en lima metropolitana, según


la encuesta existe una varianza muestral de 5.23.Se encuesto a 100
personas sobre las estafas virtuales con una varianza poblacional de
8.09 .Al término de la encuesta se desea saber si existe una disminución de
la varianza con respecto a las estafas virtuales ocurridos en lima
metropolitana. Tomar un nivel de significancia de 5%.

Solución:

Ơ2 8.09
N 100
S2 5.23

PASO 1

H0: Ơ 2 ≥ 8.09
H1: Ơ 2 < 8.09

PASO 2
α=0.05

PASO 3

2
2 ( N −1)S ( 100−1 ) 5.23
X cal= = =64.00
Ơ
2
8.09

2. PRUEBAS NO PARAMETRICAS

2.1) PRUEBA DE HIPOTESIS DE SIGNO

Se muestra la cantidad de personas que tiene sus datos registrados en


empresas. Se toma una muestra de 35 encuestados al azar, se desea
probar la hipótesis de que la mediana de datos registrados es 2. Utilizar un
nivel de significancia al 5%.

N Xi-2
1 4 (+)
2 3 (+)
3 3 (+)
4 2 (0)
5 1 (-)
6 2 (0)
7 1 (-)
8 1 (-)
9 2 (0)
10 2 (0)
11 3 (+)
12 4 (+)
13 4 (+)
14 2 (0)
15 4 (+)
16 2 (0)
17 1 (-)
18 1 (-)
19 3 (+)
20 3 (+)
21 3 (+)
22 3 (+)
23 4 (+)
24 2 (0)
25 2 (0)
26 1 (-)
27 1 (-)
28 1 (-)
29 1 (-)
30 2 (0)
31 4 (+)
32 4 (+)
33 4 (+)
34 2 (0)
35 3 (+)

R+= 16; N=25; N/2=12.5


2.2) PRUEBA DE RACHAS

La siguiente tabla muestra las edades de 7 personas. Determinar si los


datos proceden de una muestra aleatoria. Usar un nivel de confianza del
95%
1 2 3 4 5 6
18 23 21 28 20 23 18
(-) (+) (0) (+) (-) (+) (-)

De acuerdo a la información se tiene una mediana igual a 21

Solución:

PASO 1

H0: La muestra es aleatorio


H1: La muestra no es aleatorio
PASO 2

α=0.05
α/2=0.025 1- α/2=0.975
z(α/2)=-1.96 z(1- α/2)=1.96

PASO 3
−¿=3+ 3=6, N 1 =3 yN 2=3 ¿
+ ¿+ N 2 ¿
G=N 1

2 N1 N 2 2(3)(3)
UG= +1= +1=4
N 1+ N 2 3+3

σ G=
√ 2( N 1 N 2 )(2 N 1 N 2−N 1−N 2)
(N 1 + N 2)
2
=
√ 2(3)(3)(2 X 3 X 3−3−3)
(3+3)
2
=2.44

G −U G 6−4
ZC = = =0.82
σG 2.44

PASO 4

Z α /2 < Z C < Z 1−α / 2

−1.96<0.82<1.96 ACEPTA LA HIPOTESIS NULA

PASO 5: Conclusión

AL nivel del 5% de significancia, la muestra es aleatoria

2.3) PRUEBA DE RANGOS DE WILCOXON

Se realizó una eficacia de usar vpn al registrar nuestros datos en un antes y


un después, se tomaron 4 semanas arrojando los siguientes datos.

Registro de robos
Antes 5 1 7 8
Después 2 3 5 4

Determinar la prueba de rango de Wilcoxon para saber si existe eficacia en


el uso de vpn

Solución:
Antes 5 1 7 8
Después 2 3 5 4
Diferencia 3 -2 2 4
Valor 3 2 2 4
Absoluto

PASO 1

H0: u2 = u1
H1: u2 < u1

PASO 2

α=0.05

PASO 3
Antes 5 1 7 8
Después 2 3 5 4
Diferencia 3 -2 2 4
Valor 3 2 2 4
Absoluto
3 1.5 1.5 4

Diferencias T+ T-
3 3
-2 1.5
2 1.5
4 4
Suma 8.5 1.5

T+= 8.5 T=MIN (T+; T-)= 1.5


T-= 1.5
n ( n+1 ) 4 ( 5 )
E ( T )= = =5
4 4
n ( n+ 1 )( 2 n+1 ) 4 ( 5 ) ( 9 )
Var ( T ) = = =7.5
24 24
T −E (T ) 1.5−5
Zc= = =−1.28
√ σ (T ) √7.5
PASO 4
Zc< Zα SE RECHAZA LA HIPOTESIS NULA
-1.28>-.1.65 Se acepta la hipótesis nula
PASO 5: Conclusión
A un nivel de significancia al 5% se acepta la hipótesis nula, concluyendo que
el promedio de robos después de usar vpn es menor

2.4) PRUEBA U DE MANN WITNEY

Suponga que se desea probar el uso de dos vpn, 8 personas usan el vpn 1 y 5
personas el vpn 2
A continuación se muestra el uso de las vpn, probar que el uso promedio de
vpn 1 y 2 son los mismos a un nivel de 5% de significancia.
Vpn 1 7 6 4 2 8 5 3 5

Vpn 2 4 2 5 3 2

Solución:
PASO 1
H0: u2 = u1
H1: u2 ≠ u1
PASO 2
α=0.05
α/2=0.025 Z(0.025)=-1.96
α/2-1=0.975 Z(0.975)= 1.96

PASO 3
VPN 1 R1 VPN 2 R2
7 12 4 6.5
6 11 2 2
4 6.5 5 9
2 2 3 4.5
8 13 2 2
5 9
3 4.5
5 9
SUMATORIA 67 24

N1=8 N2=5
N 1 (N 1+1) 8 (9)
U 1=N 1 N 2 + −∑ R1=8 ( 5 )+ −67=9
2 2
N 2(N 2+1) 5 (6)
U 1=N 1 N 2 + −∑ R2=8 ( 5 )+ −24=31
2 2
U =Min ( U 1 , U 2 )=9

N 1 N 2 8 (5)
uU = = =20
2 2

σ U=
√ 12 √
N 1 N 2 ( N 1+ N 2+ 1)
=
8(5)(8+5+1)
12
=6.83

PASO 4
U −uU 9−20
ZC = = =−1.61
√ σU 6.83

Z α/2 < Z C < Z α


−1
2

−1.96←1.61<1.96 SE ACEPTA LA HIPOTESIS NULA

PASO 5: Conclusiones
A un 5% de nivel de significancia se acepta la hipótesis nula, hay evidencia de
que las medias del uso de ambos vpn son el mismo

2.5) PRUEBA DE KRUSKALL WALLIS


En la siguiente tabla se tiene lo errores que tienen algunas vpn al ser utilizadas
Error 1 Error 2 Error 3 Error 4
5 2 4 3
1 9 3 4
2 8 8 3
2 4 7 7

Desarrollar la prueba de hipótesis respectiva, utilizar la prueba de Kruskall


Wallis a un nivel de significancia del 5%
Solución:
PASO 1
H0: Las muestras de uso de vpn provienen de poblaciones iguales
H1: Las muestras de uso de vpn provienen de poblaciones distintas
PASO 2
Error 1 Rango Error 2 Rango Error 3 Rango Error 4 Rango
5 11 2 3 4 9 3 6
1 1 9 16 3 6 4 9
2 3 8 14.5 8 14.5 3 6
2 3 4 9 7 12.5 7 12.5
Suma 18 42.5 42 33.5

α=0.05
PASO 3

( )
2 2 2 2 2
12 Ri 12 18 42.5 42 33.5
H=
n(n+1)
∑ ni
−3 ( n+1 )=
16 ( 17 ) 4
+
4
+
4
+
4
−3(17)

H=4.33
Gl=4-1=3
2
X ( 3 ; 0.05 )=0.352

X 2 ( 3 ; 0.95 )=7.815
0.352< 4.33<7.815 se aceptalahipotesis nula

PASO 4: Conclusión
A un nivel de confianza del 5% se acepta la hipótesis nula, concluyendo que las
muestras de error al usar las vpn son de poblaciones iguales

2.6) PRUEBA DE FRIEDMANN


20 operarios de una empresa evaluaron el tiempo de uso de 4 empresas
Hora 1 Hora 2 Hora 3 Hora 4
Empresa 1 15 10 10 13
Empresa 2 13 11 18 17
Empresa 3 13 13 12 14
Empresa 4 10 12 17 14
Empresa 5 11 15 15 13

Probar si existen diferencias entre el promedio de al menos dos empresas con


un nivel de significancia del 5%

Solución:
PASO 1
H0: u1 = u2=u3=u4 (Las medias son iguales)
H1: Al menos dos medias son diferentes
PASO 2
Hora 1 Hora 2 Hora 3 Hora 4
Empresa 1 4 1.5 1.5 3
Empresa 2 2 1 4 3
Empresa 3 2.5 2.5 1 4
Empresa 4 1 2 4 3
Empresa 5 1 2.5 2.5 4
SUMA 10.5 9.5 13 17

α=0.05
PASO 3
12
X 2π =
HK ( K+ 1 )
( ∑ RC2 ) −3 H (K +1)

12
2
X π= ( 10.52 +9.5 2+13 2+17 2 )−3(5)(5)
5 ( 4) ( 5)
2
X π =4.02

Gl=4-1=3

3. BONDAD DE AJUSTE

3.1) BINOMIAL

Se desea encontrar a que distribución teórica se puede ajustar los datos


encontrados. Se realizó un estudio a un grupo de 100 personas para
evaluar la cantidad de robos virtuales. Cada persona de hasta 3 robos por
persona. Se arrojaron los siguientes datos
Número de robos por 0 1 2 3
persona
Número de personas 44 32 16 8

Use un nivel de significancia de 5%

Solución:

X=N° de robos
n=3 robos analizados por persona
N=100 personas
P=??

PASO 1

H0: El número de robos por persona sigue una distribución binomial


H1: El número de robos por persona no sigue una distribución binomial

PASO 2

α=0.05

PASO 3

Calculando la prueba esperada

u=∑ x i o i=np

0 ( 44 )+ 1 ( 32 ) +2 ( 16 ) +3(8)
=3 p
100
p=0.293

Calculando la binomial para cada x

()
P ( x=0 )= 3 ( 0.293 )0 ( 0.707 )3=0.35
0
P ( x=1 )=( 3 )( 0.293)1 (0.707)2=0.44
1
3 2 1
P ( x=2 )=( )(0.293) (0.707) =0.18
2

()3 3 0
P ( x=3 )= ( 0.293 ) ( 0.707 ) =0.25
3
2
(O i−Ei )
X c =∑
2
Ei

Clase(Xi) Oi Pi Ei=Npi X 2c
0 44 0.35 35 2.31
1 32 0.44 44 3.27
2 16 0.18 18 0.22
3 8 0.25 25 11.56
TOTAL 100 2
X c=17.36

Gl=K-m-1=4-1-1=2

3.2) POISSON

Se desea encontrar a que distribución teórica se puede ajustar los datos


encontrados. Se realizó un estudio a un grupo de 100 personas para
evaluar la cantidad de robos virtuales. Cada persona de hasta 3 robos por
persona. Se arrojaron los siguientes datos

Número de robos por persona 0 1 2 3


Número de personas 44 32 16 8

Use un nivel de significancia de 5%


Solución:
PASO 1
H0: El número de robos por persona sigue una distribución Poisson
H1: El número de robos por persona no sigue una distribución Poisson

PASO 2

α=0.05

PASO 3
−λ x
( ) e λ
F x,λ =
x!

Donde λ=
∑ X i Oi = 0 ( 44 )+1 ( 32 ) +2 ( 16 ) +3(8) =0.88
n 100

−0.88 0
e (0.88)
P ( x=0 )= =0.42
0!

−0.88 1
e (0.88)
P ( x=1 )= =0.37
1!

−0.88 2
e (0.88)
P ( x=2 )= =0.14
2!

−0.88 3
e (0.88)
P ( x=3 )= =0.07
3!

2
(Oi−Ei )
X =∑
2
c
Ei

2
Clase(Xi) Oi Pi Ei=Npi Xc
0 44 0.42 42 0.10
1 32 0.37 37 0.68
2 16 0.14 14 0.11
3 8 0.07 7 0.14
TOTAL 100 2
X c=1.03

Gl=K-m-1=4-1-1=2
3.3) PRUEBA DE INDEPENDENCIA

Se tiene un estudio a 100 personas que usan el registro de datos en una


empresa en lo laboral y formal

EMPRESA
REGISTRO DE DATOS TOTAL
REGISTRO REGISTRO
A B
USO Laboral 20 40 60
Normal 30 10 40
TOTAL 50 50 100

Se desea saber si existe relación entre el uso y el registro de datos. Usar un


nivel de significancia del 5%.

Solución:

PASO 1

H0: Existe relación entre el uso y el registro de datos


H1: No existe relación entre el uso y el registro de datos

PASO 2

α=0.05

PASO 3

Total fila x Totalcolumna


FRECUENCIA ESPERADA ( E )=
Grantotal
2
(O i−Ei )
X c =∑
2
Ei

EMPRESA
REGISTRO DE DATOS TOTAL
REGISTRO A REGISTRO B
USO Laboral 20 (30) 40 (30) 60
Normal 30 (20) 10 (20) 40
TOTAL 50 50 100

50(60)
E11 = =30
100

50( 40)
E21 = =20
100

50(60)
E12 = =30
100

50( 40)
E22 = =20
100

2 2 2 2
2 (20−30) (40−30) (30−20) (10−20)
X c= + + +
30 30 20 20
2
X c =16.6

gl=( ¿ filas−1 )( ¿ columnas−1 )


gl=( 2−1 )( 2−1 )
gl=1
3.4) PRUEBA DE HOMOGENIEDAD

Estamos interesados en observar el uso de cierta vpn en 3 empresas, para


ello se tomó una muestra de 100 persona para cada empresa comprobando
si es favorable o desfavorable el uso de la vpn

La siguiente tabla muestra lo favorable y lo desfavorable de la vpn en cada


una de las empresas

VPN TOTAL
Favorable Desfavorable
Empresas E1 25 75 100
E2 52 48 100
E3 80 20 100
TOTAL 157 143 300
Comprobar si hay diferencias en el uso de la vpn con un 5% de significancia

Solución:

PASO 1

H0: No hay diferencias entre las 3 empresas sobre la efectividad de la vpn


H1: Si hay diferencias entre las 3 empresas sobre la efectividad de la vpn

PASO 2

α=0.05

PASO 3

Total fila x Totalcolumna


FRECUENCIA ESPERADA ( E )=
Grantotal

(O i−Ei )2
X =∑
2
c
Ei

VPN TOTAL
Favorable Desfavorable
Empresas E1 25 (52.33) 75 (47.67) 100
E2 52 (52.33) 48 (47.67) 100
E3 80 (52.33) 20 (47.67) 100
TOTAL 157 143 300

157(100)
E11 = =52.33
300

157(100)
E21 = =52.33
300

157(100)
E31 = =55.33
300

143(100)
E12 = =47.67
300

143(100)
E22 = =47.67
300

143(100)
E32 = =47.67
300

2 2 2 2 2 2
(25−52.33) ( 52−52.33) (80−52.33) (75−47.67) ( 48−47.67) (20−47.67)
X 2c = + + + + +
52.33 52.33 52.33 47.67 47.67 47.67

2
X c =60.64

gl=( ¿ filas−1 )( ¿ columnas−1 )


gl=( 3−1 )( 2−1 )
gl=2

4) REGRESION LINEAL SIMPLE


Se hace un estudio para determinar la relación entre el número de
empresas y el número de personas que tienen guardados sus datos. Se
presenta la siguiente tabla

Empresas 1 1 2 2 2 3 3 4 4
Personas 16 17 8 6 14 8 7 10 14

-Identifique las variables y clasifique cada uno de ellos, como se relacionan


ambas variables
-Estime el modelo de regresión lineal estimada
-Pronosticar: ¿Cuánto en promedio será el número de personas que tienen
registrado sus datos en 5 empresas?

Solución:

Y(PERSONAS) X(EMPRESAS X2 Y2 XY
16 1 1 256 16
17 1 1 289 17
8 2 4 64 16
6 2 4 36 12
14 2 4 196 28
8 3 9 64 24
7 3 9 49 21
10 4 16 100 40
14 4 16 196 56
∑ y=100 ∑ x =22 ∑ x 2=64 ∑ y2 =1250 ∑ xy =230
ŷ=β 0 + β 1 x

PERSONAS=β 0 + EMPRESAS β 1
n ∑ xy−∑ x ∑ y
β 1=
n ∑ x 2−( ∑ x)
2

9(230)−22(100)
β 1= 2
9(64 )−(22)

β 1=−1.41

β 0=
∑ y−β 1 ∑ x
n
100−(−1.41 ) 22
β 0=
9
β 0=14.56

Modelo de Regresión Estimada

PERSONAS=14.56−1.41 EMPRESAS

Solución: Pronostico de la propina cuando el número de empresas es 5

PERSONAS=14.56−1.41(5)

PERSONAS=7.51≡ 8

INTERPRETACION DE β 1
Cuando el número de empresas disminuye en 1 las personas disminuye en
8

5) INTERVALO DE CONFIANZA Y PREDICCION

Sobre el ejercicio anterior Encontrar un intervalo de predicción y un intervalo


de confianza para el valor medio de 95% para evaluar el número de
personas cuando el número de empresas es 5.

Solución:

PERSONAS=14.56−1.41 EMPRESAS

Para 5 empresas

ŷ=14.56−1.41 ( 5 )=7.51
n
SC ( X ) =∑ X 2i −nX
i=1
2
SC ( X ) =64−9 ( 2.44 ) =10.42

CME=¿ ¿

( 1250−9 ( 11.11 )2 )−1.41( 230−9 ( 2.44 )( 11.11 ) )


CME=
9−1

CME=19.85

Intervalo de predicción

( α
) (
t 1− , n−2 =t 1−
2
0.05
2 )
, 9−2 =2.365

√ ( )
2
1 (5−2.44 )
IP ( Y ∕ X =5 )=7.51± 2.365∗ 19.85 1+ + =(−6.44 , 21.46)
9 10.42

6) COEFICIENTE DE CORRELACION (r)

Hallar el coeficiente de Pearson

Y(PERSONAS) X(EMPRESAS X2 Y2 XY
16 1 1 256 16
17 1 1 289 17
8 2 4 64 16
6 2 4 36 12
14 2 4 196 28
8 3 9 64 24
7 3 9 49 21
10 4 16 100 40
14 4 16 196 56
∑ y=100 ∑ x =22 ∑ x 2=64 ∑ y2 =1250 ∑ xy =230
9 ( 230 )−22(100)
r=
√ 9 ( 64 )−( 22)2∗√9 ( 1250 ) −1002
r =−0.4

Como r se encuentra entre -1<r<0.8 ahí una relación inversa intensa

7) COEFICIENTE DE DETERMINACION ( R2)

Yi X ŷ=14.56−1.41 X SCR=∑ ( ŷ i−Y )2 SCE=∑ (Y i− ŷ i )2


16 1 13.15 4.16 8.12
17 1 13.15 4.16 14.82
8 2 11.74 0.40 13.99
6 2 11.74 0.40 32.95
14 2 11.74 0.40 5.11
8 3 10.33 0.61 5.43
7 3 10.33 0.61 11.09
10 4 8.92 4.80 1.17
14 4 8.92 4.80 25.81
Y=11.11 SCR=20.34 SCE=118.49
SCT =SCR +SCE
SCT =20.34 +118.49
SCT =138.83

2 20.34
R=
138.83
2
R =0.16
2
R =16 %

Cumpliendo la regresión lineal simple


2 2
R =r

UTILIZACION CUADRO ANOVA

Hallas a un nivel de α=0.95

ŷ=14.56−1.41 X
Yi X ŷ=14.56−1.41 X SCR=∑ ( ŷ i−Y ) SCE=∑ (Y i− ŷ i )
2 2

16 1 13.15 4.16 8.12


17 1 13.15 4.16 14.82
8 2 11.74 0.40 13.99
6 2 11.74 0.40 32.95
14 2 11.74 0.40 5.11
8 3 10.33 0.61 5.43
7 3 10.33 0.61 11.09
10 4 8.92 4.80 1.17
14 4 8.92 4.80 25.81
Y=11.11 SCR=20.34 SCE=118.49

SCT =SCR +SCE


SCT =20.34 +118.49
SCT =138.83

PASO 1

H0: β 1= 0 (No hay relación entre X e Y)


H1: β 1≠ 0 (Si hay relación entre X e Y)

PASO 2

Fuente de GL SC CM Fc Ftab
Variación
Regresión 1 SCR=20.34 20.34 1.20 5.59
Residual
(Error) 7 SCE=118.49 16.93
TOTAL 8 SCT= 138.83

Ftab=F (0.95, 1, 7)=5.59

PASO 3
PASO 4 Conclusión:

Con un nivel de significancia del 5% se acepta la hipótesis nula. Se


concluye que no hay relación entre la X y Y

8) REGRESION LINEAL MULTIPLE

Se ha reunido la siguiente información de una muestra de registro de datos.


Se intenta predecir el número de empresas con base a las edades y al
número de personas

NUMERO DE EDADES NUMERO X1 Y X2 Y X1 X2 X 21 X 22


EMPRESAS(Y) PERSONAS
X1 X2

1 21 15 21 15 315 441 225


2 27 28 54 56 756 729 784
3 32 33 96 99 1056 1024 1089
4 25 24 100 96 600 625 576
10 105 100 271 266 2727 2819 2674

-Determinar la ecuación de regresión estimada


-Interpreta los Coeficientes
Hallaremos las ecuaciones respectivas

Obteniendo el siguiente sistema de ecuaciones


10=4 β 0 +105 β 1+100 β 2

271=105 β 0 +2819 β 1+2727 β 2

266=100 β0 +2727 β 1 +2674 β 2

[][ ]
β0 3.65
β= β1 = −0.30
β2 0.27

ŷ=β 0 + β 1 X 1+ β 2 X 2

ŷ=3.65−0.30 X 1 +0.27 X 2

ŷ=3.65−0.30 EDAD +0.27 PERSONAS

INTERPRETACION

Β0: El número de empresas esperada (promedio). Cuando la edad y el


número de personas toman el valor de cero será 3.65≡4

Β1: Por cada incremento de una edad, el número de empresas esperada


(promedio) se disminuirá en -0.30 manteniendo constante el número de
personas.

Β2: Por cada incremento del número de personas, el número de empresas


esperada (promedio) se incrementara en 0.27 manteniendo constante la
edad.

9) CONCLUSIONES

 Se concluye que aunque muchas personas piden más seguridad en


sus datos virtuales (74%), solo un 56% actualiza sus datos virtuales.
Esto quiere decir que aún se necesita más apoyo y conocimiento
sobre la seguridad virtual

 La probabilidad de las personas que tenían conocimientos sobre la


seguridad virtual es un 90% pero todos menores de 21 años, es
decir la mayoría de ellos aún no cargan con la responsabilidad que
adulos mayores de 23 años lo hacen y que deberían aprender para
un mejor apoyo

10) RECOMENDACIONES
 La recomendación con respecto al número de personas que pide
más seguridad virtual pero poco presta atención en el momento, es
tratar de tener más seguridad y leer muchos términos y condiciones
para saber qué es lo que estoy dando a cambio de tener datos
guardados.

 Tener cuidado con enlaces sospechosos, Cookies sospechosas y


mantener actualizado los datos ayudaran a mantener más seguro los
datos

11) ANEXO
12) ENLACE
- https://youtu.be/PmCoAz8T54E

También podría gustarte