Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Taller Estadistica Descriptiva

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 9

TALLER ESTADISTICA DESCRIPTIVA

JERSON GUERRERO MIRANDA


LEIDY AGUAS PATERNINA

Docente: JUAN CAMILO DIAZ

UNIVERSIDAD DE ANTIOQUIA
FACULTAD DE INGENIERA
INGENIERA INDUSTRIAL
MEDELLN
2017
1. VARIABLES CUALITATIVAS:
1. Ordinales:
ESTRATO (Estrato socioeconmico)
2. Nominales:
ESTCIV (Estado civil: Soltero o Casado)
RESID (Residencia en Medelln o fuera de Medelln)
TRAB (Trabaja Si o NO)
FAC (Facultad a la que pertenece el estudiante)

VARIABLES CUANTITATIVAS
1. Discretas:
HORAS(nmero de horas semanales dedicadas a estudiar, fuera del tiempo
de clase)

2. Continuas:
VMATRI (Valor de la matrcula en miles de pesos)
PROM(promedio obtenido en el semestre anterior)
PUNTAJE(puntaje obtenido en el examen de admisin)

Tabla de frecuencia para la variable discreta HORAS:


HORAS Freq CumFreq Rel CumRel
1 2 24 24 0.0108843537 0.01088435
2 3 117 141 0.0530612245 0.06394558
3 4 192 333 0.0870748299 0.15102041
4 5 263 596 0.1192743764 0.27029478
5 6 231 827 0.1047619048 0.37505669
6 7 186 1013 0.0843537415 0.45941043
7 8 178 1191 0.0807256236 0.54013605
8 9 183 1374 0.0829931973 0.62312925
9 10 182 1556 0.0825396825 0.70566893
10 11 170 1726 0.0770975057 0.78276644
11 12 173 1899 0.0784580499 0.86122449
12 13 114 2013 0.0517006803 0.91292517
13 14 84 2097 0.0380952381 0.95102041
14 15 45 2142 0.0204081633 0.97142857
15 16 39 2181 0.0176870748 0.98911565
16 17 9 2190 0.0040816327 0.99319728
17 18 10 2200 0.0045351474 0.99773243
18 19 3 2203 0.0013605442 0.99909297
19 20 2 2205 0.0009070295 1.00000000

De la anterior tabla de frecuencias de horas de estudio se puede concluir que la m


ayora de los estudiantes dedica entre 5 y 6 horas para estudiar fuera de las clases
, correspondiendo estas dos horas al 22,3% del total de horas. Mientras que el solo
el 0,09% de los estudiantes dedica 20 horas de estudio fuera de las clases.
VALOR MATRICULA:
mean(VMATRI) #media
[1] 601060.4
> median(VMATRI) #mediana
[1] 602694.5
> sd(VMATRI) #desviacion estandar
[1] 101009.9
> skewness(VMATRI) #coeficiente de asimetria
[1] 0.01288379
> kurtosis(VMATRI, type=1) #coeficiente de curtosis
[1] -0.01932378

A partir de los resultados se concluye que en promedio el valor de la matrcula


equivale a 601060 pesos, adems que la mediana de todos los datos es 602694
pesos, a su vez se vemos que la distribucin es aproximadamente simtrica, ya
que su coeficiente (0.01288379) se encuentra en el intervalo -0,37 y 0,37.
Tambin podemos ver que tiene una distribucin platicurtica ya que su
coeficiente de curtosis es menor que 3, finalmente tenemos que el valor
promedio en que se desvan los datos de la media es 101009 pesos.
VALOR PROMEDIO:

mean(PROM) #media
[1] 3.060883
> median(PROM) #mediana
[1] 3.152232
> sd(PROM) #desviacion estandar
[1] 1.002021
> skewness(PROM) #coeficiente de asimetria
[1] -0.2873763
> kurtosis(PROM, type=1) #coeficiente de curtosis
[1] -0.6597898

A partir de los resultados se concluye que el promedio obtenido por los


estudiantes en el semestre anterior equivale a 3.060883, adems que la
mediana de todos los datos es 3.152232. La asimetra se considera negativa ya
que su coeficiente es -0.2873763, es decir que tiene una asimetra a la izquierda,
Tambin podemos ver que tiene una distribucin platicurtica ya que su
coeficiente de curtosis es menor que 3. El valor promedio en que se desvan los
datos de la media es 1,002021.
2.

CUARTILES VALOR DE LA MATRICULA:


quantile(VMATRI,0) #cuartil 0%
0%
263845.6
> quantile(VMATRI,0.25) #cuartil 25%
25%
532871.2
> quantile(VMATRI,0.5) #cuartil 50%
50%
602694.5
> quantile(VMATRI,0.75) #cuartil 75%
75%
670278.6
> quantile(VMATRI,1) #cuartil 100%
100%
973486.3

Podemos concluir que el primer cuartil equivalente al 25% de los datos est por
debajo de 532871.2, a su vez el segundo cuartil equivalente al 50% de los datos
est por encima de 602694.5 y el tercer cuartil equivalente al 75% de los datos est
por debajo de 670278.6

CUARTILES PROMEDIO DE NOTAS:

> quantile(PROM,0) #cuartil 0%


0%
0.3400412
> quantile(PROM,0.25) #cuartil 25%
25%
2.319512
> quantile(PROM,0.5) #cuartil 50%
50%
3.152232
> quantile(PROM,0.75) #cuartil 75%
75%
3.8555265
> quantile(PROM,1) #cuartil 100%
100%
4.968211

Podemos concluir que el primer cuartil equivalente al 25% de los datos est por
debajo de 2.319512, el segundo cuartil equivalente al 50% de los datos est por
encima de 3.152232 y el tercer cuartil equivalente al 75% de los datos est por
debajo de 3.8555265.
3.

En base a la informacin obtenida en la grfica anterior podemos concluir que la


hiptesis es falsa debido a que el grafico de dispersin nos muestra que estudiantes
que obtuvieron puntajes altos (mayores a 750), no necesariamente tienen sus
promedios altos (mayores a 4.0), por ende el sacar un buen puntaje no garantiza
tener un promedio alto en el semestre.
4.

Pareto chart analysis for table(FAC)


Frequency Cum.Freq. Percentage Cum.Percent.
Psicologia 1195.0000000 1195.0000000 54.1950113 54.1950113
Humanas 300.0000000 1495.0000000 13.6054422 67.8004535
Agronomia 250.0000000 1745.0000000 11.3378685 79.1383220
Medicina 200.0000000 1945.0000000 9.0702948 88.2086168
Arquitectura 120.0000000 2065.0000000 5.4421769 93.6507937
Ciencias 120.0000000 2185.0000000 5.4421769 99.0929705
Ingenieria 20.0000000 2205.0000000 0.9070295 100.0000000

Del grfico y tabla anterior podemos concluir que el 68% correspondiente a 1495
estudiantes se concentran en las facultades de psicologa y humanas, y a su vez
el 79% correspondiente a 1745 estudiantes se concentra en psicologa, humanas
y agronoma. Adems que solo el 0,09% correspondiente a 20 estudiantes
pertenecen a la facultad de ingeniera.
Cdigos empleados:

Importar bases de datos"


install.packages("xlsx")
library(xlsx)

"activar las variables"


attach(datos)
View(datos)

Para tabla de frecuencias (Horas):


Freq <- as.data.frame(table(HORAS))
Tabla <- transform(Freq, CumFreq = cumsum(Freq), Rel =
prop.table(Freq), CumRel=cumsum(prop.table(Freq)))
Tabla

Para calcular la media, mediana, desviacin estndar,


coeficiente de asimetra y coeficiente de curtosis:
(PROM y VMATRI)

mean(PROM)
median(PROM)
sd(PROM)
skewness(PROM)
kurtosis(PROM)

Para graficar los histogramas (PROM y VMATRI)

hist(PROM, ylab="Frecuencia", xlab=promedio,


main="Histograma Promedio obtenido semestre anterior",
col="green", las=1)

Para calcular los cuartiles (PROM y VMATRI) en el


punto 2
quantile(PROM,0)
quantile(PROM,0.25)
quantile(PROM,0.5)
quantile(PROM,0.75)
quantile(PROM,1)
Para graficar el diagrama de dispersin en el punto 3
plot(PUNTAJE, PROM, col="red", ylab="PROMEDIO",
main="Promedio vs Puntaje", pch=21, las=1)

Para graficar diagrama de Pareto y tabla en el punto 4

install.packages("qcc")
require(qcc)
pareto.chart(table(FAC),las=1, ylab="Frecuencia", main="Grafico
de pareto estudiantes por facultad", ylab2="porcentaje
acumulado")

También podría gustarte