Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Ficha - 2 Leire Susinos

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Estadística Descriptiva

Ficha 2

Universidad Camilo José Cela

Prof. Guido Corradi

Prof. Eduardo García Garzón


1. Una semana antes de los exámenes, un profesor pregunta a sus alumnos que
evalúen su nivel de nervios antes los exámenes (nada, un poco nervioso, muy
nervioso). Tras recoger las respuestas de 80 estudiantes, obtiene los siguientes
resultados:

Xi ni Pi na Pa

Nada 20 0,25 0 0,0


Un poco nervioso 50 0,65 50 0,875
Muy nervioso 10 0,12 10 0,95
Total 80 1

Responde a las siguientes preguntas:

1.1. Parece que nuestro profesor estaba un poco nervioso también cuando realizó el
análisis, ya que ha cometido varios errores. ¿Puedes identificarlos? Corrige los
resultados para realizar el resto de los análisis correctamente.
Xi ni Pi na Pa

Nada 20 0,25 20 0,25


Un poco nervioso 50 0,625 70 0,875
Muy nervioso 10 0,125 80 1
Total 80 1

1.2.¿Cuál es la proporción de sujetos que estaban un poco nerviosos? ¿Qué porcentaje


de sujetos indicaban estar nerviosos (e.g., están un poco o muy nerviosos)?
El 62,5% estaba “un poco nervioso”.

1.3.¿Qué estadístico central usarías para describir esta variable? Razona tu respuesta.
Yo, en este caso, usaría la moda, para saber donde se encuentran la mayoría de los
alumnos.

1.4.¿Cómo describirías la forma y la dispersión de esta variable? Razona tu respuesta.


Podemos decir que la dispersión de esta variable es concentrada, ya que al situarla
en un grafico vemos como las variables no llegan hasta el mismo punto.
2. Una profesora de universidad quiere conocer qué método de evaluación es preferido por
sus estudiantes. De una lista de opciones, cada uno de los 90 estudiantes debe elegir su
método preferido. 40 de ellos indican preferir un único examen final, 35 prefieren
evaluación por pares y el resto, evaluación por trabajos. Nadie eligió la opción de
evaluación con exámenes parciales.

Con esta información, completa la siguiente tabla y responde a las siguientes preguntas.

Xi �� �� �� ��
Examen final 40 0.44 40 0.44
Exámenes parciales 0 0 40 0.44
Evaluación por pares 35 0.39 75 0.83
Evaluación por 15 0.17 90 1
trabajos
Total 90 1

2.1.¿Cuál es la frecuencia relativa para la categoría de evaluación por trabajos? ¿cómo


interpretamos dicho dato? Razona tu respuesta.
En este caso, la frecuencia relativa acumulada para la última categoría siempre
debería ser igual a 1 menos la suma del resto de frecuencias realativas. Sin embargo,
no tiene sentido interpretar este dato ya que se trata de una variable categórica
nominal, no ordinal (no existe un orden lógico de estas categorías). En la categoría
de evaluación por trabajos, su frecuencia relativa es 0.17 o 17%.

2.2.¿Cuál es la proporción de estudiantes que desean la evaluación por pares? ¿tiene


sentido calcular esta frecuencia relativa? Razona tu respuesta.
La frecuencia relativa para evaluación por pares es 0.39 (o 39%). En este caso,
podemos interpretar este dato sin ningún problema.

2.3.¿Cuál es la frecuencia relativa acumulada para la categoría del examen final? ¿cómo
interpretamos dicho dato? Razona tu respuesta.
En este caso, la frecuencia relativa acumulada para la primera categoría siempre
debería ser igual que la frecuencia relativa. Sin embargo, no tiene sentido interpretar
este dato ya que se trata de una variable categórica nominal, no ordinal (no existe un
orden lógico de estas categorías). En la categoría de examen final, su frecuencia
relativa acumulada es 0.44 o 44%.
3. Un psicólogo quiere conocer cómo los jóvenes utilizan las redes sociales. Para ello,
selecciona a los alumnos de tres clases de un instituto (segundo, tercero y cuarto de la
ESO) y valora si los alumnos muestran un comportamiento responsable de sus redes
sociales.

Nuestro psicólogo obtiene los siguientes resultados:

Segundo Tercero Cuarto Total


ESO ESO ESO

Uso responsable 5 7 18 30
Uso no responsable 30 23 17 70
Total 35 30 35 100

Realiza los siguientes cálculos, indicando en cada caso los datos utilizados para calcular el
porcentaje o proporción indicado (p.ej., 30/100 = 0.30 o 30%).

3.1.¿Qué porcentaje de todos los alumnos no utilizaban las redes de manera responsable?
¿qué porcentaje de todos los alumnos estaba en 2º de la ESO y usaban las redes de
manera responsable?
Viendo la tabla que hay situada arriba, podemos llegar a la conclusión de que solo el
5% de los alumnos de 2º de la E.S.O. usaban las redes de forma responsable; y que
el 70% de los alumnos no utilizaba las redes de manera responsable.

3.2.Dentro de los alumnos de 3º de la ESO, ¿qué porcentaje realizaba un uso no


responsable de sus redes sociales? Dentro de los alumnos que utilizaban las redes
sociales de manera responsable, ¿qué porcentaje iban a 4º de la ESO?
Dentro de los alumnos de 3º de la E.S.O., podemos observar que solo el 23% de
ellos no hacía un uso responsable de sus redes sociales. En cambio, en el grupo de 4º
de la E.S.O., el 18% de los alumnos usaban las redes sociales de forma responsable.

3.3.¿A qué conclusión llegarías sobre la relación entre el uso de las redes sociales y el
curso académico?
Observando los datos que hay en la tabla, podemos llegar a la conclusión de que
conforme los alumnos van pasado de curso, van actuando de forma mas responsable
respecto al uso de las redes sociales, con lo que podemos concluir que los alumnos
podrían usar menos tiempo a las redes y más a los estudios. Esto se puede observar
comparando el curso de 4º de la E.S.O., el cual tiene más de la mitad de los alumnos
con un uso responsable, y si vamos bajando los cursos, ese porcentaje disminuye.
4. Un grupo de investigadores se preguntan por el impacto psicológico que puede tener
una potencial crisis económica en la sociedad. Para ello, pasan la escala de
Expectativas Negativas sobre el futuro revisada (NSF-R) a un grupo de personas con
diferentes niveles educativos. Este cuestionario proporciona una puntuación 0-100
(en saltos de 10 puntos), donde puntuaciones más altas representan expectativas
más negativas. Tras recoger los datos de 350 personas, los investigadores observan
los siguientes resultados:

Puntuación ��
10 15
20 22
30 24
40 31
50 44
60 41
70 20
80 35
90 15
100 3

Puntuación �� �� �� ��
10 15 0.06 15 0.06
20 22 0.09 37 0.15
30 24 0.10 61 0.24
40 31 0.12 92 0.37
50 44 0.18 136 0.54
60 41 0.16 177 0.71
70 20 0.08 197 0.79
80 35 0.14 232 0.93
90 15 0.06 247 0.99
100 3 0.01 250 1.00
350 1

4.1.¿Cuál es el valor aproximado del centil 50 (C50) de la distribución de estas


puntuaciones?
El valor del centil 50, es decir, de C50 es 54.
4.2.¿Cuál es el rango intercuartil de esta variable?
Podemos decir que el rango intercuartil ( Rq = Q3-Q1) de esta variable es 18: (Q1: 6;
Q3: 24) Rq = 24-6 = 18.
4.3.¿Qué porcentaje de gente obtuvo una puntuación inferior a 40? ¿Qué número de
personas obtuvieron una puntuación mayor a 70?
Podemos ver en la tabla como 232 personas tuvieron una puntuación mayor de 70; y
que el 24% de la gente obtuvo una puntuación menor de 40.
5. El grupo de investigadores se pregunta qué papel juega la educación recibida en
dichas expectativas. Para describir esta relación, realizan un gráfico de caja y bigotes
por cada nivel educativo alcanzado, y añaden la media a los mismos (cuadrado
negro). ¿Podrías ayudarles a interpretar estos resultados?

5.1.¿Qué grupo tiene peores expectativas acerca de su futuro? ¿Qué grupo muestra una
menor preocupación por su futuro? Razona tu respuesta.

Compaando la media con los resultados individuales, podemos llegar a la conclusión de


que el grupo con peores expectativas es el e Primaria y, por el contario, el hrupo con
una menor preocupación es el de MBA.

5.2.¿Qué grupo muestra puntuaciones más homogéneas? ¿Qué grupo presentará un


rango intercuartil mayor? Razona tu respuesta.

Podríamos decir que el grupo que muestra unas puntuaciones más homogeneas es el que
tiene el cuadrado más pequeño, ya que esto quiere decir que sus puntuaciones se encuentran
más cercanas. En este ejemplo tendríamos que el grupo con puntuaciones más homogéneas es
el grupo MBA.

Por otro lado, el grupo que muestra un rango intercuartil mayor (que la Q1 y la Q3 tienen más
distancia entre sí) es el grupo de secundaria.
5.3.¿Por qué coinciden la mediana y la media para la gente que tiene estudios de
Primaria, pero son diferentes para las personas que tienen estudios universitarios?
¿Qué estadístico elegirías en cada caso? Razona tu respuesta.
Para el grupo de primaria, yo elegiría la media porque en la caja en la que podemos
observar tanto la media como la mediana vemos que estan al mismo nivel, pero en
este caso, la media nos da más información. Estos dos estadísticos coinciden porque
ambos se encuentran dentro del parámetro (mínimo/máximo) de la caja de bigotes.

En cambio, par el grupo de universitarios, habría que escoger la mediana porque


este grupo contiene individuos más dispersos, esto provoca que la media y la
mediana no sean iguales o no tengan el mismo valor, y por lo tanto la media se ve
afectada.

5.4.¿Qué estadístico (media, moda, mediana) preferiríamos para describir la tendencia


central de las personas con estudios de Secundaria? ¿Y para las personas con
estudios de MBA? Razona tu respuesta.
Para el grupo de secundaria yo elegiría la mediana porque la distancia que podemos
ver enntre la Q3 y el máximo es bastante larga, lo que provoca que el resultado d la
media salga alterado. Por el contario, para el grupo de MBA, como los datos son
más similares habría que seleccionar la media, puesto que nos da más infromación.

5.5.¿Qué representan los puntos resaltados en los gráficos de las personas con estudios
universitarios y doctorados (PhD)? ¿Cómo afectan al cálculo de la media en ambos
casos? Razona tu respuesta.
En el gráfico podemos ver como la media se ve alterada, ya que ambos grupos
poseen individuos que superan el máximo de la escala, por lo tanto, no coinciden
con la mediana.

5.6.Si calculamos la curtosis de las puntuaciones para los siguientes grupos: Primaria= -
0,15; Universidad= -3.75; MBA = 4.5. ¿Qué podemos decir de las puntuaciones de
cada grupo en cada caso? Razona tu respuesta.
 Primaria: se encuentra cerca del 0, por lo tanto es mesocúrtica.
 Universidad: se encuentra lejos del 0 y es negativo, por lo tanto es platicúrtica.
 MBA: se encuentra lejos del 0 aunque es positivo, por lo tanto es leptocúrtica.
6. Decide que estadísticos de tendencia central, dispersión y forma elegirías para analizar
las siguientes variables.

6.1.Número de personas que prefieren cada plataforma de streaming (i.e., eligiendo


entre HBO, Netflix, Amazon Prime o Filmin).
Para poder proceder al análisis de estas variables disponemeos de varios estadísticos,
como son la media, la moda y la mediana, la varianza, el rango intercuartil y la
desviación típica, o la asimetría y la curtosis. Son para estudiar la tendencia central,
la dispersión y la forma, respectivamente.

En el caso de las plataformas de streeaming, hay algunas que son más conocidas o
se usan más, lo que hace que a la hora de realizar un gráfico encontremos valores
extremos o muy dispersos. Por esto, es mejor usar la mediana antes que la media
para conocer la posición central de los valores. Por otro lado, en caso de querer
saber cúal es la más utilizada, habría que escoger la moda.

Para conocer la dispersión habría que elegir el rango intercuartil, ya que gracias a él
podremos conocer la diferencia entre los valores situados en el primer cuartil y los
valores situados en el tercero.

Finalmente, para estudiar la forma de estos datos estadísticos, habría que usar la
curtosis, gracias al cual se conocerá el grado de concentración de las puntuaciones
respecto al valor medio.
6.2.Precio de venta de las casas en un barrio de Madrid (ver siguiente gráfico).

Podemos observar un gráfico con una distribución bastante picuda, es dceir, con una
forma totalmente ieptocúrtica.

Observando este gráfico, podemos llegar a la conclusión de que no muchos valores se


repiten, por lo tanto, antes que usar la moda sería más recomendable usar la mediana.

Al igual que en el apartado anterior, para conocer la desviación típica, debemos usar el
rango intercuartil, ya que al tener valores tan dispersos la desviación típica no nos
aportaría tanta información.
6.3.Número de clientes según la hora de apertura de un negocio (ver siguiente gráfico).

En este gráfico, como podemos observar, no hay valores que sean demasiado extremos,
por este motivo sería recomendable utilizar la media, ya que no hay unos valores que la
vayan a modificar demasiado.

En relación a los estadísticos de dispersión, y al usar la media, lo mejor sería utilizar la


desviación típica ya que nos va a aportar bastante información.

Finalemnte, en cuanto a la forma del gráfico, vemos que es totalmente simétrico, ya que
si lo dividimos por el punto medio a dos partes iguales obtendríamos el mismo gráfico
pero a la inversa.
7. Cómo experto en análisis de datos, una compañía pide que modifiques dos gráficos
según sus objetivos. Para realizar tus versiones de estos gráficos, puedes utilizar el
software que prefieras (Excel, powerpoint, dibujarlo a mano, etc.). Por favor, asegúrate
que el gráfico se puede leer correctamente. El gráfico no tiene que ser exacto, pero si
aproximado a los datos que se ofrecen. Puedes cambiar los elementos del gráfico que
prefieras: manipular los ejes, cambiar el orden de las categorías, etc…

7.1.Los siguientes datos representan las ventas de varios productos en un nicho de


mercado determinado durante la semana del Black Friday. Como nuestro producto
(Producto C) es el más elegido por los consumidores de este nicho, nos gustaría un
gráfico en el que se vieran de manera lo más clara posibles las diferencias entre los
grupos. La empresa os da los datos y un gráfico inicial que ellos habían realizado
como punto de partida para que realicéis vuestro gráfico.

7.2.Utilizando los datos anteriores, imagínate que ahora es la compañía responsable del
Producto D (el producto menos elegido) la que quiere que realices un gráfico en el
que se minimizasen las diferencias entre el número de productos vendidos. ¿Qué
gráfico realizarías?

También podría gustarte