Estadistica Descriptiva 2021
Estadistica Descriptiva 2021
Estadistica Descriptiva 2021
ESTADÍSTICA DESCRIPTIVA
Introducción
Este texto tiene un enfoque práctico, respetando el principio que la Estadística debe ser
una herramienta fundamental para describir procesos y tomar decisiones en el trabajo
cotidiano de cualquier profesional. En el mismo se trató de romper la dicotomía entre
teoría y realidad, respondiendo permanentemente a la pregunta ¿Cuándo puedo usar
esta teoría? ¿Qué me permite conocer o responder la misma? Por lo que se puede
describir “la estadística” como: “un conjunto de técnicas para describir grupos de datos y
para tomar decisiones en ausencia de una información completa”.
¿Qué es la estadística?
Cuando coloquialmente se habla de estadística, se suele pensar en una relación de datos
numéricos presentada de forma ordenada y sistemática. Esta idea es la consecuencia
del concepto popular que existe sobre el término y que cada vez está más extendido
debido a la influencia de nuestro entorno, ya que hoy día es casi imposible que cualquier
medio de difusión, periódico, radio, televisión, etc., no aborde a todo el mundo
diariamente con cualquier tipo de información estadística sobre accidentes de tráfico,
índices de crecimiento de población, turismo, tendencias políticas, etc.
La Estadística es una disciplina que utiliza recursos matemáticos para organizar y resumir
una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de
ellos.
Los métodos estadísticos pueden y deberían ser usados en todas las etapas de una
investigación, desde el comienzo hasta el final. Existe el convencimiento de que la
1
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
estadística trata con el ANÁLISIS DE DATOS (quizás porque esta es la contribución más
visible de la estadística), pero este punto de vista excluye aspectos vitales relacionados
con el DISEÑO DE LAS INVESTIGACIONES. Es importante tomar conciencia que la
elección del método de análisis para un problema, se basa tanto en el tipo de datos
disponibles como en la forma en que fueron recolectados.
Se puede por tanto clasificar la Estadística en descriptiva, cuando los resultados del
análisis no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo
del estudio es derivar las conclusiones obtenidas a un conjunto de datos más amplio.
Conceptos básicos:
2
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Una variable estadística permite realizar una clasificación de los individuos de una
población que se consideran como equivalentes. Se colocan en una misma clase las
unidades estadísticas que se consideran equivalentes. Cada clase se llama modalidad
del carácter estadístico.
3
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que una
modalidad ha sido observada, es decir el número de veces que aparece en la muestra
dicho valor de la variable.
Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al
aumentar el tamaño de la muestra aumentará también el tamaño de la frecuencia
absoluta. Esto hace que no sea una medida útil para poder comparar. Para esto es
necesario introducir el concepto de frecuencia relativa, que es el cociente entre la
frecuencia absoluta y el tamaño de la muestra.
Porcentaje
La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente
hablar siempre en términos de tantos por ciento o porcentajes, por lo que esta medida
resulta de multiplicar la frecuencia relativa por 100.
Porcentaje Acumulado:
Análogamente se define el Porcentaje Acumulado como la frecuencia relativa acumulada
por 100.
Intervalos de clase:
Los intervalos se usan cuando la variable es cuantitativa continua o cuando los datos son
discretos pero muy numerosos.
Si se reúnen grandes cantidades de datos sueltos es útil distribuirlos en clases o
categorías y determinar el número de individuos que pertenecen a cada categoría, a lo
que se le llama frecuencia de clase. A una disposición tabular de los datos por clases,
4
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
El mundo presenta una enorme variabilidad. Por ejemplo, los seres vivos son distintos
entre sí, y aportan diversidad a la población. Muchas son las características que pueden
variar entre individuos (en el ser humano: altura, color de pelo, sexo, edad, respuesta a
tratamientos, entre muchos otros). Se las llama variables y se las puede clasificar como
se indica en la siguiente tabla:
Variables cualitativas Nominales: Sus valores no se pueden ordenar. Por ejemplo: sexo (F o
No se pueden medir M), grupo sanguíneo (A, B, AB, 0, entre otros), religión, nacionalidad,
numéricamente. No etc.
permiten realizar Ordinales: Sus valores se pueden ordenar. Por ejemplo: mejoría de un
operaciones algebraicas. paciente ante un tratamiento (muy mejorado, moderado, poco
Pueden ser nominales u mejorado, sin mejoras), grado de satisfacción (muy, medianamente,
ordinales. poco, nada satisfecho), intensidad del dolor, etc.
Variables cuantitativas Discretas: sólo pueden tomar valores enteros (1, 2, 25, -12, etc.). Por
Tienen valor numérico ejemplo: número de hijos (puede ser 1, 2, 3, etc., pero nunca podrá ser
(edad, altura, ingresos 3,5).
mensuales). Se pueden Continuas: pueden tomar cualquier valor real dentro de un intervalo.
clasificar en discretas y Por ejemplo, la altura de las personas puede ser 1,65 m; 1,70 m; 1,90
continuas. m; etc.
5
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Tablas Estadísticas:
A partir de este momento se van a trabajar las estadísticas de una sola variable, llamadas
"Estadísticas Unidimensionales".
Las tablas estadísticas según el número de observaciones y según el recorrido de la
variable estadística, así se tienen los siguientes tipos de tablas estadísticas:
1. Tablas Tipo I
2. Tablas Tipo II
3. Tablas Tipo III
Tablas tipo I:
6
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3
Se puede observar que la variable toma valores comprendidos entre 1 y 4, por lo que se
precisa una tabla en la que se resuman estos datos quedando la siguiente tabla:
Evidentemente, la variable estadística tiene un recorrido muy grande, 4998 (en miles de
pesos), por lo que sí se quiere hacer una tabla con estos datos se tendrán que tomar
intervalos. Para decidir la amplitud de los intervalos, se necesita decidir ¿Cuántos
intervalos se quieren? Normalmente se suele trabajar con no más de 10 o 12 intervalos.
Amplitud =4998/10 = 499,8 Por lo que se tomaran intervalos de amplitud 500
7
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Este es otro ejemplo. Al medir la altura de los niños de una clase, se obtienen los
siguientes resultados (en metros)
Una vez obtenida una tabla de frecuencias, se puede representar mediante un gráfico.
En estadística se denominan gráficos a aquellas imágenes que, combinando la utilización
de colores, puntos, líneas, símbolos, números, texto y un sistema de referencia
(coordenadas), permiten presentar información cuantitativa. La utilidad de los gráficos es
doble, ya que pueden servir no sólo como sustituto a las tablas, sino que también
constituyen por sí mismos una poderosa herramienta para el análisis de los datos, siendo
en ocasiones el medio más efectivo no sólo para describir y resumir la información, sino
también para visualizarla y analizarla.
8
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Ejemplo 1
2 4 2 3 1 2 4 2 3 0 2 2 2 3 2 6 2 3 2 2 3 2 3 3 4
3 3 4 5 2 0 3 2 1 2 3 2 2 3 1 4 2 3 2 4 3 3 2 2 1
Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable se está estudiando?
c) ¿Qué tipo de variable es?
d) ¿Construir la tabla de frecuencias?
e) ¿Cuál es el número de familias que tiene como máximo 2 hijos?
f) ¿Cuántas familias tienen más de 1 hijo, pero como máximo 3?
¿Qué porcentaje de familias tiene más de 3 hijos?
Solución:
a) La población objeto de estudio es el conjunto de familias de un determinado
país.
b) La variable que se está estudiando es el número de hijos por familia
c) El tipo de variable es discreta ya que el número de hijos solo puede tomar
determinados valores enteros (es imposible tener medio o un cuarto de hijo).
d) Para construir la tabla de frecuencias se tiene que ver cuántas familias tienen un
determinado número de hijos. Se puede ver que el número de hijos, toma los valores
existentes entre 0 hijos, los que menos y 6 hijos, los que más, y se tiene:
xi ni Ni Fi Fi
0 2 2 0.04 0.04
1 4 6 0.08 0.12
2 21 27 0.42 0.54
3 15 42 0.30 0.84
4 6 48 0.12 0.96
5 1 49 0.02 0.98
6 1 50 0.02 1.00
N = 50 1.00
9
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Ejemplo 2
Un nuevo hotel va a abrir sus puertas en cierta ciudad. Antes de decidir el precio de
sus habitaciones, el gerente investiga los precios por habitación de 40 hoteles de la
misma categoría de esa ciudad. Los datos obtenidos en dólares fueron:
3,9 4,7 3,7 5,6 4,3 4,9 5,0 6,1 5,1 4,5
5,3 3,9 4,3 5,0 6,0 4,7 5,1 4,2 4,4 5,8
3,3 4,3 4,1 5,8 4,4 4,8 6,1 4,3 5,3 4,5
4,0 5,4 3,9 4,7 3,3 4,5 4,7 4,2 4,5 4,8
Se pide:
a) ¿Cuál es la población objeto de estudio?
b) ¿Qué variable se está estudiando?
c) ¿Qué tipo de variable es?
d) ¿Qué problema plantea la construcción de la tabla de frecuencias?
e) ¿Cuántos hoteles tienen un precio entre 3,25 USD y 3,75 USD?
f) ¿Cuántos hoteles tienen un precio superior a 4,75 USD?
g) ¿Qué porcentaje de hoteles cuestan como mucho 4,25 USD?
SOLUCIONES:
a) La población objeto de estudio son los hoteles de una ciudad.
b) La variable que se está estudiando es el precio.
c) El tipo de variable es continua.
d) El problema que plantea es que existen muchos valores diferentes para por tanto
es bueno agrupar la serie en intervalos.
La manera de hacerlo sería la siguiente: primero, se calcula el recorrido
Re = xn– x1= 6.1 –3.3 = 2.8
Cuando no se dice nada, el nº de intervalos, se obtiene calculando la raíz cuadrada
del nº de datos observado. El resultado de la raíz cuadrada de 40 es igual a 6.32 por lo
tanto se toman 6 intervalos.
Como el recorrido es 2.8 si lo se divide por el nº de intervalos se tiene la amplitud de
cada uno de ellos y así: 2,8/6 = 0,46.
Importante: La amplitud es de 0,46 por lo que además de no ser muy fácil operar,
puede que no cubra el rango de la variable. Se puede evitar, tomando un valor superior,
en este caso 0,5:
[Li-1,, Li) ni Ni Fi Fi
[3,25,3,75) 3 3 0.075 0.075
[3,75,4,25) 8 11 0.200 0.275
[4,25,4,75) 14 25 0.350 0.625
[4,75,5,25) 6 31 0.150 0.775
[5,25,5,75) 4 35 0.100 0.875
[5,75,6,25) 5 40 0.125 1.000
N= 40
e) 3
f) 15
g) %=F2*100=0.275*100=27.5%
10
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
¿Cuál será la medida de tendencia central que se debe usar, teniendo un conjunto de
observaciones?, para responder a este cuestionamiento, se debe tomar en cuenta la
necesidad de considerar dos factores muy importantes uno es la escala de medición, que
tiene que ser ordinal o numérica; y otra, la forma de distribución de las observaciones,
porque se tiene que saber si la distribución de las observaciones se desvía a la izquierda
o a la derecha de la media. Si hay observaciones distantes en una sola dirección se trata
de una distribución sesgada. Si los valores distantes son pequeños se sesga a la
izquierda, sesgo negativo. Si los valores distantes son grandes se sesga a la derecha,
sesgo positivo.
Las siguientes reglas deben considerarse al decidir cuál medida se aplicará a las
observaciones del trabajo de investigación. La media se usa para datos numéricos y
distribuciones simétricas, es decir sin ningún tipo de sesgo, y es sensible a los valores
absolutos. La mediana se emplea para datos ordinales o para datos numéricos con
distribución sesgada, porque no es sensible a la variación de los extremos. El modo se
utiliza para distribuciones bimodales (dos observaciones que se repiten el mismo número
de veces en la distribución). Una forma de saber la forma que tiene la distribución de
observaciones es la siguiente: Si la media y la mediana son iguales la distribución es
simétrica (se usa la media). Si la media es mayor que la mediana, la distribución está
sesgada a la derecha. Si la media es menor que la mediana la distribución está sesgada
a la izquierda (en los últimos dos casos, se usa la mediana).
Además de dar información sobre la tendencia central de los datos y sobre cómo se
reparten respecto del centro, en ocasiones interesa conocer si los datos se reparten de
un modo simétrico a ambos lados de la media o no.
11
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Las medidas de la asimetría, al igual que la curtosis, van a ser medidas de la forma de la
distribución, es frecuente que los valores de una distribución tiendan a ser similares a
ambos lados de las medidas de centralización. La simetría es importante para saber si
los valores de la variable se concentran en una determinada zona del recorrido de la
variable.
12
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
- En primer lugar, dar un valor lo más representativo posible de todos los valores de la
muestra, que no sea, por tanto, ni de los más bajos ni de los más altos. Así se crean
las medidas o parámetros de centralización, tendencia central o posición central.
- En segundo lugar, y como complemento a lo anterior, dar una valoración de hasta qué
punto los datos se parecen entre sí o bien están muy diferenciados (dispersos);
además, cuanto más se parezcan entre sí los valores que salen, más se parecerán al
representante o parámetro de centralización que se elijan, y mejor sería éste. Por todo
esto conviene medir las diferencias internas de los datos mediante las medidas ó
parámetros de dispersión.
- Finalmente, en tercer lugar, se puede también tratar de medir qué valor supera a una
cierta porción o proporción de valores, o lo que es lo mismo, tratar de informar sobre
la distribución de la variable diciendo a cuántos de sus valores supera uno dado. Para
ello se usan los cuantiles como medidas ó parámetros de posición.
A continuación, se definen los más importantes entre todos los parámetros de estos tres
tipos y para ilustrar su cálculo se usará el siguiente ejemplo, donde los datos son el
número de hermanos (excluido él mismo) de una muestra de 13 niños; se presentan los
13
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
datos ordenados de menor a mayor para mejor comprensión, pero en principio los datos
vendrían en cualquier orden. Suponiendo que son los siguientes:
0 0 0 0 1 1 1 2 2 3 4 5 7
Las medidas de posición facilitan la información sobre la serie de datos que se está
analizando. Estas medidas permiten conocer diversas características de esta serie de
datos.
14
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Según el tipo de datos que se analice será más apropiado utilizar la media
aritmética o la media geométrica.
c) Media ponderada
Fórmula:
15
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Ejemplo
d) Medias recortadas
Las Medias recortadas tienen por finalidad evitar la distorsión que las
puntuaciones extremas no compensadas causan a la Media aritmética.
Para obtener la Media recortada se excluyen las puntuaciones de los
extremos superior e inferior de la distribución, como el 10% de las
puntuaciones del extremo superior y el 10% de las puntuaciones del
extremo inferior. Ejemplo:
16
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Luego:
Xm = 1,253
Luego:
Xm = 1,253
17
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
3.- Mediana:
La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de
los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna
de frecuencias relativas acumuladas.
4.- Moda:
Se pude decir que los Cuantiles son unas medidas de posición que dividen a la
distribución en un cierto número de partes de manera que en cada una de ellas hay el
mismo de valores de la variable.
Primer percentil, que supera al uno por ciento de los valores y es superado por el
noventa y nueve por ciento restante.
19
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
1º cuartil: es el valor 1,22 cm, ya que por debajo suya se sitúa el 25% de la
frecuencia (tal como se puede ver en la columna de la frecuencia relativa
acumulada).
2º cuartil: es el valor 1,26 cm, ya que entre este valor y el 1º cuartil se sitúa
otro 25% de la frecuencia.
3º cuartil: es el valor 1,28 cm, ya que entre este valor y el 2º cuartil se sitúa
otro 25% de la frecuencia. Además, por encima suya queda el restante 25% de
la frecuencia.
Atención: cuando un cuartil recae en un valor que se ha repetido más de una vez (como
ocurre en el ejemplo en los tres cuartiles) la medida de posición no central sería realmente
una de las repeticiones.
20
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
MEDIDAS DE DISPERSIÓN
21
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Luego:
Cv = 0,0320 / 1,253
Luego,
Cv = 0,0255
22
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
¿Qué es la inferencia?
Tras haber elegido el estudio, la población objetivo, la muestra, haber realizado
cálculos con la muestra (Media, mediana, los percentiles, la varianza, etc.) aparece
una pregunta:
¿Las medidas que se han calculado en la muestra serían las mismas que si se
calcularan en la población?
Los intervalos de confianza tienen un límite inferior, valor mínimo, y un límite superior,
valor máximo, y llevan siempre un nivel de confianza (1-α), un porcentaje de acierto
(en 1-α en tanto por uno), por llamarlo de algún modo. A mayor nivel de confianza
más amplia será la ventana.
23
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
1
https://support.minitab.com/es-mx/minitab/18/help-and-how-to/statistics/basic-statistics/supporting-
topics/basics/what-is-a-confidence-interval/
24
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
25
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
GRÁFICOS ESTADÍSTICOS
A la hora de hacer un gráfico hay que tener en cuenta las siguientes consideraciones:
Deben ajustarse a la realidad de los datos que representan
Deben ser claros, fáciles de leer y entender
Deben llevar todas la indicaciones necesarias para su fiel interpretación
Deber ser los adecuados para el carácter estadístico que visualizan.
Diagramas de barras:
Es una gráfica que consta de rectángulos, cuyas áreas representan las frecuencias de
cada clase.
Histogramas:
Es una gráfica que asocia a cada intervalo de
una variable cuantitativa, un rectángulo cuya
área coincide con la frecuencia.
26
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Polígonos:
27
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
• Su formato es libre.
• Emplean una secuencia de símbolos para representar frecuencias.
• Se emplean para el tratamiento de datos tanto cualitativos como cuantitativos.
• Los pictogramas son diagramas poco precisos y, por tanto, escasamente utilizados
por los expertos, pero son de sencilla interpretación para los menos entendidos.
Una forma de ordenar “rápidamente” los datos es a través del método conocido como
diagrama de tallo y hojas, es muy sencilla y permite mostrar la forma de la distribución de
una variable numérica.
Para construir el diagrama se tabulan los datos en varias filas. Cada fila está encabezada
por un tallo, y detrás de él se escriben ordenados e igualmente espaciados los dígitos
que forman las hojas correspondientes a cada tallo. Para la variable Diámetro:
Diámetro, datos 2.5 2.5 2.9 3.9 3.9 3.9 4.2 4.3 4.5 5.3
ordenados
De cada dato, Tallo 2 2 2 3 3 3 4 4 4 5
Hoja 5 5 9 9 9 9 2 3 5 3
Tallo Hojas
2 5 5 9
3 9 9 9
4 2 3 5
5 3
Para completar la información se suele añadir una columna delante del tallo en la que se
cuentan las frecuencias de cada tallo acumulándolas de arriba hacia abajo y viceversa,
en el tallo donde se encuentre el dato mediano se escribe solamente la frecuencia de ese
tallo, encerrada entre paréntesis.
28
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Si se desea se pueden marcar las filas donde estén los cuartiles colocando un asterisco
a continuación de la frecuencia. Para los datos anteriores:
Frecuencias Tallo Hojas
3* 2 5 5 9
(3) 3 9 9 9
4* 4 2 3 5 7
1 5 3
Ejemplo con la Edad de 20 personas2
Suponiendo la siguiente distribución de frecuencias
36 25 37 24 39 20 36 45 31 31
39 24 29 23 41 40 33 24 34 40
que representan la edad de un colectivo de N = 20 personas y que se va a representar
mediante un diagrama de Tallos y Hojas.
Se empieza seleccionando los tallos que en este caso son las cifras de decenas, es decir
3, 2, 4, que reordenadas son 2, 3 y 4.
2 http://www.estadisticaparatodos.es/taller/graficas/tallos_hojas.htmln
29
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Diagrama de Caja – Caja y Bigotes de Gato - Cajón y pata Caja y Sesgo – Caja
y punto – Box-and-Whisker Plots - Box-plot:
A continuación, y desde el centro de cada uno de los lados de la caja se lleva un segmento
horizontal que termina en el los valores observados menor y mayor que no son outliers,
si los hay, o en los valores menor y mayor de los observados. Si hay outliers se marcan
con símbolos especiales, por ejemplo, * para los leves y # para los graves.
El diagrama de caja y bigotes para la variable diámetro es:
El bigote empieza con el menor dato y termina con el mayor. Se puede ver que la
distribución presenta una cola o asimetría hacia la izquierda y que hay dos outliers leves;
3 Un outlier es un dato que no encaja bien dentro de la distribución de los otros datos en una lista.
30
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
GRÁFICOS ENGAÑOSOS
Los gráficos XY por convención se representan respetando una relación 4:3 entre el eje
horizontal y el vertical, prácticamente todos los paquetes que construyen gráficos
respetan esta convención. La siguiente figura muestra cuatro representaciones diferentes
de los mismos datos de una serie anual donde se pretende mostrar como estos cambios
pueden afectar la interpretación de la imagen.
La figura (a) muestra el gráfico obtenido respetando la relación 4:3 y usando la escala del
eje vertical que comienza en cero. Se observa una tendencia moderadamente creciente
y fluctuaciones moderadas.
31
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Todos los gráficos de la figura anterior son correctos en el sentido que se construyeron
usando la misma información (no se ha falseado o modificado los datos para construirlos).
Sin embargo, algunos de ellos producen impresiones engañosas amplificando o
disimulando diferencias que existen.
32
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
USO DE EXCEL
1. En el menú Herramientas seleccione la opción Análisis de datos.
2. Seleccione la opción Estadística descriptiva.
3. Seleccione el rango de entrada, estos corresponden a los datos numéricos de
la tabla.
4. Seleccione Resumen de estadísticas.
5. En opciones de salida seleccione en Rango de salida, una celda de la hoja de
cálculo que este en blanco (a partir de esta celda serán insertados los
resultados).
La hoja mostrará las siguientes medidas estadísticas de los datos presentados:
Columna1
Media 50.0537692
Error típico 1.9738137
Mediana 49.345
Moda 50.1
Desviación
estándar 22.5049388
Varianza de la
muestra 506.47227
Curtosis -0.4466339
Coeficiente de
asimetría -0.0352296
Rango 94.37
Mínimo 2.41
Máximo 96.78
Suma 6506.99
Cuenta 130
El Error Típico o desviación estándar (SD) representa la variación en los valores de una
variable, mientras que el error estándar4 de la media (Estándar Error of the Mean, SEM)
representa la dispersión que tendría la media de una muestra de valores si se continuaran
tomando muestras. Por lo tanto, el SEM proporciona una idea de la precisión de la media
y el SD nos da una idea de la variabilidad de las observaciones individuales. Estos dos
parámetros están relacionados5:
SEM = SD/√n
Donde:
SEM = Error estándar de la media
SD = Desviación estándar
n = tamaño de la muestra
33
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Partiendo con la idea de que hay muchas muestras posibles, también hay que decir que
cada muestra tiene su media muestral6.
Así se tendría una media de cada muestra que se tome, a esto se le llama distribución
muestral de la media. Y resulta que la media de esas medias coincide con la media
poblacional.
Imagine que está realizando una encuesta y elige al azar 1.000 personas para la
encuesta. Este grupo es una muestra. Puede elegir otra muestra aleatoria de 1.000
personas, y otra muestra, y otra muestra y etcétera. A continuación, puede calcular la
media para cada muestra. La distribución de estas medias muestrales es la distribución
de muestreo. Al calcular la desviación estándar de esta distribución, obtendrá el error
estándar de la media. Cuando el error estándar se escribe sin cualificación, se da por
supuesto que es el error estándar de la media7.
6
https://estadisticalidia.com/tema-8-estimacion/
7https://www.ibm.com/support/knowledgecenter/es/SS4QC9/com.ibm.solutions.wa_an_overview.2.0.0.doc
/standarderror.html
34
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
ACTIVIDADES
Actividad 1. Revisión de conceptos
Respuesta:
variables tipo de gráfico
nominales gráficos de áreas y diagramas
cualitativas
ordinales de barras
discretas diagramas de barras
cuantitativas
continuas histogramas
En esta actividad se propone que los alumnos agrupen las siguientes variables, según el
tipo al que pertenezcan:
a) El grupo sanguíneo
b) Número de hijos
c) Nacionalidad
d) Intensidad de dolor
e) Peso
f) Número de sesiones de un tratamiento
g) Número de hojas de un árbol
h) Peso de las semillas recolectadas por planta
i) Grado de satisfacción al comprar un producto
j) Sexo
k) Longitud del tallo
l) Nº de huevos por gallina
Respuesta:
Cualitativas
Nominales: a, c, j
Ordinales: d, i
Cuantitativas o Numéricas
35
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
Discretas: b, f, g, l
Continuas: d, h, k
Esta actividad tiene por objetivo ejercitar el diseño, interpretación y análisis de los
resultados de una muestra de estudio, y la obtención de conclusiones.
Se mide la estatura de 30 habitantes de un barrio y se obtienen los siguientes resultados
(m):
Respuestas
a) Si se presentara esta información en una tabla de frecuencia se obtendría una tabla
de 30 líneas (una para cada valor), cada uno de ellos con una frecuencia absoluta de
1 y con una frecuencia relativa del 3,3%, lo cual aportaría escasa información.
En lugar de ello, se agrupan los datos por intervalos, y así la información queda más
resumida.
36
Estadística Descriptiva
Tecnología en Gestión de Mercados – 2021 GD
7
Estatura habitantes Barrio XYZ
6
Número de Personas
5
4
3
2
1
0
1,01 - 1,10 1,11 - 1,20 1,21 - 1,30 1,31 - 1,40 1,41 - 1,50 1,51 - 1,60 1,61 - 1,70 1,71 - 1,80 1,81 - 1,90 1,91 - 2,00
Estatura
c) Según el gráfico, la estatura entre 1,41 m y 1,50 m. Es la que se presenta con más
frecuencia en esta población. Es posible darse cuenta ya que es la barra más alta (la
que incluye mayor cantidad de individuos) entre el total.
d) Para conocer si estos resultados y conclusiones se aplican a una población más amplia
se debería tomar una muestra mayor, representativa de toda la ciudad.
37