Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

T2.Estadística Descriptiva - Sin Soluciones

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 62

Tema 2.

Estadística
Descriptiva
Dra. Irene García-Camacha Gutiérrez
Índice
1. Conceptos fundamentales
2. Tablas de frecuencia
3. Representaciones gráficas
4. Medidas de tendencia central
5. Medidas de posición
6. Medidas de dispersión
7. Medidas de forma
8. Tipificación
9. Otras gráficos descriptivos
10. Resumen
1. Conceptos fundamentales
Población. Es el conjunto de todos los individuos u
objetos que poseen alguna propiedad o característica
común que es objeto de estudio. Es un concepto “teórico”

Muestra. Es el subconjunto de la población sobre el que


se recoge información acerca de la propiedad o
característica de interés. Es un concepto “real”

Individuo o unidad experimental. Son cada una de las


personas u objetos que forman parte de la muestra que
van a ser entrevistados o analizados.
La estadística inferencial es el conjunto de técnicas
estadísticas que permiten extraer resultados o conclusiones
sobre la población a partir de la información recogida
en una muestra. Los resultados no son 100% seguros, sino
que se basan en estimaciones, predicciones, probabilidades,
etc. de modo que establecen valores o afirmaciones bajo
cierto nivel de incertidumbre.

La estadística descriptiva persigue resumir y describir


información acerca de la muestra. Las técnicas que utiliza se
basan en la presentación de datos a través de tablas y gráficas, y
en el cálculo de ciertos valores numéricos representativos de los
datos muestrales.
Un estadístico es un valor que Un parámetro es un valor que
describe una característica de una describe una característica de la
muestra población.

El valor de un estadístico varía de Siguiendo el enfoque clásico de la


una muestra a otra. NO TIENE UN estadística, el valor de un parámetro
VALOR ÚNICO. poblacional es ÚNICO.

Se representan con letras latinas Se representan con letras griegas


𝑥,ҧ 𝑆, 𝑟. 𝜇, 𝜎, 𝜌.
Estadística Inferencial:
POBLACIÓN
Conocer PARÁMETROS
poblacionales.
Ejemplo: Número de pie
medio de los españoles.

Estadística Descriptiva:

Conocer ESTADÍSTICOS
muestrales.
Ejemplo: Número de pie
medio de la clase.
Herramientas
de
trabajo
Los datos son cada uno de los valores o
respuestas observadas de variables que
van a analizarse.

Una variable es una característica de


interés, observable o medible, en los sujetos
o unidades experimentales objeto de estudio.
Identifique en el siguiente supuesto:

✓ La población
✓ La muestra.
✓ Individuo o unidad experimental.
✓ El parámetro.
✓ El estadístico.
✓ La variable.

Los enfermeros y enfermeras de Hospital Virgen de la


Salud quieren llevar a cabo un estudio para conocer el
grado de satisfacción medio de las condiciones
laborales del sistema público de salud castellano-
manchego. Para ello han realizado la pregunta a 50
enfermer@s de 10 hospitales de Castilla-La Mancha
elegidos al azar, que debían dar su valoración de 0 a 10.
✓ Las categorías NO siguen un
orden.
Nominales ✓ Ejemplos: Sexo, forma de pie,
Cualitativas problemas de visión.
Expresan una
cualidad a partir de ✓ Las categorías siguen un orden.
categorías
Ordinales ✓ Ejemplos: Regularidad en el
estudio, importancia al trabajo.

✓ Valores numéricos concretos.


Discretas ✓ Ejemplos: nº de hijos, nº días a la
Cuantitativas
semana que hace ejercicio.
Expresan una
cantidad a partir de
valores numéricos ✓ Puede tomar cualquier valor
Continuas numérico (infinitos decimales)
✓ Ejemplos: Peso, Estatura.
Clasifica adecuadamente las
siguientes variables
estadísticas siguiendo la
clasificación anterior.

✓ Tensión arterial sistólica. ✓ Grupo sanguíneo.


✓ Número de vacunas recibidas. ✓ Grado de satisfacción de la visita
✓ Percentil del peso. a atención primaria.
✓ Percentil de la talla. ✓ Test de Apgar (ver siguiente diap.)
✓ Nº aciertos en el test de visión. ✓ Frecuencia cardiaca.
✓ Tipo de problema de visión ✓ Esfuerzo respiratorio.
✓ Nº de dioptrias. ✓ Respuesta a sonda.
✓ Género. ✓ Tono muscular.
✓ Edad. ✓ Color.
https://www.fisioterapiamirasierra.com/el-test-de-apgar-valora-la-viabilidad-del-recien-nacido-en-los-primeros-minutos-de-vida/
2. Tablas de frecuencia
Seguro que alguna vez has recibido
información sobre algún tema de la
forma que aparece en la figura…

O tú mism@ has elaborado alguna


tabla para, por ejemplo, decidir el
destino el viaje de fin de curso.

Pero..

¿Cuál es su finalidad?
Imagina que eres
el/la enfermer@
al cargo de todo
un campamento
de verano para
niños.

Entre las
diversas tareas
que debes
desempeñar,
eres el/la
encargad@ de
preparar el
botiquín de
primeros
auxilios.

Éste es el
material de que
dispones.
A la vista de la figura…

¿Serías capaz de
resumir el contenido
del botiquín para
decidir qué llevar y
qué es lo que falta
por comprar?
¿Y así?
Lo mismo ocurre con los DATOS.

La forma más intuitiva de resumir un conjunto de datos consiste en:

✓ Organizar “el material” recogido por grupos de elementos similares.

✓ Hacer un recuento de los elementos en cada uno de los grupos.

✓ Analizar y valorar la proporción del total que supone cada grupo.

Esto es, conocer la DISTRIBUCIÓN DE FRECUENCIAS.

Una tabla de frecuencias es una representación ordenada


de su distribución de frecuencias, que persigue resumir su
contenido y convertirlos en información útil de una muestra.
¿Todas las tablas de frecuencia son IGUALES?

Depende del TIPO DE VARIABLE, pues no todos los tipos de


variable reportan la misma información.

NOMINALES
Para datos ¿Existe
SIN un
ORDINALES
AGRUPAR orden?

DISCRETAS (con pocos valores distintos)

Para datos DISCRETAS (con muchos valores distintos)


AGRUPADOS
CONTINUAS
Tabla de frecuencias para datos SIN agrupar

LAS CATEGORÍAS NO SIGUEN UN ORDEN LAS CATEGORÍAS SIGUEN UN ORDEN

Categorías Frecuencia Frecuencia Frecuencia Frecuencia


Categorías Frecuencia Frecuencia Absoluta Relativa Absoluta Relativa
Absoluta Relativa Acumulada Acumulada
Categoría 1 𝑛1 𝑓1 = 𝑛1 /𝑁
Categoría 1 𝑛1 𝑓1 = 𝑛1 /𝑁 𝑁1 = 𝑛1 𝐹1 = 𝑓1
Categoría 2 𝑛2 𝑓2 = 𝑛2 /𝑁
Categoría 2 𝑛2 𝑓2 = 𝑛2 /𝑁 𝑁2 = 𝑛1 + 𝑛2 𝐹2 = 𝑓1 + 𝑓2
... … …
Categoría k 𝑛𝑘 𝑓𝑛 = 𝑛𝑘 /𝑁 ... … … … …
Total N = σ𝑘𝑖=1 𝑛𝑖 1 = σ𝑘𝑖=1 𝑓𝑖 Categoría k 𝑛𝑘 𝑓𝑛 = 𝑛𝑘 /𝑁 N = σ𝑘𝑖=1 𝑛𝑖 1 = σ𝑘𝑖=1 𝑓𝑖

Total N = σ𝑘𝑖=1 𝑛𝑖 1 = σ𝑘𝑖=1 𝑓𝑖


¿Por qué debemos hacer distinción entre variables
cuyas categorías que siguen un orden y las que no
al elaborar una tabla de frecuencias para datos sin
agrupar?

En ocasiones las frecuencias relativas pueden venir


dadas en tanto por cien (%). Esto es 𝑝𝑖 = 𝑓𝑖 ∗ 100.
Normalmente, si vienen expresadas en tanto por
uno se conocen como frecuencias relativas;
mientras que si vienen dadas en tanto por cien se
denominan frecuencias porcentuales o
frecuencias relativas porcentuales.
Análogamente ocurre con la frecuencia relativa
acumulada.
Elabore una tabla de frecuencias adecuada para resumir
la información recogida en los siguientes supuestos:

Caso 1. El material (por unidades) de que se dispone para


preparar el botiquín para la enfermería del campamento es:

gasas – jabón – vendas - agua oxigenada – antipirético - suero


oral – vendas – jabón – alcohol - agua oxigenada – tijeras –
antipirético – termómetro - agua oxigenada - suero oral –
antihistamínico – tijeras - guantes quirúrgicos – esparadrapo –
algodón – pinzas – antipirético – esparadrapo – pinzas – vendas
– antihistamínico- algodón - guantes quirúrgicos – gasas -
termómetro - agua oxigenada - suero oral – antihistamínico –
tijeras - guantes quirúrgicos – esparadrapo – algodón
Elabore una tabla de frecuencias adecuada para
resumir la información recogida en los siguientes supuestos:

Caso 2. Las repuestas recogidas en la prueba de esfuerzo


respiratorio del Test de Apgar de los recién nacidos en
hospital Virgen de la Salud de Toledo en la última semana son
las siguientes:

débil – débil – vigoroso (llanto) – no respira – vigoroso


(llanto) – vigoroso (llanto) – débil – débil – débil – no respira
– vigoroso (llanto) – débil – vigoroso (llanto) –débil – débil –
vigoroso (llanto)- vigoroso (llanto) – vigoroso (llanto) – no
respira – débil – débil -débil –débil –vigoroso (llanto) –
vigoroso (llanto) – vigoroso (llanto)
Tabla de frecuencias para datos AGRUPADOS

Intervalos de clase Marca de clase Frecuencia Frecuencia Frecuencia Frecuencia


Absoluta Relativa Absoluta Relativa
Acumulada Acumulada

𝑙𝑜 , 𝑙1 𝑙0 + 𝑙1 𝑛1 𝑓1 = 𝑛1 /𝑁 𝑁1 = 𝑛1 𝐹1 = 𝑓1
𝑥1 =
2
[𝑙1 , 𝑙2 ) 𝑙1 + 𝑙2 𝑛2 𝑓2 = 𝑛2 /𝑁 𝑁2 = 𝑛1 + 𝑛2 𝐹2 = 𝑓1 + 𝑓2
𝑥2 =
2
... … … … … …
[𝑙𝑘 , 𝑙𝑘+1 ) 𝑙𝑘 + 𝑙𝑘+1 𝑛𝑘 𝑓𝑛 = 𝑛𝑘 /𝑁 N = σ𝑘𝑖=1 𝑛𝑖 1 = σ𝑘𝑖=1 𝑓𝑖
𝑥𝑘 =
2
Total N = σ𝑘𝑖=1 𝑛𝑖 1 = σ𝑘𝑖=1 𝑓𝑖
Cómo construir los intervalos de clase ADECUADAMENTE

Regla nº 1

nº entero más próximo a


𝑁 (entre 5 y 20)

intervalos
1 + 3.22 ∗ 𝐿𝑜𝑔(𝑁)
Regla nº 2 Regla nº 3

El extremo inferior de los


Todos los intervalos
intervalos, 𝑙0 , y el extremo superior, deben tener la misma
𝑙𝑘+1 , pueden ser los valores mínimo
y máximo, 𝑥𝑚𝑖𝑛 y 𝑥𝑚𝑎𝑥 , de la base amplitud
de datos o bien “un poquito” más
pequeño en el caso de 𝑥𝑚𝑖𝑛 y “un
poquito” más grande en el caso de 𝑙𝑘+1 − 𝑙0
𝑥𝑚𝑎𝑥 para “cuadrar” con la amplitud
𝐴𝑚𝑝𝑙𝑖𝑡𝑢𝑑 = 𝑎 =
𝑛º 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠
de los intervalos.
Elabore una tabla de frecuencias
para resumir la información recogida
en el siguiente supuesto siguiendo las
reglas anteriores para la construcción
de los intervalos de clase:

Caso 3. Las frecuencias cardíacas


(medidas en nº de latidos por minuto)
recogidas en el Test de Apgar de los
recién nacidos en un hospital de Madrid
en la última semana son las siguientes:

86.76 – 121.76 – 143.46 – 104.89 –


88.69 – 153.94 – 111.56 – 123.48 –
76.29 – 82.38 – 86.94 – 75.15 – 144.60
– 88.43 – 155.83 – 181.40 – 139.38 –
101.42 – 156.98 – 74.45
3. Representaciones gráficas

Otra forma de resumir un


conjunto de datos de
manera visual y de forma
que, a golpe de un vistazo,
podamos extraer
información valiosa es a
partir de gráficos.
Cómo construir gráficos ADECUADAMENTE

Regla nº 1 Regla nº 2
Los elementos que representan
Deben indicar las escalas y
a cada categoría en el gráfico
unidades de medida.
deben tener un área proporcional
a su frecuencia.

Regla nº 3 Regla nº 4
Deben explicarse por sí solos. Deben contribuir a clarificar el
material presentado.
¿Puedo utilizar un gráfico para representar cualquier variable?
Depende del TIPO DE VARIABLE, pues no todos los tipos de
variable reportan la misma información.

NOMINALES
Diagrama de barras
Diagrama de sectores ORDINALES
Pictogramas
DISCRETAS (con pocos valores distintos)

Histograma
Polígono de frecuencias DISCRETAS (con muchos valores distintos)
Diagrama de frec.
acumuladas CONTINUAS
Diagrama de Barras

✓ Cada barra representa una categoría o valor.


✓ La anchura de la barra debe ser la misma para
todas las categorías o valores.
✓ En la altura se representan las frecuencias
absolutas o relativas

Diagrama de Sectores

✓ Cada sector representa una categoría o valor.


✓ La amplitud de cada sector debe ser
proporcional a su frecuencia: 𝛼 = 𝑓𝑖 ∗ 360°.
✓ El radio de la circunferencia es arbitrario.
Pictograma

✓ La figura elegida debe estar en consonancia con


la variable representada.
✓ La forma de la figura debe ser la misma para
todas las categorías.
✓ La escala de la figura debe ser proporcional a
su frecuencia.
Curva “normal” (SPSS) Histograma

✓ Las barras de un histograma deben estar


“pegadas” unas a otras.
✓ La anchura de las barras debe ser la misma.
✓ En la altura de las barras se representan las
frecuencias absolutas o relativas.
Polígono de frecuencias

✓ Se construye a partir de un histograma uniendo


los puntos medios de la parte superior de las
barras para cada intervalo.
✓ En ocasiones suele realizarse a partir del
gráfico de frecuencias acumuladas.

Diagrama de frecuencias acumuladas

✓ Para cada intervalo de clase, la altura de la


barra representa su frecuencia relativa
acumulada o su frecuencia absoluta acumulada.
Realiza las representaciones
gráficas adecuadas para resumir el
contenido de los conjuntos de datos
analizados en los supuestos:

✓ Caso 1.

✓ Caso 2.

✓ Caso 3.
4. Medidas de tendencia central
Las medidas de tendencia central son estadísticos que nos
informan hacia qué valores tienden a agruparse los datos de una
muestra. En otras palabras, nos devuelven un valor que representa
a la mayor parte de los datos. Los más conocidos son:

✓ La media.

✓ La mediana.

✓ La moda.
FICHA TÉCNICA: LA MEDIA

➢ QUÉ ES: Es la media aritmética ➢ PUEDE CALCULARSE PARA


de los valores de una variable. VARIABLES DE TIPO: Cuantitativas

➢ CÓMO SE CALCULA: ➢ PROPIEDADES:

σ𝑁
𝑖=1 𝑥𝑖 σ𝑘𝑖=1 𝑥𝑖 ∙ 𝑛𝑖 ❑ Es un estadístico adecuado cuando
𝑥ҧ = 𝑥ҧ = los datos se reparten de forma
𝑁 𝑁
simétrica.
para datos sin agrupar y agrupados ❑ Es muy sensible a los valores
respectivamente. extremos. No es adecuada en caso
de existir outliers.
FICHA TÉCNICA: LA MEDIANA

➢ QUÉ ES: Es valor que toma la Para datos agrupados:


variable en el individuo que n
− N i −1
ocupa la posición central de un Si Ni-1<N/2< N i→ Me = li −1 + 2 (li − li −1 )
conjunto de datos ordenados. ni

Si i/Ni=N/2 → Me=xi
➢ CÓMO SE CALCULA:
➢ PUEDE CALCULARSE PARA
Para datos sin agrupar: VARIABLES DE TIPO: Cuantitativas
y cualitativas ordinales

➢ PROPIEDADES: No es sensible a
valores extremos.
FICHA TÉCNICA: LA MODA

➢ QUÉ ES: Es valor o valores de la Para datos agrupados:


variable con mayor frecuencia. 1
M 0 = li −1 + (li − li −1 )
1 +  2
➢ CÓMO SE CALCULA:

Para datos sin agrupar:

➢ PUEDE CALCULARSE PARA


VARIABLES DE TIPO: Todas
Calcula los estadísticos de
tendencia central aprendidos
para los supuestos anteriores cuando
sea posible e indique qué representa
cada valor.

✓ Caso 1.

✓ Caso 2. (*) Considera las puntuaciones


establecidas en el test de Apgar para
cada categoría: 0, no respira; 1, débil; 2
vigoroso (llanto)

✓ Caso 3.
5. Medidas de posición
Las medidas de posición son
estadísticos que nos indican cómo ✓ Los cuantiles:
se reparten los datos, por partes que
incluyen el mismo número de ➢ Los percentiles.
individuos o unidades experimentales,
de un conjunto ordenado. Las más ➢ Los cuartiles.
conocidas son las siguientes:

Sólo pueden calcularse para


variables cuantitativas y
ordinales
FICHA TÉCNICA: LOS CUANTILES

➢ QUÉ ES: El cuantil 𝛼 es el valor Para datos agrupados:


de la variable que deja por 𝑁
debajo el 𝛼% de las frecuencias 𝛼∙ − 𝑁𝑖−1
𝐶𝛼 = 𝑙𝑖 + 100 (𝑙𝑖 − 𝑙𝑖−1 )
acumuladas. 𝑛𝑖
Siendo i el intervalo de clase
➢ CÓMO SE CALCULA: donde se encuentra el cuantil
Para datos sin agrupar: nº de veces que consume comida rápida a la semana
5
2 2 2 2 3 3
1 1 1

33% 𝑐33 = 1.5 veces


FICHA TÉCNICA: LOS CUANTILES

➢ Los percentiles y los cuartiles ➢ Los cuartiles son los valores


son casos particulares de de la variable que dividen la
cuantiles (son los más utilizados, muestra en 4partes iguales con
aunque existen otros) los datos ordenados de menor a
mayor: 𝑄1 , 𝑄2 𝑦 𝑄3
➢ Los percentiles son los
valores de la variable que dividen
la muestra en 100 partes iguales
con los datos ordenados de
menor a mayor.
𝑃1 , 𝑃2 , … , 𝑃99
Calcula los cuartiles, el 𝑃20 y el 𝑃60 para
los supuestos anteriores cuando sea posible e
indique qué representa cada valor.

✓ Caso 1.

✓ Caso 2. (*) Considera las


puntuaciones establecidas en
el test de Apgar para cada
categoría: 0, no respira; 1, débil;
2 vigoroso (llanto)

✓ Caso 3.
6. Medidas de dispersión
Las medidas de dispersión son estadísticos que nos informan si los
valores que ha tomado la variable son muy parecidos entre sí o, por el
contario, son muy diferentes. En otras palabras, nos hablan de la
homogeneidad o heterogeneidad de los valores recogidos. Por tanto, miden
la variabilidad de los datos. Entre otros, destacan:

✓ La amplitud o rango. ✓ La desviación típica y


cuasidesviación típica.
✓ El rango intercuartílico.
✓ El coeficiente de
✓ La varianza y cuasivarianza. variación de Pearson.

Sólo pueden calcularse para variables cuantitativas


FICHA TÉCNICA: EL RANGO FICHA TÉCNICA: LA VARIANZA Y
CUASIVARIANZA
➢ QUÉ ES: Es la diferencia entre los valores
máximo y mínimo de un conjunto de datos.
➢ QUÉ ES: Es el promedio de las desviaciones
de cada dato con respecto de la media al
➢ CÓMO SE CALCULA: 𝑅 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛
cuadrado.
➢ PROPIEDADES: Es muy sensible a los
➢ CÓMO SE CALCULA:
valores extremos. Tiene las mismas
unidades que la variable.
σ𝑁 ҧ 2
𝑖=1(𝑥𝑖 − 𝑥) σ𝑁 ҧ 2
𝑖=1(𝑥𝑖 − 𝑥)
𝑆2 = 𝑆𝐶2 =
𝑁 𝑁−1
FICHA TÉCNICA: EL RANGO
➢ PROPIEDADES:
INTERCUARTÍLICO
❑ Es sensible a los valores extremos.
➢ QUÉ ES: Es la diferencia entre e l 50% de los
valores centrales.
❑ Tiene unidades de la variable original al
cuadrado. Por tanto, es difícil de interpretar.
➢ CÓMO SE CALCULA: IQ𝑅 = 𝑄3 − 𝑄1
❑ SPSS calcula la 𝑆𝐶2 pues tiene “mejores”
➢ PROPIEDADES: Tiene las mismas unidades
propiedades para la estimación.
que la variable.
FICHA TÉCNICA: LA DESVIACIÓN
TÍPICA Y CUASIDESVIACIÓN FICHA TÉCNICA: EL COEFICIENTE
DE VARIACIÓN DE PEARSON
➢ QUÉ ES: Es la raíz cuadrada positiva de la
varianza.
➢ QUÉ ES: Es la razón entre la desviación típica
y la media. Es una medida de variabilidad
➢ CÓMO SE CALCULA:
relativa.

σ𝑁 ҧ 2 σ𝑁 ҧ 2 𝑆
𝑖=1(𝑥𝑖 − 𝑥) 𝑖=1(𝑥𝑖 − 𝑥) ➢ CÓMO SE CALCULA: 𝐶𝑉 =
𝑆 =+ 𝑆𝐶 = + 𝑥ҧ
𝑁 𝑁−1
➢ PROPIEDADES:
➢ PROPIEDADES:
❑ Es un estadístico adimensional (no tiene
❑ Es sensible a los valores extremos. unidades). Por tano, permite comparar la
dispersión entre variables que tienen
❑ Tiene las mismas unidades que la variable diferentes unidades.
original. Por tanto, es fácil de interpretar.
❑ En ocasiones, suele darse en porcentaje (%)
❑ SPSS calcula la 𝑆𝐶 pues tiene “mejores”
propiedades para la estimación.
Calcula los estadísticos de
dispersión aprendidos para los
supuestos anteriores cuando sea
posible e indique qué representa cada
valor.

✓ Caso 1.

✓ Caso 2. (*) Considera las puntuaciones


establecidas en el test de Apgar para
cada categoría: 0, no respira; 1, débil; 2
vigoroso (llanto)

✓ Caso 3.
7. Medidas de forma
Las medidas de forma son estadísticos que nos informan sobre cómo se
reparten las frecuencias en el rango de valores observados de la variable.
En particular, nos reportan información sobre la distribución de la variable
en comparación con la distribución Normal, que es la distribución que en
estadística suele considerarse como referencia.

✓ La asimetría o sesgo ✓ El apuntamiento o curtosis.

Sólo pueden calcularse para variables cuantitativas


FICHA TÉCNICA: ASIMETRÍA

➢ QUÉ ES: Una variable se distribuye de forma simétrica si la mitad izquierda


de la distribución es la imagen especular de su mitad derecha. En otro caso
se dice que es asimétrica.

➢ TIPOS: Asimetría negativa (izquierda), simetría, asimetría positiva (derecha)

No confundir asimetría
con dispersión!!!
FICHA TÉCNICA: ASIMETRÍA
➢ CÓMO SE CALCULA: Existen varios estadísticos para detectar asimetría:
x − Mo
❑ Coeficiente de Asimetría (CA) de Pearson 1: A1 =
s
3( x − M e )
❑ Coeficiente de Asimetría (CA) de Pearson 2: 2 A =
s
1 n
 ( x i − x ) 3

❑ Coeficiente de Asimetría (CA) de Fisher: g1 = n i =1


SPSS
s x3
Interpretación: Valores nulos o casi nulos son indicadores de simetría. En
función del signo que tome diremos que es asimetría positiva o negativa.

Regla de oro: Un CA mayor que el doble de su error estándar es indicador


de asimetría.
FICHA TÉCNICA: ASIMETRÍA
➢ PROPIEDADES:

❑ La asimetría es positiva o negativa en función de a qué lado se


encuentra la cola de la distribución.

❑ La media se ve “arrastrada” por los valores extremos que generan las


colas de la asimetría.
❑ Si las medidas de tendencia
centran distan mucho entre
sí, existe desviación de la
simetría.
FICHA TÉCNICA: CURTOSIS

➢ QUÉ ES: es el grado de apuntamiento que tiene la forma de la distribución


de frecuencias de la variable con respecto al de la distribución normal.
1
σ 𝑥𝑖 −𝑥ҧ 4 ∙𝑛𝑖
➢ CÓMO SE CALCULA: 𝑔2 = 𝑛
1 2 −3
2
𝑥 −𝑥ҧ ∙𝑛𝑖
𝑛 𝑖

➢ TIPOS:

❑ Leptocúrtica: apuntada (𝑔2 > 0)


❑ Mesocúrtica: “normal” (𝑔2 ≈ 0)

❑ Platicúrtica: aplanada (𝑔2 < 0)


BONUS: LA DISTRIBUCIÓN NORMAL

Se llama distribución Normal o gaussiana


en estadística a la distribución de
frecuencias de una variable continua que,
entre otras propiedades (que estudiaremos
más adelante), es:

➢ Simétrica.
➢ Mesocúrtica

Es la distribución MODELO en Estadística ya que aparece con frecuencia


en numerosos fenómenos naturales y sociales.
8. Tipificación
➢ QUÉ ES: La tipificación es una transformación lineal que puede realizarse en
variables de tipo cuantitativo y nos permite realizar comparaciones “justas” (en
términos relativos) entre datos que pertenecen a grupos con características
diferentes.
𝑥−𝑥ҧ
➢ CÓMO SE CALCULA: z =
𝑆

➢ PROPIEDADES:

❑ Las puntuaciones tipificadas son adimensionales.


❑ Indica cuántas desviaciones típicas se encuentra el dato respecto a la media.
❑ También se conocen como puntuaciones estandarizadas o z-score.
¡A
Resuelve el siguiente caso haciendo uso
de los conocimientos aprendidos:
trabajar
se ha
Se sabe que la media de las puntuaciones
obtenidas en test de Apgar por los recién dicho!
nacidos durante en año 2019 en un hospital
de Madrid es 7.6 con una desviación típica
de 2.3; mientras que en un hospital de la
provincia de Toledo en el mismo año se
obtuvo 8.3 de media y 1.6 de desviación
típica. Los primeros bebés nacidos en 2020
en dichos hospitales obtuvieron 8.5 y 8.9
puntos respectivamente. ¿Cuál de los dos
obtuvo una puntuación relativa más
alta en el test?
9. Otros gráficos descriptivos
BOX PLOT - DIAGRAMA DE CAJA Y BIGOTES
➢ Los extremos de la caja representan los cuartiles 𝑄1 y 𝑄3 .
➢ La línea que divide la caja corresponde al 𝑄2 = 𝑀𝑒.
➢ La media se sitúa en la mitad de la caja.
➢ Los extremos de los bigotes representan:
LI = min{𝑥𝑖 , 𝑥𝑖 > 𝑄1 − 1.5𝐼𝑄𝑅} y LS = m𝑎𝑥{𝑥𝑖 , 𝑥𝑖 < 𝑄3 + 1.5𝐼𝑄𝑅}
(*) Sólo en algunas casos coinciden con el Mínimo y Máximo.
➢ Sean 𝐿𝐼
෩ = min{𝑥𝑖 , 𝑥𝑖 > 𝑄1 − 3 ∙ 𝐼𝑄𝑅} y 𝐿𝑆
෪ = m𝑎𝑥{𝑥𝑖 , 𝑥𝑖 < 𝑄3 + 3 ∙ 𝐼𝑄𝑅}
❑ Los 𝑥𝑖 ∈ 𝐿𝐼,
෩ LI y 𝑥𝑖 ∈ 𝐿𝑆, 𝐿෪𝑆 son valores atípicos.
❑ Los 𝑥𝑖 < 𝐿𝐼
෩ y x𝑖 > 𝐿𝑆
෪ son valores extremos.
* Extremo
Diagrama de
tallo y hojas

• Es un gráfico útil para


representar pocos datos.
• Se divide en dos partes,
tallo y hojas.
• El tallo puede representar
unidades y las hojas
decimales, o bien, el tallo
decenas y las hojas las
unidades, etc.
• Si lo observamos “al revés”
nos informa sobre la
distribución de frecuencias.
• Es sencillo identificar sobre
él medidas de posición.
Dibuje un diagrama de
caja para los siguientes
supuestos:

➢ Los datos proceden de una


distribución asimétrica
negativa. ¡A trabajar!
➢ Los datos proceden de una
distribución simétrica.
➢ Los datos proceden de una
distribución asimétrica
positiva.
Dibuje un diagrama de caja para los siguientes
supuestos:

➢ Los datos proceden de una distribución platicúrtica.


➢ Los datos proceden de una distribución mesocúrtica.
➢ Los datos proceden de una distribución leptocúrtica.
Dibuje un diagrama de caja para el siguiente caso:

Un estudio consistió en preguntarles a 24 pacientes cual fue el


grado de dolor que sintieron durante una punción lumbar. Este
grado de valor de midió creando una escala del 1 al 5 donde a
medida que el número aumenta, el nivel de dolor es cada vez
mayor y donde el 1 representa “nada de dolor” y el 5
representa “dolor insoportable”. La tabla que se muestra a
continuación representa las respuestas de estas 24 personas:

3 5 5 2 2
2 2 4 4 3
4 4 5 3 5
4 3 3 3 4
5 1 2 1
Se han recogido los siguientes tiempos de espera en minutos de
los pacientes de una determinada consulta de un Hospital:

12, 13, 13, 14, 14, 15, 15, 20, 21, 22, 22, 22, 25, 27, 28, 29, 31, 31, 33, 34,
36, 38, 39, 40, 41, 41, 42, 44, 45, 50, 51 52.

Elabore el diagrama de tallo y hojas correspondiente a


estos datos e interprételo.

¿Detecta algún tipo de asimetría?


En caso afirmativo, ¿cuál?

Identifique la moda, la mediana y


los cuartiles
10. Resumen
Nominal Ordinal/ Continua/
Discreta Discretas
(pocos valores distintos) (muchos valores distintos)

Definición Categorías sin orden Categorías ordenadas Valores numéricos


Valores numéricos
Tabla de Frecuencias absolutas Frecuencias absolutas, Intervalos de clase.
frecuencias y relativas relativas y acumuladas Frecuencias absolutas,
relativas y acumuladas
Gráficos Barras, sectores y Barras, sectores y Histograma, curva normal,
pictogramas pictogramas / polígonos de frecuencia y
Diagrama de tallo y hojas diagramas de frecuencias
acumuladas.

Diagrama de caja y bigotes.


Diagrama de tallo y hojas.
Nominal Ordinal/ Continua/
Discreta Discretas
(pocos valores distintos) (muchos valores distintos)

Medidas de Moda Moda, Mediana/ Media, Mediana y Moda


tendencia central Media, Mediana y Moda
Medidas de --- Cuantiles (cuartiles, Cuantiles (cuartiles,
posición percentiles) percentiles)
Medidas de --- ---/ Rango, IQR, Varianza,
dispersión Rango, IQR, Varianza, Desviación típica, Coeficiente
Desviación típica, de Variación
Coeficiente de Variación
Medidas de forma --- ---/ Coeficiente de asimetría.
Coeficiente de asimetría. Curtosis
Curtosis
Tipificación --- ---/ Sí

También podría gustarte