Teoría - Tendencia Central
Teoría - Tendencia Central
Teoría - Tendencia Central
Definición
La estadística es la ciencia cuyo objetivo es reunir, organizar, presentar, analizar e interpretar datos
concernientes a individuos, grupos, serie de hechos, etc., con el fin de obtener conclusiones y tomar decisiones
Observación sobre determinados eventos en estudio.
Las variables pueden ser:
• Altura (en metros):
1,82; 1,52; 1,49; 1,70; ...
Conceptos básicos
• Estado civil:
Variable Muestra Población
Casado; soltero; divorciado Es una característica observable Es un subconjunto de la población Es el conjunto sobre el que
que varía entre los individuos de sobre la que realmente hacemos estamos interesados en obtener
• Peso (en kg):
20; 40; 60; 80; ... una población. las observaciones. conclusiones.
Ejemplo: Ejemplo: Ejemplo:
• Sexo: • Desempeño en clase, puntuali- • Un grupo de profesores de un • Profesores de un colegio.
Masculino; femenino
dad, etc. colegio.
2. Organización de datos
Después de la recopilación de datos se procede a 0 80 120 250 250
su organización clasificación, de modo que facilite su 270 300 300 370 380
representación en tablas, gráficos, etc.
380 400 450 450 450
Ejemplo:
460 470 490 500 600
De los datos anteriores, los ordenaremos de menor a mayor.
70 Intelectum 4.°
• Ancho de clase (wi) • Marca de clase (xi)
A
Es el tamaño de un intervalo determinado. Es la media de los límites de un intervalo.
En el ejemplo: Ejemplo:
I1 = [0; 200H & w1 = 200 - 0 I1 = [0; 200H
w1 = 200 Observación
x1 = 0 + 200 = 100
2 El número de intervalos puede
ser elegido a criterio y el ancho
• Número de intervalos (k) de clase podría variar en la
Los datos se pueden clasificar en cierta cantidad de intervalos de clase. La regla de Sturges permite obtener tabla, si esto ayuda al análisis
el número de intervalos convenientes (k), de igual ancho de clase en los que se deben clasificar, dependiendo estadístico.
del número de datos (N).
k = 1 + 3,3log(N)
En el ejemplo:
N = 20 & k = 1 + 3,3log(20) = 5,294...
Considerando que k aproximado puede ser 4; 5 o 6, elegiremos k = 5.
Polígono de Atención
5 frecuencias Diagrama circular
Se emplea principalmente con
3 fines comparativos, a este tipo
2 de representación gráfica tam-
1 bién se le conoce como gráfico
0 120 240 360 480 600
Ii de sectores o gráfico de pastel.
B
Diagrama escalonado
Son diagramas similares al histograma con la diferencia de que las alturas son frecuencias absolutas acumuladas b
C
o relativas acumuladas. A a c%
Del cuadro anterior:
e% d%
Fi
E D
20
17 Al total le corresponde 360°
Ojiva
Total " 360°
8 A " α° (α en grado sexagesimal)
3 Al total le corresponde 100%
2 Total " 100%
Ii C " c%
0 120 240 360 480 600
Moda (Mo)
A) Para datos no clasificados B) Para datos clasificados
La moda es el dato que más se repite en el d1
conjunto de datos. Mo = Lo + wo > H
d1 + d 2
Ejemplo: Donde:
En los datos: 20; 30; 30, 30, 40, 40, 50 Lo: límite inferior de la clase modal.
30 se repite más, por lo tanto es la moda. wo: ancho de la clase modal.
d1: fo - f(o - 1)
d2: fo - f(o + 1)
fo: frecuencia absoluta de la clase modal.
Ejemplo:
De la tabla:
Mo = 360 + 120 ; 4 E = 408
4+6
Cuartil (Q1)
Al calcular la mediana, lo que hallábamos es el dato que se encuentra en la mitad. El cuartil halla el dato que se
encuentra en la cuarta parte del conjunto.
72 Intelectum 4.°
Centil o percentil (Cr)
A
Con el centil calculamos el dato que se encuentra en la centésima parte del conjunto. Si nos piden el centil 17
Nota
(C17) nos están pidiendo el dato que se encuentra en la 17 parte del conjunto.
100 Se le llama Decil (D1), al dato
que divide el conjunto en la
Cálculo del centil décima parte.
A) Para datos no tabulados B) Para datos tabulados
Se ordenan los datos y se escoge el dato de la rN
100 - FC - 1
posición rN/100. Cr = LC + WC > H
fC
LC, WC, fC pertenecen al intervalo centil y FC - 1 a Atención
un intervalo anterior. Nos pueden pedir:
C1; C2; C3 ... C99.
MEDIDAS DE DISPERSIÓN Sea Cm lo que nos piden, la
Varianza y desviación estándar fórmula será:
Estas medidas sirven para calcular la dispersión de los datos, es decir, que tan alejados se encuentran los datos N.m - F
de la media. Cm = LC + WC > 100 H
c-1
fc
Se calculan:
Esto es extensivo a los cuarti-
A) Para datos no tabulados B) Para datos tabulados les y deciles.
N k
/ (di - X) 2 / (xi - X) 2 fi
Varianza S2 = i=1
S2 = i=1
N N
N k
/ (di - X) 2 / (xi - X) 2 fi
i=1
Desviación S = i=1 S=
N N
estándar
Coeficiente de variación
Cuando queremos comparar las dispersiones de dos o más conjuntos de datos, no es correcto comparar
directamente las varianzas o desviaciones estándar cuando las medias aritméticas son distintas, en este caso
se comparan los coeficientes de variación (CV).
CV = S .100
X
El conjunto que tenga mayor CV tendrá mayor dispersión y viceversa.
Efectuar
1. Dado el siguiente cuadro estadístico, calcula la moda. 3. En el siguiente cuadro se muestra la distribución de edades
de un cierto número de personas.
Xi fi Fi Calcula: x + y + z.
6 4
Ii fi hi Fi Hi
8 6
[20; 30H 80
10 15
[30; 40H 40 0,25 z
13 20
15 8 [40; 50H 0,15 y
[50; 60H x
2. Dado el siguiente cuadro, determina la moda.
4. Dado el siguiente pictograma, en D hay 7 dólares. ¿Cuántos
Ii fi dólares hay en A?
[0; 40H 6
A
[40; 80H 5
F
30° a ° B
` 2 j°
[80; 120H 4 a `3j
[120; 160H 9 70°
40°
a° C
[160; 200] 6 E `6j
D
1 El diagrama muestra la cantidad de postulantes a la universidad 3 El siguiente gráfico muestra la preferencia de un grupo de N
X, los últimos 5 años. Calcula el promedio anual de postulantes alumnos sobre los cursos de Aritmética (A), Álgebra (X), Física
en dicho periodo y la mayor variación porcentual entre dos años (F) y Química (Q). Determina cuántos prefieren Aritmética si los
consecutivos. que prefieren Álgebra son 100 personas.
Postulantes
6300
X
5600
5000 A
6n°
3500 72°
5n° F
3000
Q
2009 2010 2011 2012 2013 Año
Resolución:
Resolución:
6n° + 5n° + 72° + 90° = 360°
El promedio anual lo calcularemos dividiendo el número total de 11n° + 162° = 360°
postulantes entre el número de años, esto es: 11n° = 198° & n = 18
6300 + 5600 + 5000 + 3500 + 3000 = 4680 Prefieren Aritmética: a
5
a $ 6n° = 108°
La mayor diferencia porcentual la hallaremos ayudándonos
100 $ 90°
con el gráfico. Buscamos la barra que su año consecutivo haya
aumentado más. No es difícil darse cuenta que es la barra del & a = 100 . 108° = 120
90°
año 2010.
La mayor variación es: 5000 - 3500 = 1500
4 Dado el siguiente cuadro, determina la mediana.
` La variación en porcentual es: 1500 = 42,8%.
3500 Ii fi Fi
[20; 30H 2 2
2 El diagrama muestra la distribución del personal de una empresa
[30; 40H 4 6
por género. Si el promedio anual de personal femenino es 35,75;
calcula qué tanto por ciento es el personal masculino en el año [40; 50H 5 11
2005. [50; 60H 6 17
n.° de personas [60; 70H 3 20
61
a
35 Resolución:
28 Determinamos primero el intervalo de la clase mediana.
25
20 Ii fi Fi Hi
Intervalo [20; 30H 2 2 0,10
2003 2004 2005 2006 Año de la clase
[30; 40H 4 6 0,30
mediana
Hombres Mujeres
[40; 50H 5 11 0,55
[50; 60H 6 17 0,85
Resolución:
[60; 70H 3 20 1,00
El promedio anual de personal femenino es la suma total de
mujeres entre el número de años, esto es: n = 20
2a + 35 + 28 = 35, 75 n -F
Me = Lm + wm > 2 H
4 (m - 1)
fm
2a + 35 + 28 = 143 & a = 40
Para calcular el porcentaje de personal masculino en el año 2005, 20 - 6
hacemos: Me = 40 + 10 > 2 H
5
20 # 100% = 20 # 100% = 33, 3| %
20 + 40 60 Me = 40 + 8 & Me = 48
74 Intelectum 4.°