Estatística - Medidas de Dispersão
Estatística - Medidas de Dispersão
Estatística - Medidas de Dispersão
Introduo
Para a compreenso deste captulo, necessrio que voc tenha
entendido os conceitos apresentados nos captulos 4 (ponto mdio, classes e
frequncia) e 6 (mdia). Assim ser fcil para voc calcular as medidas de
disperso (amplitude total, varincia, desvio padro e coeficiente de variao)
para variveis quantitativas e interpretar os valores dessas medidas em
diferentes situaes do cotidiano.
Estudamos, no captulo anterior, mecanismos para encontrar valores
(mdia, mediana e moda) que sintetizam o comportamento dos elementos de
um conjunto de dados. Esses valores fornecem parmetros significativos para
uma anlise dos dados, porm ainda importante identificar como variam ou
diferenciam as caractersticas dos elementos de um conjunto.
Imagine, por exemplo, que voc precise analisar o valor da cotao do
dlar no ano passado. Inicialmente, voc precisar de uma mdia aritmtica
envolvendo os doze meses. Alm da mdia, precisamos observar se houve ou
no uma discrepncia significativa do valor durante esses meses. Caso
positivo, ento podemos afirmar que ocorreu uma grande variabilidade ou
disperso dos dados em relao mdia. Caso contrrio, ento o valor da
cotao permaneceu bastante semelhante durante o ano.
Nesse captulo, aprenderemos como medir o grau de concentrao ou
disperso dos dados em torno da mdia. Por isso estudaremos as principais
medidas de disperso, que so: amplitude total, varincia, desvio padro e
coeficiente de variao. A escolha de uma medida em relao outra
depender do objetivo que se pretende alcanar.
Para exemplificar os clculos das medidas de disperso, usaremos tanto
dados no agrupados quanto dados agrupados com e sem intervalos de
classe. Comearemos com a amplitude total.
7.1 Amplitude total
80
76
55
80
77
65
80
78
70
80
79
75
80
80
80
80
80
85
80
81
85
80
82
90
80
83
95
80
84
100
54
1
3
2
5
9
ressaltar
que
esses
valores
foram
selecionados
Cabe ressaltar que no valor obtido para a amplitude total com dados
agrupados com intervalos de classe levado em considerao somente os
dois valores extremos da srie, descartando qualquer valor intermedirio
existente. Sendo assim, o valor obtido somente uma indicao aproximada
da disperso dos dados.
:;
07
13
21
10
04
Logo ! " #3,,, reais. Diante disso, podemos verificar que a amplitude
total como medida de disperso um valor limitado e instvel, visto que valores
internos da srie nunca so levados em considerao.
Veja agora a medida de disperso varincia e desvio padro.
7.2 Varincia e desvio padro
A%$4 ( $B '@
#
)
teremos:
? " C? @
ou
?"D
A%$4 ( $B '@
)
$4
18
22
15
17
19
21
16
$4 ( $B
-0,2
3,8
-3,2
-1,2
0,8
2,8
-2,2
A partir dos valores da tabela, calculamos A%$4 ( $B '@ , que igual a 0,36.
?"D
A 54 $4@
A 54 $4
(F
G
)
)
de #
n),
54 $4
1
6
6
20
45
A " /+
54 $4@
1
12
18
80
225
A " >>0
:;
07
13
>, < .,
., < 3,
3, < 0,
de#
21
10
04
$4 , 54 $4 e 54 $4@ para cada uma das classes da varivel idade, conforme pode ser
observado no quadro 6.
K;
15
25
35
45
55
-
54 $4
105
325
735
450
220
A " 2L+>3
54 $4@
1.575
8.125
25.725
20.250
12.100
A " 0/L//3
" 2,EJ=,
Em que:
O
Q 2,,
$
P
S = desvio-padro
$B = mdia
STT
UVTT
Q 2,, W =3E/2X
YYTT
@ZTT
Q 2,, W .,E/.X
Resumo
Algumas medidas utilizadas para identificar o grau de disperso entre os
elementos de um conjunto so amplitude total, varincia, desvio padro e
coeficiente de variao, tanto para dados no agrupados quanto para dados
agrupados com e sem intervalo de classes. A amplitude total definida pela
diferena entre o maior e o menor valor analisado em uma varivel. A varincia
e o desvio padro so medidas que levam em considerao a totalidade dos
valores da varivel em estudo, por isso so ndices de variabilidade bastantes
estveis.
Especificamente, a varincia encontrada a partir dos desvios em torno
da mdia aritmtica. J o desvio padro a medida de disperso mais utilizada
porque aponta de forma mais precisa a disperso dos valores em relao
mdia aritmtica. O coeficiente de variao uma medida relativa de
disperso. til quando se deseja comparar em termos relativos o grau de
concentrao em torno da mdia de sries distintas.
Atividades
1. Em uma semana, a empresa X recebeu as seguintes quantidades de email:
D
1
S
10
T
14
Q
12
Q
7
S
6
S
3
$4
1
2
3
4
5
6
54
6
3
1
4
2
4
b) 2,62.
c) 1,28.
d) 1,05.
e) 2,05.
3. Suponha que as notas finais de uma disciplina de programao foram:
3, 7, 4, 5, 1, 8, 4, 6, 5, 6, 2, 4, 6, 9, 8, 4, 5, 5, 6
Separe os dados em dois grupos: aprovados, com nota maior ou igual que 5;
reprovados, com nota menor que cinco. Quais so os valores aproximados de
seus respectivos coeficientes de variao?
a) Aprovados = 27,17%; Reprovados = 35,67%.
b) Aprovados = 17,18%; Reprovados = 11,2%.
c) Aprovados = 63,3%; Reprovados = 31,4%.
d) Aprovados = 22,35%; Reprovados = 28,18%.
e) Aprovados = 8,1%; Reprovados = 15,31%.
4. Considere que em uma rede existam quatro roteadores: A, B, C, D. Foram
obtidas mostras do tempo de resposta de cada um dos roteadores, expressas
na tabela a seguir. A partir dos tempos, foi possvel determinar a mdia de
tempo de resposta dos roteadores.
ROTEADOR
A
B
C
D
$4 ( $B
-6,57
2,43
6,43
0,43
-0,57
-1,57
-4,57
A partir dos valores da ltima coluna, calculamos A%$4 ( $B '@ , que 16,40
$4
1
2
3
4
5
6
54
6
3
1
4
2
4
A " =,
54 $4
6
6
3
16
10
24
A " /2
54 $4@
6
12
9
64
50
144
A " =+3
YEZ@
[EUU
YEY@
UEY\
Amplitude total
Varincia
Desvio padro
Coeficiente de
variao
ROTEADOR A
0.25
0.6
0.5
ROTEADOR B
0.009
0.031
0.030
ROTEADOR C
0.096
0.177
0.173
ROTEADOR D
23.936%
53.867%
36.131%
0.2
0.006
0.075
40.656%