Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estatística - Medidas de Dispersão

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 13

Captulo 7 Medidas de disperso

Introduo
Para a compreenso deste captulo, necessrio que voc tenha
entendido os conceitos apresentados nos captulos 4 (ponto mdio, classes e
frequncia) e 6 (mdia). Assim ser fcil para voc calcular as medidas de
disperso (amplitude total, varincia, desvio padro e coeficiente de variao)
para variveis quantitativas e interpretar os valores dessas medidas em
diferentes situaes do cotidiano.
Estudamos, no captulo anterior, mecanismos para encontrar valores
(mdia, mediana e moda) que sintetizam o comportamento dos elementos de
um conjunto de dados. Esses valores fornecem parmetros significativos para
uma anlise dos dados, porm ainda importante identificar como variam ou
diferenciam as caractersticas dos elementos de um conjunto.
Imagine, por exemplo, que voc precise analisar o valor da cotao do
dlar no ano passado. Inicialmente, voc precisar de uma mdia aritmtica
envolvendo os doze meses. Alm da mdia, precisamos observar se houve ou
no uma discrepncia significativa do valor durante esses meses. Caso
positivo, ento podemos afirmar que ocorreu uma grande variabilidade ou
disperso dos dados em relao mdia. Caso contrrio, ento o valor da
cotao permaneceu bastante semelhante durante o ano.
Nesse captulo, aprenderemos como medir o grau de concentrao ou
disperso dos dados em torno da mdia. Por isso estudaremos as principais
medidas de disperso, que so: amplitude total, varincia, desvio padro e
coeficiente de variao. A escolha de uma medida em relao outra
depender do objetivo que se pretende alcanar.
Para exemplificar os clculos das medidas de disperso, usaremos tanto
dados no agrupados quanto dados agrupados com e sem intervalos de
classe. Comearemos com a amplitude total.
7.1 Amplitude total

De acordo com Crespo (2002), a amplitude total a diferena entre o


maior e o menor valor analisado em uma varivel. Vejamos, agora, como
calcular amplitude total com dados agrupados e no agrupados.
7.1.1 Amplitude total dados no agrupados
Para dados no agrupados, o clculo da amplitude total pode ser
expresso pela seguinte frmula:

! " #$%&$' ( $%&)'

Considerando os valores das variveis A, B e C apresentados a seguir,


vamos, ento, calcular a amplitude total.
A
B
C

80
76
55

80
77
65

80
78
70

80
79
75

80
80
80

80
80
85

80
81
85

80
82
90

80
83
95

80
84
100

Assim, aplicando a frmula anterior para esses dados, obteremos os


seguintes resultados:

!* " #$%&$' ( $%&)' " +, ( +, " ,

!- " #$%&$' ( $%&)' " +. ( /0 " +

!1 " #$%&$' ( $%&)' " 2,, ( 33 " .3

Nesse caso, podemos observar que a varivel A obteve uma amplitude


total igual a 0, ou seja, uma disperso nula. Ento significa que os valores no
variam entre si. A varivel B, por sua vez, obteve uma amplitude igual a 8. J a
varivel C teve uma amplitude total igual a 45.
Embora o valor da amplitude total tenha sido diferente para as variveis
A, B e C, caso voc calcule a mdia aritmtica para essas variveis, observar
que o valor encontrado ser igual a 80 para todas as situaes.
Independentemente da mdia, podemos verificar que a varivel A possui
elementos muito mais homogneos do que as variveis B e C. E, tambm, que
os elementos da varivel B so mais homogneos do que os da varivel C.
Portanto possvel encontrar conjuntos de elementos que possuem o mesmo
valor da mdia aritmtica, mas eles podem ser compostos por elementos
totalmente diferentes.

De um modo geral, quanto maior for o valor encontrado para a amplitude


total, maior ser a discrepncia ou a variao entre os valores da varivel.
7.1.2 Amplitude total dados agrupados
Para dados agrupados sem intervalos de classe, a frmula usada para a
identificao da amplitude total semelhante utilizada para dados no
agrupados. Porm o processo se diferencia porque identificaremos o maior e o
menor valor em uma tabela de distribuio de frequncia.
1.

Por exemplo, considere os dados da varivel $ apresentados no quadro

Quadro 1: Valores e frequncia da varivel $


$4
1
2
3
4
5

54
1
3
2
5
9

Nesse caso, como 5 e 1 so o maior e o menor valores,

respectivamente, da varivel $, aplicando a frmula anterior, teramos o


seguinte resultado:
Cabe

! " #$%&6$' ( $%&7)' " 3 ( 2 " .

ressaltar

que

esses

valores

foram

selecionados

independentemente do valor da frequncia associada a eles.


No entanto, se nos depararmos com dados agrupados com intervalos de
classe, a amplitude total ser encontrada pela diferena entre o limite superior
da ltima classe e o limite inferior da primeira classe, conforme pode ser
expresso na frmula a seguir:

! " #8%&6$' ( 9%&7)'

Cabe ressaltar que no valor obtido para a amplitude total com dados
agrupados com intervalos de classe levado em considerao somente os
dois valores extremos da srie, descartando qualquer valor intermedirio
existente. Sendo assim, o valor obtido somente uma indicao aproximada
da disperso dos dados.

Considere, agora, os dados do quadro 2 para o clculo da amplitude


total.
Quadro 2: Valores e frequncia da varivel salrio
SALRIO (EM REAIS)
2,,, < =,,,
=,,, < >,,,
>,,, < .,,,
.,,, < 3,,,
3,,, < 0,,,

:;
07
13
21
10
04

Nesse caso, aplicando a frmula apresentada anteriormente, obteremos


o seguinte resultado:

! " #8%&6$' ( 9%&7)' " 0,,, ( 2,,, " 3,,,

Logo ! " #3,,, reais. Diante disso, podemos verificar que a amplitude

total como medida de disperso um valor limitado e instvel, visto que valores
internos da srie nunca so levados em considerao.
Veja agora a medida de disperso varincia e desvio padro.
7.2 Varincia e desvio padro

A varincia e o desvio padro so medidas que levam em considerao


a totalidade dos valores da varivel em estudo, e no apenas os valores
externos, como a amplitude total (CRESPO, 2002). Por isso, essas medidas
so ndices de variabilidade bastantes estveis e, consequentemente, muito
utilizados no cotidiano. Alm disso, a varincia e o desvio padro
complementam informaes obtidas pelas medidas de tendncia central.

A varincia, denotada por ? @ , encontrada a partir dos desvios em torno

da mdia aritmtica, conforme pode ser observado na frmula a seguir:


?@ "

A%$4 ( $B '@
#
)

Aqui $4 representa cada elemento do conjunto de dados, $B a mdia do

conjunto e ) representa o nmero de elementos do conjunto.

O desvio padro, denotado por ?, a raiz quadrada da varincia. Assim

teremos:

? " C? @

ou
?"D

A%$4 ( $B '@
)

O desvio padro a medida de disperso mais utilizada porque aponta


de forma mais precisa a disperso dos valores em relao mdia aritmtica
(NAZARETH, 2003). Para exemplificar o clculo do desvio padro para dados
no agrupados, considere a srie de valores a seguir:
18, 22, 15, 17, 19, 21, 16
Inicialmente, precisamos encontrar a mdia dessa srie, que 18,2.
Depois, precisaremos encontrar, para cada elemento, a diferena do seu valor
e a mdia. Para facilitar o processo, vamos criar uma tabela contendo duas

colunas, uma para o valor de $4 , e outra para o valor de $4 ( $B , conforme pode

ser visto no quadro 3.

Quadro 3: Valores para $4 e $4 ( $B

$4
18
22
15
17
19
21
16

$4 ( $B
-0,2
3,8
-3,2
-1,2
0,8
2,8
-2,2

A partir dos valores da tabela, calculamos A%$4 ( $B '@ , que igual a 0,36.

Assim, aplicando a frmula do desvio padro, teramos o seguinte:


A%$4 ( $B '@
,E>0
"D
" C,E,3 " ,E,=
?"D
/
)

O desvio padro de uma srie ser sempre um valor positivo, e quanto


maior esse valor, maior ser a disperso entre os elementos.
Quando nos deparamos com dados agrupados, o valor das frequncias
tambm precisa ser levado em considerao para o clculo do desvio padro.
Assim sendo, a frmula para o clculo do desvio padro para dados agrupados
a seguinte:

?"D

A 54 $4@
A 54 $4
(F
G
)
)

Temos 54 , que representa a frequncia de um determinado elemento.

Para exemplificar o clculo do desvio padro para dados agrupados sem


intervalos de classe, vamos considerar os dados apresentados no quadro 1.
Para auxiliar a aplicao da frmula do desvio padro, criaremos um quadro
para encontrar os somatrios da frequncia dos valores existentes (equivalente
a

de #

n),

54 $4 e de 54 $4@ , conforme pode ser visualizado no quadro 4.

Quadro 4: Valores para $4 , 54 , 54 $4 e 54 $4@


$4
54
1
1
2
3
3
2
4
5
5
9
A " =,

54 $4
1
6
6
20
45
A " /+

54 $4@
1
12
18
80
225
A " >>0

Aplicando, agora, a regra do desvio padro para dados agrupados,


teramos:
A 54 $4@
A 54 $4
>>0
/+ @
?"D
(F
G "D
( H I " C20E+ ( 23E=2 " C2E3J " 2E=0
)
)
=,
=,
@

O processo para encontrar o desvio padro para dados agrupados com


intervalos de classe semelhante ao anterior, sendo apenas necessrio
encontrar o ponto mdio ($4 ) de cada uma das classes antes de calcular o

produto de 54 $4 e de 54 $4@ . Assim realizaremos a multiplicao do ponto mdio

de cada classe com a sua respectiva frequncia ao invs do valor exato da


varivel.
Para exemplificar o clculo do desvio padro, vamos considerar os
dados da varivel idade no quadro 5.
Quadro 5: Valores e frequncia da varivel idade
IDADE
2, < =,
=, < >,

:;
07
13

>, < .,
., < 3,
3, < 0,

de#

21
10
04

De modo similar, construiremos uma tabela para apresentar os valores

$4 , 54 $4 e 54 $4@ para cada uma das classes da varivel idade, conforme pode ser

observado no quadro 6.

Quadro 6: Valores para $4 , 54 $4 e 54 $4@


IDADE
:;
07
2, < =,
13
=, < >,
21
>, < .,
10
., < 3,
04
3, < 0,
A " 33

K;
15
25
35
45
55
-

54 $4
105
325
735
450
220
A " 2L+>3

54 $4@
1.575
8.125
25.725
20.250
12.100
A " 0/L//3

Ao aplicar a frmula com os dados obtidos na tabela, teramos o


seguinte:
A 54 $4@
A 54 $4
0/L//3
2L+>3 @
D
D
?"
(F
G "
(H
I
)
)
33
33
@

" C2L=>=E=/ ( 2L22>E,2 " C22JE=3

Logo ? " 2,EJ=.

" 2,EJ=,

Segundo Crespo (2002), o desvio padro possui algumas propriedades

que permitem introduzir, no clculo do desvio padro, simplificaes teis.


Entre as propriedades existentes, destacam-se:
somando-se (ou subtraindo-se) uma constante a (de) todos os
valores de uma varivel, o desvio padro permanecer o mesmo;
multiplicando-se todos os valores de uma varivel por uma
constante (diferente de zero), o desvio padro ficar multiplicado
por essa constante.
Voc j conheceu a amplitude total, a varincia e o desvio padro. Agora
finalizaremos com o coeficiente de variao.

7.3 Coeficiente de variao


O coeficiente de variao uma medida relativa de disperso. Ela til
quando se deseja comparar em termos relativos o grau de concentrao em
torno da mdia de sries distintas. calculado por:
MN "

Em que:

O
Q 2,,
$
P

S = desvio-padro
$B = mdia

O coeficiente de variao expresso em porcentagem.


Para exemplificar, suponha que o acesso mdio de homens em um ms
em um stio web de 3.500, com desvio padro de 900; e das mulheres em
mdia 2.700, com desvio padro de 1.100. Ento:
R

Para os homens: MN " "


$
P

STT

UVTT

Para as mulheres: MN " "


$
P

Q 2,, W =3E/2X

YYTT
@ZTT

Q 2,, W .,E/.X

Assim conclumos que os acessos das mulheres apresentam maior


disperso relativa do que os dos homens.
Na prtica, considera-se que um coeficiente de varincia superior a 50%
indica alto grau de disperso e, por consequncia, baixa representatividade da
mdia. Por outro lado, quanto menor for o valor de seu coeficiente de varincia,
mais representativa a mdia (MARTINS; DONAIRE, 2004, p. 164).
Chegamos ao fim do captulo e da disciplina. Esperamos que voc tenha
conseguido vislumbrar as possibilidades de aplicaes que a estatstica
fornece. Voc aprendeu, neste captulo, o porqu da necessidade de que um
conjunto de dados seja complementado por uma medida de disperso ou
variabilidade, sendo capaz de calcular as medidas de disperso para variveis
quantitativas e de interpretar os valores dessas medidas em diferentes
situaes do cotidiano.

Resumo
Algumas medidas utilizadas para identificar o grau de disperso entre os
elementos de um conjunto so amplitude total, varincia, desvio padro e
coeficiente de variao, tanto para dados no agrupados quanto para dados
agrupados com e sem intervalo de classes. A amplitude total definida pela
diferena entre o maior e o menor valor analisado em uma varivel. A varincia
e o desvio padro so medidas que levam em considerao a totalidade dos
valores da varivel em estudo, por isso so ndices de variabilidade bastantes
estveis.
Especificamente, a varincia encontrada a partir dos desvios em torno
da mdia aritmtica. J o desvio padro a medida de disperso mais utilizada
porque aponta de forma mais precisa a disperso dos valores em relao
mdia aritmtica. O coeficiente de variao uma medida relativa de
disperso. til quando se deseja comparar em termos relativos o grau de
concentrao em torno da mdia de sries distintas.
Atividades
1. Em uma semana, a empresa X recebeu as seguintes quantidades de email:
D
1

S
10

T
14

Q
12

Q
7

S
6

S
3

Diante disso, determine a amplitude total e o desvio padro.


2. Considere a distribuio a seguir que representa os valores de 20
lanamentos de um dado.

$4
1
2
3
4
5
6

O valor do desvio padro ser de


a) 1,65.

54
6
3
1
4
2
4

b) 2,62.
c) 1,28.
d) 1,05.
e) 2,05.
3. Suponha que as notas finais de uma disciplina de programao foram:
3, 7, 4, 5, 1, 8, 4, 6, 5, 6, 2, 4, 6, 9, 8, 4, 5, 5, 6
Separe os dados em dois grupos: aprovados, com nota maior ou igual que 5;
reprovados, com nota menor que cinco. Quais so os valores aproximados de
seus respectivos coeficientes de variao?
a) Aprovados = 27,17%; Reprovados = 35,67%.
b) Aprovados = 17,18%; Reprovados = 11,2%.
c) Aprovados = 63,3%; Reprovados = 31,4%.
d) Aprovados = 22,35%; Reprovados = 28,18%.
e) Aprovados = 8,1%; Reprovados = 15,31%.
4. Considere que em uma rede existam quatro roteadores: A, B, C, D. Foram
obtidas mostras do tempo de resposta de cada um dos roteadores, expressas
na tabela a seguir. A partir dos tempos, foi possvel determinar a mdia de
tempo de resposta dos roteadores.
ROTEADOR
A
B
C
D

TEMPOS (EM SEGUNDOS)


0.5, 0.25, 0.3, 0.45, 0.4, 0.5
0.1, 0.7, 0.25, 0.2, 0.3, 0.4, 0.35, 0.2
0.2, 0.4, 0.6, 0.7, 0.65, 0.5, 0.3
0.3, 0.15, 0.2, 0.1, 0.25, 0.1

MDIA (EM SEGUNDOS)


0.40
0.33
0.48
0.18

Qual a afirmao falsa?


a) A amplitude total do roteador A de 0.25.
b) A varincia do roteador B de 0.031, aproximadamente.
c) O desvio padro do roteador 'C de 0.173, aproximadamente.
d) O coeficiente de variao do roteador D de 40.656%, aproximadamente.
e) A maior varincia e desvio padro so os do roteador B; o menor
coeficiente de variao o do roteador D.

Comentrio das atividades


Para responder atividade 1, precisamos relembrar os conceitos de
amplitude total e de desvio padro para dados no agrupados. Assim,
aplicando a frmula da amplitude, obtivemos o seguinte resultado:
! " #$%&6$' ( $%&7)' " 2. ( 2 " 2>

Para o desvio padro, precisamos encontrar, inicialmente, a mdia que


7,57. Em seguida, construmos a tabela a seguir para identificar a diferena
entre o valor e a mdia.
$4
1
10
14
8
7
6
3

$4 ( $B
-6,57
2,43
6,43
0,43
-0,57
-1,57
-4,57

A partir dos valores da ltima coluna, calculamos A%$4 ( $B '@ , que 16,40

e, depois, aplicamos a frmula do desvio padro, que pode ser observada a


seguir:
A%$4 ( $B '@
20E.,
"D
" C=E>. " 2E3>
?"D
/
)
Para a atividade 2, precisamos criar a tabela a seguir como auxlio na
aplicao da frmula do desvio padro para dados agrupados.

$4
1
2
3
4
5
6

54
6
3
1
4
2
4
A " =,

54 $4
6
6
3
16
10
24
A " /2

54 $4@
6
12
9
64
50
144
A " =+3

Depois, aplicando os somatrios encontrados na frmula do desvio


padro, obtivemos o seguinte resultado:
A 54 $4@
A 54 $4
=+3
/2 @
?"D
(F
G "D
( H I " C2.E=3 ( 2=E0, " C2E03 " 2E=+
)
)
=,
=,
@

Logo a alternativa correta a (c), que apresenta o valor de 1,28.


Na atividade 3, a alternativa correta a letra (a). O primeiro passo foi
separar os conjuntos dos aprovados {7, 5, 8, 6, 5, 6, 6, 9, 8, 5, 5, 6} e dos
reprovados {3, 4, 1, 4, 2, 4, 4}. Na sequncia, foi necessrio calcular as

mdias: $B aprovados=6,33 e $B reprovados=3,14 e os desvios-padro: Saprovados=1,72 e


Sreprovados=1,12. Por fim, calculamos os coeficientes de varincia.
R

aprovados: MN " "


$
P

YEZ@
[EUU

reprovados: MN " "


$
P

Q 2,, " =/E2/X

YEY@
UEY\

Q 2,, " >3E0/X

Na atividade 4, a resposta solicitada se refere nica alternativa falsa,


correspondente letra (e). A partir dos dados fornecidos, foi possvel montar a
tabela a seguir.

Amplitude total
Varincia
Desvio padro
Coeficiente de
variao

ROTEADOR A
0.25
0.6
0.5

ROTEADOR B
0.009
0.031
0.030

ROTEADOR C
0.096
0.177
0.173

ROTEADOR D
23.936%
53.867%
36.131%

0.2

0.006

0.075

40.656%

De acordo com os dados expressos na tabela anterior, verificamos que a


alternativa (a) verdadeira, porque a amplitude total do roteador A 0.25. A
alternativa (b) tambm verdadeira, porque a varincia do roteador B , em
valores aproximados, 0.031. A alternativa (c) verdadeira, pois o roteador C
tem como desvio padro 0.173, aproximadamente. A alternativa (d) tem como
coeficiente de variao cerca de 40.656%. A alternativa (e) falsa porque,

apesar de a maior varincia e de o desvio padro serem realmente do roteador


B, o menor coeficiente de variao do roteador A, e no do D.
Referncias
CRESPO, Antnio Arnot. Estatstica fcil. So Paulo: Saraiva, 2002.
MARTINS, Gilberto de A.; DONAIRE, Denis. Princpios da estatstica: 900
exerccios resolvidos e propostos. So Paulo: Atlas 2004.
NAZARETH, Helenalda. Curso bsico de estatstica. So Paulo: tica, 2003.

Você também pode gostar