Curso-237934-Aula-02-5cfb-Grifado (LENDO)
Curso-237934-Aula-02-5cfb-Grifado (LENDO)
Curso-237934-Aula-02-5cfb-Grifado (LENDO)
As separatrizes são medidas que dividem (ou separam) uma série ordenada em duas ou mais partes, cada
uma contendo a mesma quantidade de elementos. Nesse caso, o nome da medida separatriz é definido de
acordo com a quantidade de partes em que a série é dividida:
• mediana: divide uma série ordenada em duas partes iguais, cada uma contendo 50% dos valores
da sequência;
• quartis: dividem uma série ordenada em quatro partes iguais, cada uma contendo 25% dos
valores da sequência;
• quintis: dividem uma série ordenada em cinco partes iguais, cada uma contendo 20% dos valores
da sequência;
• decis: dividem uma série ordenada em dez partes iguais, cada uma contendo 10% dos valores da
sequência; e
• percentis: dividem uma série ordenada em cem partes iguais, cada uma contendo 1% dos valores
da sequência.
Ao longo dessa aula, vamos estudar a mediana, os quartis, os decis e os percentis. Os quintis, por não serem
tão explorados em provas de concurso, não serão abordados.
MEDIANA
A mediana é, simultaneamente, uma MEDIDA DE POSIÇÃO, de TENDÊNCIA CENTRAL e SEPARATRIZ. Ela
caracteriza a posição central de uma série de valores. Além disso, também separa uma série de valores em
duas partes de tamanhos iguais, cada uma contendo o mesmo número de elementos. Muitas vezes, a
mediana é designada como valor mediano, sendo representada pelos símbolos 𝑴𝒅 ou, em menor
̃.
frequência, 𝒙
O método para determinação da mediana envolve a realização de uma etapa anterior, que consiste na
ordenação do conjunto de dados. Feito isso, a mediana é o elemento que ocupa a POSIÇÃO CENTRAL de
uma série de observações ordenada segundo suas grandezas (isto é, dados brutos organizados em rol
crescente ou decrescente).
Agora, determinaremos o elemento que ocupa a posição central desse conjunto de dados. Para isso,
devemos encontrar o termo que possui o mesmo número de elementos tanto à sua esquerda quanto à sua
direita. Em nosso exemplo, esse valor é o 8, pois existem cinco elementos antes dele e cinco após ele.
𝟏, 𝟐, 𝟑, 𝟓, 𝟕,
⏟ 𝟖,
⏟ 𝟗,
⏟ 𝟏𝟑, 𝟏𝟕, 𝟏𝟗, 𝟐𝟏.
𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐 𝒄𝒆𝒏𝒕𝒓𝒂𝒍 𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔
É importante notarmos que essa série possui um número ímpar de elementos. Quando isso acontece, isto
é, quando uma série possui um número ímpar de elementos, a mediana SEMPRE coincide com o elemento
central do conjunto de dados. Portanto, temos:
𝑀𝑑 = 8
Contudo, se porventura a série tivesse um número par de elementos, POR CONVENÇÃO, a mediana seria a
média aritmética dos dois termos centrais. Assim, caso adicionássemos o número 23 ao conjunto de dados
apresentado anteriormente, teríamos a seguinte situação:
𝟏, 𝟐, 𝟑, 𝟓, 𝟕,
⏟ 𝟖,
⏟ 𝟗, 𝟏𝟑, 𝟏𝟕, 𝟏𝟗, 𝟐𝟏, 𝟐𝟑.
⏟
𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒄𝒆𝒏𝒕𝒓𝒂𝒊𝒔 𝟓 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔
Nesse caso, em que temos um número par de elementos, a mediana é definida como a média aritmética dos
termos centrais, que são os números 8 e 9. Assim, temos:
8 + 9 17
𝑀𝑑 = = = 8,5
2 2
𝒏+𝟏
Note que, quando o número é ímpar, o termo central sempre ocupa a posição . Por outro lado, quando
𝟐
𝒏
o número de termos é par, existem dois termos centrais, sendo que o primeiro ocupa a posição ; e o
𝟐
𝒏
segundo ocupa a posição imediatamente seguinte, ou seja, + 𝟏.
𝟐
Essas relações são importantes porque nem sempre conseguiremos identificar a posição central tão
facilmente. Por exemplo, se tivermos uma série composta por 501 elementos, podemos afirmar que o termo
𝑛+1 501+1
central será o elemento ocupando a posição
2
= = 251, sem precisar recorrer a qualquer outro
2
método. Logo, a mediana terá o mesmo valor do termo central:
𝑀𝑑 = 𝑥251 .
𝒙𝟏 , 𝒙𝟐 , ⋯ , 𝒙𝟐𝟓𝟎 ,
⏟ 𝒙⏟𝟐𝟓𝟏 , 𝒙𝟐𝟓𝟐 , 𝒙𝟐𝟓𝟑 , ⋯ , 𝒙𝟓𝟎𝟏 .
⏟
𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝒕𝒆𝒓𝒎𝒐 𝒄𝒆𝒏𝒕𝒓𝒂𝒍 𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔
Agora, se tivermos uma série composta por 500 elementos, os termos centrais serão os elementos ocupando
as posições:
𝑛 500 𝑛 500
= = 250 e +1= + 1 = 251.
2 2 2 2
Vejamos a disposição dos termos centrais em relação aos demais elementos da série:
𝒙𝟏 , 𝒙𝟐 , ⋯ , 𝒙𝟐𝟒𝟗 , ⏟
⏟ 𝒙𝟐𝟓𝟎 , 𝒙𝟐𝟓𝟏 , 𝒙
⏟𝟐𝟓𝟐 , 𝒙𝟐𝟓𝟑 , ⋯ , 𝒙𝟓𝟎𝟎 .
𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒂𝒏𝒕𝒆𝒔 𝒕𝒆𝒓𝒎𝒐𝒔 𝒄𝒆𝒏𝒕𝒓𝒂𝒊𝒔 𝟐𝟓𝟎 𝒆𝒍𝒆𝒎𝒆𝒏𝒕𝒐𝒔 𝒅𝒆𝒑𝒐𝒊𝒔
Nessa situação, por convenção, a mediana será a média aritmética entre os termos centrais,
𝑥250 +𝑥251
𝑀𝑑 = .
2
Portanto, podemos estabelecer que a mediana de um conjunto composto por 𝑛 elementos ordenados de
forma crescente ou decrescente será:
𝑛+1
a) se 𝑛 for ímpar, o termo de ordem , isto é,
2
𝑴𝒅 = 𝒙𝒏+𝟏
𝟐
𝑛 𝑛
b) se 𝑛 for par, a média aritmética dos termos de ordem e + 1, isto é,
2 2
𝒙𝒏 + 𝒙𝒏+𝟏
𝟐 𝟐
𝑴𝒅 =
𝟐
A mediana nem sempre coincidirá com um elemento da série de dados. Isso somente acontecerá
quando o número de elementos da série de dados for ímpar, pois haverá coincidência entre os
valores da mediana e do termo que ocupa a posição central. Contudo, quando o número de
elementos for par, não existirá essa coincidência.
Quando o número de elementos do conjunto é ÍMPAR, o valor da mediana é único e igual ao termo
central. Porém, quando o número de elementos é PAR, a mediana pode ser QUALQUER VALOR
ENTRE OS TERMOS CENTRAIS, havendo infinitos valores possíveis para a mediana. Para
exemplificar, imaginemos os números 1 e 2 como termos centrais. Entre esses dois números temos
infinitas possibilidades de escolha, a exemplo de 1,01; 1,2; 1,673; etc. A mediana poderia ser
qualquer desses valores, contudo, POR CONVENÇÃO, adotamos a média aritmética dos valores
centrais.
Seja {𝑥𝑛 } uma série de dados estatísticos composta por n elementos ordenados de forma crescente
ou decrescente, isto é, {𝑥𝑛 } = {𝑥1 , 𝑥2 , 𝑥3 , ⋯ , 𝑥𝑛 }. A mediana desse conjunto de dados será:
𝑛+1
a) se 𝑛 for ímpar, o termo de ordem , isto é, 𝑀𝑑 = 𝑥𝑛+1
2 2
𝑥𝑛 + 𝑥𝑛
𝑛 𝑛 +1
b) se 𝑛 for par, a média aritmética dos termos de ordem e + 1, isto é, 𝑀𝑑 = 2 2
2 2 2
𝑀𝑑 = 𝑥6 ⇒ 𝑀𝑑 = 9
𝑦𝑛 + 𝑦𝑛+1 𝑦8 + 𝑦8+1
2 2 2 2 𝑦4 + 𝑦4+1 𝑦4 + 𝑦5
𝑀𝑑 = = = =
2 2 2 2
Logo, a mediana será a média aritmética entre o quarto e o quinto elementos da série, isto é:
𝑦4 + 𝑦5 16 + 18 34
𝑀𝑑 = = = = 17 ⇒ 𝑀𝑑 = 17
2 2 2
Como vimos, a mediana depende apenas do termo que ocupa a posição central em um conjunto de dados,
e não dos valores de todos os elementos que compõem a série. Por isso, dizemos que a mediana não sofre
tanta influência pela presença de valores extremos/discrepantes quanto à média. Essa é, inclusive, uma
das principais diferenças entre essas duas medidas.
Podemos constatar essa propriedade da mediana por meio de um exemplo. Considere que tenhamos
inicialmente a seguinte série:
1 + 2 + 4 + 6 + 7 + 9 + 10 + 11 + 13 63
𝑥= = =7
9 9
Como o número de elementos é ímpar, 𝑛 = 9, a mediana será o elemento que ocupa a posição:
𝑛 + 1 9 + 1 10
= = = 5.
2 2 2
O quinto termo é 7, portanto:
𝑀𝑑 = 𝑥5 ⇒ 𝑀𝑑 = 7.
Agora, considere que o elemento de valor 13 tenha sido alterado para 130.000. Veja o que acontece com a
média aritmética desse conjunto:
1 + 2 + 4 + 6 + 7 + 9 + 10 + 11 + 130.000
𝑥= = 14.450 ⇒ 𝑥 = 14.450
9
Como o número de elementos permanece inalterado, 𝑛 = 9, a mediana continua sendo o elemento que
ocupa a posição:
𝑛 + 1 9 + 1 10
= = = 5.
2 2 2
𝑀𝑑 = 𝑥5 ⇒ 𝑀𝑑 = 7.
Portanto, a alteração no valor de um único elemento do conjunto de dados causou um impacto significativo
na média, ao passo que a mediana permaneceu inalterada. Por isso, dizemos que a média é mais
influenciada pela presença de valores extremos que a mediana.
A mediana depende da apenas posição e não dos valores dos elementos de uma série ordenada.
Essa é uma das principais diferenças entre a média e a mediana, pois a primeira é muito impactada
pela presença de valores extremos enquanto a última não.
Em geral, os valores da média aritmética e da mediana são diferentes. Por exemplo, a média da série
{𝑥𝑛 } = {1, 2, 4, 6, 7, 9, 10, 11, 13} é:
1 + 2 + 4 + 6 + 7 + 9 + 10 + 11 + 130.000
𝑥= = 14.450,
9
enquanto sua mediana é:
𝑀𝑑 = 7.
(CESPE/IPHAN/2018) Define-se estatística descritiva como a etapa inicial da análise utilizada para
descrever e resumir dados. Em relação às medidas descritivas, julgue o item a seguir.
A mediana é o valor que ocupa a posição central da série de observações de uma variável, dividindo-se o
conjunto de valores ordenados em partes assimétricas desiguais.
Comentários:
A mediana é o valor que ocupa a posição central da série de observações de uma variável, dividindo o
conjunto em duas partes com a mesma quantidade de valores. As partes não serão necessariamente
assimétricas desiguais. Se tivéssemos um conjunto formado apenas por elementos repetidos, por exemplo,
a mediana dividiria os valores em partes simétricas.
Gabarito: Errado.
(CESPE/IPHAN/2018) Uma pesquisa a respeito das quantidades de teatros em cada uma de 11 cidades
brasileiras selecionadas apresentou o seguinte resultado: {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4}. Com referência a
esses dados, julgue o item seguinte.
A mediana do conjunto é igual a 3.
Comentários:
A mediana divide um conjunto ao meio e ocupa a posição central. Temos 11 elementos na amostra. Então,
a mediana ocupará a posição:
𝑛 + 1 11 + 1 12
= = =6
2 2 2
Vejamos:
{1, 2, 2, 3, 3, ⏟
𝟑 , 4, 4, 4, 4, 4}
𝟔º 𝒕𝒆𝒓𝒎𝒐 = 𝒕𝒆𝒓𝒎𝒐 𝒄𝒆𝒏𝒕𝒓𝒂𝒍
(CESPE/FUB/2018) A tabela seguinte mostra as quantidades de livros de uma biblioteca que foram
emprestados em cada um dos seis primeiros meses de 2017.
Mês
1 2 3 4 5 6
Comentários:
A mediana é o termo central de uma amostra ou população. Se temos 6 meses, então a mediana poderá ser
encontrada pela média dos termos que ocupam as posições 3 e 4, pois, nesse caso, não há apenas um termo
central.
Assim, o primeiro passo a se dar é colocar os dados da tabela em ordem crescente (isto é, em rol crescente):
50 150 ⏟
200 250 250 300
𝑡𝑒𝑟𝑚𝑜𝑠 𝑐𝑒𝑛𝑡𝑟𝑎𝑖𝑠
O raciocínio adotado no cálculo da mediana para dados agrupados por valor (sem intervalos de classe) é
similar ao empregado no caso dos dados não-agrupados. Basicamente, teremos que encontrar um valor que
dividirá a distribuição de frequências em duas partes contendo o mesmo número de elementos.
Considere a seguinte situação hipotética: uma empresa realizou uma pesquisa para medir o nível de
satisfação dos clientes com relação ao seu atendimento. Os clientes puderam atribuir notas de 0 a 5 no que
diz respeito ao nível de satisfação, resultando na seguinte distribuição de frequências:
Nível de
Frequência (𝒇𝒊 )
Satisfação (𝑿𝒊 )
0 3
1 5
2 8
3 10
4 13
5 10
3 + 5 + 8 + 10 + 13 + 10 = 49.
Como o número de entrevistados é ímpar, 𝑛 = 49, a mediana será o termo que ocupa a posição de ordem:
𝑛 + 1 49 + 1 50
= = = 25
2 2 2
Em outros termos, a mediana será o elemento que ocupa a vigésima quinta posição. Para chegarmos a esse
elemento, precisamos percorrer cada um dos níveis de satisfação. Reparem que três clientes atribuíram a
nota 0 (zero); cinco atribuíram a nota 1 (um); e oito atribuíram a nota 2 (dois). Portanto, até esse ponto,
temos um total de 16 avaliações:
3 + 5 + 8 = 16
Vejam que ainda não chegamos na posição desejada, isto é, na vigésima quinta. Contudo, sabemos que o
próximo nível de satisfação, referente à nota 3 (três), teve frequência absoluta igual a 10. Se somarmos essas
dez novas avaliações com o total obtido anteriormente, chegaremos a um valor que ultrapassa a posição
procurada (16 + 10 = 26). Assim, descobrimos que a mediana está localizada nessa faixa de avaliação.
Portanto,
𝑀𝑑 = 𝑥25 = 3
Esse procedimento pode ser simplificado com a introdução de uma coluna adicional para armazenar as
frequências acumuladas. Já vimos que, para calcularmos a frequência acumulada, devemos repetir a primeira
frequência e somar as frequências subsequentes, exibindo os resultados a cada linha. Observem:
Nível de Frequência
Frequência Memória
Satisfação Acumulada
(𝒇𝒊 ) de cálculo
(𝑿𝒊 ) (𝒇𝒂𝒄 )
0 3 3 =3
1 5 8 = 3+5 = 8
2 8 16 = 8 + 8 = 16
3 10 26 = 16 + 10 = 26
4 13 39 = 26 + 13 = 39
5 10 49 = 39 + 10 = 49
Nível de Frequência
Frequência
Satisfação Acumulada
(𝒇𝒊 )
(𝑿𝒊 ) (𝒇𝒂𝒄 )
0 3 3
1 5 8
2 8 16
3 10 26
4 13 39
5 10 49
Reparem que o número 16, na terceira linha da coluna de frequências acumuladas, representa a soma das
frequências absolutas simples das três primeiras linhas, isto é, 3 + 5 + 8. Assim, concluímos que 16 clientes
avaliaram o atendimento da empresa com nota igual ou inferior a 2. De forma análoga, como 49 clientes
participaram da pesquisa, podemos afirmar que 33 avaliaram o atendimento com nota igual ou superior a 3.
Observem que a introdução da coluna de frequências acumuladas torna possível calcularmos a mediana de
forma praticamente imediata. Nesse sentido, se n for ímpar, basta identificarmos o valor da variável
correspondente à primeira frequência acumulada imediatamente igual ou superior à posição de ordem
𝒏+𝟏
; e, se n for par, basta identificarmos os dois valores correspondentes às frequências acumuladas
𝟐
𝒏 𝒏
imediatamente iguais ou superiores às posições de ordens e 𝟐 + 𝟏, respectivamente.
𝟐
𝑛+1 49+1
Em nosso exemplo, como a frequência total é ímpar, teremos que buscar pela posição = = 25. A
2 2
mediana será o valor da variável correspondente à primeira frequência acumulada maior ou igual a essa
posição, portanto, 𝑀𝑑 = 3. Vejamos:
Nível de Frequência
Frequência
Satisfação Acumulada
(𝒇𝒊 )
(𝑿𝒊 ) (𝒇𝒂𝒄 )
0 3 3
1 5 8
2 8 16
3 10 26 (> 25)
4 13 39
5 10 49
Assim, podemos estabelecer que a mediana de uma tabela de frequências composta por um total de 𝑛
elementos será:
a) se 𝑛 for ímpar, o valor identificado na tabela correspondente à frequência acumulada imediatamente
𝑛+1
igual ou superior à posição de ordem , isto é,
2
𝑴𝒅 = 𝑿𝒏+𝟏
𝟐
b) se 𝑛 for par, a média aritmética dos valores identificados na tabela correspondentes às frequências
𝑛 𝑛
acumuladas imediatamente iguais ou superiores às posições de ordens e + 1, isto é,
2 2
𝑿𝒏 + 𝑿𝒏+𝟏
𝟐 𝟐
𝑴𝒅 =
𝟐
Calcular a mediana da seguinte tabela de frequências:
Nota Frequência
(𝑿𝒊 ) (𝒇𝒊 )
6 5
7 15
8 10
9 7
10 3
Frequência
Nota Frequência
Acumulada
(𝑿𝒊 ) (𝒇𝒊 )
(𝒇𝒂𝒄 )
6 5 5
7 15 20
8 10 30
9 7 37
10 3 40
TOTAL 40
Como o número de elementos é par, 𝑛 = 40, temos dois termos ocupando as posições centrais. O
𝑛 40 𝑛
primeiro termo ocupa a posição = = 20; o segundo, a posição + 1 = 21. Assim, a mediana
2 2 2
será a média aritmética dos termos que ocupam essas duas posições.
A frequência acumulada indica que 20 elementos foram contados até a segunda linha. Portanto,
𝑥20 = 7
Logo, o termo de posição 21 está na linha seguinte:
𝑥21 = 8
Assim, a mediana é:
𝑥20 + 𝑥21 7 + 8
𝑀𝑑 = = = 7,5
2 2
(CESPE/Pref. SL/2017)
Texto 11A2CCC
A tabela a seguir apresenta uma comparação entre a evolução populacional ocorrida na cidade de São
Luís, no estado do Maranhão e no Brasil, a cada cinco anos, de 1985 a 2010.
Com base na tabela do texto 11A2CCC, considerando-se a sequência dos seis valores correspondentes à
população de São Luís, infere-se que a mediana desses valores é igual a
a) 725.000.
b) 775.000.
c) 825.000.
d) 875.000.
e) 700.000.
Comentários:
A mediana é o termo central de uma amostra ou população. Se temos 6 observações representadas na
tabela, então a mediana poderá ser encontrada pela média dos termos que ocupam as posições 3 e 4 pois
nesse caso não há apenas um termo central. Os dados já estão ordenados em ordem crescente. Então:
780 + 870 1650
𝑀𝑑 = =
2 2
𝑀𝑑 = 825
Gabarito: C.
(CESPE/TCE-PA/2016)
Número diário de
Frequência
denúncias registradas
Relativa
(X)
0 0,3
1 0,1
2 0,2
3 0,1
4 0,3
Total 1,0
Comentários:
A mediana é o valor associado a uma frequência relativa acumulada de 50%, ou seja, que separa os 50%
menores dos 50% maiores. Vamos calcular a frequência relativa acumulada.
Frequência
Número de Frequência
Relativa
denúncias Relativa
Acumulada
(𝑿𝒊 ) (𝒇𝒓 )
(𝒇𝒓 𝒂𝒄 )
O raciocínio adotado no cálculo da mediana para dados agrupados em classes é muito similar ao empregado
no tópico anterior. Agora, contudo, não nos importaremos com o número de elementos da série.
Adotaremos um único procedimento de cálculo, independentemente de termos um número par ou ímpar
de elementos.
Considere a distribuição de frequências descrita a seguir, que resume as idades de um grupo de 50 alunos
do Estratégia Concursos:
Frequência
Idades
(𝒇𝒊 )
23 ⊢ 26 3
26 ⊢ 29 4
29 ⊢ 32 10
32 ⊢ 35 13
35 ⊢ 38 10
38 ⊢ 41 6
41 ⊢ 44 4
TOTAL 50
A etapa inicial do cálculo da mediana consiste na construção da coluna de frequências acumuladas:
Frequência
Frequência
Idades Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
23 ⊢ 26 3 3
26 ⊢ 29 4 7
29 ⊢ 32 10 17
32 ⊢ 35 13 30
35 ⊢ 38 10 40
38 ⊢ 41 6 46
41 ⊢ 44 4 50
TOTAL 50
Para calcular a mediana de dados que estão agrupados por intervalo de classes, precisamos identificar a
classe em que se encontra a mediana, a chamada classe mediana, que corresponde à frequência acumulada
imediatamente igual ou superior à metade da frequência total, ou seja, metade da soma das frequências
simples, ∑ 𝒇𝒊 ⁄𝟐. Em nosso exemplo, temos:
∑ 𝑓𝑖 50
= = 25
2 2
Agora, devemos comparar o valor encontrado com os valores presentes na coluna de frequências
acumuladas, percorrendo-os de cima para baixo. A classe mediana será a primeira classe em que a frequência
acumulada for igual ou superior a 25. Assim, teremos que analisar o seguinte:
Pronto, encontramos a classe mediana. Nesse ponto, paramos a comparação e verificamos que a mediana
se encontra na quarta classe, isto é, no intervalo entre 32 e 35.
Conhecendo a classe mediana, podemos aplicar a fórmula da mediana, a seguir:
∑𝒇
( 𝟐 𝒊 ) − 𝒇𝒂𝒄 𝒂𝒏𝒕
𝑴𝒅 = 𝒍𝒊𝒏𝒇 + [ ]×𝒉
𝒇𝒊
em que:
ℎ = 35 − 32 = 3.
∑𝑓
( 𝑖 ) − 𝑓𝑎𝑐 𝑎𝑛𝑡
2
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [ ]×ℎ
𝑓𝑖
50
( ) − 17
𝑀𝑑 = 32 + [ 2 ]×3
13
25 − 17
𝑀𝑑 = 32 + ( )×3
13
8
𝑀𝑑 = 32 + ( ) × 3 ≅ 33,85
13
Com a memorização da fórmula da mediana para dados agrupados em classes, você conseguirá
compreender, com mais facilidade, a aplicação dos quartis, decis e percentis. As fórmulas dessas
medidas sofrem poucas alterações em relação à fórmula da mediana. Por isso, recomendo
fortemente que internalizem a expressão:
∑𝑓
( 𝑖 ) − 𝑓𝑎𝑐 𝑎𝑛𝑡
2
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [ ]×ℎ
𝑓𝑖
A fórmula apresentada anteriormente é obtida pelo método de interpolação linear. Esse método
consiste, basicamente, em utilizar valores conhecidos para estimar valores desconhecidos de forma
linear, isto é, por meio de uma reta. No caso da mediana, a reta se inicia no ponto (𝑙𝑖𝑚𝑖𝑛𝑓 , 𝑓𝑎𝑐 );
𝑎𝑛𝑡
passa pelo ponto (𝑀𝑑 , ∑ 𝑓𝑖 ⁄2) e termina no ponto (𝑙𝑖𝑚𝑖𝑛𝑓 + ℎ, 𝑓𝑎𝑐 + 𝑓𝑖 ). Vejamos:
𝑎𝑛𝑡
Em virtude da semelhança entre os triângulos 𝐴𝐵𝐶 e 𝐴𝐷𝐸, podemos estabelecer a seguinte relação
de proporcionalidade:
𝑀𝑑 − 𝑙𝑖𝑛𝑓 (𝑙𝑖𝑛𝑓 + ℎ) − 𝑙𝑖𝑛𝑓
=
∑𝑓 (𝑓𝑎𝑐 + 𝑓𝑖 ) − 𝑓𝑎𝑐
( 𝑖 ) − 𝑓𝑎𝑐 𝑎𝑛𝑡 𝑎𝑛𝑡
2 𝑎𝑛𝑡
𝑀𝑑 − 𝑙𝑖𝑛𝑓 ℎ
=
∑𝑓 𝑓𝑖
( 𝑖 ) − 𝑓𝑎𝑐
2 𝑎𝑛𝑡
∑ 𝑓𝑖
( ) − 𝑓𝑎𝑐
2 𝑎𝑛𝑡
𝑀𝑑 − 𝑙𝑖𝑛𝑓 = ×ℎ
𝑓𝑖
[ ]
Assim, chegamos à fórmula mostrada anteriormente:
∑ 𝑓𝑖
( ) − 𝑓𝑎𝑐
2 𝑎𝑛𝑡
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + ×ℎ
𝑓𝑖
[ ]
Calcular a mediana da distribuição de frequências apresentada a seguir, referente às estaturas de
um grupo de 40 alunos:
Frequência
Estaturas
(𝒇𝒊 )
150 ⊢ 154 4
154 ⊢ 158 9
158 ⊢ 162 11
162 ⊢ 166 8
166 ⊢ 170 5
170 ⊢ 174 3
TOTAL 40
Frequência
Frequência
Estaturas Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
150 ⊢ 154 4 4
154 ⊢ 158 9 13
158 ⊢ 162 11 24
162 ⊢ 166 8 32
166 ⊢ 170 5 37
170 ⊢ 174 3 40
TOTAL 40
Agora, precisamos identificar a classe mediana. Para tanto, vamos calcular sua posição por meio da
expressão:
∑ 𝑓𝑖 40
= = 20
2 2
Devemos comparar esse valor com os existentes na coluna de frequências acumuladas, da mesma
maneira que fizemos anteriormente. A classe mediana será a primeira classe em que a frequência
acumulada for igual ou superior a 20.
Assim, teremos:
• a primeira frequência acumulada (4) é maior ou igual a 20? Não;
• a segunda frequência acumulada (13) é maior ou igual a 20? Não;
• a terceira frequência acumulada (24) é maior ou igual a 20? Sim.
Nesse ponto, paramos a comparação e verificamos que a mediana se encontra na terceira classe,
isto é, no intervalo entre 158 e 162.
Conhecendo a classe mediana, podemos identificar os termos empregados na fórmula da mediana:
∑ 𝑓𝑖 = 40; 𝑙𝑖𝑛𝑓 = 158; 𝑓𝑎𝑐 𝑎𝑛𝑡 = 13; 𝑓𝑖 = 11; e ℎ = 162 − 158 = 4.
40
( ) − 13
𝑀𝑑 = 158 + [ 2 ]×4
11
20 − 13
𝑀𝑑 = 158 + ( )×4
11
7
𝑀𝑑 = 158 + ( ) × 4 ≅ 160,54
11
Portanto, metade dos valores estão entre 150 e 160,54; e metade estão entre 160,54 e 174.
Reparem que o método de interpolação linear nada mais é que uma regra de três simples: a
∑ 𝒇𝒊
frequência 𝒇𝒊 = 𝟏𝟏 está para a amplitude 𝒉 = 𝟒, assim como a diferença [( ) − 𝒇𝒂𝒄 𝒂𝒏𝒕 ] = 𝟕
𝟐
está para 𝒙.
𝒇𝒊 ⟶ 𝒉
∑ 𝒇𝒊 𝟏𝟏 ⟶ 𝟒
⟹
[( ) − 𝒇𝒂𝒄 𝒂𝒏𝒕 ] ⟶ 𝒙 𝟕 ⟶ 𝒙
𝟐
7
11𝑥 = 4 × 7 ⟹ 𝑥 = ( ) × 4 = 2,54
11
Agora, para encontrar a mediana 𝑴𝒅 , basta adicionar o valor de 𝒙 ao limite inferior, 𝒍𝒊𝒏𝒇 = 𝟏𝟓𝟖:
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + 𝑥 = 158 + 2,54 = 160,54
(CESPE/DEPEN/2015)
18 ≤ 𝑥 < 25 30%
25 ≤ 𝑥 < 30 25%
30 ≤ 𝑥 < 35 20%
35 ≤ 𝑥 < 45 15%
45 ≤ 𝑥 < 60 10%
Total 100%
Felipe M. Monteiro, Gabriela R. Cardoso e Rafael da Silva. A seletividade do sistema prisional brasileiro e as políticas de segurança pública. In: XV
Congresso Brasileiro de Sociologia, 26 a 29 de julho de 2011. Curitiba (PR). Grupo de Trabalhos - Violência e Sociedade (com adaptações).
Comentários:
Nessa questão, podemos afirmar que o item está errado, pois os valores mínimo e máximo não são
suficientes para determinarmos o valor da mediana. Assim, ainda que o valor da mediana estivesse correto,
o item estaria errado.
De todo modo, vamos calcular o valor da mediana para treinar. Primeiro, construiremos a coluna da
frequência acumulada e descobriremos a classe mediana.
Frequência
Idade (𝑿𝒊 ) Frequência (𝒇𝒊 ) Acumulada
(𝒇𝒂𝒄 )
18 - 25 30% 30%
25 - 30 25% 55%
30 - 35 20% 75%
35 - 45 15% 90%
45 - 60 10% 100%
Total 100%
A classe mediana é a primeira classe com frequência acumulada maior ou igual a 50%. Dessa forma, a classe
mediana é a segunda, pois 55% ≥ 50%. Assim, a mediana é um número entre 25 e 30.
Sabendo disso, vamos calcular o valor da mediana pelo método da interpolação:
∑𝑓
( 𝑖 ) − 𝑓𝑎𝑐𝑎𝑛𝑡
2
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [ ]×ℎ
𝑓𝑖
em que:
• o somatório das frequências é ∑ 𝑓𝑖 = 100%.
• o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 25.
• a frequência acumulada da classe anterior é 𝑓𝑎𝑐 𝑎𝑛𝑡 = 30%.
• a frequência da própria classe é 𝑓𝑖 = 25%.
• a amplitude da classe é ℎ = 30 − 25 = 5.
50% − 30%
𝑀𝑑 = 25 + [ ]×5
25%
𝑀𝑑 = 29
Gabarito: Errado.
(FCC/CNMP/2015) A tabela de frequências absolutas abaixo corresponde à distribuição dos valores dos
salários dos funcionários de nível médio lotados em um órgão público no mês de dezembro de 2014.
Comentários:
Nosso primeiro passo será calcular as frequências absolutas por meio da equação apresentada (𝑓𝑖 = −𝑖 2 +
10𝑖 + 1) no problema. Em seguida, completamos a tabela com as novas informações e calculamos as
frequências acumuladas. Assim:
Frequências
Classe de Salários (R$) Frequências Absolutas
Acumuladas
1.500 ⊢ 2.500 𝑓1 = −12 + 10 + 1 = 10 𝟎 + 10 = 𝟏𝟎
2.500 ⊢ 3.500 𝑓2 = −2 + 10 × 2 + 2 = 17
2
𝟏𝟎 + 17 = 𝟐𝟕
3.500 ⊢ 4.500 𝑓3 = −32 + 10 × 3 + 3 = 22 𝟐𝟕 + 22 = 𝟒𝟗
4.500 ⊢ 5.500 𝑓4 = −42 + 10 × 4 + 4 = 25 𝟒𝟗 + 25 = 𝟕𝟒
5.500 ⊢ 6.500 𝑓5 = −5 + 10 × 5 + 5 = 26
2
𝟕𝟒 + 26 = 𝟏𝟎𝟎
6.500 ⊢ 7.500 𝑓6 = −6 + 10 × 6 + 6 = 25
2
𝟏𝟎𝟎 + 25 = 𝟏𝟐𝟓
Total 125 125
Somando as frequências acumuladas chegamos a um total de 125 observações. A mediana é o termo central
do conjunto. Portanto, temos:
125
= 62,5.
2
A quarta classe é a primeira a superar esse valor em termos de frequências acumuladas, portanto, ela será
nossa classe mediana. Vejamos:
Sabendo disso, podemos calcular a mediana por meio do método de interpolação linear. Temos:
∑𝑓
( 𝑖 ) − 𝑓𝑎𝑐 𝑎𝑛𝑡
2
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [ ]×ℎ
𝑓𝑖
em que:
o limite inferior da classe é 𝑙𝑖𝑛𝑓 = 4.500.
a frequência acumulada da classe anterior é 𝑓𝑎𝑐 𝑎𝑛𝑡 = 49.
a frequência da própria classe é 𝑓𝑖 = 25.
a amplitude da classe é ℎ = 5.500 − 4.500 = 1.000.
Aplicando a fórmula, temos:
125
( ) − 49
𝑀𝑑 = 4.500 + [ 2 ] × 1.000
25
13,5
𝑀𝑑 = 4.500 + ( ) × 1.000
25
𝑀𝑑 = 4.500 + 13,5 × 40
𝑀𝑑 = 4.500 + 540
𝑀𝑑 = 5040
Gabarito: B.
Propriedades da Mediana
1º Propriedade
• Somando-se (ou subtraindo-se) uma constante 𝒄 a todos os valores de uma variável, a
mediana do conjunto fica aumentada (ou diminuída) dessa constante.
Para explicar essa propriedade, vamos tomar como exemplo a sequência {𝒙𝒏 } = {3, 6, 8, 9, 10}, cuja
mediana é:
𝑀𝑑𝑥 = 𝑥𝑛+1 = 𝑥5+1 = 𝑥6 = 𝑥3 = 8
2 2 2
𝑀𝑑𝑥 = 8
Se adicionarmos o número 5 a cada um dos termos da sequência, iremos obter uma nova lista {𝑦𝑛 } =
{𝑥𝑛 + 5} = {8, 11, 13, 14, 15}, cuja mediana é:
𝑀𝑑𝑦 = 𝑦𝑛+1 = 𝑦5+1 = 𝑦6 = 𝑦3 = 13
2 2 2
𝑀𝑑𝑦 = 13
Veja que a adição do número 5 a cada um dos termos da sequência fez com que a mediana também
aumentasse em 5 unidades, indo de 8 para 13.
2º Propriedade
• Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
𝒄, a mediana do conjunto fica multiplicada (ou dividida) por esta constante.
Para explicar essa propriedade, vamos tomar como exemplo a sequência {𝒙𝒏 } = {3, 6, 8, 9, 10}, cuja
mediana é:
𝑀𝑑𝑥 = 𝑥𝑛+1 = 𝑥5+1 = 𝑥6 = 𝑥3 = 8
2 2 2
𝑀𝑑𝑥 = 8
Se multiplicarmos cada um dos termos da sequência por 5, iremos obter uma nova lista {𝑦𝑛 } =
{𝑥𝑛 × 5} = {15, 30, 40, 45, 50}, cuja mediana é:
𝑀𝑑𝑦 = 𝑦𝑛+1 = 𝑦5+1 = 𝑦6 = 𝑦3 = 40
2 2 2
𝑀𝑑𝑦 = 40
Veja que a multiplicação de cada um dos termos da sequência por 5 fez com que a mediana também
fosse multiplicada por 5, aumentando de 8 para 40.
3º Propriedade
• A soma dos desvios absolutos de uma sequência de números, em relação a um número
𝒂, é mínima quando 𝒂 é a mediana dos números.
Para explicar essa propriedade, vamos tomar como exemplo a série {𝑥𝑛 } = {1, 2, 3, 4, 6, 7, 8, 9}.
Como o número de termos é par, a mediana será, por convenção, a média aritmética dos dois termos
centrais:
4+6
𝑀𝑑 = = 5.
2
∑|𝑑𝑖 | = 4 + 3 + 2 + 1 + 1 + 2 + 3 + 4 = 20
𝑖=1
A propriedade garante que, ao calcularmos a soma dos desvios absolutos em relação à mediana, o
menor valor que encontraremos para essa sequência será 20.
Há um detalhe importante que precisamos esclarecer. Como vimos anteriormente, quando o
número de elementos do conjunto é ímpar, o valor da mediana é único e igual ao termo central.
Porém, quando o número de elementos é par, a mediana pode ser qualquer valor entre os termos
centrais, havendo infinitos valores possíveis para a mediana. Por convenção, contudo, adotamos
a média aritmética dos valores centrais.
Certo, o que isso tem a ver com a propriedade que estamos estudando? Significa dizer que, se
calcularmos a soma dos desvios absolutos para qualquer valor entre 4 e 6, que são os termos
centrais, o valor dos desvios absolutos em relação a mediana também será mínimo. A título
exemplificativo, vamos calcular os desvios em relação ao valor 4,5:
𝑑1 = 𝑥1 − 4,5 = 1 − 4,5 = −3,5
𝑑2 = 𝑥2 − 4,5 = 2 − 4,5 = −2,5
𝑑3 = 𝑥3 − 4,5 = 3 − 4,5 = −1,5
𝑑4 = 𝑥4 − 4,5 = 4 − 4,5 = −0,5
𝑑5 = 𝑥5 − 4,5 = 6 − 4,5 = 1,5
𝑑6 = 𝑥6 − 4,5 = 7 − 4,5 = 2,5
𝑑7 = 𝑥7 − 4,5 = 8 − 4,5 = 3,5
𝑑8 = 𝑥8 − 4,5 = 9 − 4,5 = 4,5
Somando os valores absolutos desses desvios:
8
Por último, a propriedade também garante que, para qualquer valor fora do intervalo entre 4 e 6,
encontraremos um valor maior que o mínimo. Por exemplo, vamos calcular os desvios em relação
ao valor 7:
𝑑1 = 𝑥1 − 7 = 1 − 7 = −6
𝑑2 = 𝑥2 − 7 = 2 − 7 = −5
𝑑3 = 𝑥3 − 7 = 3 − 7 = −4
𝑑4 = 𝑥4 − 7 = 4 − 7 = −3
𝑑5 = 𝑥5 − 7 = 6 − 7 = −1
𝑑6 = 𝑥6 − 7 = 7 − 7 = 0
𝑑7 = 𝑥7 − 7 = 8 − 7 = 1
𝑑8 = 𝑥8 − 7 = 9 − 7 = 2
Somando os valores absolutos desses desvios:
8
∑|𝑑𝑖 | = 6 + 5 + 4 + 3 + 1 + 0 + 1 + 2 = 22
𝑖=1
Portanto, como havíamos previsto anteriormente, o valor foi maior que o mínimo.
QUARTIL, DECIL E PERCENTIL
Já vimos que a mediana separa uma série em duas partes iguais, cada uma contendo o mesmo número de
elementos. Contudo, uma série também pode ser dividida em um número maior de partes, todas compostas
por quantidades iguais de elementos. Nesse caso, o nome da medida separatriz é atribuído de acordo com
a quantidade de partes em que a série é dividida:
Quartis
Denominamos de quartis os valores de uma série que a dividem em quatro partes iguais, isto é, quatro
partes contendo o mesmo número de elementos (25%). A imagem a seguir mostra os quartis de uma
distribuição hipotética:
Temos, então, 3 quartis (𝑄1 , 𝑄2 e 𝑄3 ) para dividir uma série em quatro partes iguais:
• 𝑄1: o primeiro quartil corresponde à separação dos primeiros 25% de elementos da série;
• 𝑄2 : o segundo quartil corresponde à separação de metade dos elementos da série, coincidindo com
a mediana (𝑸𝟐 = 𝑴𝒅 );
• 𝑄3 : o terceiro quartil corresponde à separação dos primeiros 75% de elementos da série, ou dos
últimos 25% de elementos da série.
Para o cálculo dos quartis, empregaremos a mesma fórmula adotada no cálculo da mediana, apenas
∑ 𝑓𝑖 𝑘×∑ 𝑓𝑖
substituindo a expressão por , em que 𝑘 indica a ordem do quartil e assume valores inteiros no
2 4
intervalo de 1 a 3.
O cálculo do quartil para dados não-agrupados será realizado por meio das etapas descritas a seguir:
𝒌
𝑷𝑸𝒌 = × 𝒏 (𝒌 = 𝟏, 𝟐, 𝟑);
𝟒
• 2.a etapa: identificamos a posição mais próxima do rol;
• 3.a etapa: verificamos o valor que está ocupando essa posição.
Sempre que houver necessidade, teremos que organizar o conjunto de valores por ordem de magnitude.
a) Cálculo de 𝑸𝟏 :
Começamos determinando a posição de 𝑄1 :
1
𝑃𝑄1 = × 16 = 4
4
Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a
posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.
Em seguida, verificamos o valor que está ocupando a posição identificada:
b) Cálculo de 𝑸𝟐 :
Começamos determinando a posição de 𝑄2 :
2
𝑃𝑄2 = × 16 = 8
4
Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a
posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.
Em seguida, verificamos o valor que está ocupando a posição identificada:
c) Cálculo de 𝑸𝟑 :
Começamos determinando a posição de 𝑄3 :
3
𝑃𝑄3 = × 16 = 12
4
Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a
posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.
Em seguida, verificamos o valor que está ocupando a posição identificada:
O cálculo do quartil para dados agrupados sem intervalos de classe será realizado por meio das etapas
descritas a seguir:
𝒌 × ∑ 𝒇𝒊
𝑷𝑸𝒌 = (𝒌 = 𝟏, 𝟐, 𝟑)
𝟒
Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 4 4
1 6 10
2 9 19
3 5 24
4 4 28
TOTAL 28
a) Cálculo de 𝑸𝟏 :
Começamos determinando a posição de 𝑄1 :
1 × 28
𝑃𝑄1 = =7
4
Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos
a variável que corresponde a essa posição:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 4 4
1 6 10 (≥ 𝟕)
2 9 19
3 5 24
4 4 28
TOTAL 28
b) Cálculo de 𝑸𝟐 :
Começamos determinando a posição de 𝑄2 :
2 × 28
𝑃𝑄2 = = 14
4
Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos
a variável que corresponde a essa posição:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 4 4
1 6 10
2 9 19 (≥ 𝟏𝟒)
3 5 24
4 4 28
TOTAL 28
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 4 4
1 6 10
2 9 19
3 5 24 (≥ 𝟐𝟏)
4 4 28
TOTAL 28
O cálculo do quartil para dados agrupados em classes será realizado por meio das seguintes etapas:
𝑘 × ∑ 𝑓𝑖
𝑃𝑄𝑘 = (𝑘 = 1, 2, 3);
4
em que:
𝑘 = índice do quartil;
• 4.ª etapa: calculamos o valor do quartil por meio da fórmula apresentada a seguir, que consiste em
uma variação da fórmula da mediana para dados agrupados em classes, mudando-se apenas o
𝑘×∑ 𝑓𝑖
:
4
𝒌 × ∑ 𝒇𝒊
− 𝒇𝒂𝒄 𝒂𝒏𝒕
𝑸𝒌 = 𝒍𝒊𝒏𝒇 + [ 𝟒 ] × 𝒉𝑸𝒌
𝑸𝒌 𝒇𝑸 𝒌
em que:
Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.
Calcular 𝑄1 , 𝑄2 e 𝑄3 da distribuição de frequências dos pesos de um grupo de 180 alunos do
Estratégia Concursos:
Frequência
Frequência
i Pesos (kg) Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
1 10 ⊢ 30 10 10
2 30 ⊢ 50 24 34
3 50 ⊢ 70 57 91
4 70 ⊢ 90 44 135
5 90 ⊢ 110 29 164
TOTAL 180
a) Cálculo de 𝑸𝟏 :
Começamos determinando a posição de 𝑄1 :
1 × ∑ 𝑓𝑖 180
𝑃𝑄1 = = = 45
4 4
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
Em seguida, encontramos o valor numérico de 𝑄1 utilizando a expressão:
1 × ∑ 𝑓𝑖
− 𝑓𝑎𝑐 𝑎𝑛𝑡
𝑄1 = 𝑙𝑖𝑛𝑓 + [ 4 ] × ℎ𝑄1
𝑄1 𝑓𝑄1
45 − 34
𝑄1 = 50 + [ ] × 20 ≅ 53,9 𝐾𝑔
57
b) Cálculo de 𝑸𝟐 :
Começamos determinando a posição de 𝑄2 :
2 × ∑ 𝑓𝑖 2 × 180
𝑃𝑄2 = = = 90
4 4
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
90 − 34
𝑄2 = 50 + [ ] × 20 ≅ 69,7 𝐾𝑔
57
c) Cálculo de 𝑸𝟑 :
Começamos determinando a posição de 𝑄3 :
3 × ∑ 𝑓𝑖 3 × 180
𝑃𝑄3 = = = 135
4 4
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
135 − 91
𝑄3 = 70 + [ ] × 20 = 90 𝐾𝑔
44
Decis
Denominamos de decis os valores de uma série que a dividem em dez partes iguais, isto é, dez partes
contendo o mesmo número de elementos (10%). A imagem a seguir mostra os decis de uma distribuição
hipotética:
Temos, então, 9 decis (𝐷1 , 𝐷2 , ⋯, 𝐷9 ) para dividir uma série em dez partes iguais:
Para o cálculo dos decis, empregaremos a mesma fórmula adotada no cálculo da mediana, apenas
∑ 𝑓𝑖 𝑘×∑ 𝑓𝑖
substituindo a expressão por , em que 𝑘 indica a ordem do decil e assume valores inteiros no
2 10
intervalo de 1 a 9.
O cálculo do decil segue o mesmo raciocínio empregado no cálculo do quartil para dados não-agrupados. A
primeira tarefa que devemos realizar, se houver necessidade, é organizar o conjunto de valores por ordem
de magnitude. Depois disso, procedemos conforme as seguintes etapas:
𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎
2 3 4 5 10 12 15 18 20 22
b) Cálculo de 𝑫𝟖 :
Começamos determinando a posição de 𝐷8 :
8 × 10
𝑃𝐷8 = =8
10
Depois, identificamos a posição mais próxima no rol. Como o resultado foi um número inteiro, a
posição mais próxima coincidirá com o valor encontrado, não havendo necessidade de aproximação.
𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎
2 3 4 5 10 12 15 18 20 22
O cálculo do decil para dados agrupados sem intervalos de classe será realizado por meio das etapas
descritas a seguir:
𝒌 × ∑ 𝒇𝒊
𝑷𝑫𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗)
𝟏𝟎
• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a frequência
acumulada imediatamente igual ou superior à posição do decil;
• 3.a etapa: verificamos o valor da variável que corresponde a essa posição.
Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.
Vamos calcular 𝐷3 e 𝐷8 da tabela de frequências a seguir, que representa a quantidade de filhos dos
professores do Estratégia Concursos:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 18 18
1 35 53
2 46 99
3 28 127
4 25 152
5 10 162
6 5 167
7 3 170
TOTAL 170
a) Cálculo de 𝑫𝟑 :
Começamos determinando a posição de 𝐷3 :
3 × 170
𝑃𝐷3 = = 51
10
Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos
a variável que corresponde a essa posição:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 18 18
1 35 53 (≥ 𝟓𝟏)
2 46 99
3 28 127
4 25 152
5 10 162
6 5 167
7 3 170
TOTAL 170
b) Cálculo de 𝑫𝟖 :
Começamos determinando a posição de 𝐷8 :
8 × 170
𝑃𝐷8 = = 136
10
Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos
a variável que corresponde a essa posição:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
0 18 18
1 35 53
2 46 99
3 28 127
4 25 152 (≥ 𝟏𝟑𝟔)
5 10 162
6 5 167
7 3 170
TOTAL 170
O cálculo do decil para dados agrupados em classes será realizado por meio das seguintes etapas:
𝑘 × ∑ 𝑓𝑖
𝑃𝐷𝑘 = (𝑘 = 1, 2, 3, ⋯ , 9);
10
em que:
𝑘 = índice do decil;
• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a frequência
acumulada imediatamente igual ou superior à posição do decil;
• 4.ª etapa: calculamos o valor do decil por meio da fórmula apresentada a seguir, que consiste em
uma variação da fórmula da mediana para dados agrupados em classes, mudando-se apenas o
𝑘×∑ 𝑓𝑖
:
10
𝒌 × ∑ 𝒇𝒊
− 𝒇𝒂𝒄 𝒂𝒏𝒕
𝑫𝒌 = 𝒍𝒊𝒏𝒇 + [ 𝟏𝟎 ] × 𝒉𝑫𝒌
𝑫𝒌 𝒇𝑫𝒌
em que:
Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.
Calcular 𝐷1 , 𝐷2 e 𝐷7 da distribuição de frequências das estaturas de um grupo de 54 alunos do
Estratégia Concursos:
Frequência
Frequência
i Estaturas (cm) Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
1 120 ⊢ 128 6 6
2 128 ⊢ 136 12 18
3 136 ⊢ 144 16 34
4 144 ⊢ 152 13 47
5 152 ⊢ 160 7 54
TOTAL 54
a) Cálculo de 𝑫𝟏 :
Começamos determinando a posição de 𝐷1 :
1 × ∑ 𝑓𝑖 54
𝑃𝐷1 = = = 5,4
10 10
Depois disso, identificamos a posição na coluna de frequências acumuladas.
Em seguida, encontramos o valor numérico de 𝐷1 utilizando a expressão:
1 × ∑ 𝑓𝑖
− 𝑓𝑎𝑐 𝑎𝑛𝑡
𝐷1 = 𝑙𝑖𝑛𝑓 𝐷 + [ 10 ] × ℎ𝐷1
1 𝑓𝐷1
5,4 − 0
𝐷1 = 120 + [ ] × 8 = 127,5 𝑐𝑚
6
b) Cálculo de 𝑫𝟐 :
Começamos determinando a posição de 𝐷2 :
2 × ∑ 𝑓𝑖 2 × 54
𝑃𝐷2 = = = 10,8
10 10
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
10,8 − 6
𝐷2 = 128 + [ ] × 8 = 131,2 𝑐𝑚
12
c) Cálculo de 𝑫𝟕 :
Começamos determinando a posição de 𝐷7 :
7 × ∑ 𝑓𝑖 7 × 54
𝑃𝐷7 = = = 37,8
10 10
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
37,8 − 34
𝐷7 = 144 + [ ] × 8 = 146,3 𝑐𝑚
13
Percentis
Denominamos de percentis os valores de uma série que a dividem em cem partes iguais, isto é, cem partes
contendo o mesmo número de elementos (1%). A imagem a seguir mostra os percentis de uma distribuição
hipotética:
Temos, então, 99 percentis (𝑃1 , 𝑃2 , ⋯, 𝑃99 ) para dividir uma série em cem partes iguais:
Para o cálculo dos percentis, empregaremos a mesma fórmula adotada no cálculo da mediana, apenas
∑ 𝑓𝑖 𝑘×∑ 𝑓𝑖
substituindo a expressão por , em que 𝑘 indica a ordem do percentil e assume valores inteiros no
2 100
intervalo de 1 a 99.
O cálculo do percentil segue o mesmo raciocínio empregado nos cálculos do quartil e do decil para dados
não-agrupados. A primeira tarefa que devemos realizar, se houver necessidade, é organizar o conjunto de
valores por ordem de magnitude. Depois disso, colocamos em prática as seguintes etapas:
𝒌×𝒏
𝑷𝑷𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗);
𝟏𝟎𝟎
• 2.a etapa: identificamos a posição mais próxima do rol;
• 3.a etapa: verificamos o valor que está ocupando essa posição.
Calcularemos os percentis 𝑃27 e 𝑃83 para o seguinte conjunto de valores:
{15, 2, 4, 6, 10, 12, 13, 7, 21, 18, 20}
Reparem que os valores não estão organizados. Portanto, nossa primeira tarefa será colocá-los em
ordem de magnitude (rol):
{2, 4, 6, 7, 10, 12, 13, 15, 18, 20, 21}
a) Cálculo de 𝑷𝟐𝟕 :
Começamos determinando a posição de 𝑃27 :
27 × 11
𝑃𝑃27 = = 2,97
100
Depois, identificamos a posição mais próxima no rol:
𝑃𝑃27 = 3
Em seguida, verificamos o valor que está ocupando essa posição.
𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏
2 4 6 7 10 12 13 15 18 20 21
b) Cálculo de 𝑷𝟖𝟑 :
Começamos determinando a posição de 𝑃83 :
83 × 11
𝑃𝑃83 = = 9,13
100
Depois, identificamos a posição mais próxima no rol:
𝑃𝑃27 = 9
Em seguida, verificamos o valor que está ocupando essa posição.
𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏
2 4 6 7 10 12 13 15 18 20 21
O cálculo do percentil para dados agrupados sem intervalos de classe será realizado por meio das etapas
descritas a seguir:
𝒌 × ∑ 𝒇𝒊
𝑷𝑷𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗)
𝟏𝟎𝟎
Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.
Vamos calcular 𝑃45 e 𝑃93 da tabela de frequências a seguir, que representa a quantidade de filhos
dos professores do Estratégia Concursos:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
1 15 15
2 30 45
3 20 65
4 12 77
5 10 87
6 8 95
TOTAL 95
a) Cálculo de 𝑷𝟒𝟓 :
Começamos determinando a posição de 𝑃45 :
45 × 95
𝑃𝑃45 = = 42,75
100
Depois disso, identificamos a posição na coluna de frequências acumuladas. Em seguida, verificamos
a variável que corresponde a essa posição:
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
1 15 15
2 30 45 (≥ 𝟒𝟑)
3 20 65
4 12 77
5 10 87
6 8 95
TOTAL 95
Frequência
Frequência
Filhos Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
1 15 15
2 30 45
3 20 65
4 12 77
5 10 87
6 8 95 (≥ 𝟖𝟖)
TOTAL 95
O cálculo do percentil para dados agrupados em classes será realizado por meio das seguintes etapas:
𝑘 × ∑ 𝑓𝑖
𝑃𝑃𝑘 = (𝑘 = 1, 2, 3, ⋯ , 99);
100
em que:
𝑘 = índice do percentil;
• 4.ª etapa: calculamos o valor do percentil por meio da fórmula apresentada a seguir, que consiste
em uma variação da fórmula da mediana para dados agrupados em classes, mudando-se apenas o
𝑘×∑ 𝑓𝑖
:
100
𝒌 × ∑ 𝒇𝒊
− 𝒇𝒂𝒄 𝒂𝒏𝒕
𝑷𝒌 = 𝒍𝒊𝒏𝒇 + [ 𝟏𝟎𝟎 ] × 𝒉𝑷𝒌
𝑷𝒌 𝒇𝑷𝒌
em que:
Sempre que houver necessidade, teremos que incluir uma coluna de frequências acumuladas.
Calcular 𝑃45 e 𝑃77 da distribuição de frequências das estaturas de um grupo de 54 alunos do
Estratégia Concursos:
Frequência
Frequência
i Estaturas (cm) Acumulada
(𝒇𝒊 )
(𝒇𝒂𝒄 )
1 120 ⊢ 128 5 5
2 128 ⊢ 136 13 18
3 136 ⊢ 144 16 34
4 144 ⊢ 152 13 47
5 152 ⊢ 160 7 54
TOTAL 54
a) Cálculo de 𝑷𝟒𝟓 :
Começamos determinando a posição de 𝑃45 :
45 × ∑ 𝑓𝑖 45 × 54
𝑃𝑃45 = = = 24,30
100 100
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
24,30 − 18
𝑃45 = 136 + [ ] × 8 = 139,15 𝑐𝑚
16
b) Cálculo de 𝑷𝟕𝟕 :
Começamos determinando a posição de 𝑃77 :
77 × ∑ 𝑓𝑖 77 × 54
𝑃𝑃77 = = = 41,04
100 100
Depois, identificamos a classe que representa essa posição na coluna de frequências acumuladas:
41,58 − 34
𝑃77 = 144 + [ ] × 8 = 148,66 𝑐𝑚
13
(FCC/BANRISUL/2019) As idades dos 120 funcionários lotados em uma repartição pública estão
distribuídas conforme a tabela de frequências absolutas abaixo.
𝟐𝟎 < 𝒙 ≤ 𝟑𝟎 40
𝟑𝟎 < 𝒙 ≤ 𝟒𝟎 50
𝟒𝟎 < 𝒙 ≤ 𝟓𝟎 20
𝟓𝟎 < 𝒙 ≤ 𝟔𝟎 10
Total 120
Utilizando o método da interpolação linear, obteve-se o primeiro quartil (𝑸𝟏) e a mediana (𝑴𝒅) desta
distribuição em anos. A amplitude do intervalo [𝑸𝟏,𝑴𝒅] é então igual a
a) 4,0.
b) 6,5.
c) 10,0.
d) 3,5.
e) 7,5.
Comentários:
Para calcularmos o primeiro quartil, precisamos encontrar a posição:
1𝑛 1 × 120
= = 30
4 4
Agora, vamos determinar a classe em que se encontra o primeiro quartil. Devemos procurar a primeira
frequência acumulada que é maior do que ou igual a 30. Vejam que a primeira frequência acumulada já é
maior do que 30. Portanto, o primeiro quartil está na primeira classe.
Idade em anos Número de funcionários Frequência acumulada
20 - 30 40 40 (> 30)
30 - 40 50 90
40 - 50 20 110
50 - 60 10 120
Total 120
Pronto, agora vamos calcular a mediana. Para tanto, precisamos descobrir a posição:
𝑛 120
= = 60
2 2
De posse dessa informação, podemos determinar a classe em que se encontra a mediana. Devemos procurar
a primeira frequência acumulada que é maior do que ou igual a 60. A segunda frequência acumulada é maior
que 60. Portanto, a mediana está na segunda classe.
20 - 30 40 40
30 - 40 50 90 (> 60)
40 - 50 20 110
50 - 60 10 120
Total 120
Agora é só aplicar a fórmula da 𝑀𝑑 :
𝑛
− 𝑓𝑎𝑐 𝑎𝑛𝑡
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [2 ]×ℎ
𝑓𝑖
(CESPE/IPHAN/2018) Uma pesquisa a respeito das quantidades de teatros em cada uma de 11 cidades
brasileiras selecionadas apresentou o seguinte resultado: {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4}.
Com referência a esses dados, julgue o item seguinte.
O valor do primeiro quartil do conjunto de dados (Q1/4) é igual a 3.
Comentários:
Podemos usar a seguinte fórmula para encontrar a posição do primeiro quartil:
1
𝑃𝑄1 = ×𝑛
4
Assim, temos:
1
× 11 = 2,75
4
Logo, o primeiro quartil está entre as posições 2 e 3. De acordo com o conjunto, o valor do primeiro quartil
é 2.
Gabarito: Errado.
(CESPE/IPHAN/2018) Uma pesquisa a respeito das quantidades de teatros em cada uma de 11 cidades
brasileiras selecionadas apresentou o seguinte resultado: {1, 2, 2, 3, 3, 3, 4, 4, 4, 4, 4}.
Com referência a esses dados, julgue o item seguinte.
O valor do terceiro quartil do conjunto de dados (Q3/4) é igual a 4.
Comentários:
Podemos usar a seguinte fórmula para encontrar a posição do terceiro quartil:
3×𝑛
𝑃𝑄3 =
4
Assim, temos:
11
3× = 8,25
4
Logo, o terceiro quartil está entre as posições 8 e 9. De acordo com o conjunto, o valor do terceiro quartil é
4.
Gabarito: Certo.
(FGV/DPE-RJ/2014) Um levantamento sobre o local de residência das pessoas que recorrem à Defensoria
Pública indicou que 30% moram a menos de 10 quilômetros distância de um dos pontos de atendimento,
70% a menos de 20 quilômetros, 90% a menos de 30 quilômetros e que nenhuma delas mora a mais de 40
quilômetros de distância. Supondo ainda que a distribuição das distâncias, dentro das faixas especificadas
(10 Km), é uniforme pode-se afirmar que
a) A distância mediana é de 15 quilômetros e o percentil 75 é 22,5 quilômetros.
b) A distância mediana é de 20 quilômetros e o desvio-padrão é de 8 quilômetros.
c) A distância mediana é de 20 quilômetros a moda é de 18 quilômetros.
d) A distância mediana é de 15 quilômetros e o decil 9 é de 35 quilômetros.
e) A distância mediana é de 15 quilômetros e a média é de 15 quilômetros.
Comentários:
Para entendermos a questão vamos montar uma tabela com os dados fornecidos pelo enunciado.
Freq. Relativa
Distância (𝒙)
Acumulada
0 ≤ 𝑥 < 10 30%
20 ≤ 𝑥 < 30 90%
30 ≤ 𝑥 < 40 100%
Para identificar a mediana, precisamos encontrar o termo central da amostra. Como temos uma frequência
acumulada total de 100%, a mediana ocupará a posição representada por 50%. Dessa forma, nossa classe
mediana será o intervalo entre 10 e 20 quilômetros, pois é o primeiro a superar a marca de 50%.
Sabendo disso, podemos aplicar a fórmula da mediana:
𝑛
− 𝑓𝑎𝑐 𝑎𝑛𝑡
𝑀𝑑 = 𝑙𝑖𝑛𝑓 + [2 ]×ℎ
𝑓𝑖
Agora, vamos calcular o septuagésimo quinto percentil (𝑃75 ). Para isso, precisamos identificar a classe que
corresponde à frequência acumulada de 75%. Vejamos:
Freq. Relativa
Distância (𝒙)
Acumulada
0 ≤ 𝑥 < 10 30%
10 ≤ 𝑥 < 20 70%
30 ≤ 𝑥 < 40 100%
10 ≤ 𝑥 < 20 15 0,40 6
20 ≤ 𝑥 < 30 25 0,20 5
Total 𝟏 𝟏𝟔
Para construir um gráfico de boxplot, usamos uma haste horizontal ou vertical e uma caixa retangular
(box). O local em que a haste começa (da esquerda para a direita) indica o valor mínimo e o ponto em que
a haste termina indica o valor máximo.
A caixa retangular, localizada no meio da haste, em geral, possui três linhas. A primeira linha, na
extremidade esquerda da caixa, indica o primeiro quartil. A terceira linha, na extremidade direita, indica
o terceiro quartil. A linha do meio, no interior da caixa, indica o segundo quartil ou a mediana. O segundo
quartil pode estar entre o primeiro e o terceiro quartis, ou pode coincidir com um, ou outro, ou ambos.
Além disso, há dois traços, chamados de whiskers (ou bigodes), ligando o valor mínimo à extremidade
esquerda da caixa e o valor máximo à extremidade direita da caixa. Cada um desses traços comporta,
aproximadamente, 25% dos dados. O restante, cerca de 50%, está distribuído no interior da caixa.
Também podemos encontrar gráficos de box plot com pontos ou asteriscos marcando valores discrepantes
(outliers). Nesses casos, os whiskers não se estendem aos valores mínimo e máximo do conjunto de dados,
mas ficam limitados a um comprimento máximo de 1,5 × 𝐷𝐼𝑄, em que 𝑫𝑰𝑸 é a distância interquartílica.
𝑫𝑰𝑸 = 𝑸𝟑 − 𝑸𝟏
Dessa forma, valores menores que 𝑸𝟏 − 𝟏, 𝟓 × 𝑫𝑰𝑸 ou maiores que 𝑸𝟑 + 𝟏, 𝟓 × 𝑫𝑰𝑸 são considerados
VALORES DISCREPANTES (OUTLIERS) e representados por PONTOS ou ASTERISCOS.
{58, 65, 66, 67, 68, 68, 68, 69, 69, 69, 69, 70, 70, 70, 70, 70, 70, 70, 70, 71, 71, 72, 72, 73, 73, 74, 75,
75, 75, 75, 75, 76, 76, 77, 77, 78, 79, 79, 80, 87}.
b) primeiro quartil:
Determinando a posição de 𝑄1 :
1 × 40
𝑃𝑄1 = = 10
4
Em seguida, verificamos o valor que está ocupando essa posição
𝑄1 = 69
c) mediana:
Determinando a posição de 𝑀𝑑 :
40
𝑃𝑀𝑑 = = 20
2
Em seguida, verificamos o valor que está ocupando essa posição
𝑀𝑑 = 71
d) terceiro quartil:
Determinando a posição de 𝑄3 :
3 × 40
𝑃𝑄3 = = 30
4
Em seguida, verificamos o valor que está ocupando essa posição
𝑄3 = 75
e) valor máximo:
𝑚á𝑥 = 87
f) distância interquartílica:
𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 75 − 69 = 6
Agora, podemos reunir essas informações em um gráfico de box plot. Reparem que o valor mínimo
está localizado em 65, porque esse é o MENOR VALOR do conjunto de dados IGUAL OU SUPERIOR
ao limite inferior para detecção de outliers (60). De igual modo, notem que o valor máximo está
localizado em 80, porque esse é o MAIOR VALOR do conjunto de dados IGUAL OU INFERIOR ao
limite superior para detecção de outliers (82). Vejam também que os valores abaixo de 60 e acima
de 82 são considerados discrepantes, sendo sinalizados por pontos.
Agora, vamos analisar uma segunda série de dados, que representa os pesos de um grupo de 40
alunas do Estratégia Concursos.
{59, 60, 61, 62, 62, 63, 64, 64, 64, 65, 65, 65, 65, 65, 65, 65, 65, 65, 65, 66, 66, 66, 66, 66, 66, 66, 67,
67, 67, 67, 67, 67, 67, 68, 68, 68, 68, 68, 69, 69}
b) primeiro quartil:
Determinando a posição de 𝑄1 :
1 × 40
𝑃𝑄1 = = 10
4
Em seguida, verificamos o valor que está ocupando essa posição
𝑄1 = 65
c) mediana:
Determinando a posição de 𝑀𝑑 :
40
𝑃𝑀𝑑 = = 20
2
Em seguida, verificamos o valor que está ocupando essa posição
𝑀𝑑 = 66
d) terceiro quartil:
Determinando a posição de 𝑄3 :
3 × 40
𝑃𝑄3 = = 30
4
Em seguida, verificamos o valor que está ocupando essa posição
𝑄3 = 67
e) valor máximo:
𝑚á𝑥 = 69
f) distância interquartílica:
𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 67 − 65 = 2
Nesse ponto, podemos reunir essas informações em um segundo gráfico de box plot. Reparem que
o valor mínimo está localizado em 62, porque esse é o MENOR VALOR do conjunto de dados IGUAL
OU SUPERIOR ao limite inferior para detecção de outliers (62). De igual modo, notem que o valor
máximo está localizado em 69, porque esse é o MAIOR VALOR do conjunto de dados IGUAL OU
INFERIOR ao limite superior para detecção de outliers (70). Vejam também que os valores abaixo
de 62 são considerados discrepantes, sendo sinalizados por pontos.
Podemos, também, construir um único gráfico de box plot reunindo duas ou mais distribuições, o
que torna o processo de comparação mais simples e visual.
Por fim, gostaria de chamar atenção para um detalhe importante. A depender do conjunto de dados,
teremos valores iguais para máximos, mínimos, primeiro quartil, mediana e terceiro quartil. Nesse
caso, o aspecto visual do box plot sofrerá alterações.
Por exemplo, considere a distribuição a seguir, em que a mediana e o terceiro quartil são iguais:
𝒙𝟏 𝒙𝟐 𝒙𝟑 𝒙𝟒 𝒙𝟓 𝒙𝟔 𝒙𝟕 𝒙𝟖 𝒙𝟗 𝒙𝟏𝟎 𝒙𝟏𝟏
1 1 1 1 6 6 6 6 6 6 8
a) valor mínimo: 1;
b) primeiro quartil:
𝑃𝑜𝑠𝑖çã𝑜: 1 × (11/4) = 2,75 ⟶ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑖𝑠 𝑝𝑟ó𝑥𝑖𝑚𝑜: 𝑥3 = 1
c) segundo quartil (mediana):
𝑃𝑜𝑠𝑖çã𝑜: 11/2 = 5,5 ⟶ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑖𝑠 𝑝𝑟ó𝑥𝑖𝑚𝑜: 𝑥5 = 6
d) terceiro quartil:
𝑃𝑜𝑠𝑖çã𝑜: 3 × (11/4) = 8,25 ⟶ 𝑉𝑎𝑙𝑜𝑟 𝑚𝑎𝑖𝑠 𝑝𝑟ó𝑥𝑖𝑚𝑜: 𝑥8 = 6
e) valor máximo: 8
Nessa situação, a caixa retangular não exibirá três linhas em seu interior, pois a linha da mediana irá
se sobrepor a do quartil superior. Além disso, também não haverá um traço ligando o valor mínimo
ao quartil inferior, vez que ambos terão a mesma magnitude. O gráfico ficará assim:
(CESPE/TJ-PA/2020)
Considerando que o desenho esquemático (boxplot) antecedente se refere a uma variável quantitativa X,
assinale a opção correta.
a) O intervalo interquartil é igual a 65.
b) Metade da distribuição da variável X se encontra entre os valores 20 e 40.
c) Os valores da variável X que se encontram no intervalo [5;10] representam 5% da distribuição de X.
d) A mediana de X é igual a 25.
e) O primeiro quartil da distribuição de X é igual a 10.
Comentários:
O diagrama de box-plot pode ser apresentado tanto na horizontal quanto na vertical, como ocorre nessa
questão. Em nossos exemplos, o diagrama foi apresentado sempre na horizontal, por ser mais compacto. No
entanto, as características de ambos são idênticas.
Sabendo disso, vamos analisar cada alternativa:
• Letra A: Errada. O intervalo interquartil vale 𝐷𝐼𝑄 = 𝑄3 − 𝑄1 = 40 − 10 = 30.
• Letra B: Errada. O diagrama mostra que a mediana ocorre em 20, logo, a metade da distribuição está
entre 20 e 70.
• Letra C: Errada. O diagrama é distribuído em 4 quartis, 4 partes com a mesma quantidade de valores,
cada quartil representando 25% das observações, sendo o primeiro quartil representado pelo intervalo
[5;10].
• Letra D: Errada. O diagrama mostra que a mediana vale 20.
• Letra E: Correta. O diagrama mostra que o primeiro quartil vale 10, ocupando o intervalo [5;10].
Gabarito: E.
(CESPE/IPHAN/2018) Julgue o item subsequente, referente à análise exploratória de dados.
O BOXPLOT representa os dados em um retângulo construído com o primeiro e o segundo quartil,
fornecendo informação sobre valores médios.
Comentários:
O boxplot oferece informações sobre os quartis (1.º, 2.º e 3.º), o limite mínimo, o limite máximo e os outliers
(valores discrepantes). O 2.º quartil coincide com o valor da mediana. Portanto, a questão erra ao afirmar
que as informações são sobre os valores médios.
Gabarito: Errado.
(FGV/MPE-BA/2017) Em uma amostra desconfia-se de que três valores sejam, na verdade, “ outliers” e
que deveriam ser descartados. Para tal avaliação o estatístico dispõe apenas dos valores dos 1º e 3º quartil
da distribuição. Os números são os seguintes:
𝑸𝟏 (𝑿) = 𝟐𝟏, 𝑸𝟑 (𝑿) = 𝟑𝟑, 𝑿𝟏 = 𝟓𝟖, 𝑿𝟐 = 𝟐 e 𝑿𝟑 = 𝟒𝟑
Onde 𝑸𝒊𝒔 são os quartis e os 𝑿𝒊𝒔 os valores em análise.
Assim, é correto afirmar que:
a) Todos os valores são “ outliers”;
b) Os valores 𝑋1 e 𝑋3 são “ outliers”;
c) Nenhum dos valores é “ outliers”;
d) Apenas o valor 𝑋2 é “ outlier”;
e) Os valores 𝑋1 e 𝑋2 são “ outliers”.
Comentários:
Para resolvermos a questão, precisamos calcular os limites inferior e superior da amostra. Assim:
𝑙𝑖𝑛𝑓 = 𝑄1 − 1,5 × (𝑄3 − 𝑄1 )
𝑙𝑖𝑛𝑓 = 21 − 1,5 × (33 − 21)
𝑙𝑖𝑛𝑓 = 21 − 18 = 3
Como 2 < 3 e 58 > 51, então podemos afirmar que os valores 𝑋1 e 𝑋2 são outliers.
Gabarito: E.
(FCC/TRT 3ª Região/2015) Seja uma representação gráfica de dados de acordo com o desenho
esquemático abaixo (box-plot) que foi preparado para comparar todos os salários dos funcionários do sexo
masculino (Grupo I) com todos os salários dos funcionários do sexo feminino (Grupo II) lotados em um
órgão público.
Comentários:
Vamos analisar cada uma das alternativas:
• Letra A: Errada. O diagrama não mostra a quantidade de elementos de cada grupo, portanto, não
podemos afirmar que o Grupo I tem mais elementos que o Grupo II.
• Letra B: Errada. O diagrama mostra que as medianas valem 8 e 7 para cada grupo, portanto, a
diferença entre elas é igual a 1. Podemos observar também que o menor salário é 2. Logo, a diferença entre
as medianas corresponde a 50% do menor salário.
• Letra C: Errada. Se separarmos o Grupo I em quartis, cada quartil corresponderá a 25% do total de
elementos. Somando o último e o primeiro quartil teremos 50%, exatamente a metade, dos elementos.
Portanto, não podemos afirmar que mais da metade dos elementos do Grupo I possui um salário inferior a
R$ 5.000,00 ou superior a R$ 10.000,00.
3
• Letra D: Correta. O menor salário do Grupo II vale 3. A mediana do Grupo I vale 8. Então, 8 = 0,375 =
37,5%.
• Letra E: Errada. Para o primeiro grupo 𝑄3 = 10, 𝑄1 = 5 → 𝑄3 − 𝑄1 = 10 − 5 = 5 para o segundo
grupo 𝑄3 = 9 , 𝑄1 = 4 → 𝑄3 − 𝑄1 = 9 − 4 = 5. Portanto, as distâncias são iguais.
Gabarito: D.
RESUMO DA AULA
MEDIDAS SEPARATRIZES
As separatrizes são medidas que dividem (ou separam) uma série ordenada em duas ou mais
partes, cada uma contendo a mesma quantidade de elementos. Nesse caso, o nome da medida
separatriz é definido de acordo com a quantidade de partes em que a série é dividida:
Divide uma série ordenada em duas Dividem uma série ordenada em Dividem uma série ordenada em
partes iguais, cada uma contendo quatro partes iguais, cada uma cinco partes iguais, cada uma
50% dos valores da sequência contendo 25% dos valores da contendo 20% dos valores da
sequência. sequência
MEDIANA
A mediana é o elemento que ocupa a POSIÇÃO CENTRAL de uma série de observações ordenada
segundo suas grandezas. Para estabelecer que a mediana de um conjunto composto por 𝑛
elementos ordenados de forma crescente ou decrescente temos:
A mediana é um valor que dividirá a distribuição de frequências em duas partes contendo o mesmo
número de elementos. Para estabelecer que a mediana de uma tabela de frequências composta por
um total de 𝑛 elementos:
𝒙𝒏 + 𝒙𝒏+𝟏
b) se 𝑛 for par: 𝑴𝒅 = 𝟐 𝟐
𝟐
I - Para calcular a mediana de dados que estão agrupados por intervalo de classes, identificamos a
classe mediana, que corresponde à frequência acumulada imediatamente igual ou superior à
metade da frequência total, ou seja, metade da soma das frequências simples, ∑ 𝒇𝒊 ⁄𝟐.
III - método de interpolação linear consiste em utilizar valores conhecidos para estimar valores
desconhecidos de forma linear, isto é, por meio de uma reta.
Propriedades da Mediana
1º Propriedade
• Somando-se (ou subtraindo-se) uma constante 𝒄 a todos os valores de uma variável, a
mediana do conjunto fica aumentada (ou diminuída) dessa constante.
2º Propriedade
• Multiplicando-se (ou dividindo-se) todos os valores de uma variável por uma constante
𝒄, a mediana do conjunto fica multiplicada (ou dividida) por esta constante.
3º Propriedade
• A soma dos desvios absolutos de uma sequência de números, em relação a um número
𝒂, é mínima quando 𝒂 é a mediana dos números.
O nome da medida separatriz é atribuído de acordo com a quantidade de partes em que a série
é dividida:
Quartis
O cálculo do quartil para dados não-agrupados será realizado por meio de três etapas:
𝒌×𝒏
𝑷𝑸𝒌 = (𝒌 = 𝟏, 𝟐, 𝟑);
𝟒
• 2.a etapa: identificar a posição mais próxima do rol;
• 3.a etapa: verificar o valor que está ocupando essa posição.
Quartil para dados agrupados sem intervalos de classe
O cálculo do quartil para dados agrupados sem intervalos de classe será realizado por meio de
três etapas:
𝒌 × ∑ 𝒇𝒊
𝑷𝑸𝒌 = (𝒌 = 𝟏, 𝟐, 𝟑)
𝟒
• 2.a etapa: identificar a posição do quartil na coluna de frequências acumuladas, isto é, a
frequência acumulada imediatamente igual ou superior à posição do quartil;
• 3.a etapa: verificar o valor da variável que corresponde a essa posição.
O cálculo do quartil para dados agrupados em classes será realizado por meio das seguintes
etapas:
𝒌 × ∑ 𝒇𝒊
𝑷𝑸𝒌 = (𝒌 = 𝟏, 𝟐, 𝟑)
𝟒
𝒌 × ∑ 𝒇𝒊
− 𝒇𝒂𝒄 𝒂𝒏𝒕
𝑸𝒌 = 𝒍𝒊𝒏𝒇 + [ 𝟒 ] × 𝒉𝑸𝒌
𝑸𝒌 𝒇𝑸 𝒌
Decis
O cálculo do decil para dados não-agrupados será realizado por meio de três etapas:
𝒌×𝒏
𝑷𝑫𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗);
𝟏𝟎
• 2.a etapa: identificar a posição mais próxima do rol;
• 3.a etapa: verificar o valor que está ocupando essa posição.
O cálculo do decil para dados agrupados sem intervalos de classe será realizado por meio das
seguintes etapas:
𝒌 × ∑ 𝒇𝒊
𝑷𝑫𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗)
𝟏𝟎
• 2.a etapa: identificamos a posição do decil na coluna de frequências acumuladas, isto é, a
frequência acumulada imediatamente igual ou superior à posição do decil;
• 3.a etapa: verificamos o valor da variável que corresponde a essa posição.
Decil para dados agrupados em classes
O cálculo do decil para dados agrupados em classes será realizado por meio das seguintes
etapas:
𝒌 × ∑ 𝒇𝒊
𝑷𝑫𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗)
𝟏𝟎
𝒌 × ∑ 𝒇𝒊
− 𝒇𝒂𝒄 𝒂𝒏𝒕
𝑫𝒌 = 𝒍𝒊𝒏𝒇 + [ 𝟏𝟎 ] × 𝒉𝑫𝒌
𝑫𝒌 𝒇𝑫𝒌
Percentis
O cálculo do Percentil para dados não-agrupados será realizado por meio de três etapas:
• 1.a etapa: determinar a posição do percentil, por meio da expressão:
𝒌×𝒏
𝑷𝑷𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗);
𝟏𝟎𝟎
• 2.a etapa: identificar a posição mais próxima do rol;
• 3.a etapa: verificar o valor que está ocupando essa posição.
O cálculo do percentil para dados agrupados sem intervalos de classe será realizado por meio
das seguintes etapas:
𝒌 × ∑ 𝒇𝒊
𝑷𝑷𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗)
𝟏𝟎𝟎
• 2.a etapa: identificar a posição do percentil na coluna de frequências acumuladas, isto é,
a frequência acumulada imediatamente igual ou superior à posição do percentil;
• 3.a etapa: verificar o valor da variável que corresponde a essa posição.
O cálculo do percentil para dados agrupados em classes será realizado por meio das seguintes
etapas:
𝒌 × ∑ 𝒇𝒊
𝑷𝑷𝒌 = (𝒌 = 𝟏, 𝟐, ⋯ , 𝟗𝟗)
𝟏𝟎𝟎
BOX PLOT
𝑫𝑰𝑸 = 𝑸𝟑 − 𝑸𝟏