Estatística - Metodos - Unidi - 2009 (1) .1
Estatística - Metodos - Unidi - 2009 (1) .1
Estatística - Metodos - Unidi - 2009 (1) .1
DA BAHIA
CETEC – CENTRO DE CIÊNCIAS EXATAS E
TECNOLÓGICAS
2009
1. IMPORTÂNCIA DA ESTATÍSTICA
Métodos estatísticos representam as ferramentas básicas para remediar e controlar variações, porque
a análise estatística é a única base para tentar entender variabilidade. Indústrias ocidentais estão
acordando para o uso de métodos estatísticos e técnicas relacionadas para fazer frente ao
crescimento constante da competição. Estas empresas também sabem que a implantação de um
programa para melhoria da qualidade pode eliminar desperdícios, reduzir os índices de produtos
defeituosos fabricados, diminuir a necessidade da realização de inspeção e aumentar a satisfação
dos clientes, fatores que implicam em um aumento da produtividade e da competitividade das
empresas. Um profissional treinado em Estatística terá maior facilidade em identificar um
problema em sua área de atuação, determinar os tipos de dados que irão contribuir para a sua
análise, coletar estes dados e a seguir estabelecer conclusões e determinar um plano de ação para a
solução do problema detectado.
A Estatística Descritiva abrange métodos gráficos e numéricos utilizados para resumir dados de
maneira que características importantes da amostra possam ser expostas.
Sandra-CET060-1
Divisões da Estatística
Estatística Descritiva - consiste num conjunto de métodos que ensinam a reduzir uma
quantidade de dados bastante numerosa por um número pequeno de medidas,
substitutas e representantes daquela massa de dados.
Técnicas de Amostragem
População Amostra
características
Análise
Descritiva
Inferência
Conclusões Estatística
sobre as
características Informações
da população
contidas nos dados
i) Deseja-se conhecer o consumo total de energia elétrica em MWH nas residências da cidade de
Salvador no ano de 1998.
População ou universo: todas as residências que estavam ligadas a rede elétrica em Salvador, em
1998.
Características: X = consumo anual de energia elétrica em MWH.
ii) Deseja-se saber se nas indústrias situadas no Estado da Bahia, em 1997, existia algum tipo de
controle ambiental.
População ou universo: indústrias situadas no Estado da Bahia em1998.
Característica: X = existência ou não de algum tipo de controle ambiental na indústria.
Sandra-CET060-2
iii) Estudo sobre a precipitação pluviométrica na Região Nordeste no ano 1997.
População ou universo: área referente à Região Nordeste.
Característica: X = precipitação pluviométrica.
Populações finitas e infinitas: Quanto ao número de elementos, as populações podem ser
classificadas em finita ou infinita, dependendo se o número de elementos que a compõe for finito ou
infinito.
Exemplos:
i) População finita: empresas do Pólo Petroquímico de Camaçari.
ii) População infinita: as pressões atmosféricas ocorridas nos diversos pontos do Continente em
determinado momento.
Em geral, como os universos são grandes, investigar todos os elementos populacionais para
determinarmos a característica necessita muito tempo, e/ou o custo é elevado, e/ou o processo de
investigação leva a destruição do elemento observado, ou, como no caso de populações infinitas, é
impossível observar a totalidade da população. Assim, estudar parte da população constitui-se um
aspecto fundamental da Estatística.
1) Formulação do problema;
2) Escolha da unidade amostral (residências, bairro, cidade, fábricas, rios, etc)
3) Escolha das variáveis que serão medidas;
4) Planejamento da pesquisa
5) Coleta de dados;
6) Produção de resultados;
7) Análise dos resultados;
8) Relatório contendo as conclusões.
Esquemas amostrais
Por esquema amostral entende-se a dupla: sorteio e métodos de estimação dos parâmetros,
geralmente médias e totais, e de modo que se possa obter suas variâncias.
Os principais esquemas amostrais são: amostragem aleatória simples, sistemática, estratificada e por
conglomerados. Normalmente é usada uma combinação destes esquemas básicos.
Sandra-CET060-3
2.3.1. Amostragem Aleatória Simples
Neste tipo de amostra considera-se que cada componente da população estudada tem a mesma
chance de ser escolhido para compor a amostra e a técnica que garante esta igual probabilidade é a
seleção aleatória de indivíduos, por exemplo através de sorteio.
O sorteio dos elementos da amostra é feito geralmente de uma lista com todos os elementos da
população, e pode-se usar a tabela de números aleatórios.
A amostragem estratificada faz com que ao se ponderar as estimativas vindas de cada estrato em
uma estimativa global, a variabilidade final seja menor do que se fosse usada a amostragem
aleatória simples.
O dimensionamento das sub-amostras, ou alocação dos elementos, pode ser de maneira balanceada
(mesmo número de elementos em cada estrato) ou proporcional (número de elementos no estrato é
proporcional à sua contribuição no total populacional).
Esta estratégia de amostragem pode ser vista como uma combinação de dois ou mais planos
amostrais. Considere por exemplo uma população estratificada onde o número de estratos é muito
grande. Ao invés de sortear uma amostra de cada estrato, o que poderia ser inviável devido à
quantidade de estratos, o pesquisador poderia optar por sortear alguns estratos e em seguida
selecionar uma amostra de cada estrato sorteado. Neste caso, teríamos uma amostragem em dois
estágios usando, nas duas vezes, a amostragem aleatória simples, sendo que no primeiro estágio as
unidades amostrais são os estratos e no segundo são as componentes da população.
A Estatística ocupa-se fundamentalmente das propriedades das populações cujas características são
passíveis de representação numérica como resultado de medições e contagens. Essas características
da população são comumente chamadas de variáveis.
•Nominal: caracteriza-se por dados que consistem apenas em nomes, rótulos ou categorias. Os
dados não podem ser dispostos segundo um esquema ordenado. Ex: setor de atividade econômica,
sexo, etc.
•Ordinal: envolve dados que podem ser dispostos em alguma ordem, mas as diferenças entre os
valores dos dados não podem ser determinadas ou não tem sentido. Ex: Nível de escolaridade,
classe sócio-econômica, porte da empresa, etc.
ii) Quantitativas - os resultados das observações serão expressos sempre através de números, que
representam contagens ou medidas. Ex: idade, altura, peso, número de empregados, salário mensal,
volume de dejetos, nº de habitantes do domicílio, etc.
•Discreta - só pode assumir valores pertencentes a um conjunto finito ou enumerável. Ex: número
de empregados, , nº de habitantes do domicílio, etc.
Sandra-CET060-5
Contínua : pode assumir qualquer valor pertencente a um determinado intervalo do conjunto dos
Reais. Pode-se dizer que a variável contínua resulta normalmente de mensurações.
Ex: Estatura, peso, salário mensal, volume de dejetos, etc.
Exercício:
Em um estudo estatístico a característica de interesse pode ser qualitativa (nominal ou ordinal)
ou quantitativa (discreta ou contínua). Classifique as variáveis nos exemplos que se seguem:
a) população: moradores de uma certa cidade
variável: cor dos olhos (pretos, castanhos, azuis, verdes)
b) população: casais residentes em uma certa cidade
variável 1: número de filhos
variável 2: classe econômica
c) população: candidatos a um exame vestibular
variável 1: renda familiar
variável 2: sexo (masculino, feminino)
variável 3: número de pessoas na família
d) população: sabonetes de certa marca
variável: peso líquido
e) população: aparelhos produzidos por uma linha de montagem
variável: número de defeitos por unidade
Sandra-CET060-6
Exemplo 1:
POPULAÇÃO RESIDENTE SEGUNDO OS MUNICÍPIOS DA
REGIÃO METROPOLITANA DE SALVADOR - 1991
MUNICÍPIOS POPULAÇÃO
(em 1.000 habitantes)
Camaçari 114
Candeias 68
Dias D'Avila 31
Itaparica 15
Lauro de Freitas 69
Madre de Deus 9
Salvador 2.075
São Francisco do Conde 20
Simões Filho 73
Vera Cruz 22
Total 2.496
FONTE: IBGE, Censo Demográfico, Bahia. 1991.
Neste tipo de série estatística o tempo, o local e o fenômeno permanecem fixos. O fenômeno
considerado é uma variável qualitativa ou quantitativa (discreta ou contínua) e seus valores
observados são descritos considerando o número de vezes que ocorreram na série (freqüência).
Algumas definições:
Freqüência simples relativa: é a razão entre a freqüência simples absoluta e o número total de
dados (soma de todas as freqüências simples absolutas).
Notação: fri
Sandra-CET060-7
Agora vamos exemplificar distribuições de freqüência e suas respectivas tabelas para cada
tipo de variável.
Exemplo: Foi observado o número de defeitos apresentados por uma máquina industrial durante o
período de 30 dias. Os resultados foram os seguintes:
1 1 1 0 1 1
0 2 1 3 1 0
1 1 1 2 0 1
1 1 4 1 0 3
2 2 1 1 0 1
Tabela de Freqüências
Número de Freqüência Freqüência
defeitos simples absoluta simples relativa
0 6 0,20
1 17 0,57
2 4 0,13
3 2 0,07
4 1 0,03
Total 30 1,00
Fonte: Dados fictícios
2 ª) Dados contínuos:
Exemplo: Antes de enviar um lote de aparelhos elétricos para venda, o Departamento de Inspeção
da empresa produtora selecionou uma amostra casual de 32 aparelhos avaliando o desempenho
através de uma medida específica, obtendo os seguintes resultados:
Sandra-CET060-8
Construir uma tabela de distribuição de freqüências por intervalos de classes.
k ≅ 1 + 3,3 log 10 32
k ≅ 5,97
Aproximando para o número inteiro mais próximo, temos que k = 6.
A amplitude total será dada por AT = 218 – 154 = 64.
Assim, a amplitude de cada intervalo de classe será:
AT 64
h= = ≅ 10,67.
k 6
Aproximando para o inteiro mais próximo, temos que h = 11.
Dessa forma, a tabela de distribuição de freqüências para dados agrupados em classes fica da
seguinte maneira:
Tabela de Freqüências
Medida Freqüência Freqüência
simples absoluta simples relativa
154 |— 165 4 0,13
165 |— 176 5 0,16
176 |— 187 7 0,22
187 |— 198 5 0,16
198 |— 209 6 0,19
209 |— 220 5 0,16
Total 32 1,00
Fonte: Dados fictícios
Sandra-CET060-9
Tipos de fraude nos cartões de crédito da
Mastercard Internacional no Brasil - 2000
Outros
Tipo de fraude
Pedido por
correio/telefone
Cartão
falsificado
Cartão roubado
N ú m e ro d e c ria n ç a s d e b a ix a re n d a ,
s e g u n d o o b a irro d e re s id ê n c ia , q u e
p a rtic ip a ra m d o e n s in o d e m ú s ic a
n a E s c o la X Y Z , e m S a lv a d o r - 1 9 9 8
50
45
40
Nº de crianças
35
30
25
20
15
10
5
0
P a rip e P e rip e ri P la ta fo rm a P ra ia
G ra nd e
B a irro
Sandra-CET060-10
Exemplo: Série Especificativa-Temporal
Ingressantes da Universidade
XYZ - segundo área de estudo e
classe sócio econômica - 1999
200
150 Exatas
100 Humanas
50 Biológicas
0
1998 1999 2000
Sandra-CET060-11
Índ ice d e P rod uto Industrial - Brasil - 1979
IPI 25000
20000
15000
10000
5000
0
jan fev m ar abr m ai jun jul ago set out nov dez
Fonte: IBGE
Percentual de funcionários da
Companhia Milsa segundo
região de procedência
Procedência Percentual
Interior 33,30
Capital 30,60
Outro 36,10
Fonte: Bussab
Percentual de funcionários da
Companhia Milsa segundo região de
procedência
36,1 33,3
Interior
Capital
Outro
30,6
Fonte: Bussab
Sandra-CET060-12
5º) Histograma
Este gráfico é utilizado para quando os dados estão agrupados em intervalos de classes. No caso de
classes de mesma amplitude, é construído um retângulo para cada classe, com base igual à
amplitude do intervalo classe e altura proporcional a freqüência da classe. Neste caso,
altura ~ freqüência (absoluta ou relativa)
Quando temos classes com amplitudes diferentes, devemos construir um retângulo para cada classe,
com base igual à amplitude do intervalo de classe e altura dada por:
freqüencia
d=
amplitude da classe
Note que, neste caso, a área do retângulo é igual a freqüência da classe. A altura d definida acima é
chamada de densidade de freqüência.
Tabela de Freqüências
Medida Freqüência Freqüência
simples absoluta simples relativa
154 |— 165 4 0,13
165 |— 176 5 0,16
176 |— 187 7 0,22
187 |— 198 5 0,16
198 |— 209 6 0,19
209 |— 220 5 0,16
Total 32 1,00
Fonte: Dados fictícios
fi 4
0
154 |— 165 165 |— 176 176 |— 187 187 |— 198 198 |— 209 209 |— 220
medida
Sandra-CET060-13
3. MEDIDAS DE POSIÇÃO
A estatística descritiva ensina a reduzir a informação contida em uma grande quantidade de dados a
um pequeno número de medidas, substitutas e representantes daquela massa de dados. As principais
medidas da Estatística Descritiva são agrupadas em medidas de posição (ou de locação ou de
localização) e medidas de dispersão (ou de variabilidade).
3.1. Médias
Uma média de uma lista de números é um valor que pode substituir todos os valores da lista sem
alterar uma certa característica da lista.
i) Quando a característica a ser mantida é a soma dos elementos da lista, obtemos a média
aritmética.
n
∑ xi
x1 + x2 + ... + xn i =1
x= =
n n
3 + 36 + 54
Ex: A média aritmética dos números 3, 36 e 54 é x = = 31
3
ii) Quando a característica a ser mantida é o produto dos elementos da lista, obtemos a
média geométrica.
x g = n x1 ⋅ x 2 ⋅ ... ⋅ x n
Comentários
Podemos pensar na média aritmética como o valor “típico” do conjunto de dados e é considerada a
principal medida de tendência central. Algumas das razões que fazem com que seja a medida de
posição mais recomendada são:
Sandra-CET060-14
• É definida rigorosamente e pode ser interpretada sem ambiguidades;
Entretanto, esta medida apresenta alguns inconvenientes como o fato de ser muito sensível a valores
extremos, isto é, a valores excessivamente pequenos ou excessivamente grandes, em relação às
demais observações do conjunto de dados.
Exemplo: Temos o seguinte conjunto de salários mensais, em reais: 123 - 145 - 210 - 225 - 2500.
Podemos observar que quatro dos cinco salários apresentam valores entre 123 e 225 reais,
porém a média salarial de 640,6 reais é bastante distinta desse conjunto pela influência do
salário de 2500 que puxou o valor médio para cima. A média geométrica apresenta valor
mais coerente 291,6 reais.
Utiliza-se uma média ponderada quando os valores do conjunto de dados apresentam diferentes
graus de importância. Qualquer uma das médias definidas acima pode ser também considerada com
valores ponderados. Vamos ver a seguir a definição da média aritmética ponderada.
i) A média aritmética ponderada dos números x1 , x2 ,..., xn , n com pesos p1, p2, ..., pn é
definida por
∑ x .p
i =1
i i
x= n
,
∑p
i =1
i
∑x
i =1
i fi
ou quando estamos tratando com distribuição de frequências x = n
.
∑f
i =1
i
Exemplo: Em um grupo de pessoas, 70% são adultos e 30% são crianças. O peso médio dos adultos
é 70 kg e o peso médio das crianças é 40 kg. Qual o peso médio do grupo?
70 × 0 ,7 + 40 × 0 ,3
xp = = 61 kg
0 ,7 + 0 ,3
Sandra-CET060-15
ii) A média geométrica ponderada dos números x1 , x2 ,..., xn , n com pesos p1, p2, ..., pn é
definida por
3.3. Moda
Notação: Mo = moda
Exemplo 6:
a) X = {2, 3, 3, 5, 5, 5, 6, 7} ⇒ Mo = 5
d) W = {10, 12, 12, 12, 13, 13, 15, 18, 18, 18, 21} ⇒ A distribuição apresenta dois valores modais:
12 e 18 (distribuição bimodal).
Quando o conjunto de dados apresenta mais de uma moda damos o nome de distribuição
plurimodal.
Quando a distribuição de freqüências está organizada por classes de valores, devemos identificar a
classe modal (classe em que observamos a maior freqüência). A moda bruta será o ponto médio
da classe modal.
hi
Mo = li +
2
onde: li = limite inferior da classe modal;
hi = amplitude da classe modal;
Exemplo1:
Obs: No casos Freqüência Simples Absoluta (fi)
11 1
15 1
17 2
19 1
21 1
25 3
Sandra-CET060-16
De acordo com a definição a moda é 25, entretanto este valor não é representativo do conjunto de
dados e portanto a moda não é uma boa medida de locação neste caso.
Exemplo2:
Tabela de Freqüências
Medida Freqüência simples
absoluta (fi)
154 |— 165 4
165 |— 176 5
176 |— 187 7
187 |— 198 5
198 |— 209 6
209 |— 220 5
Total 32
11
Mo = 176 + = 181,5
2
3.4. Separatrizes
As separatrizes são medidas de posição que permitem calcularmos valores da variável que dividem
ou separam a distribuição em partes iguais. Temos quatro tipos de separatrizes, também chamadas
de quantis: a mediana; os quartis; os decis; e os percentis.
Notação: Md = mediana
1) Quando n é par
n
Emd = , neste caso teremos dois valores centrais e a mediana será
2
x n + x n
+1
2 2
Md =
2
Sandra-CET060-17
2) Quando n é ímpar
n +1
Emd = , neste caso teremos um valor central e a mediana será
2
Md = x n +1
2
Exemplo: Comparação entre a média aritmética e a mediana para os conjuntos de salários (em
reais) dados.
Podemos observar que no caso do conjunto Y a média não sintetiza adequadamente o conjunto de
dados, pois apenas um valor é superior a ela.
Observações:
iii) O intervalo interquartil ou interquartílico, definido por (Q1; Q3), contém 50% do total de
observações localizadas mais ao cento da distribuição.
iv) Podemos também ter idéia sobre a assimetria da distribuição utilizando apenas seus quartis:
• Se (Md - Q1) < (Q3 - Md) => assimetria à direita ou positiva;
• Se (Md - Q1) > (Q3 - Md) => assimetria à esquerda ou negativa;
• Se (Md - Q1) = (Q3 - Md) => distribuição simétrica
Sandra-CET060-18
ii) Cálculo dos percentis para dados brutos (não tabelados)
1) Se Posi = valor inteiro, então o percentil é definido como a média dos valores que ocupam a
posição Posi e Posi + 1.
2) Se Posi = valor não inteiro, então o percentil é definido como o valor que ocupa a posição k + 1,
onde k = inteiro mais próximo que seja menor que Posi.
1. Ordenar os valores: 18 21 23 24 25 28
2. Pos 25 = 25 (6/100) = 1,5 (valor não inteiro) ⇒ k = 1 e portanto o Q1 é o valor que ocupa a 2ª
posição na série ordenada.
3. Q1 = 21
Para dados agrupados em classes o elemento mediano é obtido através da fórmula Emd = n/2,
não se fazendo distinção entre número par ou ímpar de observações. Pelo elemento mediano é
encontrada a classe mediana e em seguida a mediana será calculada através da seguinte expressão:
E md =
∑ fi
, e a mediana por:
2
Md = l i + h
(E md − f ac . ant )
fi
onde,
Sandra-CET060-19
Exemplo: Carga anula de fósforo (lbs/ac/ano) nos rios.
Carga anual Nº de rios Fiac
(lbs/ac/ano)
0,0 |-- 0,4 5 5
0,4 |-- 0,8 10 15
0,8 |-- 1,2 4 19
1,2 |-- 1,6 2 21
1,6 |-- 2,0 1 22
TOTAL 22 ..
Encontre a mediana
Emd = 22/2 = 11
Md = 0,4 + 0,4 (11 – 5)/10 = 0,64
50% dos rios têm carga de fósforo inferior ou igual a 0,64 lbs/ac/ano e 50% deles têm carga de
fósforo superior ou igual a 0,64 lbs/ac/ano.
Percentil ou centil: separatriz que divide um conjunto ordenado de dados em cem partes iguais.
Através desta separatriz encontramos todas as demais.
O elemento do percentil será sempre definido como:
Ci = l i + h
(E ci − f ac . ant )
fi
onde,
li = limite inferior da classe do percentil i;
h = amplitude do intervalo de classe
Emd = elemento do percentil i
fac ant = frequência acumulada anterior à classe do percentil i
fi = frequência absoluta simples da classe do percentil i
Ec25 = 25*32/100 = 8
C25 = 165 + 11 (8 – 4)/ 5 = 173,8
25% das observações têm valores inferiores ou iguais a 173,8 e 75% delas têm valores
superiores ou iguais a 173,8.
b) Ec75 = 24 Emd = 16
C75 = 203,5 Md = 187
(Md - Q1) < (Q3 - Md) (187 – 173,8) < (203,5 – 187) 13,2 < 16,5
Distribuição assimétrica à direita ou positiva
4. MEDIDAS DE DISPERSÃO
As medidas de dispersão servem para avaliar o grau de variabilidade dos valores de um conjunto
de dados. Estas medidas permitem estabelecer comparações entre fenômenos de mesma natureza ou
de natureza distinta e geralmente essa variabilidade é observada em torno de uma medida de
tendência central. Essas medidas podem ser absolutas ou relativas.
Exemplo: Duas máquinas foram reguladas para encher cada pacote de café com 500g. Com o
objetivo de verificar a regulagem dessas máquinas, um fiscal de área anotou o peso dos 5
primeiros pacotes produzidos por cada máquina e calculou o peso médio dos pacotes. Os
resultados encontram-se abaixo:
Observando apenas o peso médio dos pacotes, poderíamos concluir que a máquina B
apresentou melhor desempenho do que A. Porém, quando observamos cada informação
separadamente, verificamos que o peso dos pacotes vindos da máquina A variou entre
495 e 500g, enquanto que o da B variou entre 490 e 510g. Isto quer dizer que a máquina
A enche os pacotes mais uniformente que a máquina B.
Sandra-CET060-21
4.1. Amplitude Total
Exemplo: Calcular as amplitudes totais do exemplo anterior e identificar qual a máquina que
apresentou a menor dispersão no peso dos pacotes de café.
A máquina A apresentou uma menor variabilidade nos pesos dos pacotes de café.
Observações:
É uma medida que avalia a dispersão dos dados em torno de sua média.
Definição: Sejam x1 , x2 ,..., xn , n valores que a variável X assume. O desvio padrão amostral é
definido como:
n
∑ ( xi − X )
2
i =1
S=
n −1
Sandra-CET060-22
Resolução: Para A, utilizando a definição, temos:
∑ (x )
k 2
−X
(0 ,8 − 0 ,8 )2 + (1 − 0 ,8 )2 + (0 ,75 − 0 ,8 )2 + (0 ,65 − 0 ,8 )2
i 2
S = i =1
= = 0 ,15
n −1 4 −1
Para B: S = 0,11 ; para C: S = 0,08 . Com os valores encontrados para o desvio padrão, podemos
observar que o grupo C apresentou a menor dispersão em relação aos demais.
O desvio ponderado é para dados agrupados em classes onde a freqüência absoluta simples é
considerada como o fator ponderador.
∑ (x − X ) f
n
2
i i
i =1
S=
∑ f −1 i
508 804
X = = 4,6 S= = 7,376 = 2,7
110 110 − 1
4.3 Variância
Notação: s2
Observações:
i) O desvio padrão tem a unidade de medida igual a unidade de medida original da variável,
enquanto que a variância apresentará a unidade de medida elevada ao quadrado.
Sandra-CET060-23
ii) Ao trabalharmos com os dados de toda a população calculamos a variância e o desvio
padrão populacional dividindo por N (tamanho da população) e não por N-1.
Quando se deseja comparar a variabilidade de duas ou mais distribuições, mesmo quando essas se
referem a diferentes fenômenos e sejam expressas em unidades de medida distintas, podemos
utilizar o Coeficiente de Variação de Pearson (medida de dispersão relativa).
Exemplo:
As medidas produzidas pela turma B são mais homogêneas, pois apresenta menor dispersão
relativa.
5. Boxplot
Boxplot
5
X
4
Sandra-CET060-24
O centro da distribuição é indicado pela linha da mediana. A dispersão é representada pela
altura do retângulo (Q3-Q1), o qual contém 50% dos valores do conjunto de dados. A posição da
linha mediana no retângulo informa sobre a assimetria da distribuição. Uma distribuição simétrica
teria mediana no centro do retângulo. Se a mediana é próxima de Q1 então os dados são
positivamente assimétricos. Se a mediana é próxima de Q3 os dados são negativamente
assimétricos.
Referências Bibliográficas
1ª LISTA DE EXERCÍCIOS
2) Uma indústria automobilística verificou que, nos últimos meses, ocorreu um aumento no número
de reclamações sobre a ocorrência de defeitos no suporte da lanterna traseira de um modelo de
automóvel por ela fabricado. A empresa desejava eliminar esta situação indesejável e para isto
iniciou estudos para melhorar resultados. Na etapa de identificação do problema, os técnicos da
indústria classificaram o número total de peças defeituosas encontradas em uma amostra de peças
produzidas durante uma semana de trabalho, segundo os tipos de defeitos que foram detectados. Os
dados obtidos são apresentados na tabela abaixo.
3) Uma empresa procurou estudar a ocorrência de acidentes com seus empregados, tendo, para isso,
realizado um levantamento abrangendo um período de 36 meses, onde foi observado o número de
operários acidentados para cada mês. Os dados correspondentes são:
1 2 2 3 3 3 3 4 4 4 4 4
5 5 5 5 5 5 5 6 6 6 6 6
6 7 7 7 7 7 8 8 8 9 9 10
a) Construa uma distribuição de freqüência adequada (obs: mantenha o valor das amplitudes de
classes com uma casa decimal);
b) encontre o intervalo inter-quartílico;
c) qual o percentual de acidentes ocorridos em menos de sete meses?
Resp: b) IQ = 7,4 – 4,2 = 3,2 c) 69,4%
Determine:
a) A carga média de nitrogênio
b) a carga mediana de nitrogênio
c) Avalie a distribuição quanto à assimetria
d) O desvio-padrão
e) O coeficiente de variação
f) qual o percentual de rios com carga anual de nitrogênio superior ou igual a 8 lbs/ac/ano
g) 40% dos rios têm carga anual de nitrogênio superior a qual valor?
Resp:a) 8,2 b)7,6 c)ass. à direita d) 4,7 e) 57,3% f) 46,2% g) 8,9
Sandra-CET060-26
4) Contou-se o número de erros de impressão da primeira página de um jornal durante 16 dias,
obtendo-se os resultados abaixo:
08 11 08 12 14 13 11 14 14 05 06 10 14 13 06 12
a) Calcule o número médio de erros de impressão por primeira página;
b) Calcule a mediana;
c) Determine a moda;
d) a amplitude total
e) o desvio-padrão
resp: a) 10,7 b) 11,5 c) 14 d) 9 e) 3,2
Máquina 1
11,7 11,8 12,1 10,7 11,7 10,9 10,7 11,6 12,5 10,7 11,5 11,1 11,2 11,2 11,8 11,2 11,0 11,7
12,1 10,9 11,7 11,3 11,5
Máquina 2
11,4 11,5 11,5 10,4 11,0 9,9 10,5 10,8 11,4 11,5 10,9 10,2 11,1 11,0 10,2 11,2 11,9 10,8
10,4 10,8 11,2 10,8 10,6
Para cada máquina calcule a média, a mediana, o intervalo inter-quartílico, o desvio padrão e o
coeficiente de variação. A partir das medidas obtidas compare o desempenho das duas máquinas
comentando os aspectos de posição e variabilidade dos dados.
Sandra-CET060-28