Fasciculo 1
Fasciculo 1
Fasciculo 1
Curso de pós-graduação
“lato sensu”
PROBABILIDADE
E ESTATÍSTICA
Marcos Santos de Oliveira
Daniela Carine Ramires de Oliveira
Probabilidade e Estatística
Marcos Santos de Oliveira
Daniela Carine Ramires de Oliveira
UFSJ
MEC / SEED / UAB
2009
O48p Oliveira, Marcos Santos de
Probabilidade e estatística / Marcos Santos de Oliveira ; Daniela
Carine Ramires de Oliveira . – São João del-Rei, MG : UFSJ, 2009.
87 p.
CDU: 519.2
Reitor
Helvécio Luiz Reis
Coordenador UAB/NEAD/UFSJ
Heitor Antônio Gonçalves
Coordenadora do curso Educação Empreendedora
Rosângela Maria de Almeida Camarano Leal
Coordenador do curso Matemática
Carlos Alberto Raposo da Cunha
Coordenadores do curso Práticas de Letramento e Alfabetização
Gilberto Aparecido Damiano
Maria José Netto Andrade
Conselho Editorial
Adélia Conceição Diniz
Alessandro de Oliveira
Bernadete Oliviera Sidney Viana Dias
Betânia Maria Monteiro Guimarães
Frederico Ozanan Neves
Geraldo Tibúrcio de Almeida e Silva
Gilberto Aparecido Damiano
Guilherme Chaud Tizziotti
Ignácio César de Bulhões
Luiz Fernando de Carvalho
Maria do Carmo Santos Neta
Maria do Socorro Alencar Nunes Macedo
Maria José Netto Andrade
Marise Santana da Rocha
Rosângela Branca do Carmo
Terezinha Lombello Ferreira
Edição
Núcleo de Educação a Distância - NEAD-UFSJ
Conselho Editorial NEAD-UFSJ
Capa / Diagramação
Luciano Alexandre Pinto
Probabilidade e Estatística
Sumário
O livro está dividido em quatro unidades, contendo duas aulas cada uma. Ao final de cada aula
incluímos exercícios que visam à aplicação imediata dos conceitos discutidos.
Esperamos que o(a) prezado(a) Estudante sinta o prazer de estudar este livro na mesma
proporção que os autores sentiram ao elaborar cuidadosamente cada conteúdo apresentado.
Atenção! Recomendamos insistentemente que você estude uma aula por semana. Faça todos
os exercícios propostos antes de iniciar o estudo da aula seguinte e tire suas dúvidas com os
tutores presenciais e a distância. Lembre-se de que o ensino a distância tem suas
peculiaridades e que você é o principal responsável pelo seu sucesso no curso. Por isso, é
necessário que você tenha disciplina, dedicação e empenho. Não deixe acumular matéria. Caso
isso aconteça, aproveite os fins de semana para colocar a matéria em dia e finalizar cada
unidade proposta.
Agradecemos à equipe do NEAD/UFSJ pelo apoio na produção deste material. Pedimos desde
já desculpas pelos erros que serão eventualmente identificados neste livro. As críticas e
sugestões de colegas e estudantes serão muito bem-vindas e auxiliarão a melhoria da próxima
versão.
Os Autores
5
.
6
UNIDADE I
Objetivos
7
.
8
Aula 1 – Noções de Estatística
1.1 Introdução
A palavra estatística é derivada da palavra latina status (que significa “estado”). Os primeiros
usos da estatística envolviam compilação de dados e gráficos que descreviam vários aspectos
de um estado ou país. Em 1662, John Graunt publicou informação estatística acerca de
nascimentos e mortes. O trabalho de Graunt foi seguido por estudos sobre taxas de
mortalidade e de doenças, tamanhos de população, renda e taxas de desemprego. As famílias,
os governos e as empresas se apóiam fortemente nos dados estatísticos para orientação. Por
exemplo, taxas de desemprego, taxas de inflação, índices do consumidor e taxas de
nascimento e morte são cuidadosamente compiladas de modo regular, e os dados resultantes
são usados para tomar decisões que afetam futuras contratações, níveis de produção e
expansão para novos mercados. Assim, necessitamos entender os conceitos básicos da
Estatística, bem como as suposições necessárias para o seu emprego de forma criteriosa, em
cada tipo de problema a ser analisado.
O que é Estatística?
Podemos considerar que a Estatística é uma ciência que fornece um conjunto de técnicas que
nos permitem, coletar, organizar, descrever, analisar e interpretar dados oriundos de estudos ou
experimentos realizados em qualquer área do conhecimento. Estamos denominando por dados
a um (ou mais) conjunto de valores, numéricos ou não. A aplicabilidade das técnicas a serem
discutidas se dá nas mais variadas áreas das atividades humanas. Nesse sentido, o principal
objetivo da Estatística é nos auxiliar a tomar decisões ou tirar conclusões em situações de
incerteza, a partir de informações numéricas.
9
Probabilidade: teoria matemática utilizada para se estudar a incerteza associada a
fenômenos aleatórios.
Inferência Estatística: denominação usualmente empregada ao estudo de técnicas que
possibilitam a extrapolação, a um grande conjunto de dados (população), das informações
e conclusões obtidas a partir de um subconjunto de valores (amostra).
A Figura 1 ilustra como a Estatística funciona na prática. Suponha, inicialmente, que estamos
interessados em estudar algumas características em um grande conjunto de dados que
denominaremos de população. Deve-se considerar que, na terminologia estatística, população
refere-se não somente a uma coleção de indivíduos, mas ao alvo no qual reside nosso
interesse. Assim, todos os clientes de um banco, todos os alunos de uma faculdade, todos os
automóveis de uma determinada marca, ou mesmo todo o sangue no corpo de uma pessoa são
10
exemplos de possíveis populações. Algumas vezes podemos acessar todos os dados da
população (nesse caso dizemos que o censo foi realizado), mas em muitas situações tal
procedimento não pode ser realizado. Em geral, razões econômicas e éticas são as mais
determinantes dessas situações. Para contornar esse fato, tomamos alguns elementos da
população para formar um grupo a ser estudado. Esse subconjunto da população, em geral
com dimensão sensivelmente menor, é denominado amostra.
A seleção de uma amostra pode ser feita de várias maneiras, dependendo, entre outros fatores,
do grau de conhecimento que temos da população, da quantidade de recursos disponíveis, e
assim por diante. Existem técnicas adequadas de amostragem que nos auxiliam na obtenção de
um subconjunto de valores o mais parecido possível com a população que lhe dá origem.
Algumas dessas técnicas serão vistas posteriormente.
Obtida uma amostra, o próximo passo é utilizar as técnicas de Estatística Descritiva para
organizar e descrever os resultados contidos na amostra. A partir daí, podemos usar técnicas de
Inferência Estatística para estimar quantidades desconhecidas, realizar extrapolação dos
resultados e testar algumas hipóteses de interesse sobre a população. As técnicas de Inferência
Estatística não fazem parte da ementa desta disciplina; entretanto, as mesmas serão vistas de
forma detalhada na disciplina Estatística Aplicada.
11
1930 Início das técnicas de Controle Estatístico de Qualidade nas indústrias.
1940 Invenção do Computador Eletrônico.
Maiores detalhes sobre a história da Estatística podem ser encontrados no site da Associação
Brasileira de Estatística – ABE, no link
http://www.redeabe.org.br/historia.htm
Qualquer característica associada a uma população é chamada de variável. Ela recebe esse
nome porque ela “varia” de alguma forma. A idade de um indivíduo, o sexo ou o estado civil
são possíveis exemplos de variáveis. Alguns conjuntos de dados consistem de números (tais
como altura de 1,50 m a 2,15 m), enquanto outros são não-numéricos (tais como cor dos
olhos: verde e castanho). Os termos dados quantitativos e dados qualitativos são em geral
usados para distinguir entre esses dois tipos. Dessa forma, as variáveis podem ser classificadas
como Qualitativas ou Quantitativas. Vejamos um exemplo.
De modo geral, para cada elemento investigado numa pesquisa, tem-se associado um (ou mais
de um) resultado correspondendo à realização de uma característica (ou características). Por
exemplo, considerando a variável conceito em inglês, para cada funcionário pode-se associar
um dos resultados, A, B, C ou D.
12
Tabela 1. Informações sobre seção, grau de instrução, números de filhos, notas e conceitos
nas disciplinas redação, inglês, metodologia e política de 25 empregados da MD Indústria e
Comércio.
Grau de N° de
Func. Seção Redação Inglês Metodologia Política
instrução filhos
1 Pessoal Ensino Médio 0 8,6 B A 9,0
2 Pessoal Fundamental 2 7,0 B C 6,5
3 Pessoal Ensino Médio 3 8,0 D B 9,0
4 Pessoal Ensino Médio 1 8,6 D C 6,0
5 Pessoal Superior 2 8,0 A A 6,5
6 Pessoal Superior 1 8,5 B A 6,5
7 Pessoal Fundamental 1 8,2 D C 9,0
8 Técnica Fundamental 2 7,5 B C 6,0
9 Técnica Superior 3 9,4 B B 10,0
10 Técnica Ensino Médio 4 7,9 B C 9,0
11 Técnica Fundamental 2 8,6 C B 10,0
12 Técnica Ensino Médio 3 8,3 D B 6,5
13 Técnica Superior 1 7,0 B C 6,0
14 Técnica Superior 1 8,6 A B 10,0
15 Venda Ensino Médio 0 8,6 C B 10,0
16 Venda Fundamental 1 9,5 A A 9,0
17 Venda Superior 0 6,3 D C 10,0
18 Venda Fundamental 0 7,6 C C 6,0
19 Venda Superior 3 6,8 D C 6,0
20 Venda Superior 2 7,5 C B 6,0
21 Venda Fundamental 1 7,7 D B 6,5
22 Venda Ensino Médio 2 8,7 C A 6,0
23 Venda Fundamental 1 7,3 C C 9,0
24 Venda Superior 0 8,5 A A 6,5
25 Venda Superior 1 7,0 B A 9,0
Fonte: Adaptado de Bussab e Morettin (2006).
13
Uma variável é qualitativa nominal se não existe nenhuma ordenação nos possíveis
resultados. Possíveis exemplos são seção a que o funcionário pertence, sexo, raça etc.
Uma variável é qualitativa ordinal se existe uma ordem natural nos seus resultados. Alguns
exemplos são grau de instrução, conceito em inglês, classe social etc.
As variáveis nota em redação, nota em política e número de filhos apresentam como possíveis
resultados números resultantes de uma contagem ou mensuração. Essas variáveis são
chamadas de variáveis quantitativas. As variáveis quantitativas também podem sofrer uma
classificação dicotômica: discreta ou contínua.
Uma variável é quantitativa discreta se os seus possíveis valores formam um conjunto finito
ou infinito enumerável de números, e que resultam, freqüentemente, de uma contagem. Alguns
exemplos são números de filhos, números de carros na família etc.
Para cada tipo de variável existem técnicas apropriadas para resumir as informações dos dados
obtidos da amostra. Por exemplo, a utilização de uma tabela é um meio de descrever os dados
de uma forma resumida. Veremos mais detalhes sobre tabelas e gráficos nas próximas seções.
Existe um tipo de variável qualitativa para a qual essa quantificação é muito útil: a chamada
variável dicotômica. Para essa variável podem ocorrer somente duas realizações, usualmente
chamadas de sucesso e fracasso. Exemplos de variáveis dicotômicas são sexo, hábito de fumar
(sim ou não) etc.
14
1.3 EXERCÍCIOS
15
Aula 2 – Técnicas de Amostragem
2.1 Introdução
A amostragem é naturalmente usada em nossa vida diária. Por exemplo, para verificar o
tempero de um alimento em preparação, podemos provar (observar) uma pequena porção deste
alimento. Nesse caso, estamos fazendo uma amostragem, ou seja, extraindo do todo
(população) uma parte (amostra) com propósito de avaliarmos sobre a qualidade do tempero
de todo o alimento.
16
Necessidade de alta precisão: a cada dez anos o IBGE1 realiza um censo demográfico
para estudar diversas características da população brasileira. Dentre estas características
tem-se o número total de habitantes, uma informação fundamental para o planejamento do
país. Dessa forma, o número de habitantes precisa ser avaliado com grande precisão e, por
isso, se pesquisa toda a população.
A técnica de amostragem aleatória é o método mais simples e um dos mais utilizados para a
seleção de uma amostra. Para a seleção de uma AAS precisamos ter uma lista completa dos
elementos da população. Este tipo de amostragem consiste em selecionar a amostra através de
um sorteio. Sua principal característica está no fato de todos os elementos da população ter
igual probabilidade de serem escolhidos.
Para realizar este sorteio, podemos utilizar urnas, tabelas de números aleatórios ou algum
software que gere números aleatórios. A Tabela 2 foi construída usando-se o software Excel®
(comando “aleatorio()”).
1
IBGE - Instituto Brasileiro de Geografia e Estatística
17
existir, simplesmente não consideramos e prosseguimos o processo.
É utilizada quando a população está naturalmente ordenada, como listas telefônicas, fichas de
cadastramento e em sistemas de produções contínuos como produções de garrafas de cervejas
etc.
18
Exemplo 3. Considerando uma turma com 49 alunos, retire uma amostra de tamanho 5
utilizando a técnica de amostragem sistemática.
A população é dividida em subgrupos, denominados estratos (por exemplo, por sexo, classe de
renda, bairro etc.) e a AAS ou AS é utilizada na seleção de uma amostra de cada estrato. Esses
estratos devem ser internamente mais homogêneos do que a população toda, com respeito às
variáveis em estudo. Aqui, um conhecimento prévio sobre a população em estudo é
fundamental.
Exemplo 4. Com o objetivo de realizar uma pesquisa de opinião sobre a gestão atual da
reitoria em uma determinada universidade, realizaremos um levantamento por amostragem. A
população é composta por 70 professores, 80 servidores técnicos administrativos e 800 alunos,
19
que identificaremos da forma apresentada na Tabela 3.
Supondo que a opinião sobre a gestão atual da reitoria possa ser relativamente homogênea
dentro de cada categoria, realizaremos uma amostragem estratificada proporcional por
categoria, para obter uma amostra global de tamanho n = 15. A Tabela 4 mostra as relações de
proporcionalidade.
20
famílias, bairros etc.). Alguns dos conglomerados são selecionados segundo a AAS, e todos os
indivíduos nos conglomerados selecionados são observados. Em geral, é menos eficiente que a
AAS ou AE, mas, por outro lado, é bem mais econômica. Tal procedimento amostral é
adequado quando é possível dividir a população em um grande número de pequenas
subpopulações.
Exemplo 5. Realização de uma pesquisa eleitoral em uma cidade com 12 zonas eleitorais.
Usando a técnica de amostragem por conglomerados, podemos selecionar aleatoriamente 2
zonas eleitorais e, em seguida, entrevistar todos os eleitores dessas zonas selecionadas:
3
Zona 9
6 11
1
7 12
2
4 10
8
Entrevistar todos os
eleitores dessas zonas
É fácil confundir amostragem estratificada com amostragem por conglomerado porque ambas
envolvem a formação de subgrupos. A diferença é que a amostragem por conglomerado usa
todos os membros de uma amostra de conglomerados, enquanto a amostragem estratificada
usa uma amostra de membros de todos os estratos.
21
2.6 Exercícios
4. Uma cidade possui N = 200 zonas eleitorais. Uma empresa destinada a fazer uma pesquisa
eleitoral vai selecionar aleatoriamente n = 15 zonas e entrevistar todos os elementos que estão
dentro dessas zonas eleitorais, isto é, foi utilizada amostragem por conglomerado. Apresente
quais serão as 15 zonas eleitorais amostradas.
22
UNIDADE II
EXPLORAÇÃO DE DADOS
Objetivos
23
.
24
Aula 1 – Tabelas e Gráficos
Interpretação da Tabela 5. Nota-se que, dos 25 empregados, 33% tem nível fundamental,
28% nível médio e 40% nível superior.
25
cada categoria, sendo o “n” o número total de observações.
As proporções (ou porcentagens) são muito úteis quando necessitamos comparar resultados de
duas pesquisas distintas. O próximo exemplo ilustra este fato.
Exemplo 7. Suponha que se queira comparar a variável grau de instrução dos empregados
que fizeram o curso com a mesma variável para todos os empregados da Companhia MD.
Digamos que a empresa tenha 2000 empregados e que a distribuição de freqüências seja a da
Tabela 6.
26
Solução: Agrupar os dados por faixas de notas. Assim, construímos a chamada tabela de
classes de freqüências.
Procedendo-se desse modo, ao resumir os dados referentes a uma variável quantitativa, perde-
se alguma informação. Por exemplo, não sabemos quais são as doze notas da classe de 8 a 9, a
não ser que investiguemos a tabela original. Sem perda de muita precisão, poderíamos supor
que todas as doze notas daquela classe fossem iguais ao ponto médio da referida classe, isto é,
8,5.
A escolha dos intervalos é arbitrária. A familiaridade do pesquisador com os dados é que lhe
indicará quantas e quais classes (intervalos) devem ser usadas. Entretanto, deve-se observar
que, com um número pequeno de classes, perde-se informação, e com um número grande de
classes, o objetivo de resumir os dados fica prejudicado. Normalmente, sugere-se o uso de 4 a
8 classes com a mesma amplitude.
27
variáveis qualitativas. Aqui serão ilustrados os dois mais simples e freqüentemente utilizados:
gráficos de barras e de composição em setores (“pizza”).
Gráfico de barras
O gráfico de barras consiste em construir retângulos ou barras, em que uma das dimensões é
proporcional à magnitude a ser representada (ni), sendo a outra arbitrária, porém igual para
todas as barras. Essas barras são dispostas paralelamente uma às outras, horizontalmente ou
verticalmente. No exemplo a seguir temos o gráfico de barras (verticais) para a variável grau
de instrução da Tabela 6.
45
40
42,5
35
30 32,5
Porcentagem
25
25
20
15
10
0
Fundamental Médio Superior
Grau de Instrução
28
Fundamental
Superior 33%
42%
Médio
25%
Gráfico de barras
O gráfico de barras para as variáveis quantitativas é construído da mesma forma que o das
variáveis qualitativas. Como ilustração, considere a variável número de filhos dos 25
empregados da Companhia MD. A Tabela 8 apresenta esses dados.
Tabela 8. Freqüências e porcentagens da variável número de filhos.
N° de Filhos Freqüência (ni) Porcentagem (100 x fi)
0 5 20
1 9 36
2 6 24
3 4 16
4 1 4
Total 25 100
29
40
35 36
30
25
Porcentagem
24
20
20
15 16
10
5
4
0
1 2 3 4 5
Números de Filhos
Exemplo 9. Considere a variável tempo, em segundos, entre carros que passam por um
cruzamento, viajando na mesma direção. As 14 medições realizadas foram
6,0 3,0 5,0 6,0 4,0 3,0 5,0 4,0 6,0 3,0 4,0 5,0 2,0 11
2 3 4 5 6 7 8 9 10 11
Tempo
30
Histograma
O histograma consiste em retângulos contíguos com base nas faixas de valores da variável e
com área igual à freqüência relativa (fi) da respectiva faixa. Desta forma, a altura de cada
retângulo é denominada densidade de freqüência definida pelo quociente da área pela
amplitude da faixa, ou seja, fi/ai, com ai indicando a amplitude da i-ésima classe. Com essa
convenção, a área total do histograma será 1 (um).
0,5 48 %
0,4
36 %
Densidade
0,3
0,2
0,1 8% 8%
0,0
6 7 8 9 10
Notas em Redação
Gráfico de linhas
É um gráfico muito importante utilizado para representar observações feitas ao longo do
tempo, em intervalos iguais ou não. Tais conjuntos de dados constituem as chamadas séries
históricas ou séries temporais. Traduzem o comportamento de um fenômeno em certo
intervalo de tempo.
Exemplo 11. Considere a dívida externa do Brasil (em milhões de dólares) no período de 1956
a 2006, apresentados na Tabela 9.
31
Tabela 9. Dívida externa do Brasil de 1956 a 2006, em milhões de dólares.
Ano Dívida Ano Dívida Ano Dívida Ano Dívida
1956 2736 1969 4635 1982 85487 1995 159256
1957 2491 1970 6240 1983 93745 1996 179935
1958 2870 1971 8284 1984 102127 1997 199998
1959 3160 1972 11464 1985 105171 1998 241644
1960 3738 1973 14857 1986 111203 1999 241468
1961 3291 1974 20032 1987 121188 2000 236156
1962 3533 1975 25115 1988 113511 2001 226067
1963 3612 1976 32145 1989 115506 2002 227689
1964 3294 1977 37951 1990 123439 2003 235414
1965 3823 1978 52187 1991 123910 2004 220182
1966 3771 1979 55803 1992 135949 2005 187987
1967 3440 1980 64259 1993 145726 2006 191999
1968 4092 1981 73963 1994 148295
Fonte: IPEADATA
250000
200000
150000
100000
50000
0
1956 1960 1964 1968 1972 1976 1980 1984 1988 1992 1996 2000 2004
Ano
32
1.5 Exercícios
3. Faça o gráfico de linhas para os dados fornecidos na sua conta de luz durante o último ano,
isto é, no eixo x coloque os meses e no eixo y coloque o consumo em kwh.
33
Aula 2 – Medidas de Posição e Dispersão
Exemplo 14. Uma empresa de segurança deseja estudar qual o número de ligações a cobrar
mais freqüentes que são recebidas em um determinado bairro de classe alta da cidade de São
Paulo no mês de março. Foram selecionadas 30 residências e observado o número de ligações
a cobrar em cada residência. O resultado se encontra na Tabela 11.
34
Tabela 11. Distribuição de freqüência do número de ligações a cobrar.
Número de ligações a cobrar Número de residências (ni)
0 2
1 5
2 15
3 8
Total 30
A moda é 2 ligações a cobrar, pois foi o número que ocorreu com maior freqüência. O valor
mínimo foi zero e o valor máximo da variável foi 3.
A mais importante medida de posição é a média aritmética. Esse conceito já é, sem dúvida,
familiar ao Leitor, quando fala, por exemplo, da altura média de um grupo de alunos ou da
nota média da sala em determinada prova.
A média aritmética é a soma das observações divididas pelo número delas. De forma mais
formal, considere n observações de um conjunto de dados representados por x1, x2,..., xn. A
média deste conjunto é obtida pela soma das n observações divididas por n, ou seja,
n
x + x2 + x3 +L + xn ∑x i
x= 1 = i =1
(4.1)
n n
Exemplo 15. Considere o seguinte conjunto de notas: 2, 5, 3, 7, 8. A média das notas é
2 + 5 + 3 + 7 + 8 25
x= = =5
5 5
Podemos adaptar a fórmula (4.1) para o caso de dados agrupados em tabelas de freqüência.
Neste caso, a média é calculada levando-se em conta as freqüências de cada valor da variável,
da seguinte forma:
35
v
∑x n i i
x= i =1
(4.2)
n
onde v é a quantidade de resultados que a variável contém e ni é a respectiva freqüência da i-
ésima classe. Assim, para o Exemplo 14, temos
n
∑x n i i
0x 2 + 1x 5 + 2x15 + 3x8
x= i =1
= = 1,9 6 ≅ 2 .
n 30
Portanto, o número médio de ligações a cobrar recebido em um determinado bairro de classe
alta da cidade de São Paulo no mês de março é 2.
A mediana é o valor que ocupa a posição central da série de observações, quando estão
ordenadas em ordem crescente.
Vamos formalizar o conceito da mediana. Considere que x1, x2, ..., xn são os n valores
(distintos ou não) da variável X. Considerando as observações ordenadas em ordem crescente,
podemos denotar a menor observação por x(1), a segunda por x(2), e assim por diante, obtendo-
se
x(1) ≤ x(2) ≤ ... ≤ x(n-1) ≤ x(n) (4.3)
Por exemplo, se x1 = 3, x2 = -2, x3 = 6, x4 = 1 e x5 = 3, então -2 ≤ 1 ≤ 3 ≤ 3 ≤ 6, de modo que
x(1) = -2, x(2) = 1, x(3) = 3, x(4) = 3 e x(5) = 6.
36
⎧ x ⎛ n +1 ⎞ se n é impar
⎪ ⎜ ⎟
⎪ ⎝ 2 ⎠
med(x) = ⎨ x ⎛ n ⎞ + x ⎛ n ⎞
⎜ +1 ⎟
⎪ ⎜⎝ 2 ⎟⎠ ⎝2 ⎠
se n é par
⎪⎩ 2
Nota: A mediana depende da posição e não dos valores dos elementos na série ordenada. Essa
é uma diferença marcante entre mediana e média, pois a média se deixa influenciar, e muito,
pelos valores extremos. Vejamos:
Na série: 5, 7, 10, 13, 15 Média = 10 e Mediana = 10;
Na série: 5, 7, 10, 13, 65 Média = 20 e Mediana = 10,
isto é, a média do segundo conjunto de valores é maior do que a do primeiro, por influência
dos valores extremos, ao passo que a mediana permanece a mesma.
Quando os dados estão agrupados em tabelas de freqüências, o método mais prático para
calcular a mediana é adicionar uma coluna à tabela contendo a freqüência acumulada. Vejamos
um exemplo.
Como o rol é par, pois n = 30, a mediana será a média dos valores que estão nas posições 15ª e
16ª. Ambos os valores que estão nestas posições são 2 ligações a cobrar recebida por
residência, pois F3 é a primeira freqüência acumulada que contém os elementos da 15ª e 16ª
posições.
37
Tabela 12. Freqüência absoluta e acumulada do número de ligações a cobrar.
Número de ligações a cobrar Número de Residências (ni) Freq. Acumulada (Fi)
0 2 2
1 5 7
2 15 22
3 8 30
Total 30
Além das medidas de posição que estudamos, há outras que, consideradas isoladamente, não
são medidas de tendência central, mas estão ligadas à mediana relativamente à sua
característica de separar a série em duas partes que apresentam o mesmo número de valores.
Essas medidas - os quartis, os decis e os percentis - são, juntamente com a mediana,
conhecidas pelo nome de separatrizes.
Denominamos quartis os valores de uma série que a dividem em quatro partes iguais.
Portanto, precisamos de 3 quartis (Q1, Q2 e Q3) para dividir a série em quatro partes iguais.
Note que o quartil 2 (Q2) é por definição a própria mediana da série.
O método mais prático para calcular os quartis é utilizar o princípio do cálculo da mediana
para os 3 quartis. Na realidade serão calculadas “3 medianas” em uma mesma série.
Exemplo 17. Cosidere a seguinte série de dados: 5, 2, 6, 9, 10, 13, 15. Ordenando a série,
temos: 2, 5, 6, 9, 10, 13, 15. O valor que divide a série acima em duas partes iguais é 9. Logo a
mediana é 9 = Q2. Temos agora {2, 5, 6} e {10, 13, 15} como sendo os dois grupos de valores
iguais proporcionados pela mediana. Para o cálculo do quartil 1 (Q1) e quartil 3 (Q3) basta
calcular as medianas de cada um desses grupos. Assim, em {2, 5, 6}, a mediana é 5 = Q1. Em
{10, 13, 15} a mediana é 13 = Q3.
38
Seguindo o mesmo principio dos quartis (que divide em quatro partes a série de dados) e
levando em conta o aumento do número de informações disponíveis, podemos dividir a série
de dados em 10 partes ou 100 partes. Quando dividimos em 10 partes, obtemos os decis (D1,
D2,..., D9) e em 100 partes obtemos os percentis (P1, P2,..., P99).
Como ilustração, o decil D6 representa o valor que deixa 60% das informações a sua esquerda
e, conseqüentemente, 40% a sua direita. De forma análoga, o percentil P74 representa o valor
que deixa 74% das observações a sua esquerda e 26% a sua direita.
O resumo de um conjunto de dados por uma única medida representativa de posição central
esconde toda a informação sobre a variabilidade do conjunto de observações. Comecemos com
um exemplo de motivação para ilustrar a importância da utilidade das medidas de dispersão,
também conhecidas como medidas de variabilidade.
Exemplo 18. Para preencher uma única vaga existente em uma empresa, 50 candidatos foram
submetidos a 6 provas de mesma importância sobre conhecimentos específicos de interesse da
empresa. Três destes candidatos destacaram-se com as notas descritas na Tabela 13.
Que candidato escolher? Por um critério inicial poderia ser escolhido aquele com a maior
média, mas todos têm mesma média, ou seja, 8. De modo análogo, nem adianta pensar em
39
moda ou mediana, pois também essas medidas são iguais a 8, para todos os candidatos.
Uma possível solução seria adotar um segundo critério: escolher o candidato que apresentou
notas mais homogêneas, isto é, aquele que apresentou menor dispersão das notas. Poderíamos
inicialmente calcular a amplitude, que é definida pelo intervalo entre o valor máximo e o
valor mínimo da série de dados, ou seja, A = máx – min. Assim, teríamos as seguintes
amplitudes: 2, 4 e 1, respectivamente para os candidatos A, B e C. Apesar de fácil de calcular,
a amplitude tem a desvantagem de levar em conta apenas dois valores, desprezando todos os
outros.
Uma medida de dispersão mais rica é obtida quando consideramos a soma dos quadrados dos
desvios em relação à média. Essa medida é chamada de variância, sendo denotada por s2 e
definida por
n
(x − x) 2 + (x 2 − x) 2 + (x 3 − x) 2 + L + (x n − x) 2 ∑ (x i − x) 2
s2 = 1 = i =1
(4.4)
n −1 n −1
A variância mede a dispersão dos dados em torno de sua média.
A raiz quadrada positiva da variância é chamada de desvio padrão (representado por s):
n
∑ (x i − x) 2
s= i =1
(4.5)
n −1
Note que a unidade de medida do desvio padrão é a mesma dos dados originais, sendo assim
interpretável, enquanto que a variância fornece uma unidade de medida elevada ao quadrado.
O cálculo do desvio padrão exige o cálculo da variância.
40
dados respectivamente por s 2B = 2 (s B ≅ 1,4) e s C2 = 0,1 (s C ≅ 0,3) .
1 ⎡⎛ n 2 ⎞ 2⎤
s2 = ⎢⎜ ∑ x i ⎟ − n ( x ) ⎥ (4.6)
n − 1 ⎣⎝ i =1 ⎠ ⎦
A fórmula (4.6) é obtida através de algumas manipulações algébricas na fórmula (4.4). Esta
tem a facilidade de apenas necessitar da informação da média ( x ) e da soma dos valores ao
quadrado da variável (∑ n
i =1
2
xi . ) Karl Pearson
Um pouco de história
A primeira utilização do termo desvio padrão ocorreu em 1894, sendo
devido Karl Pearson.
2.5 Exercícios
41
3. Um órgão do governo do estado está interessado em determinar padrões sobre o
investimento em educação, por habitante, realizado pelas prefeituras. De um levantamento de
dez cidades, foram obtidos os valores (codificados) da tabela abaixo:
Cidade A B C D E F G H I J
Investimento 20 16 14 7 19 15 14 16 19 18
42
UNIDADE III
PROBABILIDADE
Objetivos
43
.
44
Aula 1 – Introdução à Probabilidade
Exemplo 20. Os quatro itens a seguir ilustram experimentos aleatórios, pois não sabemos,
com certeza, o possível resultado que ocorrerá em cada um.
a. Jogar uma moeda duas vezes e observar a seqüência obtida de caras e coroas.
Todo experimento aleatório tem associado um espaço amostral. O Exemplo 21 ilustra esse
fato.
45
Exemplo 21. Experimentos aleatórios e seus respectivos espaços amostrais.
Existem dois eventos especiais: espaço todo (Ω) e o conjunto vazio (∅). Esses eventos não
têm aplicações práticas, mas serão úteis para provarmos propriedades das probabilidades.
46
• O evento interseção de A e B, denotado por A∩B, é o evento
A B
em que A e B ocorrem simultaneamente. Ω
• O evento união de A e B, denotado por A∪B, é o evento em
A B
que A ocorre ou B ocorre (ou ambos). Ω
c
• O evento complementar de A, denotado por A , é o evento
A B
em que A não ocorre.
Ω
Exemplo 23. Operações com eventos. Seja Ω = {1, 2, 3, 4, 5, 6}. Considere os seguintes
eventos: A = {2, 4, 6}, B = {4, 5, 6} e C = {1, 3, 5}. Os eventos a seguir ficam assim:
A ∩ B = {4, 6} A∩C=∅
A ∪ B = {2, 4, 5, 6} A ∪ Bc = {1, 2, 3, 4, 6}
Eventos disjuntos
Dois eventos A e B são mutuamente exclusivos ou disjuntos se eles não podem ocorrer
simultaneamente (A ∩ B = ∅).
Ω
A B
Após essas quatro definições, acreditamos que o leitor esteja preparado para aprender a
calcular probabilidades. Sugerimos assim, que faça os dois primeiros exercícios da seção 1.4
antes de prosseguir.
47
1.3 Definições de Probabilidade
No entanto, é fácil perceber que o termo probabilidade já está enraizado no senso comum,
pois as pessoas vivem o cotidiano calculando implicitamente algumas probabilidades, tais
como situações de sua vida pessoal; organizando-se em relação a horários a cumprir, levando
em conta as circunstâncias do tráfego; agasalhando-se ao sair de casa se a previsão do tempo
indicar uma frente fria. Em resumo, prevenindo-se em situações de risco.
48
O primeiro é devido a Laplace e é o mais conhecido, pois relaciona eventos favoráveis com
eventos possíveis. O segundo consiste em repetir um experimento várias vezes. O terceiro é
baseado na opinião pessoal, e o último é devido a Kolmogorov e baseia-se no princípio de que
qualquer experimento pode ser modelado.
Método Clássico
Consideremos o caso em que se joga um dado repetidas vezes. O dado tem seis faces: 1, 2, 3,
4, 5, 6. Se o dado é homogêneo, equilibrado, jogando-o uma vez não há razão para dizermos
que determinada face tenha preferência sobre as outras. Todos os seis resultados são
igualmente possíveis. Então a probabilidade de aparecer a face 3, por exemplo, é de 1/6. O
evento que nos interessa consiste em um elemento, e o espaço amostral tem seis elementos.
Exemplo 25. No lançamento de uma moeda equilibrada, qual a probabilidade de aparecer uma
Cara? O espaço amostral associado é Ω = {Cara, Coroa}. Pela definição clássica, a
probabilidade de ocorrência do evento A = {Cara} é P(A) = 1/2. Note que o número de
elementos em Ω é 2 e o número de elementos em A é 1.
Método Freqüentista
A definição clássica de probabilidade só se aplica a espaços amostrais em que os eventos
simples são igualmente possíveis. Esse é o caso da maioria das aplicações de probabilidades
aos jogos de azar, área que, precisamente, suscitou os primeiros problemas práticos resolvidos
pela teoria das probabilidades. Esses mesmos jogos, entretanto, repetidos inúmeras vezes,
levaram a considerar a probabilidade de um evento como a freqüência relativa, ou seja, como a
proporção de vezes que um evento ocorre em uma série suficientemente grande de realizações
49
de um experimento, em condições idênticas. Surgiu então uma nova definição de
probabilidade, a definição freqüentista.
Método Subjetivo
Definição 5.3. Cada indivíduo, baseado em informações anteriores e em sua opinião a respeito
de um evento em questão, pode ter uma resposta para a probabilidade deste evento.
Exemplo 26. Um médico experiente consegue calcular uma probabilidade de o indivíduo ter
uma determinada doença a partir dos sintomas que o indivíduo apresenta. Note que outro
médico pode calcular uma probabilidade diferente para o mesmo indivíduo. Daí o caráter
subjetivo.
Método Moderno
A definição clássica, freqüentista e subjetiva de probabilidade, embora sejam bastante
intuitivas e devendo, por isso, ser sempre lembradas, não são definições matematicamente
aceitáveis de probabilidade. Por exemplo, no caso da definição freqüentista, como saber se, à
medida que o número de repetições de um experimento cresce, a freqüência relativa converge
para um número. Além das dificuldades com o limite, existem muitas situações em que é
necessário o uso de probabilidades, e, no entanto, não é nem possível nem intuitivo pensar em
repetições.
50
Definição 5.4. Probabilidade é uma função P(⋅) , que associa a cada evento do espaço amostral
Ω, um número real, pertencente ao intervalo [0, 1], satisfazendo os seguintes axiomas:
Axioma 1. 0 ≤ P(A) ≤ 1.
Axioma 2. P(Ω) = 1.
Axioma 3. Se A e B são eventos mutuamente exclusivos: P(A∪B) = P(A) + P(B).
A partir desses axiomas, podemos demonstrar as seguintes propriedades:
P1: P(∅) = 0, onde ∅ é o conjunto vazio.
P2: Seja Ac o evento complementar de A, então P(Ac) = 1 – P(A).
P3: Se A e B forem dois eventos quaisquer, então P(A ∪ B) = P(A) + P(B) – P(A ∩ B).
P4: Se A ⊂ B, então P(A) ≤ P(B).
Exemplo 27. Seguem alguns exemplos de funções já descobertas na literatura para calcular
probabilidades, que serão discutidas em detalhes nas próximas seções.
P(X = x ) = p x (1 − p )
1− x
Bernoulli , x = 0, 1
⎛n⎞
P(X = x ) = ⎜⎜ ⎟⎟p x (1 − p ) , x = 0, 1, ..., n
n−x
Binomial
⎝x⎠
⎛ r ⎞⎛ N − r ⎞ ⎛ N⎞
Hipergeométrica P(X = x ) = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ , 0 ≤ x ≤ mínimo(r, n).
⎝ x ⎠⎝ n − x ⎠ ⎝n⎠
e −λ λ x
Poisson P(X = x ) = , x = 0, 1, ...
x!
1
Uniforme f (x) = ,α<x<β
β−α
1
1 − ( x −µ )2
Normal f (x) = e 2σ2
, - ∞ < x< + ∞
σ 2π
51
1.4 Exercícios
52
Passo 2 – Um membro do grupo vai lançar a moeda e o outro vai marcar os resultados na
planilha anexa, seguindo as seguintes instruções:
a) Jogar a moeda uma vez e anotar C ou K no espaço adequado (linha 2) da planilha.
b) Repetir este procedimento 30 vezes, preenchendo um a um todos os espaços da linha 2.
Passo 3 – Continuando com a planilha, trocar de lugar com o parceiro, voltar para os itens a) e
b) das instruções e continuar mais 30 jogadas – até perfazer 60.
d) Agora a linha 4 da planilha deve ser preenchida – em cada posição deve ser colocado o
número acumulado de CARAS, até aquela jogada (verifique que a jogada está explicitada na
linha 1- que é a linha n). Discutir com outro membro do grupo para ver se está claro – se não,
pergunte! A linha de baixo é continuação do acumulado da linha de cima.
1) Jogada(n) 31 32 33 40 47 50 55 60
2) C ou K
3) 1 ou 0
4) Caras Acumuladas (m)
5) Frequência Relativa (m/n) X X X X X X X X X X X X X X X X X X X X X X X X X X X
53
Passo 5 – Depois de completar a 1a parte da planilha, construir a seguinte tabela, usando as
linhas 4 e 5 da planilha:
n 1 2 3 4 5 6 7 8 9 10 20 30 40 50 60
m/n
m/n
1,0
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
1 2 3 4 5 6 7 8 9 10 …… 20 30 40 50 60
n
54
Aula 2 – Fundamentos de Probabilidades
Sejam A e B dois eventos associados a um mesmo espaço amostral Ω. Denota-se por P(A|B) a
probabilidade condicionada do evento A, quando o evento B tiver ocorrido.
Definição 6.1. Dados dois eventos A e B, a probabilidade condicional de A dado que ocorreu
B é representada por P(A | B) e definida por
P(A ∩ B)
P(A | B) = , P(B) > 0 (6.1)
P(B)
Da expressão (6.1), obtemos a regra do produto de probabilidades dada por
P(A ∩ B) = P(B)P(A | B) (6.2)
Exemplo 28. Um grupo de pessoas foi classificado quanto a peso e pressão arterial, de acordo
com as proporções do quadro a seguir:
Peso
Pressão Excesso Normal Deficiente Total
Alta 0,10 0,08 0,02 0,20
Normal 0,15 0,45 0,20 0,80
Total 0,25 0,53 0,22 1,00
55
a. Qual a probabilidade de uma pessoa escolhida ao acaso nesse grupo ter pressão alta?
b. Se se verifica que a pessoa escolhida tem excesso de peso, qual a probabilidade de ela ter
também pressão alta?
Solução:
a. Como a pessoa é escolhida ao acaso em um grupo em que 20% tem pressão alta, chamando
A o evento “ter pressão alta”, P(A) = 0,20 é a probabilidade pedida.
Exemplo 29. Joaninha tem probabilidade de 0,8 de passar no vestibular, enquanto que
Joãozinho tem probabilidade 0,6. Qual a probabilidade de ambos passarem no vestibular?
Qual a suposição a ser feita nesse caso para calcular a probabilidade?
56
2.3 Regra da Probabilidade Total
Considere a seqüência {B1, B2, ..., Bn} como sendo uma partição do espaço amostral Ω, isto é,
Bi ∩ Bj = ∅ sempre que i ≠ j e B1 ∪ B2 ∪ ... ∪ Bn = Ω. O diagrama da Figura 8 exibe uma
partição de Ω.
B2
B1 B3
A
B5
B4
Vamos supor que o evento A possa ocorrer juntamente com um e só um dos n eventos
mutuamente exclusivos B1, B2,..., Bn. Em outras palavras vamos assumir que
A = (A ∩ B1) ∪ (A ∩ B2) ∪ ... (A ∩ Bn), (6.4)
onde os eventos A ∩ Bi e A ∩ Bj (com subscritos distintos i e j) são mutuamente exclusivos.
57
A expressão (6.7) é denominada Regra da Probabilidade Total.
Exemplo 30. Uma mineradora explora três minas denominadas B1, B2 e B3. A partir de
pesquisas anteriores, sabe-se que a probabilidade de encontrar ouro na mina B1 é 0,1, na mina
B2 é 0,05 e na mina B3 é 0,2. Além disso, essa mineradora tem explorado as minas B1, B2 e B3
nas proporções 0,3, 0,2 e 0,5, respectivamente. Qual a probabilidade de a mineradora
encontrar ouro?
Solução: Seja A = {encontrar ouro} e Bj = {explorando a j-ésima mina j}. Pela regra da
probabilidade total temos
P(A) = P(A | B1 ) P(B1 ) + P(A | B 2 ) P(B 2 ) + P(A | B 3 ) P(B 3 )
= 0,1x0,3 + 0,05x0,2 + 0,2x0,5 = 0,14
∑ P(A | B )P(B )
i =1
i i
Exemplo 31. Considere novamente o Exemplo 30. Sabendo-se que a mineradora encontrou
ouro, qual a probabilidade de que tenha sido na mina B3?
58
Solução: Precisamos calcular a seguinte probabilidade:
P( A | B 3 ) P( B 3 ) 0,2x 0,5 0,10
P(B 3 | A) = n
= = ≅ 0,7143
∑ P( A | B ) P( B )
0,14 0,14
i i
i =1
2.5 Exercícios
Subsistema 1 Subsistema 2
59
.
60
UNIDADE IV
DISTRIBUIÇÕES DE PROBABILIDADES
Objetivos
61
.
62
Aula 1 – Variáveis Aleatórias Discretas
1.1 Introdução
Exemplo 32. Observa-se o sexo das crianças em famílias com três filhos. O espaço amostral é
Ω = {(MMM), (MMF), (MFM), (FMM), (MFF), (FMF), (FFM),(FFF)}
Uma v.a. de interesse é X = {nº. de crianças do sexo masculino}. A cada evento simples ou
ponto de Ω, associamos um número, que é o valor assumido pela v.a. X:
O passo fundamental para entendermos uma v.a. é associar a cada valor a sua probabilidade,
obtendo assim a sua distribuição de probabilidade.
X x1 x2 ... xn
P(X=x) P(X=x1) P(X=x2) ... P(X=xn)
63
∑
n
A função de probabilidade (P(⋅)) deve satisfazer: 0 ≤ P(X=xi) ≤ 1 p/ ∀ xi e i =1
P(X = x i ) = 1 .
Espaço
X Probabilidade
Amostral
21 20 19 Distribuição de Probabilidade
HHH 0 x x = 0,203
35 34 33
21 20 14 X 0 1 2 3
HHM 1 x x = 0,150
35 34 33 P(X) 0,203 0,450 0,291 0,056
HMH 1 0,150
21 14 13
HMM 2 x x = 0,097 = 0,291+ 0,056
35 34 33
MMH 2 0,097
14 13 12
MMM 3 x x = 0,056
35 34 33
64
1.2 Esperança Matemática e Variância
Assim como definimos a média de uma distribuição de freqüências como a soma dos produtos
dos diversos valores observados pelas respectivas freqüências relativas, é natural definirmos
agora a média de uma v.a., ou de sua distribuição de probabilidade, como a soma dos produtos
dos diversos valores de xi da v.a. pelas respectivas probabilidades P(X = xi).
É uma média ponderada dos xi, em que os pesos são as probabilidades associadas.
Exemplo 34. Um lojista mantém extensos registros das vendas diárias de certo aparelho. O
quadro a seguir dá o número xi de aparelhos vendidos em uma semana e a respectiva
probabilidade:
Número xi 0 1 2 3 4 5
Probabilidade P(X = xi) 0,1 0,1 0,2 0,3 0,2 0,1
Se for de R$ 20,00 o lucro por unidade vendida, qual o lucro esperado nas vendas de uma
semana?
Solução: Calculemos inicialmente E(X), que é o número esperado de aparelhos vendidos em
uma semana:
E(X) = (0)(0,1) + (1)(0,1) + (2)(0,2) + (3)(0,3) + (4)(0,2) + (5)(0,1) = 2,70.
Para x unidades vendidas o lucro é 20x. Logo, o lucro esperado é de R$ 54,00.
Variância
Assim como a média é uma medida de posição de uma v.a., é natural que procuremos uma
medida de dispersão dessa variável em relação à média. Essa medida é a variância, a ser
representada por σ2 e definida por
n
σ 2 = Var (X) = E[X − E (X)] 2 = ∑ ( x i − E (X)) 2 P(X = x i )
i =1
65
Desenvolvendo o termo quadrático do somatório, obtemos uma expressão mais fácil de
calcular a variância dada por
σ 2 = Var (X) = E(X 2 ) − [E (X)]2 ,
n
onde E (X 2 ) = ∑ x i2 P(X = x i ) .
i =1
Desvio Padrão
O desvio padrão (σ) é a raiz quadrada positiva da variância. Tem sobre esse último a vantagem
de exprimir a dispersão na mesma unidade de medida da v.a.
σ = σ2
Nesse processo de escolha, lançamos mão, em muitas situações, de algum modelo clássico.
Nesta seção estudaremos os modelos discretos comumente utilizados: Bernoulli, Binomial,
Hipergeométrica e Poisson.
Na prática, existem muitos experimentos que admitem apenas dois resultados. Por exemplo,
uma peça é classificada como boa ou defeituosa; um entrevistado concorda ou não com a
afirmação feita; o resultado de um exame médico para detecção de uma doença é positivo ou
negativo; no lançamento de um dado ocorre ou não a face 5.
66
Situações com alternativas dicotômicas podem ser representadas genericamente por respostas
do tipo sucesso-fracasso. Esses experimentos recebem o nome de ensaio de Bernoulli e
originam uma v.a. com distribuição Bernoulli.
Denotamos por X ~ Bernoulli (p) uma v.a. com distribuição de Bernoulli com parâmetro p, se
⎧ 1, se ocorrer " sucesso"
X=⎨ com função de probabilidade,
⎩0, se ocorrer " fracasso"
P(X = x ) = p x (1 − p )
1− x
, x = 0, 1
Daí segue que
E(X) = p e Var(X) = 1-p
Repetições independentes de um ensaio de Bernoulli dão origem ao modelo binomial.
67
Usamos a seguinte notação: X ~ B(n; p). A média e a variância são dadas, respectivamente,
por
E(X) = np e Var(X) = np(1-p)
Exemplo 35. Suponha que 20% dos clientes de uma empresa sejam inadimplentes. Se 10
pessoas dessa população forem escolhidas ao acaso e com reposição, determine
a. O nº esperado de inadimplentes;
b. A probabilidade de selecionar exatamente 3 pessoas inadimplentes;
c. A probabilidade de selecionar no máximo 3 inadimplentes.
Solução:
a. X={número de pessoas inadimplentes}. Temos que E[X] = 10 x 0,2 = 2.
⎛10 ⎞
b. P(X = 3) = ⎜⎜ ⎟⎟0,2 3 (1 − 0,2)10−3 ≅ 0,2
⎝3⎠
3
⎛10 ⎞ ⎛10 ⎞ ⎛10 ⎞
c. P(X ≤ 3) = ∑ P(X = i) = 0,810 + ⎜⎜ ⎟⎟0,210,8 9 + ⎜⎜ ⎟⎟0,2 2 0,88 + ⎜⎜ ⎟⎟0,2 3 0,8 7 ≅ 0,88
i =0 ⎝1⎠ ⎝2⎠ ⎝3⎠
Considere um conjunto de N objetos dos quais (r) são do tipo I e (N – r) são do tipo II. Um
sorteio de n objetos (n < N) é feito ao acaso e sem reposição. A variável aleatória discreta X
que é igual ao número de objetos do tipo I selecionados nesse sorteio tem distribuição
hipergeométrica.
68
Os valores possíveis de X vão de 0 a min(r, n), uma vez que não podemos ter mais do que o
número de objetos existentes do tipo I, nem mais que o total de sorteados.
Usamos a seguinte notação: X ~ Hipergeométrica (N; n; r). A esperança e variância são dadas
por
E(X) = np e Var(X) = np(1-p)(N-n)/(N-1),
onde p = r/N.
Exemplo 36. Uma fábrica produz peças que são embaladas em caixas com 40 unidades. Para
aceitar o lote de caixas enviado por essa fábrica, o controle de qualidade de uma empresa
sorteia uma caixa do lote e sorteia 10 peças, sem reposição, dessa mesma caixa. Se houver
alguma peça defeituosa, o lote inteiro é devolvido. Se a caixa sorteada tiver 4 peças
defeituosas, qual é a probabilidade de o lote não ser devolvido?
Solução: N = 40, n = 10 e r = 4. X: número de peças defeituosas.
⎛ 4 ⎞⎛ 40 − 4 ⎞ ⎛ 40 ⎞
P(X = 0) = ⎜⎜ ⎟⎟⎜⎜ ⎟⎟ ⎜⎜ ⎟⎟ ≅ 0,3
⎝ 0 ⎠⎝ 10 − 0 ⎠ ⎝ 10 ⎠
69
n° de clientes por hora;
n° de chamadas telefônicas recebidas por minuto.
Note-se que a unidade de medida (tempo, área) é contínua, mas a variável aleatória de
interesse (número de ocorrência) é discreta. Além disso, as falhas não são contáveis. Não é
possível contar os acidentes que não ocorreram, nem o número de defeitos por centímetros
quadrados que não ocorreram.
Solução: Seja X: número de chamadas para conserto de máquinas em uma hora. O parâmetro
λ = 5/hora. Aplicando na função da Poisson, temos
e −5 5 3
P(X = 3) = ≅ 0,14
3!
70
1.4 Exercícios
X 0 1 2 3 4 5
P(X = x) 0,10 0,15 0,25 0,30 0,15 0,05
Calcule:
a. O número médio de crianças por domicílio, µX.
b. O desvio padrão de X, σX.
c. A probabilidade P{µX - σX ≤ X ≤ µX + σX}.
2. Sabe-se que 7% dos ratos machos de uma certa linhagem são portadores de um defeito
genético que não ocorre em fêmeas. Responda:
a. Qual a probabilidade de encontrarmos pelo menos 1 animal com esse defeito genético numa
ninhada com 5 machos?
b. Qual a probabilidade de encontrarmos no máximo 3 animais com esse defeito genético
numa ninhada com 4 machos?
3. Numa central telefônica, o número de chamadas chega segundo uma distribuição Poisson,
com a média de oito chamadas por minuto. Determine qual a probabilidade de que num
minuto se tenha(m)
a. duas ou mais chamadas;
b. menos que duas chamadas;
c. entre sete (inclusive) e nove (exclusive) chamadas.
71
Aula 2 – Variáveis Aleatórias Contínuas
2.1 Introdução
Até aqui estudamos variáveis aleatórias discretas que são caracterizadas por ter uma
distribuição de probabilidade dada por uma tabela que associa a cada um de seus valores uma
probabilidade. Esta probabilidade é um número entre 0 e 1 cuja soma é igual a 1. Vamos agora
definir uma variável aleatória contínua.
Seja X uma variável aleatória. Suponha que os possíveis valores de X sejam um intervalo que
possui infinitos valores; então, dizemos que X é uma variável aleatória contínua.
Uma variável aleatória contínua assume seus possíveis valores em um determinado intervalo.
A pergunta que surge é “Como são atribuídas probabilidades neste caso?”.
72
Exemplo 39. Suponha que observamos o peso, em kg, de 1500 pessoas adultas selecionadas
aleatoriamente numa população. O histograma por densidade desses valores é apresentado na
Figura 9.
0,05
0,04
0,03
Densidade
0,02
0,01
0,00
30 40 50 60 70 80 90 100 110
Peso
Seja X = {peso em kg} de uma pessoa adulta escolhida ao acaso da população. Como se
distribuem os valores da v.a. X, ou seja, qual a distribuição de probabilidades de X?
0,05
0,04
0,03
Densidade
0,02
0,01
0,00
30 40 50 60 70 80 90 100 110
Peso
73
A Figura 10 ilustra o histograma da variável peso apresentado na Figura 9 com o ajuste de
uma função densidade, conhecida como distribuição normal.
Para as variáveis contínuas, as probabilidades são atribuídas por meio de uma função cuja área
entre a função e o eixo das abscissas (X) é igual a um.
Esta função f(x) é denominada função densidade de probabilidade (fdp) da variável aleatória
contínua X. A área sob uma curva delimitada por dois valores a e b, como mostra a Figura 11
é determinada calculando-se a integral definida entre a e b da densidade de probabilidade
representada pela função, isto é,
b
∫ f (x )dx = P(a ≤ x ≤ b)
a
Exemplo 40. Um fabricante de televisão a cores oferece uma garantia de 1 ano para
substituição gratuita se o tubo de imagem falhar. Ele estima o tempo de falha (em unidades de
anos), x, como uma variável aleatória contínua com a seguinte fdp
⎧⎪ 1 − x 4
e , x>0
f (x ) = ⎨ 4 .
⎪⎩ 0 x≤0
74
Qual a probabilidade de você comprar a televisão e necessitar de uma substituição gratuita?
Solução:
1 x
1 −
P( x ≤ 1) = ∫ e 4 dx ≅ 0,2
0
4
c. P(a ≤ X ≤ b) = área sob a função densidade de probabilidade f(x) e acima do eixo x entre os
b
pontos a e b, isto é, P(a ≤ x ≤ b) = ∫ f ( x )dx ;
a
x0
75
2.2 Esperança Matemática e Variância
Exemplo 42. Para uma variável que tem densidade f(x) = 2x, 0 < x < 1, então,
1 1 1
2 2
E[X] = ∫ x 2 x dx = ∫ 2 x dx = x 3
2
= .
0 0
3 0 3
Exemplo 43. Para uma variável que tem densidade f(x) = 2x, 0 < x < 1, calcule a variância de
2
X, sabendo que E[X] = do Exemplo 42.
3
1 1 1
2 2
Solução: E[X ] = ∫ x 2x dx = ∫ 2x dx = x 4
2 2 3
= . Logo, Var[X] = 2/4 – (2/3)2 =1/18.
0 0
4 0 4
76
de probabilidades. Abordaremos aqui, em caráter mais intuitivo, a distribuição uniforme e a
distribuição normal.
Uma v.a. X tem distribuição uniforme U(a , b) se sua função densidade de probabilidade é da
forma
⎧ 1
⎪ , a<x<b
f (x ) = ⎨ b − a .
⎪⎩ 0, caso contrário
a+b (b − a ) 2
E[X] = e Var[X] =
2 12
A probabilidade procurada é
115 − 110 5
115 115
1 1
P(110 < X < 115) = ∫ dx = x = = = 0,2
110
25 25 110 25 25
77
2.3.2 Modelo Normal
A média da distribuição é µ;
O desvio padrão é σ;
A moda e a mediana são iguais a µ;
A curva normal é simétrica em torno da média µ;
Os pontos de inflexão são µ - σ e µ + σ;
A área sob a curva e acima do eixo horizontal é igual a 1.
78
A distribuição normal depende dos parâmetros µ e σ2
µ1 µ2
Curvas normais _ _ _ N (µ , σ 1 2 )
com mesma _ _ _ N (µ , σ 2 2 )
média, mas com
desvios padrão _ _ _ N (µ , σ 3 2 )
diferentes. σ 1 2 < σ 2 2< σ 3 2
Essa nova variável chama-se variável normal padronizada. Recebe esse nome, porque sua
média é 0 e seu desvio padrão é 1. Mediante tal transformação, basta construirmos uma única
79
tabela, a da normal reduzida e, através dela, obteremos as probabilidades associadas a todas as
distribuições N(µ, σ2).
Note que essa transformação não altera a forma da distribuição, apenas refere-se a uma nova
escala.
X −µ
Assim, se quisermos calcular P(a < X < b) , sendo X ~ N(µ;σ2), podemos definir Z = e
σ
calcular a seguinte probabilidade:
⎛a −µ X−µ b−µ⎞ ⎛a −µ b−µ⎞
P(a < X < b) = P(a − µ < X − µ < b − µ ) = P⎜ < < ⎟ = P⎜ <Z< ⎟
⎝ σ σ σ ⎠ ⎝ σ σ ⎠
f(x)
f(z)
a µ b x
a–µ 0 b–µ z
σ σ
Figura 12. Representação do cálculo da P(a < X < b) via variável normal padronizada Z.
80
Tabela da Distribuição Normal Padrão
Denotamos: A(z) = P(Z ≤ z), para z ≥ 0.
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
3.5 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998 0.9998
3.6 0.9998 0.9998 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.7 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.8 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999 0.9999
3.9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
81
Exemplo 45. Se Z ~ N (0,1), então:
a. P(Z ≤ 1,71) = A(1,71) = 0,9564 b. P(0 < Z ≤ 1,71) = A(1,71) –A(0)
= 0,9564 – 0,5000 = 0,4564
Exemplo 46. Seja X = {gasto com lanche semanal}. Após estudar esta variável, vimos que
X ~ N (20, 64), então obtenha
a. P(16<X<22)
Solução:
⎛ 16 − 20 X − 20 22 − 20 ⎞
P(16 < X < 22) = P⎜ < < ⎟ = P(−0,5 < Z < 0,25)
⎝ 8 8 8 ⎠
= (A(0,25) − A(0)) + (A(0,5) − A(0)) = (0,5987 − 0,5) + (0,6915 − 0,5) = 0,2902
b. P(X<18 ou X>24)
Solução:
⎛ X − 20 18 − 20 ⎞ ⎛ X − 20 24 − 20 ⎞
P(X < 18 ou X > 24) = P(X < 18 ) + P(X > 24) = P⎜ < ⎟ + P⎜ > ⎟
⎝ 8 8 ⎠ ⎝ 8 8 ⎠
= P( Z < −0,25) + P( Z > 0,5) = (1 − A(0,25)) + (1 − A(0,5))
= (1 − 0,5987) + (1 − 0,6915) = 0,7098
82
Como encontrar o valor z da distribuição N(0,1) tal que área acumulada até ele seja A(z) =
0.975.
83
2.4 Exercícios
1. Se Z ~N(0,1), calcule:
a. P(1,32 < Z ≤ 1,79) d. P(Z ≥ 1,5)
b. P(Z ≤ -1,3) e. P(-1,5 ≤ Z ≤ 1,5)
c. P(-1,32 < Z < 0) f. P( -2,3 < Z ≤ -1,49)
3. O diâmetro de um cabo elétrico é uma variável aleatória com fdp dada por
⎧6x (1 − x ), 0 < x <1
f (x) = ⎨
⎩ 0, caso contrário
a. Verifique se f(x) é uma fdp, através do item b. da definição 8.2.
b. Obtenha a F(x).
c. Qual a probabilidade de o diâmetro ser:
c1. Igual a 0,5 cm? c3. Entre 0,10 e 0,20?
c2. Maior que 0,5? c4. Menor que 1?
84
5. O tempo de sobrevivência de uma bateria (em anos) pode ser modelado pela função
⎧e − x , x≥0
f (x) = ⎨
⎩ 0, caso contrário
a. Qual a probabilidade de a bateria sobreviver mais que 2 anos?
b. Qual é o tempo médio de sobrevivência da bateria?
6. O tempo gasto no exame vestibular de uma universidade tem distribuição Normal, com
µ = 120 min, e σ = 15 min.
a. Sorteando-se um aluno ao acaso, qual é a probabilidade de ele terminar o exame antes de
100 minutos?
b. Qual deve ser o tempo de prova, de modo a permitir que 95% dos vestibulandos a terminem
no prazo estipulado?
c. Qual o intervalo central de tempo tal que 80% dos estudantes gaste para completar o exame?
85
.
86
Probabilidade e Estatística
REFERÊNCIAS
BUSSAB, W. O.; MORETTIN, P.A. Estatística Básica. 5. ed. São Paulo: Saraiva, 2006.
FARIAS, A. A.; SOARES, J. F.; CÉSAR, C. C. Introdução à Estatística. 2. ed. Rio de Janeiro:
LTC, 2003.
ROSS, Sheldon. Afirst course in probability. 8. ed. Londres: Prentice Hall, 2005.
87