Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

COL - Módulo Probabilidade

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 163

Manual de Probabilidade Estatística

3º ano

Universidade Católica de Moçambique


Centro de Ensino á Distância
Direitos de autor

Todos os direitos dos autores deste módulo estão reservados. A reprodução, a locação, a
fotocópia e venda deste manual, sem autorização prévia da UCM-CED, são passíveis a
procedimentos judiciais.

Elaborado por:

PAULO DINIZ (BENE)

Mestrado em Educação, Especialidade de Didáctica de


Matemática, pela Faculdade de Ciências da Universidade de
Lisboa. Licenciado em Ensino de Matemática, pela
Universidade Pedagógica de Moçambique, Delegação da
Beira. Fez Especialização em Estatística (Pós-Graduação),
pela Universidade Pedagógica em parceria com a
Universidade Complutense de Madrid. Docente de
Probabilidade e Estatística, Estatística Aplicada, Estatística
Multivariada, Geometria Analítica, Geometria Euclidiana,
Álgebra Linear, Didáctica de Matemática, Análise
Matemática I, Noções de Empreendedorismo. Participou em
Conferências Internacionais e publicou artigos e Porters:

2010 – Congresso Mundial de Ciências de Educação (México) - The Status of the Educational Research: a survey with
teachers of Pedagogical University, Beira Branch.

2009 – ARIC (Brasil) - O Uso das Tecnologias da Informação e Comunicação no Ensino daMatemática em Sofala
(Moçambique): um olhar para o futuro.

2009 – PME (Grécia) – The teaching of geometry in Mozambique : perspectives of threemathematics’ secondaryteachers.

2008 – ICME (México) - The Mathematics from behind a deck of playing cards.

2007 - AMESA (África do Sul) - Challenge to students’ perceptions of lines relative positions in the spatial geometry in
PedagogicalUniversity.

2005 – ICMI (África do Sul) - The Mathematics from behind a deck of playing cards

Universidade Católica de Moçambique


Centro de Ensino à Distância
825018440
23311718
Moçambique
Fax: 23326406
E-mail: eddistsofala@ucm.ac.mz
Agradecimentos

Agradeço a colaboração dos seguintes indivíduos e/ou pessoa colectiva na elaboração deste
manual:

Por ter me confiado na elaboração deste Ao coordenador do curso de Matemática


Módulo Fernando Muchanga
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 i

Índice
Visão geral 1
Bem-vindo a Probabilidade e Estatística ........................................................................ 1
Objectivos do curso ....................................................................................................... 1
Quem deveria estudar este módulo ................................................................................ 2
Como está estruturado este módulo................................................................................ 2
Ícones de actividade ...................................................................................................... 3
Habilidades de estudo .................................................................................................... 3
Precisa de apoio? ........................................................................................................... 3
Tarefas (avaliação e auto-avaliação) .............................................................................. 3

Unidade 01 5
Introdução às Probabilidade........................................................................................... 5
Introdução ............................................................................................................ 5
1.1.0. Conceitos importantes para o cálculo das probabilidades ..................... 7
1.1.1. Experimento aleatório ................................................................................. 7
1.1.2. Espaço amostral ou Espaço de resultados ou Espaço de acontecimentos ou
Conjunto fundamental (S)..................................................................................... 9
1.1.3. Evento ou acontecimento ............................................................................ 9

Unidade 02 10
Definições ou Conceitos de Probabilidade ................................................................... 10
Introdução .......................................................................................................... 10
2.1.0. Conceito clássico de probabilidade (Teoria clássica de Laplace) ............... 10
2.2.0. Conceito frenquecista de probabilidade..................................................... 11
2.3.0. Conceito subjectivo ou personalista de probabilidade................................ 11

Unidade 03 15
Axiomas da teoria de probabilidades ........................................................................... 15
Introdução .......................................................................................................... 15
3.1.0. Alguns teoremas importantes .................................................................... 17

Unidade 04 25
PROBABILIDADES CONDICIONAIS ...................................................................... 25
Introdução .......................................................................................................... 25
4.1.0. Teorema do produto .................................................................................. 26
4.2.0. Independência ou dependência de eventos ................................................ 26
4.3.0. Multiplicação ou intersecção de probabilidades ........................................ 27
4.4.0. Teorema de Bayes .................................................................................... 28
ii Índice

Unidade 05 31
ANÁLISE COMBINATÓRIA .................................................................................... 31
Introdução .......................................................................................................... 31
5.1.0. Princípio fundamental de contagem (P.F.C.) ............................................. 32
5.2.0. Resumo das principais fórmulas da análise combinatória .......................... 33
Arranjos e Combinações..................................................................................... 33

9. Uma moeda é lançada 10 vezes ao ar. Quantas sequências de caras e coroas existem
com 5 caras e 5 coroas? 36

Unidade 06 37
VARIÁVEIS ALEATÓRIAS ...................................................................................... 37
Introdução .......................................................................................................... 37

Unidade 07 48
Distribuições Discretas ................................................................................................ 48
Introdução .......................................................................................................... 48
7.1.0. Algumas distribuições teóricas .................................................................. 48
7.1.1. Distribuições discretas .............................................................................. 48
7.1.2. Distribuições de Bernoulli e Binomial....................................................... 48
7.1.3. Distribuição geométrica ............................................................................ 50
7.1.4. Distribuição de Poisson............................................................................. 51
7.1.5. Distribuição hipergeométrica .................................................................... 52

Unidade 08 55
Distribuições Contínuas ............................................................................................... 55
Introdução .......................................................................................................... 55
8.1.0. Distribuição uniforme ............................................................................... 55
8.2.0. Distribuição exponencial........................................................................... 56
8.3.0. Distribuição normal ou de Gauss .............................................................. 57

Unidade 09 60
Inferência Estatística ................................................................................................... 60
Introdução .......................................................................................................... 60
9.1.0. Inferência estatística ................................................................................. 61
9.1.0. Introdução ................................................................................................ 61
9.2.0. População ................................................................................................. 61
9.3.0. Amostra aleatória simples ......................................................................... 62
9.4.0. Estatística e parâmetros............................................................................. 63

Unidade 10 66
Distribuições Amostrais .............................................................................................. 66
Introdução .......................................................................................................... 66
10.1.0. Distribuições amostrais ..................................................................... 66
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 iii

Unidade 11 71
Alguns Métodos de Obtenção de Estimadores ............................................................. 71
Introdução .......................................................................................................... 71
11.1.0. Alguns métodos de obtenção de estimadores ........................................... 71
11.2.0. Método dos momentos ............................................................................ 72
11.2.1. Distribuição de Poisson ........................................................................... 72
11.2.2. Distribuição exponencial......................................................................... 73
11.2.3. Distribuição normal ................................................................................ 73
11.3.0. Método da máxima verossimilhança ....................................................... 73

Unidade 12 78
Distribuição Amostral da Média .................................................................................. 78
Introdução .......................................................................................................... 78
12.1.0. Média e variância da distribuição amostral da média ............................... 78
12.2.0. Distribuição amostral da média para populações normais ........................ 80
12.3.0. Distribuição amostral da variância amostral ............................................ 85

Unidade 13 88
Distribuição Amostral da Proporção ............................................................................ 88
Introdução .......................................................................................................... 88
13.1.0. Aproximação normal da distribuição binomial ........................................ 88
13.2.0. Teorema do limite central ....................................................................... 89

Unidade 14 96
Intervalos de Confiança ............................................................................................... 96
Introdução .......................................................................................................... 96
Intervalos de Confiança ...................................................................................... 96
14.1.0. Ideias básicas .......................................................................................... 97
14.2.0. Intervalo de Confiança: média da N(μ; σ2), σ2 conhecida ................... 99
14.3.0. Interpretação do intervalo de confiança para μ ...................................... 101

Unidade 15 107
Intervalos de Confiança ............................................................................................. 107
Introdução ........................................................................................................ 107
15.1.0. Intervalo de Confiança: Média da N(μ; σ2) com σ2 desconhecida .......... 108
15.3.0. Intervalo de Confiança da média populacional para amostras grandes ... 112
15.4.0. Intervalo de confiança para a proporção populacional ........................... 113

Unidade 16 116
Intervalos de Confiança ............................................................................................. 116
Introdução ........................................................................................................ 116
iv Índice

Unidade 17 121
Testes de Hipóteses ................................................................................................... 121
Introdução ........................................................................................................ 121

Unidade 18 130
Testes de Hipóteses ................................................................................................... 130
Introdução ........................................................................................................ 130
18.2.0. Testes de Hipóteses............................................................................... 130
18.3.0. Conceitos importantes ........................................................................... 130
18.4.0. Noções básicas...................................................................................... 131
18.5.0. Conceitos básicos ................................................................................. 135
18.6.0. Estatística de teste, erros e regra de decisão........................................... 137
Região crítica e nível de significância ............................................................... 137

Unidade 19 138
Testes de Hipóteses ................................................................................................... 138
Introdução ........................................................................................................ 138
19.1.0. Teste de Hipotese: Média da N (μ; σ2) – σ2 conhecida .......................... 138
19.2.0. Hipótese nulas e alternativa................................................................... 139
19.3.0. Estatística de teste ................................................................................. 139
19.4.0. Nível de significância e região crítica.................................................... 140

Unidade 20 145
Testes de Hipóteses ................................................................................................... 145
Introdução ........................................................................................................ 145
20.2.0. Contexto básico .................................................................................... 145
Teste da média quando conhecemos a variância ............................................... 148
Teste da média quando não conhecemos a variância ......................................... 148
Teste de hipótese para uma proporção .............................................................. 148
Teste de hipótese para a diferença de médias .................................................... 149
Teste de hipótese para a diferença de proporções .............................................. 149
Teste de hipótese para a variância de uma população ........................................ 149

Bibliográfia: 152
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 1

Visão geral

Bem-vindo a Probabilidade e
Estatística

O presente módulo vai debruçar-se sobre conteúdos de Probabilidade e Estatística,


procurando apresentá-los de maneira mais simples e clara e terá um carácter auto instrutivo.
Pela importância da Estatística em todos os sectores da sociedade, esta disciplina torna-se
imprescindível, particularmente ao estudante do curso de matemática. O pensamento
probabilístico é fundamental para a análise estatística dos dados. Com a Probabilidade e
Estatística, o estudante se capacita com ferramentas para melhor explorar, descrever,
explicar, interpretar, prever ou decidir sobre fenómenos da realidadeidade e Estatística, o
estudante se capacita com ferramentas para melhor explorar, descrever, explicar, interpretar,
prever ou decidir sobre fenómenos da realidade.

Objectivos do curso
Quando terminar o estudo de Probabilidade e Estatística será capaz de:

 GERAL

Proporcionar ao estudante meios cientificos e didácticos, auxiliares e


complementares, para que possa leccionar ou aprender conteúdos
sobre “Probabilidades e Estatística ”.
Objectivos  ESPECIFICOS:

Aplicar e explicar os conceitos de probabilidade e suas propriedades


na resolução de problemas de carácter aleatório;

Resolver problemas utilizando modelos de distribuição de


probabilidade;

Capacitar o estudante na análise exploratória e descritiva de dados e


na aplicação de métodos de Inferência Estatística na sistematização e
análise de dados;

Promover a auto-formação do estudante em aspectos científicos e de


conhecimentos psico-pedagógicos;
PROBABILIDADE E ESTATÍSTICA -3º Ano

Quem deveria estudar este


módulo
Este Módulo foi concebido para todos aqueles que terminar as cadeiras
curriculares do 3ºano do curso de Matemática com maior destaque para
as cadeira de Probabilidade e Estatística

Como está estruturado este


módulo
Todos os módulos dos cursos produzidos por UCM - CED encontram-se
estruturados da seguinte maneira:

Páginas introdutórias

Um índice completo.

Uma visão geral detalhada do módulo, resumindo os aspectos-chave


que você precisa conhecer para completar o estudo. Recomendamos
vivamente que leia esta secção com atenção antes de começar o seu
estudo.

Conteúdo do módulo

O módulo está estruturado em unidades. Cada unidade incluirá uma


introdução, objectivos da unidade, conteúdo da unidade incluindo
actividades de aprendizagem.

Outros recursos

Para quem esteja interessado em aprender mais, apresentamos uma lista


de recursos adicionais para você explorar. Estes recursos que inclui
livros, artigos ou sites na internet podem serem encontrados na pagina de
referencias bibliográficas.

Tarefas de avaliação e/ou Auto-avaliação

Tarefas de avaliação para este módulo encontram-se no final de três ou


quatro unidades. Sempre que necessário, inclui-se na apresentação dos
conteúdos algumas actividades auxiliares que irão lhe ajudar a perceber a
exposição dos restantes conteúdos.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 3

Comentários e sugestões

Esta é a sua oportunidade para nos dar sugestões e fazer comentários


sobre a estrutura e o conteúdo do módulo. Os seus comentários serão
úteis para nos ajudar a avaliar e melhorar este módulo.

Ícones de actividade
Ao longo deste manual irá encontrar uma série de ícones nas margens das
folhas. Estes ícones servem para identificar diferentes partes do processo
de aprendizagem. Podem indicar uma parcela específica de texto, uma
nova actividade ou tarefa, uma mudança de actividade, etc.

Habilidades de estudo
Para suceder-se bem neste módulo precisará de um pouco mais da sua
dedicação e concentração. A maior dica para alcançar o sucesso é não
ignorar os textos que são apresentados como descrição para obter as
figuras assim como, tentar sempre que resolver uma tarefa apresentar a
descrição de todo o processo. Não ignore as actividades auxiliares pois as
restantes actividades podem depender delas!

Precisa de apoio?
Em caso de dúvidas ou mesmo dificuldades na percepção dos conteúdos
ou resolução das tarefas procure contactar o seu professor/tutor da
cadeira ou ainda a coordenação do curso acessando a plataforma da
UCM-CED Curso de Licenciatura em Ensino de Matemática.

Tarefas (avaliação e auto-


avaliação)
Apresente aqui pormenores sobre as tarefas que o aluno terá de realizar.
Por ex.: Como devem ser entregues as tarefas, a quem. Inclua também
questões relacionadas com: utilização de materiais de pesquisa, regras de
direitos de autor, plagiarismo, etc.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 5

Unidade 01

Introdução às Probabilidade

Introdução
Nesta unidade você aprenderá Conceitos importantes para o cálculo das probabilidades, Experimento
Aleatório e suas características.

No fim desta unidade deves ser capaz de:

Apresentar ideias introdutórias da teoria de Probabilidade;


Objectivos
Dar exemplos. Deverá, também, definir o conceito de probabilidade.

PENSA SOBRE ISSO!

Não precisas de decorar estas histórias! Precisas sim de lê-las muitas vezes, para sem muito esforço,
ficarem na tua mente.

- O que sabes sobre a noção de probabilidades?

- Conheces ou alguém já contou para ti alguma história sobre a noção de probabilidades?


PROBABILIDADE E ESTATÍSTICA -3º Ano

Historial

UM PEQUENO HISTORIAL Os primeiros estudos sobre probabilidades foram motivados


SOBRE O CONCEITO DE pela análise de jogos de azar (usando dado ou moeda), já
PROBABILIDADES conhecidos dos Egípcios 3500 anos A.C. Sabe-se que um dos
primeiros matemáticos que se ocupou com o cálculo das
probabilidades foi o Cardano (1501-1576). Data dessa época a
Vê ao lado....... expressão que utilizamos até hoje para o cálculo da
probabilidade de um evento (número de casos favoráveis ao
evento, dividido pelo número de casos possíveis).

Com Fermat (1601-1665) e Pascal (1623-1662), a teoria de


probabilidades começou a evoluir e ganhar mais consistência,
passando a ser utilizada em outros aspectos da vida social. Tudo
começa quando Chevalier de Méré, conhecido escritor e ardente
jogador da corte (residência) de Luis XIX, consultou Fermat
sobre problemas de divisão de apostas e interrupções antes de se
completar um jogo.

Durante o século XIX o desenvolvimento do cálculo das


probabilidades deveu-se ao contributo de três astrônomos :
Laplace, Gauss e Quetelet. Muitos dos desenvolvimentos
posteriores, nomeadamente da escola russa, baseiam-se na
análise e desenvolvimento da obra de Laplace. Actualmente, a
teoria de probabilidades é muito utilizada em outros ramos da
matemática (como em cálculo e em estatística), da biologia
(especialmente nos estudos sobre a genética), da física (como na
física nuclear), da economia, da sociologia, etc.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 7

Quando usamos as probabilidades?

Ouvimos falar desse assunto em situações como: a probabilidade de alguém ser sorteado; de
um jogador acertar numa aposta; de um candidato vencer uma eleição; de alguém acertar num
jogo; de um aluno reprovar, etc. Portanto, usamos probabilidades em situações em que dois ou
mais resultados diferentes podem ocorrer e não é possível saber, prever, qual deles realmente
vai ocorrer em cada situação.

Assim, podemos pensar que o conceito de probabilidades está associado à um certo grau de
incerteza sobre a ocorrência de um determinado fenómeno ou acontecimento.

1.1.0. Conceitos importantes para o cálculo das probabilidades


Para começarmos o cálculo das probabilidades é importante que definamos três conceitos básicos:

 Experimento ou fenómeno aleatório

 Espaço amostral (conjunto fundamental ou espaço de resultados ou espaço de acontecimentos)

 Evento ou acontecimento

1.1.1. Experimento aleatório


Chama-se Experimento Aleatório ao processo de observações ou de acção cujos resultados,
embora podendo ser descritos no seu conjunto, não são determináveis à priori, antes da
realização da experiência.

Um experimento Aleatório tem as seguintes características:

- A possibilidade de repetição do experimento em condições similares;

- Não se poder dizer à partida qual o resultado do experimento a se realizar, mas poder descrever-se o
conjunto de todos resultados possíveis;

- A existência de regularidades quando o experimento é repetido muitas vezes.


PROBABILIDADE E ESTATÍSTICA -3º Ano

Ex: Consideremos os seguintes experimentos

E1: largar uma pedra de certa altura e verificar o que vai acontecer

Para este experimento, uma questão é certa! A pedra vai cair

E2: Lançar uma moeda, ao ar, e verificar a face voltada para cima quando a moeda já estiver no chão

Aquí, porque a moeda (honesta ou não viciada) tem duas faces, não sabemos à prior qual estará
voltada para cima! Existem duas possibilidades.

Portanto, E1 é um experimento não aleatório enquanto que E2 é um experimento aleatório

Outros experimentos aleatório que podemos considerar, são por exemplo:

E3: Lançar duas moedas, ao ar, e verificar as faces de cima.

Neste experimento, os resultados possíveis são:  (C,C); (C,K); (K,C) e (K,K)  em que C é a face
coroa e K é a face cara.

E4: Lançar um dado (de 6 faces) e verificar a face voltada para cima

Para este experimento os resultados esperados são 1 ; 2 ; 3; 4; 5; 6

TAREFA PARA TI

Podes dar mais exemplos de


experimentos ou fenómenos não
aleatórios! Mais exemplos de
fenómenos aleatórios! Por exemplo:
- Controlar o número de pessoas que Actividades deste tipo permitir-te-ão fixar melhor a
vão usar uma cabine telefónica por diferença entre experimentos aleatórios e não
hora, durante meio dia, é um aleatórios.
experimento aleatório ou não? Porquê?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 9

1.1.2. Espaço amostral ou Espaço de resultados ou Espaço de


acontecimentos ou Conjunto fundamental (S)
- É o conjunto de todos resultados possíveis de um certo experimento

Ex: Para o experimento anterior (E2), o espaço amostral é S = (K , C)

Para o experimento E3 o conjunto fundamental é S = (C,C); (C,K); (K,C); (K,K)

Para o E4 o espaço de resultados é S = 1 ; 2 ; 3; 4; 5; 6

1.1.3. Evento ou acontecimento


Chama-se Evento ao qualquer subconjunto de S

Ex: Consideremos para o experimento E3 o acontecimento A: Saída da face cara pelo menos uma vez.
Então A = (C,K); (K,C); (K,K) é o conjunto de resultados favoráveis ao evento A.

Para o experimento E4 seja dado o acontecimento B: sair um nº maior do 4.

B = 5; 6. Portanto, existem só dois resultados favoráveis ao acontecimento B

Dá mais exemplos de acontecimentos


possíveis para o experimento E3? E para o
experimento E4? Por exemplo: Considera para
o experimento E4 o seguinte evento M: saída
de um número par.
Actividade deste tipo permitirão com que fixes melhor os
eventos, determines o número de resultados favoráveis a um
Quais são os resultados favoráveis ao
certo evento, para usar no cálculo de probabilidades.
acontecimento M? Quantos são os resultados
favoráveis a esse acontecimento?
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 02

Definições ou Conceitos de Probabilidade

Introdução
Nesta unidade terás a oportunidade de aprender as três definições ou conceitos de
probabilidades;

No fim desta unidade deves ser capaz de:

Definir os tês conceitos de probabilidades;


Objectivos
Resolver tarefas dadas na unidade com base nos exemplos apresentados e outros
materiais que poder consultar.

2.1.0. Conceito clássico de probabilidade (Teoria clássica de Laplace)


- Se a uma experiência aleatória se podem associar N resultados possíveis, mutuamente exclusivos
e igualmente prováveis, e se n(X) desses resultados tiverem o atributo X, então a probabilidade de
n(X) n(X)
X é a fracção N ; Isto é P(X) = N onde n(X) é o nº de resultados favoráveis a X e N é o nº

de resultados possíveis para o experimento.

Ex: No experimento que consiste em lançar duas moedas e verificar a face de cima, o espaço
amostral (S) tem 4 elementos (resultados possíveis). Então N = 4. E os casos favoráveis ao evento
A são 3. Portanto n(A) = 3.

n(A) 3
Então P(A) = =
N 4
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 11

2.2.0. Conceito frenquecista de probabilidade


- Se em N realizações de uma experiência, o acontecimento A se verificou n vezes, diz-se que a
n
frequência relativa de A nas N realizações é f(A) = N

n
P(A) = limf(A)  (quando N ∞)
N

Para o caso do exemplo anterior, o número de realizações do experimento é N = 4 e a frequência


n 3 n 3
relativa de A é é f(A) = N = 4 . Portanto a probabilidade de A é P(A)  N = 4

Portanto, aqui, a probabilidade aproxima-se à frequência relativa do evento.

2.3.0. Conceito subjectivo ou personalista de probabilidade


- Utilizando este conceito, a probabilidade de um acontecimento é dada pelo grau de credibilidade
ou de confiança que cada pessoa dá à realização de um acontecimento. Baseia-se na informação
quantitativa (ex: frequência de ocorrência de um acontecimento) e/ou qualitativa (ex: informação
sobre experiência passada em situações semelhantes) que o decisor possui sobre o acontecimento
em causa. Diferentes decisores podem atribuir diferentes probabilidades ao mesmo acontecimento
decorrentes da experiência, atitudes, valores, etc, que possuem.

Exemplo:

O João diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de seres
corrido por um cão-guarda (dessa casa) é de 90%.

Mas o Paulo diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de
seres corrido por um cão-guarda (dessa casa) é de 50%.

Aqui, o João e o Paulo dão alerta ao Manuel sobre o mesmo perigo mas podes ver que eles
atribuem probabilidades diferentes ao evento “ ser corrido...”
PROBABILIDADE E ESTATÍSTICA -3º Ano

Pode ser que de 10 vezes que o João passou daquela rua foi corrido 9 vezes e que o Paulo teve
uma sorte diferente e foi corrido apenas 5 vezes!

Portanto, cada um está usando as suas experiências passadas para definir a probabilidade de
alguém ser corrido ao passar daquela rua.

Então as probabilidades por eles atribuídas ao evento acima são subjectivas.

A aplicação da definição clássica de Laplace está condicionada ao facto de os resultados possíveis


no experimento serem mutuamente exclusivos e igualmente prováveis!

É muito importante percebermos, aqui, a questão da linguagem:

Uma questão não menos importante aqui no cálculo das probabilidades, é a linguagem usada!

É, igualmente, muito importante saber traduzir a linguagem de conjuntos (da álgebra de


conjuntos) para linguagem de probabilidades (da álgebra de acontecimentos).

- Na teoria de conjuntos fala-se de conjunto universo ou conjunto universal mas na teoria de


probabilidades esse conjunto traduz-se em conjunto fundamental ou espaço de resultados ou
universo dos acontecimentos.

- Se A  S, na teoria de conjuntos, diz-se que A é parte (subconjunto) de S, enquanto que na


teoria de probabilidades A é um evento ou acontecimento definido no espaço S.

- No caso em que A = S, na teoria de probabilidades, diz-se que A é um acontecimento certo.

- Na teoria de conjunto, se A = , diz-se que A é um conjunto vazio, enquanto que nas


probabilidades A é um acontecimento impossível.

- A união de conjuntos, traduz-se na união de acontecimentos e a intersecção de conjuntos traduz-


se na intersecção de acontecimentos.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 13

- Dois acontecimentos são mutuamente exclusivos (incompatíveis) quando a sua intersecção é um


acontecimento impossível. Isto é, se dois acontecimentos são incompatíveis, então, eles não
podem ocorrer ao mesmo tempo.

Exemplos:

a) Vida e Morte

b) Os acontecimentos “Sair cara” e “Sair coroa”, no lançamento de uma moeda.

- Dois acontecimentos são igualmente prováveis ou equiprováveis se e só se os dois têm a mesma


probabilidade de ocorrência.

Exemplos:

Para o experimento que consiste em lançar um dado (de 6 faces) vimos que S = 1; 2 ; 3; 4; 5; 6.
Podemos, assim, considerar os seguintes eventos:

A: sair um nº par

B: sair um nº maior do que 3

C: sair um nº menor do que 7

D: sair um nº maior do que 6

Ok, agora podemos combinar uma aposta. Tens quatro possibilidades de escolha. Vou mesmo
lançar o dado. Tens que escolher a regra para a aposta: ou A ou B ou C ou D. Se por exemplo
escolhes A, tu ganhas a aposta se e somente se acontecer A. E o mesmo é válido para os outros
acontecimentos.

Qual é a regra que preferes? A ou B ou C ou D? Porquê?

Qual é a probabilidade de ganhares com cada uma das regras?

Isso já sabes como determinar!

Os resultados favoráveis para cada caso são:

A =  2 ; 4; 6 B =  4; 5; 6 C = 1 ; 2 ; 3; 4; 5; 6 = S D= 
PROBABILIDADE E ESTATÍSTICA -3º Ano

3 3 6
As respectivas probabilidades são P(A) = 6 = 0,5 P(B) = 6 = 0,5 P(C) = 6 = 1

0
P(D) = 6 = 0

Com certeza, para eu apostar escolheria a regra C! Sabes porquê? É que o acontecimento C é um
acontecimento certo.

Nunca escolheria a regra D, porque nunca ganharia. O acontecimento D é impossível.

Mas se tivesse que escolher dentre as regras A e B, uma, qualquer uma podia escolher! Sabes
porquê? É que A e B são acontecimentos equiprováveis. Isto é, têm iguais probabilidades de
ocorrer.

Dá mais exemplos de acontecimentos


mutuamente exclusivos (incompatíveis) e
acontecimentos que não se excluem mutuamente
(compatíveis). Mais exemplos de
acontecimentos igualmente prováveis
(equiprováveis)!
Actividades deste tipo permitir-te-ão fixar melhor a
Por exemplo, podes pensar se os acontecimentos
questão de compatibilidade ou não de eventos.
“chover na cidade da Beira” e “chover na cidade
de Chimoio” são ou não incompatíveis? Porquê?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 15

Unidade 03

Axiomas da teoria de probabilidades

Introdução
Nesta unidade terás a oportunidade de aprender as três definições ou conceitos de
probabilidades;

No fim desta unidade deves ser capaz de:

Remeter o estudante ao tratamento axiomático do conceito de probabilidade;


Objectivos
Usar os axiomas que serão apresentados para demostrar alguns teoremas e
para o cálculos de probabilidades;

- Vamos, aquí, considerar três axiomas bastante importantes para a sistematização dos conceitos
empregues na teoria das probabilidades. Estes axiomas servirão de base para todos os
desenvolvimentos posteriores do campo das probabilidades.

Assim consideramos que P(  ) é uma função que associa a todo o acontecimento A definido em S
um nº compreendido no intervalo  ; e que satisfaz os seguintes axiomas:

I. P(A)  ,  A S
II. P(S) = 1, ( S é um acontecimento certo)
III. Sendo A e B acontecimentos mutuamente exclusivos definidos em S, ou seja A  B   ,
tem-se que P(AB) = P(A)  P(B)
PROBABILIDADE E ESTATÍSTICA -3º Ano

Em geral, se A1, A2, A3, ..., An são acontecimentos mutuamente exclusivos definidos em S,
n
então P(A1 A2  A3 ... An ) = P(A1)  P(A2)  P(A3)  ...  P( An ) =  P(Ai)
i=1

NOTA: Axiomas são proposições aceites sem demonstração

Reflecte sobre as seguintes propriedades de operações com eventos ou


acontecimentos:

Idempotente: A  A  A, A A  A

c
Complementaridade: Ac   A

Absorção: A  B  B  A  B  A  A  B

Comutativa: A  B  B  A, AB  B  A

Associativa: Actividades deste tipo irão


permitir-te aos alunos fazer
A   B  C    A  B   C, A  B  C    A  B  C demonstrações de teoremas e
resolver problemas de cálculo de
Distributivas:
probabilidades.
A(B  C) = (AB)  (AC)

A (B  C) = (AB)  (AC)

Leis de De Morgan: A  B  A  B e A  B  A  B
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 17

3.1.0. Alguns teoremas importantes


Os teoremas sempre precisam de ser demonstrados!

Definição: O conjunto (S,Q,P) se chama espaço de probabilidade, cumprindo as seguintes


propriedades (Teoremas):

Teorema 1.

Dado um acontecimento A com probabilidade P(A), a probabilidade do seu complementar


(acontecimento contrário) obtém-se subtraindo à unidade, a probabilidade de A; isto é
P( A ) = P(Ac ) = 1 – P(A)

Teorema 2.

A probabilidade do acontecimento impossível; isto é P( ) = 0

Dados dois acontecimentos A e B quaisquer, a probabilidade do acontecimento diferença

B – A é P(B - A) = P(B) – P(A  B)

Demonstração:

FIGURA:

Da figura podes ver que (B  A)  (B – A) = . Então os acontecimentos (B  A) e (B – A) são


mutuamente exclusivos

Mas (B  A)  (B – A) = B
PROBABILIDADE E ESTATÍSTICA -3º Ano

Então P(B) = P(B  A)  (B – A)] = P (B  A)  P(B – A)  P(B – A) = P(B) - P (B  A)


c.q.d

Teorema 4.

- A probabilidade da união de dois acontecimentos quaisquer (não necessariamente mutuamente


exclusivos), A e B é P(A  B) = P(A)  P(B) - P (B  A)

Corolário:

Sendo A e B acontecimentos quaisquer, P(A  B)  P(A)  P(B)

Teorema 5.

 n  n
Aditividade finita: A1 ,..., An disjuntos dois a dois  P   Ai    P( Ai )
 i 1  i 1

Teorema 6.

P é monótona: A, B  Q, se A  B  P( A)  P( B) e P( B  A)  P ( B)  P( A)

 n  n
Teorema7. A1 ,.., An  Q  P   Ai    P( Ai )
 i 1  i 1

 n  n n
Teorema8. P   Ai    P ( Ai )   P( Ai  A j )   P( Ai  A j  Ak )  ...  (1) n 1 P ( Ai )
 i 1  i 1 i j i j k i 1

n n
Desigualdade de Bonferroni: P( Ai )  1   P( Aic )
i 1 i 1
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 19

Podias reflectir sobre a demonstração dos teoremas 1, 2 e 4!

Nota que aqui usamos a união e a intersecção de


acontecimentos. Mais uma vez usamos a condição de
acontecimentos mutuamente exclusivos.

Para o teorema 1, nota que A e Ac são mutuamente


Esta actividade permitirá iniciar o
exclusivos e que a sua união é o conjunto fundamental (S).
processo de familiarização com os
teoremas que no cálculo das
Para o teorema 2,   S = , o que significa que  e S são
probabilidades são importantes.
mutuamente exclusivos.

Para o teorema 4, podes usar o facto de que A  B = A  (B


– A) e que A e (B – A) são acontecimentos mutuamente
exclusivos.

Mas não te esqueças de usar os axiomas!

EXEMPLO
1. Qual é a probabilidade de não sair um rei na extracção aleatória de uma carta de um baralho de
52 cartas?

Resolução:

Seja A o evento: Saída de um rei.

Já que num baralho (completo) de 52 cartas existem 4 reis, então, temos 4 possibilidades
n(A) 4
favoráveis ao evento A. Portanto, segundo a definição clássica de Laplace, P(A) = N = 52

Então, não sair um rei é o evento complementar de A

4 48
Portanto, P( A ) = 1 – P(A) = 1 – 52 = 52

1. Na produção de uma empresa de artigos de vestuário, 10% dos artigos produzidos têm defeitos
de matéria-prima (tecido); 5% têm defeitos de acabamentos e 2%, defeitos de ambos os tipos.
Qual a probabilidade de uma peça de vestuário retirada ao acaso ter apenas defeito de tecido?
PROBABILIDADE E ESTATÍSTICA -3º Ano

Resolução:

Consideremos os seguintes eventos:

A: O artigo tem defeitos de matéria prima (tecido)  P(A) = 10% = 0,10

B: O artigo tem defeitos de acabamentos  P(B) = 5% = 0,05

C: O artigo tem defeitos de ambos os tipos  P(C) = P (B  A) = 2% = 0,02

Queremos determinar P(A – B)

P(A – B) = P(A) - P (B  A) = 0,10 – 0,02 = 0,08

Isto quer dizer que a probabilidade da peça de vestuário ter apenas defeitos de matéria-prima, é
de 8%

2.1. Considerando o problema anterior, qual a probabilidade de uma peça de vestuário extraída
ao acaso apresentar defeitos de tecido ou de acabamentos?

Resolução: Neste caso queremos determinar P (A  B)

P(A  B) = P(A)  P(B) - P (B  A) = 0,10  0,05 – 0,02 = 0,1

1. Admitindo a equiprobabilidade dos resultados, determinar a probabilidade de, numa prova com
dois dados obter-se a face 6.

Resolução:

Para o experimento: lançar dois dados (de seis faces), temos 36 resultados

Veja:

Dado A

Dado B 1 2 3 4 5 6

1 (1;1) (1;2) (1;3) (1;4) (1;5) (1;6)

2 (2;1) (2;2) (2;3) (2;4) (2;5) (2;6)

3 (3;1) (3;2) (3;3) (3;4) (3;5) (3;6)


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 21

4 (4;1) (4;2) (4;3) (4;4) (4;5) (4;6)

5 (5;1) (5;2) (5;3) (5;4) (5;5) (5;6)

6 (6;1) (6;2) (6;3) (6;4) (6;5) (6;6)

Dos 36 resultados possíveis (1,1),(1,2),…,(4,3),…,(6,6) há 25 nos quais não comparece a face 6:


a sua probabilidade é pois 25 36 . A probabilidade desejada ( do acontecimento complementar) é,
pois, 1  25 36  1136 .

De outro modo

Designemos por A e B os acontecimentos elementares, verificar-se-á a face 6 num dos dados ou


no outro; temos: P  A  B   P ( A)  P ( B )  P  A  B .

1
Da simetria suposta (equiprobabilidade), temos P ( A)  P ( B )  6
; por outro lado, havendo 36
1
combinações do 1º com o 2º dado, é P ( A  B )  36
, o que dá P ( A  B )  16  16  361  11
36
, o que
condiz com o resultado anterior.

1.Numa urna há cinco esferas brancas, duas pretas e cinco vermelhas. Qual a probabilidade de
que uma esfera extraída ao acaso não seja vermelha?

Resolução:

A probabilidade de que uma esfera seja branca é 125 , e de que seja preta é 122 . A probabilidade
pretendida tem duas maneiras de se realizar: a esfera extraída pode ser branca ou preta, e veja
que sair branca ou preta são acontecimentos disjuntos. Então a soma das probabilidades
elementares dá a probabilidade total da extracção de uma esfera que não seja vermelha.
5 7
12
 122  12 .

Poder-se-ia também usar o raciocínio pelo complementar: como a probabilidade de sair esfera
5 5 7
vermelha é 12 , então a probabilidade de sair uma esfera não vermelha será 1  12  12 , o que
confere com a resolução anterior.

2.Lançam-se dois dados ao ar. Qual a probabilidade de que cada um tenha a face 6 voltada para
cima?
PROBABILIDADE E ESTATÍSTICA -3º Ano

Resolução:

1
A probabilidade para o primeiro dado é 6 (suponho que já sabes porquê), e para o Segundo
1
dado também é 6 . Veja que, estes dois acontecimentos são independentes, assim sendo a

probabilidade pretendida será pois o produto das duas probabilidades P  16  16  361 .

3.Selecciona-se aleatoriamente uma carta de um baralho contendo 52 cartas.

a) Qual a probabilidade de que a carta escolhida seja espada?

b) Qual a probabilidade de a carta escolhida ser uma figura (dama, rei ou valete)

Resolução:

Para este caso, primeiro deves ver que o espaço amostral tem 52 elementos, este é o número total
de cartas no baralho e num baralho normal, existem 13 cartas de espada, então 13 será o número
13 1
de casos favoráveis e a probabilidade pretendida será: P  52
 4
;

Para a alínea b), deves saber que num baralho normal, existem 12 cartas de figuras ( 4 reis-K, 4
12 3
damas-Q e 4 valetes-J), então a probabilidade pretendida será: P  52
 13

1. Quantos elementos tem os espaços amostrais seguintes:

a) Lançamento de três moedas.


b) A soma das faces de três dados.
c) Uma moeda e um dado lançados aleatoriamente.

2. Para um debate numa escola que lecciona de 8ª à 12ª classe, foram escolhidos 50 estudantes (dez
estudantes de cada classe). Findo o debate, um aluno é escolhido ao acaso para fazer comentários
sobre o debate. Qual a probabilidade de que o escolhido seja estudante da 12ª classe?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 23

3. Na cantina de uma escola, há 20 bolos, dos quais 7 de Coco, 5 Massa folhada e 8 de Arroz, se
alguém compra 3 bolos escolhendo-os aleatoriamente, achar a probabilidade de se escolher:

a)Dois bolos de Coco e um de Arroz.

b)Um bolo de cada tipo.

c)Um ou mais bolos de Coco.

d)Todos bolos do mesmo tipo.

3. Efectuam-se quatro jogadas com uma moeda equilibrada de cinco meticais. Qual a probabilidade
de ter uma sucessão de, pelo menos, duas faces com emblema da república?

4. No lançamento de dois dados, qual a probabilidade de a soma ser 8 ou 11?


a) Qual a probabilidade de a soma ser oito ou um número par?
b) Qual a probabilidade de a soma ser par ou ímpar?

5. Determine a probabilidade de se obter um total de 6 pontos no lançamento de dois dados.


a) Determine a probabilidade de não se obter 6 pontos.

6. Para o lanche, há 9 refrescos, dos quais 3 da marca Coca-cola e 6 da marca Fanta. Se duas pessoas
tiram dois refrescos (um para cada), sem escolher, qual a probabilidade de:
a) Ambas levarem Fanta?
b) Ambas levarem Coca-cola?
c) Cada um levar uma marca diferente do outro?

7. Num grupo de 6 amigos, 3 bebem cerveja e outros 3 não. Se seleccionarmos 3 dos 6 amigos,
aleatoriamente, qual a probabilidade de:
a) Pelo menos dois beberem cerveja?
b) Ao máximo um beber cerveja?
PROBABILIDADE E ESTATÍSTICA -3º Ano

8. Depois de dois bandidos terem praticado um assassinato numa cidade, a polícia local capturou
por suspeita quatro indivíduos. Os indivíduos são submetidos a testes de impressão digital um a
um até que os dois praticantes sejam encontrados. Qual a probabilidade de que o ultimo
bandido seja:
a) O Segundo a ser testado?
b) O terceiro a ser testado?
c) O quarto a ser testado?

9. No fim de um ano, um aluno gastou dois cadernos para a disciplina de Português e três para
Matemática. Deste grupo de cinco cadernos, o aluno escolhe um caderno aleatoriamente e sem
reposição deste, escolhe outro caderno, também ao acaso.
Qual a probabilidade de os dois cadernos ser de Matemática?

10. As letras do termo “taylor” são escritas em cartões, donde, depois de misturados, se retiram
quatro (de uma só vez). Supondo iguais as probabilidades de cada grupo de quatro cartões,
achar a probabilidade de encontrar a palavra “oral”.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 25

Unidade 04

PROBABILIDADES CONDICIONAIS

Introdução
Nesta unidade terás a oportunidade de aprender Teorema do produto probabilidades
condicionais; Independência ou dependência de eventos; MULTIPLICAÇÃO OU
INTERSECÇÃO DE PROBABILIDADES; Teorema de Bayes;

No fim desta unidade deves ser capaz de:

Resolver exercícios envolvendo probabilidades condicionais; e


Objectivos
Definir independência de eventos.

A partir do momento em que se conhece a probabilidade de o acontecimento B (do espaço de


resultados S) ocorrer, é possível calcular a probabilidade de qualquer outro acontecimento A se
realizar condicionado pelo acontecimento B.

Por definição esta probabilidade é dada por

P(A  B)
P(A\B) = com P(B)  , pois, o acontecimento B já ocorreu.
P(B)

P(A\B) lê-se : Probabilidade de A dado B ou probabilidade de A após B.

Ex: Seja E: Lançar um dado  S = 1; 2; 3; 4; 5; 6

Consideremos o evento B: Sair um nº ímpar  B = ; ; 

Consideremos também o evento A: Sair o nº 3  A = 

Determinemos agora P(A\B)  probabilidade de A após B.


PROBABILIDADE E ESTATÍSTICA -3º Ano

1
Para o acontecimento A, o espaço amostral é B  P(A\B) = 3

1 3
Doutro modo: A  B =   P(A  B) = e P(B) =
6 6

1
Então, usando a fórmula P(A\B) =
3

4.1.0. Teorema do produto


A probabilidade da ocorrência simultânea de dois eventos A e B, do mesmo espaço amostral, é
dada por:

P(A  B) = P(A) P(B\A) ou P(A  B) = P(B)P(A\B)

EXEMPLO:

Em um lote de 12 peças, 4 são defeituosas. Duas peças são retiradas uma após outra sem
reposição. Qual a probabilidade de que ambas sejam boas?

Solução:

8
Seja A: Saída de uma peça boa na 1ª extracção  P(A) = 12

7
Seja B: Saída de uma peça boa na 2ª extracção  P(B) = 11 , porque depois da 1ª extracção o

lote terá restado com 11 bolas das quais 7 boas.

8 7 14
Logo P(A  B) = P(A) P(B\A) = 12 11 = 33

4.2.0. Independência ou dependência de eventos


Um evento A é considerado independente de outro evento B, se a probabilidade de A é igual à
probabilidade condicional de A após B, isto é, P(A) = P(A\B).
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 27

Considerando o teorema do produto, pode-se afirmar que se A e B são independentes, então

P(A  B) = P(A) P(B)

4.3.0. Multiplicação ou intersecção de probabilidades

Em análise combinatória, estudou-se o princípio fundamental da contagem.

O que diz esse princípio? Mais adiante será retomado este princípio, como lembrete, para
acompanhar o resumo das principais fórmulas da análise combinatória.

Em probabilidades, há uma regra análoga ao princípio fundamental da contagem, denominada


regra do produto ou regra de multiplicação de probabilidades.

Enunciado:

Se um acontecimento é composto por vários eventos sucessivos e independentes, de tal modo


que:

O 1º evento é A e a sua probabilidade é P(A)

O 2º evento é B e a sua probabilidade é P(B)

O 3º evento é C e a sua probabilidade é P(C)

. . .

. . .

. . .

O K-ésimo evento é K e a sua probabilidade é P(K),

Então a probabilidade de que os eventos A, B, C, ..., K, ocorram nessa ordem é

P(A B  C ...  K) = P(A).P(B).P(C).....P(K)


PROBABILIDADE E ESTATÍSTICA -3º Ano

4.4.0. Teorema de Bayes


Probabilidade completa

Seja S um espaço amostral e seja determinada em S uma partição de subconjuntos Ai

Isto é, A1  A2  A3  ... An = S  Ai  Aj =  ou seja, Ai e Aj são mutuamente exclusivos


ou incompatíveis.

Seja B um acontecimento qualquer tal que B = (A1 B)  (A2 B) ...  (An  B)

FIGURA:

A1 A2

An
A4
B .

A3

A5

P(B) = P (A1 B)  (A2 B)  (A3 B) ...  (An  B)

P(B) = P (A1 B) + P (A2 B) + P (A3 B) +... + P (An  B)

P(B) = P(A1).P( B\A1) + P (A2).P( B\A2) + P (A3).P( B\A3) +... + P (An ).P( B\An)

n
P(B) =  P(Ai) P(B\Ai)  Fórmula para probabilçidade completa
i=1

P(A  B)
Mas sabe-se que P(A  B) = P(B)P(A\B)  P(A\B) = P(B)

P(Ai  B)
Então P (Ai\B) = P(B)

P(Ai  B)
 P(Ai\B) =  Fórmula de Bayes
n
 P(Ai) P(B|Ai)
i=1
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 29

EXEMPLO:

Dadas duas urnas A e B.

- Urna A contém uma nota de 50MT e duas de 100MT

- Urna B contém três notas de 50MT e uma de 100MT

- Extrai-se uma nota de A e introduz-se em B e em seguida extrai-se de B uma nota.

Calcular as probabilidades condicionadas seguintes:

a) Tendo sido extraida de B uma nota de100MT, tenha sido extraida de A uma nota de 50MT
b) Tendo sido extraida de B uma nota de 100MT, tenha sido extraida de A uma nota de
100MT.

Resolução:

a) Sejam: A1: Sair uma nota de 50MT da urna A

A2: Sair uma nota de100MT da urna A

B1: Sair uma nota de 50MT da urna B

B2: Sair uma nota de 100MT da urna B

Neste caso, queremos determinar P(A1\B2)

1 2 4 1 3 2
Mas P(A1) = 3 ; P(A2) = 3 ; P(B1\A1) = 5 ; P(B2\A1) = 5 ; P(B1\A2) = 5 ; P(B2\A2) = 5

P(A1 B2) P(A1) P(B2A1)


Portanto P(A1\B2) = P(B2) = =
P(A1 B2) + P(A2 B2)

P(A1) P(B2/A1) 1
 P(A1\B2) = P(A ) P(B /A ) + P(A )P(B /A ) = 5
1 2 1 2 2 2
PROBABILIDADE E ESTATÍSTICA -3º Ano

1.Uma urna contém 12 bolas: 5 brancas, 4 vermelhas e 3 pretas. Outra contém 18 bolas: 5
brancas, 6 vermelhas e 7 pretas. Uma bola é retirada ao acaso de cada urna. Qual a
probabilidade de as duas bolas sejam da mesma cor?

2. A urna nº1 contém: 1bola vermelha e duas brancas. A urna nº2 contém: 2 bolas vermelhas e
uma branca. Tiramos ao acaso uma bola da urna nº1 e colocá-mo- la na urna nº2 e misturamos.
Em seguida tiramos aleatoriamente uma bola da urna nº2. Qual a probabilidade sair uma bola
bola branca (da urna nº2)?

3. São dadas duas urnas A e B. A urna A contém uma bola preta e uma vermelha. A urna B
contém duas bolas pretas e três vermelhas. Uma bola é extraida ao acaso da urna A e colocada
em seguida na urna B. Uma bola é retirada, aleatoriamente, então da urna B. Pergunta-se:

a)Qual a probabilidade de que ambas sejam da mesma cor?

b) Qual a probabilidade de que a 1ª bola seja vermelha sabendo-se que a segunda foi preta?

4. Três máquinas A, B e C produzem respectivamente 40%; 50% e 10% do total de peças de


uma fábrica. As percentagens de peças defeituosas nas respectivas máquinas são 3%; 5% e 2%.
Uma peça é sorteada ao acaso e verifica-se que é defeituosa. Qual a probabilidade de que a
peça tenha vindo da máquina B?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 31

Unidade 05

ANÁLISE COMBINATÓRIA

Introdução
Nesta unidade terás a oportunidade de aprender Princípio Fundamental de Contagem
(P.F.C);

Fornecer técnicas de contagem indirecta com aplicação ao cálculo de


Objectivos probabilidade.

O QUE É?

A Análise combinatória é um conjunto de técnicas para determinar sem enumeração directa, o


nº de resultados possíveis de um certo experimento ou o nº de elementos de um certo conjunto
mediante certas condições.

As técnicas de contagem indirecta que são tratadas na análise combinatória são bastante úteis
para a resolução de problemas de probabilidades quando se pretende determinar o número de
casos possíveis de experimento e/ou o número de casos favoráveis a um evento.

Ex: Por contagem directa, podemos determinar quantos número de dois algarismos podemos
formar com os dígitos 1; 2 e 3! São eles 11; 12; 13; 21; 22; 23; 31; 32 e 33. Portanto são 9
números. Mas se tivéssemos os dígitos 1; 2; 3; 4; 5; 6; 7 e 8, para sabermos quantos números
com dois algarismos podemos formar, levaríamos muito tempo por contagem directa.

Daí, a importância dos métodos indirectos de contagem a se estudar na análise combinatória:


PROBABILIDADE E ESTATÍSTICA -3º Ano

5.1.0. Princípio fundamental de contagem (P.F.C.)


- Se algum procedimento pode ser realizado de n1 maneiras diferentes; se seguindo este, um 2º
procedimento pode ser realizado de n2 maneiras diferentes; se ainda seguindo este 2º, um 3º
procedimento pode ser realizado de n3 maneiras diferentes e assim em diante, então o nº de
maneiras segundo as quais pode ser realizado o procedimento é n1.n2.n3.....nk

Ex: Para se viajar de uma cidade A para uma outra cidade B deve-se passar necessariamente
pela cidade C ou pela cidade D. A quantidade de caminhos diferentes entre essas cidades está
indicada na figura. Quantos são os possíveis caminhos de A para B?

FIGURA:

A C
B

Solução:

Segundo o P.F.C usando a rota ACB existem 4 . 3 = 12 caminhos diferentes

Usando a rota ADB existem 2 . 3 = 6 caminhos diferentes

Então de A para B existem em total 12 + 6 = 53 caminhos diferentes


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 33

5.2.0. Resumo das principais fórmulas da análise combinatória

Arranjos e Combinações
Arranjos e Combinações são agrupamentos que se diferem pelas suas características.

A característica principal dos arranjos é o facto de que a ordem dos elementos nos
agrupamentos interessa. Quer dizer, se ABCDE é um agrupamento, BACDE é outro
agrupamento. Enquanto isso, nas Combinações a ordem dos elementos, nos agrupamentos, não
interessa. Portanto, a troca de posições não altera os agrupamentos. Ex: ABCDE e BACDE é o
mesmo agrupamento.

Importante! n! = n. (n-1). (n-2). (n-3).....3.2.1 e 1! = 1 e 0! = 1

Arranjos

Arranjos simples (sem repetição) de n elementos tomados m a m

n!
Am;n = (n - m)! ; n ≥ m

Nota: Quando n = m , temos um caso particular de arranjo que se chama Permutação

n! n!
Pn = An;n = (n - n)! = 0! = n!

Arranjos n elementos tomados m a m com repetição

A m;n = nm

Permutações de n elementos com um grupo repetido m1 vezes, outro grupo repetido m2 vezes,
… e outro grupo repetido mk vezes

m1
n!
P ... = m !.m !....m !
1 2 k
mk;n
PROBABILIDADE E ESTATÍSTICA -3º Ano

Combinações

a) Combinações simples de n elementos tomados m a m

n!
Cm;n = (n - m)!.m! ; n ≥ m

b) Combinações de n elementos tomados m a m com repetição

C m;n = Cm;n + m - 1

Nota: Cm;n + m - 1 é combinação de n +m-1 elementos tomados m a m

1. Com os dígitos 2; 5; 6 e 7, quantos números formados por 3 algarismos distintos


podemos formar?

Resolução:

Primeiro método (P.F.C)

1ºespaço 2ºespaço 3ºespaço

4 possibilidades 3 possibilidades 2 possibilidades

Temos três espaços para colocar os dígitos. Para o 1º espaço existem 4 possibilidades.
Podemos colocar o 2 ou 5 ou 6 ou 7. Para o 2º espaço existem 3 possibilidades, já que os
dígitos devem ser distintos. Isto é, se por exemplo colocarmos o 2 no 1º espaço, só podemos
colocar no 2º espaço os dígitos 5 ou 6 ou 7. Para o 3º espaço, restarão apenas duas
possibilidades. Isto porque se por exemplo colocarmos o 2 no 1º espaço e se colocarmos no 2º
espaço o 5, só poderemos colocar ou 6 ou 7 no 3º espaço.

Assim, pelo princípio fundamental de contagem, com os dígitos disponíveis podemos formar 4
. 3 . 2 = 24 números de algarismos distintos.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 35

Segundo método:

Analisemos as características dos agrupamentos

Um dos números pode ser por exemplo 257. Mas se trocarmos 5 por 2 teremos 527, outro
número!

Portanto, a ordem dos elementos interessa nos agrupamentos. Assim vamos determinar o nº de
arranjos simples de 4 elementos tomados 3 a 3.

4! 4!
Assim, A3;4 = (4 - 3)! = 1! = 4! = 4 . 3 . 2. 1 = 24

2. Um grupo tem 10 pessoas. Quantas comissões de 4 pessoas podem ser formadas, com as
disponíveis?

Resolução:

Sejam A; B; C; D; E; F; G; H; I e J essas pessoas

Uma das comissões pode ser por exemplo A; B; C; D.

Neste caso, a troca de A por B, por exemplo, não altera a comissão. Quer dizer que a ordem
dos elementos nos agrupamentos não importa. Portanto, vamos calcular o nº de combinações
de 10 elementos tomados 4 a 4.

10!
Assim: C4;10 = (10 - 4)!.4! = 210 é o nº de comissões que podem ser formadas nas

condições dadas.
PROBABILIDADE E ESTATÍSTICA -3º Ano

1. Quantos anagramas da palavra FILTRO podem ser formados?

2. Quantos anagramas da palavra BENE podem ser formados?

3. Temos 3 meninos e 3 meninas. De quantas formas eles podem ficar em ficar em fila se
meninos e meninas ficam em posições alternadas?

4. De quantas maneiras 5 pessoas podem sentar-se ao redor de uma mesa circular?

5. Calcule A3;m se C3;m = 84

6. Em uma reunião social, cada pessoa cumprimentou todas as outras, havendo em total 45
apertos de mão. Quantas pessoas havia na reunião?

7. Temos 6 homens e 6 mulheres. Quantas comissões de 5 pessoas podemos formar se em cada


uma deve haver 3 homens e 2 mulheres?

8. Existem 5 pontos, entre os quais não existem 3 colineares. Quantas rectas eles determinam?

9. Uma moeda é lançada 10 vezes ao ar. Quantas sequências de caras e coroas existem com 5
caras e 5 coroas?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 37

Unidade 06

VARIÁVEIS ALEATÓRIAS

Introdução
Nesta unidade terás a oportunidade de aprender Variável aleatória discreta; Variável absolutamente
contínua; Função de Probabilidade (Variável Discreta); Função de Repartição (função Distribuição); e
Função de uma variável aleatória;

No fim desta unidade deves ser capaz de:

Definir variável aleatória, distinguir variável discreta e contínua;


Objectivos
Calcular parâmetros ou estatísticas relativas às variáveis aleatórias.

Uma variável aleatória é uma função que transforma cada resultado de um experimento num valor
numérico.

EXEMPLO:

Considere o experimento E: Lançamento de duas moedas

Considere a variável X: nº de caras obtidas nas duas moedas

Portanto, S = (C,C); (C,K); (K,C); (K,K)

X(s) = 0; 1; 2, isto é, para o resultado (C;C), X(s) = 0; para (C;K) ou (K;C), X(s) = 1 e para (K;K),
X(s) = 2.

Assim, diz-se que X é uma variável aleatória ( DISCRETA)


PROBABILIDADE E ESTATÍSTICA -3º Ano

Vamos representar as variàveis aleatórias por letras maiúsculas (A, B, C, D, X, M,....) e os seus valores
particulares por letras minúsculas (a, b, c, d, x, m, ....)

Na Estatística Descritiva define três conceitos importantes que são: população, amostra e variável. A
variável foi definida como a característica de interesse (da população) que se pretende estudar.
Quanto à classificação, viu-se que a variável pode qualitativa ou quantitativa. A variável quantitativa
pode ser contínua ou discreta.

Nesta secção trataremos das variáveis aleatórias Discretas, Absolutamente Contínuas (ou
simplesmente contínuas) e variáveis Mistas, partindo do pressuposto de que elas são quantitativas.

6.1.0. Variável aleatória discreta

Diz-se que uma variável aleatória é Discreta se pode tomar uma quantidade numerável de valores (por
exemplo, números inteiros). Para além da função de massa de probabilidade que também se diz função
de distribuição de probabilidade (f(x) ou P(x)), a variável aleatória também se caracteriza pela função
Distribuição ou função de probabilidades acumuladas (F(x)). A função Distribuição F(x), calcula-se
como a soma da função de massa de probabilidade para valores iguais ou inferiores ao valor x.

F ( x)   P( x  x )
xi  x
i ;    x  

6.2.0. Variável absolutamente contínua

Diz-se que uma variável aleatória é Absolutamente Contínua ou simplesmente Contínua, se existe
uma função denominada função densidade de probabilidade f(x) tal que sua integral para um

determinado interval I, determina a probabilidade de x estar nesse intervalo. P ( x  I )   f ( x) dx


I


NOTA:  f ( x) dx  1 .


Neste tipo de variável, a probabilidade de ocorrência de um valor concreto é igual a zero (P(X= x) = 0).
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 39

A função Distribuição de uma variável continua se calcula como o integral da função densidade no
intervalo [, x] .

x
F ( x)  P ( x  [ , x])   f ( y) dy ;    x  


F ( x)  f ( x)

6.3.0. Variável aleatória mista

As variáveis aleatórias mistas são variáveis que em alguns intervalos se comportam como
absolutamente contínuas e em algum momento como variável discrete (concentram probabilidade em
algum ponto). Para este tipo de variáveis não existe uma outra caracterização teórica válida se não a
função Distribuição, que é continua em todos pontos excepto naqueles em que acumula probabilidade
(onde apresenta salto).

6.4.0. Função de Probabilidade (Variável Discreta)

Seja X uma variável aleatória (V.a) discreta

A probabilidade de que a V.a. X assuma um particular valor x é a função de probabilidade de X que se


representa por P(X = x) ou P(x).

+∞
Nota:  P(xi) = 1
-∞

Vamos determinar P(x) para o experimento E: Lançamento de duas moedas.

Vimos que para a variável X: nº de caras obtidas nas duas moedas

S = (C,C); (C,K); (K,C); (K,K)

X(s) = 0; 1; 2, isto é, para o resultado (C;C), X(s) = 0; para (C;K) ou (K;C), X(s) = 1 e para (K;K),
X(s) = 2.
PROBABILIDADE E ESTATÍSTICA -3º Ano

1 2 1 1
P(X =0) = 4 ; P(X =1) = 4 = 2 e P(X =2) = 4

Tabela

X 0 1 2

P(x) 1 1 1
4 2 4

GRÁFICO:

P(x)

1/2

1/4

0 1 2 X

6.5.0. Função de Repartição (função Distribuição)

Seja X uma V.a. discreta

Define-se Função de Repartição da V.a. X no ponto x, como sendo a probabilidade de X assumir um


valor menor ou igual a x, isto é : F(x) = P(X ≤ x)

Ex: Determinemos a Função de Repartição da V.a. X do caso anterior;

1
F(0) = P(X ≤ 0) = P(X = 0) = 4
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 41

1 1 3
F(1) = P(X ≤ 1) = P(X = 0) + P(X = 1) = 4 + 2 = 4

1 1 1 4
F(2) = P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = 4 + 2 + 4 = 4 = 1

1 3
Então escreve-se: F(x) = 0 para 0  x; F(x) = 4 para 0 ≤ x  1; F(x) = 4 para 1 ≤ x  2;

F(x) = 1 para x  2

6.6.0. Propriedades da função de repartição



1. F(x) =  P(xi)
xi≤ x
2. F(-∞) = 0
3. F(+∞) = 1
4. P(a < X ≤ b) = F(b) – F(a),
5. P(a ≤ X ≤ b) = F(b) – F(a) + P(X = a),
6. P(a < X < b) = F(b) – F(a) – P(X = b),
7. F(x) é continua à direita limF(x) = F(x0)
8. F(x) é descontínua à esquerda nos pontos em que a probabilidade é diferente de zero.
limF(x) ≠ F(x0) para P(X = x0) ≠ 0
9. A função é não decrescente, isto é, F(b) ≥ F(a) para b > a

Se X é uma variável aleatória contínua as propriedades anteriores se resumem no seguinte:

x
1. F ( x )  P ( x  [ , x ])   f ( y ) dy ;    x  


2. F(-∞) = 0

3. F(+∞) = 1

b
4. P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F(b) – F(a) =  f ( x)dx
a

5. F(x) é continua à direita limF(x) = F(x0)


6. F(x) é descontínua à esquerda nos pontos em que a probabilidade é diferente de zero.
limF(x) ≠ F(x0) para P(X = x0) ≠ 0
7. A função é não decrescente, isto é, F(b) ≥ F(a) para b > a
PROBABILIDADE E ESTATÍSTICA -3º Ano

Por exemplo para uma variável aleatória X uniforme no intervalo [0, 1] tem-se que:

1 0  x  1
f ( x)  
0 resto

x x
F ( x )   f ( x) dx   1 dx  x
0 0

f(x) F(x)
1 1

0 0
1 1

6.7.0. FUNÇÃO DE UMA VARIÁVEL ALEATÓRIA

Qualquer função de uma V.a. é também uma variável aleatória, isto é, se X é uma V.a. Y = (x)
também será.

Ex: Seja X: nº de pontos no lançamento de um dado

Consideremos a variável

Y: O máximo entre a e b, pontos de dois dados, ou seja, máx(a; b).

Para dois dados teremos 36 pares de resultados e sendo assim, Y = 1; 2; 3; 4; 5; 6. Por exemplo, para
3
os pares (1, 2); (2, 1) e (2, 2), o máximo é 2. Por isso, P(y=2) = 36

A Função de
Probabilidade da
Y 1 2 3 4 5 6
variável Y é
P(y) 1 3 5 7 9 11
36 36 36 36 36 36

DETERMINE AS FUNÇÕES DE REPARTIÇÃO (PROBABILIDADE ACUMULADA) DAS


VARIÁVEIS X E Y!
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 43

1. No lançamento simultâneo de dois dados, considere as seguintes variáveis aleatórias:

X: nº de pontos obtidos no 1º dado

Y: nº de pontos obtidos no 2º dado

a) Construir a distribuição de probabilidades através de uma tabela e gráfico das seguintes variáveis.
i) W=X–Y
A = 2Y
b) Construir a Função de Repartição da variável W e fazer o gráfico
c) Calcular: i) P(-3  W ≤ 3) ii) P(W ≤ -8)
k
2. Uma v.a discreta tem a distribuição de probabilidade dada por: P(X) = x para x = 1, 3, 5, 7

a) Calcular o valor de k; b) Calcular P(X = 5)

6.8.0. Medidas de Posição

6.8.1. Média ou Esperança matemática ou valor esperado

A média ou valor esperado é um dos conceitos muito importantes na teoria de probabilidade, pois,
permite identificar muitas das características fundamentais de uma distribuição.

Considere-se, por exemplo, uma lotaria com 100 bilhetes com os seguintes prémios: um prémio de 100
mil meticais, dois prémios de 20 mil meticais e 3 prémios de 10 mil meticais. A probabilidade de um
1
comprador de um bilhete ganhar 100 mil meticais é 100 , a probabilidade de ganhar 20 mil meticais é

2 3
100 e a de ganhar 10 mil meticais é de 100 . Portanto, o valor esperado (valor da sorte) do comprador
1 2 3
de um bilhete será: 100milx100 + 20milx 100 + 10milx100 = 1,7mil

Define-se Esperança matemática ou média ou valor esperado de uma v.a. discreta como:


E(X) =  x =  =  P(xi).Xi
i
PROBABILIDADE E ESTATÍSTICA -3º Ano

6.8.2. Propriedades da Média:


1. E(k) = k
2. E(kX) = k.E(X)
3. E(X  Y) = E(X)  E(Y)
4. E(X k) = E(X)  k
5. E(X.Y) = E(X).E(Y) se X e Y são independentes

6.9.0. Mediana

Mediana de uma v.a é o valor que divide a distribuição em duas partes iguais, ou seja, F(Md) = 0,5 ;
onde Md é mediana.

6.10.0. Moda

Moda é o valor da variável com maior probabilidade, se X for discreta ou com maior densidade se X for
contínua.

6.11.0. Momentos

Dentro do conjunto dos caracterizadores dos parâmetros de uma variável aleatória ou da respectiva
distribuição, os momentos assumem particular importância.

Podemos distinguir dois tipos de momentos: momentos em relação a origem (ou ordinários) e
momentos em relação a média (ou centrados)

6.11.1. Momentos em relação a origem


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 45

r
x i . fi
ar = E( x ) =
r i

n
, onde r = 1, 2, ... indica a ordem do momento, fi é a frequência de

cada valor xi e n é a soma das frequências fi.

Sendo assim, a1 = µ =  x . f i
i i
= E(X) é a esperança matemática ou valor esperado da
n
variável X.

6.11.2. Momentos em relação a média

 (x i  )r . fi
mr = E(Xi - µ ) = i

 (x i  )2. fi
Sendo assim, m2 = i
= Var(X) = σ2 , que se chama variância.
n

Em estatística descritiva viu-se que a variância é uma medida que indica o grau de dispersão dos
valores de uma variável aleatória. Por conveniência, usa-se frequentemente o desvio padrão para medir-
se o grau de concentração ou dispersão dos valores da variável.

2
Desvio padrão x = x = Var(X)

Mostre que x2 = E(x2 ) - x2 !

6.11.3. Propriedades da Variância


PROBABILIDADE E ESTATÍSTICA -3º Ano

1. Var(k) = 0
2
2. Var(kX) = k .Var(X)
3. Var(X  k) = Var(X)
4. Var(X  Y) = Var(X)  Var(Y)

1. Considere a variável aleatória X com a seguinte distribuição de probabilidade

X 0 1 2 3 4

f(x) 0.2 0.2 0.1 0.3 0.2

a) Calcula E(X) e Var(X)


b) Faz Y = 1-3X, e calculi E(Y) e Var(Y)
c) Sendo Z = |X - 2|, calcular E(Z) e Var(Z)

2. Uma empresa de aluguer de aviões para executivos estima que a procura diária tem um
comportamento aleatório, que pode ser descrito pela varável X « nº de aviões procurados por dia»,
com a seguinte função de probabilidade:

X 0 1 2 3

P(x) 0,25 0,35 0,30 0,10

Qual é o nº médio de aviões procurados por dia?

3. A procura diária de uma determinada peça X é uma v.a. com a seguinte distribuição de
x
2
probabilidade: f(x) = k. x! ; x = 1; 2; 3; 4

a) Determine k. B) Qual é a procura média diária?

4.Uma moeda é viciada de tal modo que a probabilidade de obter cara é duas vezes a de obter
coroa. Se a moeda é atirada 10 vezes ao ar, determine a probabilidade de se obter exactamente 5
coroas.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 47

5.O número de unidades de um produto procuradas diariamente por uma empresa é uma variável
1
aleatória com função de probabilidade f(x) = , (x = 0, 1, 2, 3, 4)
5

Se o produto é vendido durante o dia, proporciona um lucro de 50 meticais por unidade; se o


produto não é vendido, deve ser inutilizado, causando um prejuízo de 40 meticais por unidade.

a) Calcular o valor esperado e a variância de X


b) Qual deve ser o aprovisionamento diário para que o lucro esperado seja máximo?
x
5. Sendo X uma variável aleatória com f(x) = , (x = 0, 1, 2, 3, 4)
10
a) Calcula E(X) e Var(X)
b) E(Y) e Var(Y) se Y = X2
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 07

Distribuições Discretas

Introdução
Nesta unidade terás a oportunidade de aprender Distribuições Discretas; Distribuições de
Bernoulli e Binomial; Distribuição Geométrica; Distribuição de Poisson; Distribuição
Hipergeométrica.

No fim desta unidade deves ser capaz de:

Estar apto para, dada a distribuição de uma variável aleatória discreta;


Objectivos
Resolver problemas de cálculo de probabilidades.

7.1.0. Algumas distribuições teóricas


QUAIS AS MAIS
IMPORTANTES?

7.1.1. Distribuições discretas


As distribuições discretas se têm imposto como modelos probabilísticos de variáveis ou
fenómenos aleatórios com que nos deparamos nas aplicações empíricas.

7.1.2. Distribuições de Bernoulli e Binomial


Consideremos um experimento aleatório em que somente dois eventos merecem nossa
atenção: o evento A e seu contrário, A . Consideremos sucesso a ocorrência do evento A e
fracaço a não ocorrência de A. Suponhamos que A ocorre com probabilidade p e, portanto,
que A ocorre com probabilidade q = 1- p.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 49

Um experimento deste tipo, em que nos interessa conhecer se um determinado evento ocorreu
ou não, se denomina prova de Bernoulli. A variável aleatória X que assume somente dois
valores (1 quando há sucesso e 0 quando há fracasso), diz-se que tem distribuição de Bernoulli.

A função de massa de probabilidade desta variável é tal que P(X=1) = p e P(X=0)=1- p = q.

Para esta distribuição E[ X ]  p e V [ X ]  p(1  p)  pq

Neste caso, a função de repartição é: P(X ≤ x) = F(x) =

Suponhamos que, nas mesmas condições descritas antes, o experimento se repete n vezes de
maneira independente; ou seja, nas mesmas condições iniciais. Seja a variável aleatória Y =
número de sucessos obtidos. A distribuição da variável aleatória Y é conhecida como
distribuição binomial de parâmetros n e p.

Neste caso, a função de massa de Y é

n n k n
P(Y  k )    p k 1  p     p k q n  k k  0,..., n
k  k

n
Note que   é a combinação de n elementos tomados k a k.
k

A sua esperança matemática e a respectiva variância: E[Y ]  np V [Y ]  npq

EXEMPLO:

Um técnico dos serviços de prevenção e segurança rodoviária afirma que a probabilidade de


acontecer um acidente devido ao cansaço é de 0,1.

Determine a probabilidade de que em 5 acidentes haja exactamente 2 devidos ao cansaço.

Determine a probabilidade de que em 5 acidentes pelo menos 4 sejam devidos ao cansaço

Resolução:

Seja X: nº de acidentes devidos ao cansaço.


PROBABILIDADE E ESTATÍSTICA -3º Ano

Portanto, queremos:

5 2 5-2
a) P(X = 2) = 2 .(0,1) .(0,9) = 0,0729

b) P(X  4) = P(X = 4) + P(X = 5) = 0,0004 + 0,00001 = 0,00041

7.1.3. Distribuição geométrica


Suponhamos que as provas de Bernoulli consideradas anteriormente se repetem até que se
verifique o primeiro sucesso. Neste caso, o sucesso pode acontecer na primeira prova ou na
segunda prova ou … ou na x-ésima prova. Portanto, o que passa a ser aleatório é o número de
provas até que aconteça o primeiro sucesso. Chama se distribuição Geométrica, a distribuição
de uma variável aleatória X que expressa o instante em que ocorre o primeiro êxito. A sua
função de massa é P(X = x) = (1  p) x 1 . p ; onde p é o único parâmetro de que depende a
distribuição e x = 1, 2, 3, ….

0.6- 0.6-
p(x) p(x)
0.5- 0.5-
p=0.25 p=0.5
0.4- 0.4-

0.3- 0.3-

0.2- 0.2-

0.1- 0.1-

1 3 4 5 6 7 8 1 2 3 4 5 6 7 8

A esperança matemática e a variância são, respectivamente: E[ X ]  1/ p V [ X ]  q / p 2

A função Distribuição da variável X com distribuição Geométrica é

F(x) = P(X ≤ k) = 1- (1 - p)k se k ≤ x ˂ k+1e F(x) = 0 se x ˂ 1


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 51

EXEMPLO:

Um indivíduo que faz anos em 25 de Junho dispõe-se a inquirir pessoas ao aca até encontrar
uma que faça anos também no mesmo mês.

a) Qual o número médio de inquirições terá de fazer até ter sucesso?


b) Qual a probabilidade de inquirir menos de 6 pessoas?

Resolução:

a). Admitindo que os doze meses do ano têm a mesma probabilidade, a probabilidade de
1
alguém fazer anos no mês de Junho é . Como para a distribuição geométrica a média E(x) =
12
1
, substituindo tem-se que E(x) = 12. Portanto, o número médio de inquirições para se ter o
p
primeiro sucesso é 12. Ou seja, a pessoa terá de inquirir em média 12 pessoas até encontrar a 1ª
pessoa que faça anos no mês de Junho

1 5
b). P(x ˂ 6) = P(x ≤ 5) = 1 – (1 - ) = 0,3528
12

7.1.4. Distribuição de Poisson


Uma variável aleatória X com distribuição de Poisson expressa o número de eventos que ocorrem
num determinado intervalo de tempo ou espaço fixo. A intensidade ou número esperado de vezes
que tal evento ocorre em cada espaço ou intervalo de tempo é representado pelo parâmetro  .

Se usa, por exemplo para contar o número de chamadas que uma central telefónica recebe num
determinado intervalo de tempo, o número de doentes de malária que fazem consulta numa
unidade hospitalar por dia, o número de erros ortográficos de uma monografia científica por
página, etc.

e   x
Sua função de massa é P( X  x)  x  0,1,... com λ ˃ 0.
x!

Sua esperança matemática e sua variância: E[ X ]   V [ X ]   .


PROBABILIDADE E ESTATÍSTICA -3º Ano

A distribuição de Poisson também serve para aproximar a binomial quando a probabilidade de


sucesso é muito pequena.

Observação:

Seja X é uma variável com distribuição Binomial. Se n aumenta e p diminui, X→B(n,p) ≈ P(λ).
Recomenda-se utilizar esta aproximação para n > 50, p < 0,1 e np < 5.

EXEMPLO:

Na linha de atendimento a cliente de um centro comercial o número de chamadas de reclamação


segue um processo de Poisson com taxa (media) 4 chamadas por dia.

a) Qual a percentagem de dias em que não há reclamações?


b) Qual a probabilidade de num dia se receber mais de uma chamada?
c) Qual a probabilidade de numa semana (2ª a 6ª feira) se receberem exactamente 15 chamadas.

Resolução:

a). Seja X: nº de chamadas de reclamação por dia. X tem distribuição de Poisson com λ = 4.
e 4 .4 0
Pretende-se a probabilidade de x = 0. P(x=0) = = e-4
0!

A percentagem de dias é calculada multiplicando e-4 por 100%

b). P(x ˃ 1) = 1 – P(x ≤ 1) = P(x = 0) + P(x = 1) = e-4 + 4. e-4 = 5. e-4

c). Para P(x = 15) é preciso calcular a média para 5 dias que será λ = 4.5 = 20 chamadas por
semana (2ª a 6ª feira) e aplicar a formula.

7.1.5. Distribuição hipergeométrica


Suponhamos que numa população de Temana N temos D indivíduos com uma determinada
característica e N-D indivíduos sem tal característica. Extraem-se n indivíduos e pretende-se
observar a variável X: número de indivíduos com a característica “D” na amostra extraída.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 53

Se a extracção fosse feita com reposição dos elementos, então a probabilidade de existir x
x n x
n D   N  D 
elementos na amostra com a característica D seria P ( X  x)        que teria
 x N   N 
distribuição binomial B(n,D/N)

Se a extracção é sem reposição, a probabilidade de termos x elementos com a característica D é


 D  N  D 
 x  n  x 
, que é a Hipergeométrica H(N,D,n).
P ( X  x)     
N 
 
n

D
Observação:   é a combinação de D elementos tomados x a x
x

 N D 
  é a combinação de (N-D) elementos tomados (n-x) a (n-x)
 
 n x 

N
  é a combinação de N elementos tomados n a n
 
n
nD( N  D )( N  n)
A esperança matemática é E(X) = nD/N, e a variância é V ( X )  .
N 2 ( N  1)

EXEMPLO:

De um grupo de 1000 peças de uma fábrica há 50 que apresentam defeito de fabrico. Recolhida
uma amostra de 100 peças (com ou sem reposição), qual a probabilidade de se observar 10 peças
defeituosas?

Resolução:

 100 
a). Com reposição P (x = 10) =   .(0.05)10.(0.95)40
 10 

 50   950 
 . 
  
b). Sem reposição (distribuição Hipergeométrica) P(x = 10) =  10 1000
  90 
 
 
 
 100 
PROBABILIDADE E ESTATÍSTICA -3º Ano

1. Um produtor de refrigerantes resolveu lançar uma campanha publicitária, oferecendo prémios


impressos nas cápsulas das garrafas. Durante a campanha 5% das garrafas distribuídas para venda
tinham prémio. Ao adquirir 15 garrafas, qual a probabilidade de se receber pelo menos um
prémio?

2. Da produção diária de uma máquina retiram-se, para efeito de controlo, 10 peças e verifica-se que
80% estavam boas. Calcular a probabilidade de nas 10 peças mais de 8 estarem boas.

3. Um jovem casal deseja ter exactamente duas filhas. Considere que a probabilidade de ser rapaz ou
rapariga é igual, e que o casal terá filhos (rapazes e raparigas) até realizar o desejo.
a) Qual a função de probabilidade do número de rapazes?
b) Qual a probabilidade de ter quatro crianças?
c) Qual a probabilidade de ter no máximo quatro crianças?

4. O número de erros ortográficos que um aluno dá por página, numa prova escrita de Estatística,
segue a distribuição de Poisson com média 1,5 erros.
a) Qual a percentagem de provas de duas páginas sem erros de ortografia?
b) Se um aluno escreveu quatro páginas, qual a probabilidade de ter cometido mais de 8 erros?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 55

Unidade 08

Distribuições Contínuas

Introdução
Nesta unidade terás a oportunidade de aprender Distribuição Normal ou de Gauss;
Distribuição Exponencial; e Distribuição Uniforme.

No fim desta unidade deves ser capaz de:

Resolver problemas de probabilidades a ela associados.


Objectivos

QUAIS AS MAIS
IMPORTANTES?

Vamos iniciar, aquí, a exposição dos modelos probabilísticos de maior utilização para a
modelação de fenómenos aleatórios de tipo contínuo.

8.1.0. Distribuição uniforme


Uma variável aleatória contínua X, tem distribuição uniforme num dado intervalo (a ; b) com
1
a ˂ b, quando a sua função densidade é dada f ( x)  se a ˂ x ˂ b e f(x) = 0 para os
ba
restantes valores.

A respective função Distribuição é

 0 xa
x a

F ( x)   a xb
b  a
 1 xb
PROBABILIDADE E ESTATÍSTICA -3º Ano

A seguir apresentam os gráficos das funções de densidade e de Distribuição de uma variável


U(-1,3)

1,2

0,8
F(x)
0,6

0,4

0,2

0
-3 -2 -1 0 1 2 3 4 5
x

a b
A media desta variável coincide com o ponto médio do intervalo (a,b), E[ X ]  , e a
2
2

variância é V[X ] 
b  a 
12

8.2.0. Distribuição exponencial


Dentro das distribuições contínuas, outra distribuição que aparece em numerosas ocasiões é a
exponencial. Se utiliza, entre outras coisas, como modelo probabilístico para representar
tempos de funcionamento ou de vida de algum dispositivo, tempos de espera, ou em geral,
tempos entre dois eventos.

Diz-se que uma variável aleatórian X ten uma distribuição exponencial de parámetro   0 , se
sua função de densidade é da forma f ( x)   .e  x , sendo x ≥ 0.

A respectiva função Distribuição é

 0 x0
F ( x)    x
1  e x0
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 57

1,2
5 Exp(2)
1 Exp(3)
Exp(2)
4 Exp(3) 0,8 Exp(4)
Exp(4)
3 F(x)
0,6

2 0,4

1 0,2

0 0
0 0,4 0,8 1,2 1,6 2 0 0,5 1 1,5 2
x x

A Esperança e a variância são: E[ X ]  1/  V [ X ]  1/  2

Diz-se que a distribuição exponencial não tem memória. É a única distribuição continua com
esta propriedade, que se pode interpretar no sentido de que a história do passado só influencia
na história futura através do presente.

8.3.0. Distribuição normal ou de Gauss


Uma v.a. contínua unidimensional, diz-se que tem distribuição normal com parâmetros 
(  R) e  (  ) sse a sua função densidade de probabilidade tem a forma

1 1 t- 2
f(t) = exp(-2   ); tR
. 2 

E escreve-se X  N( , )
Seja Z uma variável aleatória normal com parámetros 0 e 1, isto é, Z  N(0 , 1)
1 1 2
A sua função densidade de probabilidade (f.d.p) é : f(t) = exp(-2 t ); tR
2

t t
1  1 2
E a respectiva função de repartição (f.d) é: F(t) = P(Z ≤ t) = f(u)du =  exp(-2 u ) du
2 
- -
As funções F(t) e f(t) são funções tabeladas.
A função F(t) tem aparecido como (t) ou N(t)
N(t) = F(t) = P(Z ≤ t)
(t) = P(0 ≤ Z ≤ t) = P(-t ≤ Z ≤ 0)
N(Z) = P(Z ≤ z)
PROBABILIDADE E ESTATÍSTICA -3º Ano

A V.a. Z é a estandartização ou normalização da V.a. X, isto é, tendo-se X  N( , ) pode-se


X-
obter Z  N(0 , 1). Toma-se Z =

1. Determine a área em cada um dos casos :

iii) Entre Z = 0 e Z = 1,2

iv) Entre Z = -0,68 e Z = 0

v) À esquerda de Z = -0,6

vi) À direita de Z = 2,06

a) O peso médio de 500 estudantes do sexo masculino de uma dada universidade é de 75,5
kg e o desvio padrão é 7,5 kg. Admitindo-se que os pesos dos estudantes estão normalmente
distribuídos, determinar quantos estudantes pesam:

b) Entre 60 e 77,5 kg

c) mais do que 92,5 kg

2. Faça Z uma v.a. com distribuição normal padronizada e encontre ( use a tabela):

a) P(0 ≤ Z ≤ 1,44)

b) P( -0,85  Z  0)

c) P(0,72  Z  1,89)

d) P(Z  1,08)

e) P(Z  -0,66)

f) P( Z ≤ 0,5)

3. A duração de um certo componente electrónico tem média 850 dias e desvio padrão 45
dias. Calcular a probabilidade desse componente durar:
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 59

a) Entre 700 e 1000 dias

b) Mais do que 800 dias

c) Menos do que 750 dias

d) Exactamente 1000 dias

4. Em uma distribuição normal, 28% dos elementos são superiores a 34 e 12% inferiores a 19.
Encontre a média e a variância da distribuição.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 09

Inferência Estatística

Introdução
No estudo de métodos estatísticos, já foi visto como resumir um conjunto de dados através
de tabelas de freqüências, gráficos e medidas de posição e dispersão. Depois, foram
estudados modelos probabilísticos, discretos ou contínuos, para descrever determinados
fenômenos. Agora, essas ferramentas serão utilizadas no estudo de um importante ramo da
Estatística, conhecido como Inferência Estatística, que busca métodos de fazer afirmações
sobre características de uma população, conhecendo-se apenas resultados de uma
amostra.Neste capítulo você estudará os seguintes conceitos:

• população e amostra
• amostra aleatória simples
• estatísticas e parâmetros
• estimador
• distribuição amostral de um estimador
• método dos momentos
• método da máxima verossimilhança

No fim desta unidade deves ser capaz de:

Obter informações sobre uma população a partir das informações de


Objectivos uma amostra;
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 61

9.1.0. Inferência estatística DE QUE SE TRATA?

9.1.0. Introdução

No estudo da estatística descritiva, vimos que população é o conjunto de elementos para os


quais se deseja estudar determinada (s) característica (s). Vimos também que uma amostra é
um subconjunto da população. No estudo da inferência estatística, o objectivo principal é obter
informações sobre uma população a partir das informações de uma amostra e aqui vamos
precisar de definições mais formais de população e amostra. Para facilitar a compreensão
destes conceitos, iremos apresentar alguns exemplos a título de ilustração.

9.2.0. População
A inferência estatística trata do problema de se obter informação sobre uma população a partir
de uma amostra. Embora a população real possa ser constituída de pessoas, empresas, animais,
etc., as pesquisas estatísticas buscam informações sobre determinadas características dos
sujeitos, características essas que podem ser representadas por números. Sendo assim, a cada
sujeito da população está associado um número, o que nos permite apresentar a seguinte
definição.

Definição: A população de uma pesquisa estatística pode ser representada por uma variável
aleatória X que descreve a característica de interesse.

Os métodos de inferência nos permitirão obter estimativas dos parâmetros da distribuição de


probabilidade de tal variável aleatória, que pode ser contínua ou discreta.
PROBABILIDADE E ESTATÍSTICA -3º Ano

9.3.0. Amostra aleatória simples


Como já foi dito, é bastante comum o emprego da amostragem em pesquisas estatísticas. Nas
pesquisas por amostragem, uma amostra é seleccionada da população de interesse e todas as
conclusões serão baseadas apenas nessa amostra. Para que seja possível inferir resultados para
a população a partir da amostra, é necessário que esta seja “representativa” da população.

Embora existam vários métodos de selecção de amostras, vamos nos concentrar aqui no caso
mais simples, que é a amostragem aleatória simples. Segundo tal método, toda amostra de
mesmo tamanho n tem igual chance (probabilidade) de ser sorteada. É possível extrair
amostras aleatórias simples com e sem reposição. Quando estudamos as distribuições
binomiais e hipergeométrica, vimos que a distribuição binomial correspondia a extracções com
reposição e a distribuição hipergeométrica correspondia a extracções sem reposição. No
entanto, para populações grandes - ou infinitas - extracções com e sem reposição não levam a
resultados muito diferentes. Assim, no estudo da Inferência Estatística, lidaremos sempre com
amostragem aleatória simples com reposição. Este método de selecção atribui a cada elemento
da população a mesma probabilidade de ser seleccionado e esta probabilidade se mantém
constante ao longo do processo de selecção da amostra (se as extracções fossem sem reposição
isso não aconteceria). No restante desse curso omitiremos a expressão “com reposição”, ou
seja, o termo amostragem (ou amostra) aleatória simples sempre se referirá à amostragem com
reposição. Por simplicidade, muitas vezes abreviaremos o termo amostra aleatória simples por
amostra aleatória simples.

Uma forma de se obter uma amostra aleatória simples é escrever os números ou nomes dos
elementos da população em cartões iguais, colocar estes cartões em uma urna misturando-os
bem e fazer os sorteios necessários, tendo o cuidado de colocar cada cartão sorteado na urna
antes do próximo sorteio. Na prática, em geral são usados programas de computador, uma vez
que as populações tendem a ser muito grandes.

Agora vamos formalizar o processo de selecção de uma amostra aleatória simples, de forma a
relacioná-lo com os problemas de inferência estatística que iremos estudar.

Seja uma população representada por uma variável aleatória X. De tal população será sorteada
uma amostra aleatória simples com reposição de tamanho n. Como visto nos exemplos
anteriores, cada sorteio dá origem a uma variável aleatória Xi e, como os sorteios são com
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 63

reposição, todas essas variáveis têm a mesma distribuição de X. Isso nos leva à seguinte
definição.

Definição: Uma amostra aleatória simples (aas) de tamanho n de uma variável aleatória X
(população) é um conjunto de n variáveis aleatórias X1, X2, ..., Xn independentes e
identicamente distribuídas (i.i.d.).

É interessante notar a convenção usual: o valor observado de uma variável aleatória X é


representado pela letra minúscula correspondente. Assim, depois do sorteio de uma amostra
aleatória simples de tamanho n, temos valores observados x1, x2, . . . , xn das respectivas
variáveis aleatórias.

9.4.0. Estatística e parâmetros


Obtida uma amostra aleatória simples, é possível calcular diversas características desta
amostra, como, por exemplo, a média, a mediana, a variância, etc. Qualquer uma destas
características é uma função de X1, X2, ..., Xn e, portanto, o seu valor depende da amostra
sorteada. Sendo assim, cada uma dessas características ou funções é também uma variável
aleatória. Por exemplo, a média amostral é a variável aleatória definida por

Temos, então, a seguinte definição:

Definição: Uma estatística amostral ou estimador T é qualquer função da amostra X1, X2, ...,
Xn, isto é, T = g(X1, X2, ..., Xn) onde g é uma função qualquer.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Para uma amostra específica, o valor obtido para o estimador será denominado estimativa e,
em geral, será representada por letras minúsculas. Por exemplo, temos as seguintes notações
correspondentes à média amostral e à variância:

Outras estatísticas possíveis são o mínimo amostral, o máximo amostral, a amplitude amostral,
etc.

De forma análoga, temos as características de interesse da população. No entanto, para


diferenciar entre as duas situações (população e amostra), atribuímos nomes diferentes.

Definição: Um parâmetro é uma característica da população.

Assim, se a população é representada pela variável aleatória X, alguns parâmetros são a


esperança E(X) e a variância V ar(X) de X.

Com relação às características mais usuais, vamos usar a seguinte notação:


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 65
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 10

Distribuições Amostrais

Introdução
Nesta unidade terás a oportunidade de aprender Distribuições Amostrais.

No fim desta unidade deves ser capaz de:

Encontrar a distribuição de probabilidades da variância S2


Objectivos

10.1.0. Distribuições amostrais


Nos problemas de inferência, estamos interessados em estimar um parâmetro θ da população
(por exemplo, a média populacional) através de uma amostra aleatória simples X1, X2, ..., Xn.
Para isso, usamos uma estatística T (por exemplo, a média amostral) e, com base no valor
obtido para T a partir de uma particular amostra, iremos tomar as decisões que o problema
exige. Já foi dito que T é uma variável aleatória, uma vez que depende da amostra sorteada;
amostras diferentes fornecerão diferentes valores para T .

Consideremos o seguinte exemplo, onde nossa população é o conjunto {1, 3, 6, 8}, isto é, este
é o conjunto dos valores da característica de interesse da população em estudo.

Assim, para esta população, ou seja, para essa variável aleatória X temos
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 67

Suponha que dessa população iremos extrair uma amostra aleatória simples de tamanho 2 e a
estatística que iremos calcular é a média amostral. Algumas possibilidades de amostra são
{1,1}, {1,3}, {6,8}, para as quais os valores da média amostral são 1, 2 e 7, respectivamente.
Podemos ver, então, que há uma variabilidade nos valores d estatística e, assim, seria
interessante que conhecêssemos tal variabilidade. Conhecendo tal variabilidade, temos
condições de saber “quão infelizes” podemos ser no sorteio da amostra. No exemplo acima, as
amostras {1,1} e {8,8} são as que têm média amostral mais afastada da verdadeira média
populacional. Se esses valores tiverem chance muito mais alta do que os valores mais próximos
de E(X), podemos ter sérios problemas.

Para conhecer o comportamento da média amostral, teríamos que conhecer todos

os possíveis valores de X, o que equivaleria a conhecer todas as possíveis amostras de tamanho


2 de tal população. Nesse exemplo, como só temos 4 elementos na população, a obtenção de
todas as amostras aleatórias simples de tamanho 2 não é difícil.

Lembre-se do nosso estudo de análise combinatória: como o sorteio é feito com reposição, em
cada um dos sorteios temos 4 possibilidades. Logo, o número total de amostras aleatórias
simples é 4 × 4 = 16. Por outro lado, em cada sorteio, cada elemento da população tem a
mesma chance de ser sorteado; como são 4 elementos, cada elemento tem probabilidade 1/4 de
ser sorteado. Finalmente, como os sorteios são independentes, para obter a probabilidade de
um par de elementos pertencer à amostra basta multiplicar as probabilidades (lembre-se que
P(A ∩ B) = P(A)P(B) quando A e B são independentes).

Na tabela a seguir listamos todas as possíveis amostras, com suas respectivas probabilidades e
para cada uma delas, apresentamos o valor da média amostral.

Analisando esta tabela, podemos ver que os possíveis valores de X(média) são 1; 2; 3; 3,5;
4,5;5,5; 6; 7; 8 e podemos construir a sua função de distribuição de probabilidade, notando, por
exemplo, que o valor 2 pode ser obtido através de duas amostras: (1,3) ou (3,1). Como essas
PROBABILIDADE E ESTATÍSTICA -3º Ano

amostras correspondem a eventos mutuamente exclusivos, a probabilidade de se obter uma


média amostral igual a 2 é

Distribuição amostral da média amostral


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 69

Definição:

A função de distribuição amostral de uma estatística T é a função de distribuição de


probabilidades de T ao longo de todas as possíveis amostras de tamanho n.

Podemos ver que a obtenção da distribuição amostral de qualquer estatística T é um processo


tão ou mais complicado do que trabalhar com a população inteira. Na prática, o que temos é
uma única amostra e é com essa única amostra que temos que tomar as decisões pertinentes ao
problema em estudo. Esta tomada de decisão, no entanto, será facilitada se conhecermos
resultados teóricos sobre o comportamento da distribuição amostral.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Encontre a distribuição de probabilidades da variância S2

Definição: Um estimador T é dito um estimador não-viesado do parâmetro θ se E(T) = θ.

Definição: Se T1 e T2 são dois estimadores não-viesados do parâmetro θ, diz-se que T1 é mais


eficiente que T2 se V ar(T1) < V ar(T2).

Definição: Uma sequência {Tn} de estimadores de um parâmetro θ é consistente se, para todo
ε>0

Uma maneira alternativa de verificar se uma sequência de estimadores é consistente é dada a


seguir.

Teorema: Uma sequência {Tn} de estimadores de um parâmetro θ é consistente se


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 71

Unidade 11

Alguns Métodos de Obtenção de


Estimadores

Introdução
Nesta unidade terás a oportunidade de aprender Alguns Métodos de Obtenção de
Estimadores; Método dos momentos; Distribuição de Poisson; Distribuição Exponencial;
Distribuição Normal; Método da máxima verossimilhança; Distribuição Amostral da
Média; Média e variância da distribuição amostral da média; . Distribuição amostral da
média para populações normais; . Distribuição amostral da média para populações
normais; Distribuição amostral da variância amostral;

No fim desta unidade deves ser capaz de:

Estimar um parâmetro θ = (θ1, θ2, . . . , θr) . A distribuição de


Objectivos probabilidade f da variável X depende de tal parâmetro, o que
representaremos por f (x; θ).

11.1.0. Alguns métodos de obtenção de estimadores


Definidas as propriedades desejáveis de um estimador, a questão que se coloca é: como
conseguir estimadores? Neste curso vamos ver 2 métodos, que, no entanto, não esgotam as
possibilidades. Por exemplo, no estudo dos modelos de regressão é usado o método dos
mínimos quadrados, que não será abordado aqui.

O contexto geral é o seguinte: de uma população representada pela variável aleatória X extrai-
se uma amostra aleatória simples X1, X2, . . . , Xn. com o objetivo de se estimar um parâmetro
θ = (θ1, θ2, . . . , θr) . A distribuição de probabilidade f da variável X depende de tal parâmetro,
o que representaremos por f (x; θ).
PROBABILIDADE E ESTATÍSTICA -3º Ano

11.2.0. Método dos momentos


A idéia geral do método dos momentos é a seguinte: o estimador bθ será obtido como solução
das equações que igualam os momentos populacionais aos momentos amostrais.

O momento μ k de ordem k de uma variável aleatória X é definido como

Definição: Dada uma amostra aleatória simples X1, X2, . . . , Xn de uma população X, o
momento amostral mk de ordem k é definido como

Definição: θ é o estimador para θ obtido pelo método dos momentos se ele for solução das
equações mk = μk ; k = 1, 2, . . . , r

11.2.1. Distribuição de Poisson


Seja X uma variável aleatória com distribuição de Po(λ). Vamos obter o estimador pelo
métodos dos momentos para λ. A distribuição de probabilidade de X é
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 73

e foi visto que E(X) = λ = μ1. Igualando

11.2.2. Distribuição exponencial

11.2.3. Distribuição normal

11.3.0. Método da máxima verossimilhança


Se X1, X2, . . . , Xn é uma amostra aleatória simples retirada de uma população X ~ f X(x; θ),
então X1, X2, . . . , Xn são variáveis aleatórias (porque dependem da amostra a ser sorteada)
independentes e identicamente distribuídas e sua distribuição conjunta é
PROBABILIDADE E ESTATÍSTICA -3º Ano

pela hipótese de independência das variáveis aleatórias. O parâmetro θ é desconhecido, mas


fixo, ou seja, fX(x; θ) depende deste único parâmetro. Depois de sorteada a amostra, os valores
observados de X1, X2, . . . , Xn estão fixos. O método da máxima verossimilhança consiste em

estimar o parâmetro θ pelo valor que maximiza a probabilidade de se observar esses valores
da amostra.

A título de ilustração deste conceito, vamos considerar uma amostra aleatória simples de
tamanho 1 retirada de uma população N(μ; 1). Nosso objectivo é estimar a média a partir desta
amostra de tamanho 1. Suponhamos que a amostra sorteada resulte na observação x = 2. Essa
observação poderia ter vindo de qualquer distribuição normal com variância 1. Na Figura a
seguir temos 3 dessas possíveis distribuições: todas têm variância 1 mas suas médias são
diferentes. Os pontos coloridos correspondem ao valor da respectiva função de densidade no

ponto observado x = 2. O método de máxima verossimilhança fornece o estimador como


sendo aquele que maximiza fμ(2). Note que agora quem está variando é o parâmetro μ, ou seja,
estamos escolhendo o “melhor” μ, que é aquele que maximiza f(2). Podemos ver que o
máximo ocorre quando μ = 2 (curva do meio - em azul).

Exemplo da máxima verossimilhança - amostra de tamanho 1 da N(μ; 1)


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 75

Vamos, agora, formalizar esse procedimento.

Definição: Sejam X1, X2, . . . , Xn os valores observados de uma amostra aleatória simples X1,
X2, . . . , Xn retirada de uma população X ~ fX(x; θ). A função de verossimilhança é definida
por
PROBABILIDADE E ESTATÍSTICA -3º Ano
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 77
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 12

Distribuição Amostral da Média

Introdução
Nesta unidade você irá aprofundar seus conhecimentos sobre a distribuição amostral da
média amostral. No capítulo anterior analisamos, através de alguns exemplos, o
comportamento da média amostral; mas naqueles exemplos, a população era pequena e
foi possível obter a distribuição amostral exata.Veremos agora resultados teóricos sobre a
distribuição amostral da média amostral, que nos permitirão fazer análises sem ter que
listar todas as amostras.Os principais resultados que estudaremos são:

 Média e variância da distribuição amostral da média;


 Distribuição amostral da média para populações normais;
 Teorema Limite Central;
 Distribuição amostral da variância amostral.

No fim desta unidade deves ser capaz de:

Determinar a média e a variância da distribuição amostral da média.


Objectivos

12.1.0. Média e variância da distribuição amostral da média

No capítulo anterior, vimos, através de exemplos, que a média amostral é um estimador


não-viesado da média populacional μ. Na verdade, temos o seguinte resultado geral.

Teorema: Seja X1, X2, . . . , Xn uma amostra aleatória simples de tamanho n de uma

população representada pela variável aleatória X com média μ e variância σ2. Então,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 79

DEMONSTRAÇÂO

É importante notar que esse resultado se refere a qualquer população X. O que ele estabelece é
que as médias amostrais das diferentes amostras aleatórias simples de tamanho n tendem a ser
iguais a média populacional μ. Além disso, à medida que o tamanho amostral n aumenta, a

dispersão em torno da média, medida por , vai diminuindo e tende a zero quando n
→ ∞.

Esse teorema não permite ver que é consistente para estimar a média populacional μ.
PROBABILIDADE E ESTATÍSTICA -3º Ano

O desvio padrão da distribuição amostral de qualquer estatística é usualmente chamado de erro


padrão. Então, o erro padrão da média amostral é

12.2.0. Distribuição amostral da média para populações normais


Na prática estatística, várias populações podem ser descritas, pelo menos aproximadamente,
por uma distribuição normal. Obviamente, o teorema anterior continua valendo no caso de uma
população normal, mas temos uma característica a mais da distribuição amostral da média: ela
é também normal.

Teorema: Seja X1, X2, . . . , Xn uma amostra aleatória simples de tamanho n de uma população
normal, isto é, uma população representada por uma variável aleatória normal X com média μ

e variância σ2. Então, a distribuição amostral da média amostral é normal com média μ e
2
variância σ /n, ou seja

Na Figura a seguir ilustra-se o comportamento da distribuição amostral da média amostral com


base em amostras de tamanho n = 4 para uma população normal com média 2 e variância 9. A
título de comparação, apresenta-se aí a distribuição populacional. Podemos ver que ela é mais

dispersa que a distribuição amostral de , mas ambas estão centradas no verdadeiro valor
populacional μ = 2.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 81

Distribuição amostral de com base em amostras de tamanho n = 4 de uma população N(2; 9)

Exemplo

A capacidade máxima de um elevador é de 500 kg. Se a distribuição dos pesos dos usuários é
N(70; 100), qual é a probabilidade de que 7 pessoas ultrapassem este limite? E de 6 pessoas?

Solução

Podemos considerar os 7 passageiros como uma amostra aleatória simples da população de


todos os usuários, representada pela variável aleatória X ~ N(70; 100). Seja, então, X1, . . . , X7
uma amostra aleatória simples de tamanho n = 7. Se o peso máximo é 500, para que 7 pessoas
ultrapassem o limite de segurança temos que ter

Mas sabemos das constatações anteriores que

Logo

Com 6 pessoas teríamos a seguinte probabilidade


PROBABILIDADE E ESTATÍSTICA -3º Ano

Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoas
ultrapassarem o limite de segurança. Já com 6 pessoas, essa probabilidade é bastante pequena.
Assim, o número máximo de pessoas no elevador deve ser estabelecido como 6 ou menos.

Os resultados vistos anteriormente são válidos para populações normais, isto é, se uma

população é normal com média μ e variância σ2, então a distribuição amostral de é


também normal com média μ e variância σ2/n, onde n é o tamanho da amostra.

O teorema de limite central que veremos a seguir nos fornece um resultado análogo para
qualquer distribuição populacional, desde que o tamanho da amostra seja suficientemente
grande.

Teorema de Limite Central: Seja X1, X2, . . . , Xn uma amostra aleatória simples de uma
população X tal que E(X) = μ e Var(X) = σ2. Então, a distribuição de converge para a
2
distribuição normal com média μ e variância σ /n quando n → ∞.

Isto equivale a dizer que,

A interpretação prática do teorema limite central é a seguinte: para amostras “grandes” de

qualquer população, podemos aproximar a distribuição amostral de por uma distribuição


normal com a mesma média populacional e variância igual à variância populacional dividida
pelo tamanho da amostra.

Quão grande deve ser a amostra para se obter uma boa aproximação depende das
características da distribuição populacional. Se a distribuição populacional não se afastar muito
de uma distribuição normal, a aproximação será boa, mesmo para tamanhos pequenos de
amostra. Na Figura a seguir ilustra-se esse teorema para a distribuição exponencial, ou seja,
para uma população distribuída segundo uma exponencial com parâmetro λ = 1. O gráfico
superior representa a distribuição populacional e os histogramas representam a distribuição
amostral de ao longo de 5000 amostras de tamanhos 10, 50, 100 e 250. Assim, podemos
ver que, embora a população seja completamente diferente da normal, a distribuição amostral
de vai se tornando cada vez mais próxima da normal à medida que n aumenta.

Em termos práticos, esse teorema é de extrema importância, daí ser chamado de teorema
central e, em geral, amostras de tamanho n > 30 já fornecem uma aproximação razoável.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 83

Ilustração do Teorema Limite Central para uma população X ~ exp(1)


PROBABILIDADE E ESTATÍSTICA -3º Ano

Exemplo:

Uma moeda é lançada 50 vezes, com o objectivo de se verificar sua honestidade. Se ocorrem
36 caras nos 50 lançamentos, o que podemos concluir?

Solução

Neste caso, a população pode ser representada por uma variável de Bernoulli X com parâmetro
p, isto é, X assume o valor 1 com probabilidade p na ocorrência de cara e assume o valor 0
com probabilidade 1 − p na ocorrência de coroa. Para uma variável Bernoulli, temos que E(X)
= p e Var(X) = p(1 − p). Como são feitos 50 lançamentos, o tamanho da amostra é 50 (n

grande!) e, pelo teorema limite central, é aproximadamente normal com média

e variância

Suponhamos que a moeda seja honesta, isto é, que p = 1/2. Nestas condições, qual é a
probabilidade de obtermos 36 caras em 50 lançamentos? Com a hipótese de honestidade da
moeda, o teorema limite central nos diz que

A probabilidade de se obter 36 ou mais caras em 50 lançamentos é equivalente à probabilidade


36
de X ser maior ou igual a = 0, 72 e essa probabilidade é
50

Note que essa probabilidade é bastante pequena, ou seja, há uma pequena probabilidade de
obtermos 36 ou mais caras em um lançamento de uma moeda honesta. Isso pode nos levar a
suspeitar sobre a honestidade da moeda!
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 85

12.3.0. Distribuição amostral da variância amostral

Na secção anterior, consideramos dois estimadores para a variância: Através de

um exemplo, vimos que é um estimador viesado. Vamos demonstrar agora que é


não-viesado para estimar a variância de uma população qualquer.

Teorema: Seja X1, X2, . . . , Xn uma amostra aleatória simples extraída de uma população com
N elementos e variância populacional
PROBABILIDADE E ESTATÍSTICA -3º Ano

Teorema: Se X1, X2, . . . , Xn é uma amostra aleatória simples extraída de uma população X
~ N(μ; σ2) então

1. Uma amostra de tamanho n = 18 é extraída de uma população normal com média 15 e


desvio padrão 2,5. Calcule a probabilidade de que a média amostral

(a) esteja entre 14,5 e 16,0;

(b) seja maior que 16,1.

2. Uma empresa produz parafusos em duas máquinas. O comprimento dos parafusos


produzidos em ambas é aproximadamente normal com média de 20mm na primeira máquina e
25 mm na segunda máquina e desvio padrão comum de 4mm. Uma caixa com 16 parafusos,
sem identificação, é encontrada e o gerente de produção determina que, se o comprimento
médio for maior que 23 mm, então a caixa será identificada como produzida pela máquina 2.
Especifique os possíveis erros nessa decisão e calcule as suas probabilidades.

3. Definimos a variável como sendo o erro amostral da média, onde éa


média de uma amostra aleatória simples de tamanho n de uma população com média μ e desvio
padrão σ.

(a) Determine E(e) e Var(e).

(b) Se a população é normal com σ = 20, que proporção das amostras de tamanho

100 terá erro amostral absoluto maior do que 2 unidades?

(c) Neste caso, qual deve ser o valor de δ para que Pr(| e | > δ) = 0, 01?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 87

(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam
inferiores a 1 unidade?

4. Uma fábrica produz parafusos especiais, para atender um determinado cliente, que devem ter
comprimento de 8,5 cm. Como os parafusos grandes podem ser reaproveitados a um custo
muito baixo, a fábrica precisa controlar apenas a proporção de parafusos pequenos. Para que o
processo de produção atinja o lucro mínimo desejável, é necessário que a proporção de
parafusos pequenos seja no máximo de 5%.

(a) Supondo que a máquina que produz os parafusos o faça de modo que os comprimentos
tenham distribuição normal com média μ e desvio padrão de 1,0 cm, em quanto deve ser
regulada a máquina para satisfazer as condições de lucratividade da empresa?

(b) Para manter o processo sob controle, é programada uma carta de qualidade. A cada hora
será sorteada uma amostra de 4 parafusos e, se o comprimento médio dessa amostra for menor
que 9,0 cm, o processo de produção é interrompido para uma nova regulagem da máquina.
Qual é a probabilidade de uma parada desnecessária?

(c) Se a máquina se desregulou de modo que o comprimento médio passou a ser 9,5 cm, qual é
a probabilidade de se continuar o processo de produção fora dos padrões desejados?

5. A divisão de inspeção do Departamento de Pesos e Medidas de uma determinada cidade está


interessada em calcular a real quantidade de refrigerante que é colocada em garrafas de 2 litros,
no sector de engarrafamento de uma grande empresa de refrigerantes. O gerente do sector de
engarrafamento informou à divisão de inspeção que o desvio padrão para garrafas de 2 litros é
de 0,05 litro. Uma amostra aleatória de 100 garrafas de 2 litros, obtida deste sector de
engarrafamento, indica uma média de 1,985 litro. Qual é a probabilidade de se obter uma
média amostral de 1,985 ou menos, caso a afirmativa do gerente esteja certa? O que se pode
concluir?
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 13

Distribuição Amostral da Proporção

Introdução
Aqui, você verá uma importante aplicação do Teorema de Limite Central. Vamos estudar a
distribuição amostral de proporções. Assim, você verá os resultados referentes à
aproximação da distribuição binomial pela distribuição normal. Veremos os seguintes
resultados:
 Aproximação da binomial pela normal;
 Correção de continuidade;
 Distribuição amostral da proporção amostral;

No fim desta unidade deves ser capaz de:

Fazer inferência sobre proporções.


Objectivos

13.1.0. Aproximação normal da distribuição binomial


No capítulo anterior, vimos o Teorema Limite Central, que trata da distribuição da média amostral

quando n → ∞. Esse teorema nos diz que, se X é uma população com média μ e variância σ2,
então a distribuição amostral da média de uma amostra aleatória simples de tamanho n se aproxima de

uma distribuição normal com média μ e variância quando n → ∞.

Usando as propriedades da média e da variância, podemos estabelecer esse teorema


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 89

13.2.0. Teorema do limite central

A variável aleatória binomial foi definida como “número de sucessos em n repetições independentes de
um experimento de Bernoulli com parâmetro p”. Então, uma variável binomial é a soma de n variáveis
independentes Bern(p). Pelo teorema acima e usando o fato de que se X ~ Bern(p) então E(X) = p e
Var(X) = p(1 − p), podemos dizer que a distribuição binomial com parâmetros n e p se aproxima de
uma normal com média np e variância np(1 − p) quando n → ∞.

Alguns cuidados devem ser tomados na aproximação da binomial pela normal. Um fato importante a
observar é que a distribuição binomial é discreta, enquanto a variável normal é contínua. Veja a Figura
a seguir. Aí o histograma representa uma variável aleatória X com distribuição binomial com n = 12 e p
= 0, 5. OS retângulos, centrados nos possíveis valores de X, têm base 1 e altura igual a Pr(X = k), de
modo que a área de cada retângulo é igual a Pr(X = k). A curva normal aí representada é de uma
variável aleatória Y com média μ = 12 × 0,5 = 6 e variância σ2 = 12 × 0, 5 × 0,5 = 3.

Aproximação normal da distribuição binomial

Suponha que queiramos calcular Pr(X ≥ 8). Isso equivale a somar as áreas dos 4 últimos retângulos
superiores. Pela aproximação normal, no entanto, temos que calcular a área (probabilidade) acima do
ponto 7,5, de modo a incluir os 4 retângulos. Assim, teremos
PROBABILIDADE E ESTATÍSTICA -3º Ano

Encontre o valor exacto, de Pr(X ≥ 8) calculado pela distribuição binomial.

Vamos, agora, calcular Pr(X > 10). Isso equivale à área dos 2 rectângulos superiores, centrados em 11
e 12 (este último não é visível, pois Pr(X = 12) = 0, 000244); logo, pela distribuição normal temos que
calcular Pr(Y ≥ 10, 5) :

Se queremos Pr(4 ≤ X < 8), temos a seguinte aproximação:


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 91

É interessante observar que para uma variável binomial faz sentido calcular Pr(X = k); no caso da
normal, essa probabilidade é nula, qualquer que seja k. Para usar a aproximação normal para calcular,
por exemplo, Pr(X = 5), devemos notar que essa probabilidade equivale à área do retângulo centrado
em 5 e, em termos da curva normal, temos que calcular a área compreendida entre 4,5 e 5,5:

Esses procedimentos são chamados de correcção de continuidade e na Figura seguinte ilustra-se o


procedimento geral; lembre-se que o centro de cada rectângulo é o valor da variável binomial. A
aproximação dada pelo teorema limite central é melhor para valores grandes de n. Existe a seguinte
regra empírica para nos ajudar a decidir o que é “grande”: A distribuição binomial com parâmetros n e
p pode ser aproximada por uma distribuição normal com média μ = np e variância σ2 = np(1 − p) se
são satisfeitas as seguintes condições:

1. np ≥ 5

2. n(1 − p) ≥ 5
PROBABILIDADE E ESTATÍSTICA -3º Ano

Correção de continuidade para a aproximação normal da binomial

(a) Pr(X = k) (b) Pr(X ≤ k) (c) Pr(X < k) (d) Pr(X ≥ k) (e) Pr(X > k)

12.4.0. A distribuição amostral da proporção

Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência
de determinada característica. Por exemplo, podemos pensar em eleitores escolhendo entre 2
candidatos, pessoas classificadas de acordo com o sexo, trabalhadores classificados como trabalhador
com carteira assinada ou não, e assim por diante. Em termos de variável aleatória, essa população é
representada por uma variável aleatória de Bernoulli, isto é:

Vamos denotar por p a proporção de elementos da população que possuem a característica de interesse.
Então, Pr(X = 1) = p, E(X) = p e Var(X) = p(1 −p). Em geral, esse parâmetro é desconhecido e
precisamos estimá-lo a partir de uma amostra.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 93

Suponha, então, que dessa população seja extraída uma amostra aleatória simples X1, X2 , . . . , Xn com
reposição. Essas n extracções correspondem a n variáveis aleatórias de Bernoulli independentes e, como
foi visto,

tem distribuição binomial com parâmetros n e p. Note que Sn dá o número total


de “sucessos” nas n repetições, onde “sucesso”, neste caso, representa a presença da característica de

interesse. Os valores possíveis de Sn são 0, 1, 2, . . . , n. Com relação à proporção de elementos na


amostra que possuem a característica de interesse, temos que

Justifique que

Vemos, então, que a proporção amostral é um estimador não-viesado da proporção populacional p.

Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com
distribuição de Bernoulli com parâmetro p, o Teorema de Limite Central nos diz, então, que a

distribuição da proporção amostral se aproxima de uma normal com média p e variância .


Como essa aproximação é uma consequência directa da aproximação normal da binomial, as mesmas
regras continuam valendo: a aproximação deve ser feita se np ≥ 5 e n(1 − p) ≥ 5.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Exemplo:
De um lote de produtos manufacturados, extrai-se uma amostra aleatória simples de 100 itens. Se 10%
dos itens do lote são defeituosos, calcule a probabilidade de serem sorteados no máximo 12 itens
defeituosos.

Solução

As condições para utilização da aproximação normal são válidas: com n = 100 e p = 0, 1 temos que

100 × 0,1 = 10 > 5

100 × 0,9 = 9 > 5

Seja X = “número de itens defeituosos na amostra”. Então, X ~ bin(100; 0, 1) e

X ≈ N(10; 9). Queremos calcular Pr(X ≤ 12). Usando a correção de continuidade e

denotando por Y uma variável aleatória N(10; 9), temos que

O valor exacto é Pr(X ≤ 12) = 0, 802.

1. Use a aproximação normal para calcular as probabilidades pedidas tendo o cuidado de verificar que
as condições para essa aproximação são realmente satisfeitas.

(a) Pr(X ≤ 25) se X ~ bin(50; 0, 7)

(b) Pr(42 < X ≤ 56) se X ~ bin(100; 0, 5)


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 95

(c) Pr(X > 60) se X ~ bin(100; 0, 5)

(d) Pr(X = 5) se X ~ bin(20; 0, 4)

(e) Pr(X ≥ 12) se X ~ bin(30; 0, 3)

(f) Pr(9 < X < 11) se X ~ bin(80; 0, 1)

(g) Pr(12 ≤ X ≤ 16) se X ~ bin(30; 0, 2)

(h) Pr(X > 18) se X ~ bin(50; 0, 3)

(i) Pr(X = 6) se X ~ bin(28; 0, 2)

(j) Pr(30 ≤ X < 48) se X ~ bin(95; 0, 4)

2.Em uma sondagem, perguntou-se a 1002 membros de determinado sindicato se eles haviam votado na
última eleição para a direcção do sindicato e 701 responderam afirmativamente. Os registros oficiais
obtidos depois da eleição mostram que 61% dos membros aptos a votar de fato votaram. Calcule a
probabilidade de que, dentre 1002 membros selecionados aleatoriamente, no mínimo 701 tenham votado,
considerando que a verdadeira taxa de votantes seja de 61%. O que o resultado sugere?

3.Supondo que meninos e meninas sejam igualmente prováveis, qual é a probabilidade de nascerem 36
meninas em 64 partos? Em geral, um resultado é considerado não-usual se a sua probabilidade de
ocorrência é pequena, digamos, menor que 0,05. É não-usual nascerem 36 meninas em 64 partos?

4.Com base em dados históricos, uma companhia aérea estima em 15% a taxa de desistência entre seus
clientes, isto é, 15% dos passageiros com reserva não aparecem na hora do vôo. Para otimizar a
ocupação de suas aeronaves, essa companhia decide aceitar 400 reservas para os vôos em aeronaves que
comportam apenas 350 passageiros. Calcule a probabilidade de que essa companhia não tenha assentos
suficientes em um desses vôos. Essa probabilidade é alta o suficiente para a companhia rever sua
política de reserva?

5.No controle de qualidade de produtos, uma técnica comummente utilizada é a amostragem de


aceitação. Segundo essa técnica, um lote inteiro é rejeitado se contiver mais do que um número
determinado de itens defeituosos. A companhia X compra parafusos de uma fábrica em lotes de 5000 e
rejeita o lote se uma amostra aleatória simples de 20 parafusos contiver pelo menos 2 defeituosos. Se o
processo de fabricação tem uma taxa de 10% de defeituosos, qual é a probabilidade de um lote ser
rejeitado pela companhia X?
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 14

Intervalos de Confiança

Introdução
Nesta unidade terás a oportunidade de aprender os intervalos de confiança constituem um método muito
importante de estimação de parâmetros. Vimos anteriormente que a média amostral é um bom
estimador da média populacional μ. Mas vimos, também, que existos e métodos:

 Intervalo de confiança;

 Margem de erro;

 Nível de confiança;

 Nível de seignificância;

 Intervalo de confiança para a média de uma população N (μ; σ2) com variância conhecida.

No fim desta unidade deves ser capaz de:

Obter informações para uma população a partir do conhecimento de


Objectivos uma única amostra.

Intervalos de Confiança SERVEM PARA QUÊ?


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 97

14.1.0. Ideias básicas


O objectivo central da Inferência Estatística é obter informações para uma população a partir do
conhecimento de uma única amostra. Em geral, a população é representada por uma variável aleatória
X, com função de distribuição ou densidade de probabilidade fX. Dessa população, então, extrai-se uma
amostra aleatória simples com reposição, que dá origem a um conjunto X1, X2, . . . , Xn de n variáveis
aleatórias independentes e identicamente distribuídas, todas com a mesma distribuição fX. Se f X
depende de um ou mais parâmetros, temos que usar a informação obtida a partir da amostra para
estimar esses parâmetros, de forma a conhecermos a distribuição. Vimos, por exemplo, ue a média
amostral é um bom estimador da média populacional μ, no sentido de que ela tende a “acertar o
alvo” da verdadeira média populacional, isto é, a média amostral é um estimador não-viesado da média
populacional. Mas vimos, também, que existe uma variabilidade nos valores de , ou seja, cada
amostra dá origem a um valor diferente do estimador. Para algumas amostras, X será maior que μ, para
outras será menor e para outras será igual.

Na prática, temos apenas uma amostra e, assim, é importante que se dê alguma informação sobre essa

possível variabilidade do estimador. Ou seja, é importante informar o valor do estimador obtido


com uma amostra específica, mas é importante informar também que o verdadeiro valor do parâmetro θ

poderia estar num determinado intervalo, digamos, no intervalo . Dessa forma,


estamos informando a nossa margem de erro no processo de estimação; essa margem de erro é
consequência do processo de selecção aleatória da amostra.

O que vamos estudar agora é como obter esse intervalo, de modo a “acertar na maioria das vezes”, isto
é, queremos um procedimento que garanta que, na maioria das vezes (ou das amostras possíveis), o
intervalo obtido conterá o verdadeiro valor do parâmetro. A expressão “na maioria das vezes” será
traduzida como “probabilidade alta”. Dessa forma, estaremos lidando com afirmativas do seguinte tipo:

A interpretação correcta de tal afirmativa é a seguinte: se 1 −α = 0, 95, por exemplo, então isso significa
que o procedimento de construção do intervalo é tal que, em 95% das possíveis amostras, o intervalo

obtido conterá o verdadeiro valor do parâmetro. Note que cada


amostra resulta em um intervalo diferente; mas, em 95% das amostras, o intervalo contém o verdadeiro
valor do parâmetro. Veja a Figura seguinte.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Aí dois dos intervalos não contêm o parâmetro θ. O valor 1 − α é chamado nível de confiança, enquanto

o valor α é conhecido como nível de significância. O intervalo é


chamado de intervalo de confiança de nível de confiança 1 − α.

Tendo clara a interpretação do intervalo de confiança, podemos resumir a frase acima da seguinte
maneira:

Mais uma vez, a probabilidade se refere à probabilidade dentre as diversas possíveis amostras, ou seja,

a probabilidade está associada à distribuição amostral de . Note que os limites do intervalo

dependem de , que depende da amostra sorteada, ou seja, os limites do intervalo de confiança são
variáveis aleatórias. Cada amostra dá origem a um intervalo diferente, mas o procedimento de obtenção
dos intervalos garante probabilidade 1 − α de acerto.

Interpretação dos Intervalos de Confiança


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 99

14.2.0. Intervalo de Confiança: média da N(μ; σ2), σ2 conhecida


Vamos agora estudar os métodos para construir intervalo de confiança para a média de uma população.
Como foi visto, a média populacional é um parâmetro importante que pode ser muito bem estimado

pela média amostral

Consideremos uma população descrita por uma variável aleatória normal com média μ e variância σ2 :
X ~ N(μ; σ2). Suponhamos que o valor de σ2 seja conhecido e que nosso interesse seja estimar a média
μ a partir de uma amostra aleatória simples X1 , X2, . . . , Xn. Como já deves saber do que foi visto

anteriormente, a distribuição amostral de é normal com média μ e variância σ2 / n , ou seja

Da definição de distribuição amostral, isso significa que os diferentes valores de obtidos a partir
das diferentes possíveis amostras se distribuem normalmente em torno de μ com variância σ2/ n .

Das propriedades da distribuição normal, resulta que

Com base nisso, vamos estabelecer a seguinte notação: indiquemos por a abcissa da curva normal
padrão que deixa probabilidade (área) igual a α acima dela. Vê as Figuras seguintes. Temos, então, que

Essa abcissa zα é normalmente chamada de valor crítico.

Considerando, agora, o valor crítico podemos ver que, se Z ~ N(0; 1), então

Substituindo o na expressão anterior podemos escrever


PROBABILIDADE E ESTATÍSTICA -3º Ano

Ilustração do valor crítico

Definição do valor crítico


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 101

Definição:

Seja X ~ N(μ; σ2) uma população normal com variância σ2 conhecida. Se X1 , X2, . . . , Xn é uma
amostra aleatória simples dessa população, então o intervalo de confiança de nível de confiança 1 − α
para a média populacional μ é dado por

14.3.0. Interpretação do intervalo de confiança para μ

O intervalo de confiança para μ pode ser escrito na forma onde éa


margem de erro. Como visto, essa margem de erro está associada ao fato de que diferentes amostras

fornecem diferentes valores de cuja média é igual a μ. As diferentes amostras fornecem diferentes
intervalos de confiança, mas uma proporção de 100×(1 − α)% desses intervalos irá conter o verdadeiro
valor de μ. Note que aqui é fundamental a interpretação de probabilidade como frequência relativa:
estamos considerando os diferentes intervalos que seriam obtidos, caso sorteássemos todas as possíveis
amostras.

Assim, o nível de confiança está associado à confiabilidade do processo de obtenção do intervalo: esse
processo é tal que acertamos (isto é, o intervalo contém μ) em 100×(1 − α)% das vezes.

Na prática, temos apenas uma amostra e o intervalo obtido com essa amostra específica, ou contém ou
não contém o verdadeiro valor de μ. A afirmativa

é válida porque ela envolve a variável aleatória que tem diferentes valores para as diferentes

amostras. Quando substituímos o estimador por uma estimativa específica obtida a partir de
uma amostra particular, temos apenas um intervalo e não faz mais sentido falar em probabilidade.

Para ajudar na interpretação do intervalo de confiança, suponha que, com uma amostra de tamanho 25,
tenha sido obtido o seguinte intervalo de confiança com nível de confiança de 0,95:
PROBABILIDADE E ESTATÍSTICA -3º Ano

Esse intervalo específico contém ou não contém o verdadeiro valor de μ. O que estamos dizendo é que,
se repetíssemos o mesmo procedimento de sorteio de uma amostra aleatória simples da população e
conseqüente construção do intervalo de confiança, 95% dos intervalos construídos conteriam o
verdadeiro valor de μ.

Sendo assim, é errado dizer que há uma probabilidade de 0,95 de o intervalo específico [4, 216; 5, 784]
conter o verdadeiro valor de μ. Mas é certo dizer que com probabilidade 0,95 o intervalo

contém μ. Note a variável aleatória X no limite do intervalo.

Exemplo 1: Em determinada população, o peso dos homens adultos é distribuído normalmente


com um desvio padrão de 16 kg. Uma amostra aleatória simples de 36 homens adultos é sorteada desta
população, obtendo-se um peso médio de 78,2 kg. Construa um intervalo de confiança de nível de
confiança 0,95 para o peso médio de todos os homens adultos dessa população.

Solução

Vamos inicialmente determinar o valor crítico associado ao nível de confiança de 0,95.

Como 1 − α = 0, 95, resulta que α = 0, 05 e α/2 = 0, 025.

Analisando a Figura anterior, vemos que nas duas caudas da distribuição normal padrão tem que ter 5%
da área (α = 0, 05); logo, em cada cauda temos que ter 2,5% (α/2 = 0, 025) da área total. Em termos da
nossa tabela da distribuição normal padrão (apresentada ao final da módulo como Tabela distribuição
normal), isso significa que entre 0 e z0,025 temos que ter (50 − 2, 5)% = 47,5% e, assim, temos que
procurar no corpo da tabela o valor de 0,475 para determinar a abcissa z0,025. Veja a Figura seguinte.

Procurando no corpo da tabela da distribuição normal padrão, vemos que o valor 0,475 corresponde à
abcissa z0,025 = 1, 96. Logo, nosso intervalo de confiança é
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 103

Esse intervalo contém ou não o verdadeiro valor de μ, mas o procedimento utilizado para sua obtenção
nos garante que há 95% de chance de estarmos certos.

Valor crítico associado ao nível de confiança 1 − α = 0, 95

Exemplo 2:

De uma população normal co-variância 25 extrai-se uma amostra aleatória simples de tamanho n com o
objectivo de se estimar a média populacional μ com um nível de confiança de 90% e margem de erro de
2. Qual deve ser o tamanho da amostra?

Solução

Para um nível de confiança 0,90, o valor do nível de significância é α = 0, 10. Então, na cauda superior
da distribuição normal padrão temos que ter uma área (probabilidade) de 0,05 e, portanto, para
encontrarmos o valor de z0,05 temos que procurar no corpo da tabela o valor 0,45. Resulta que z0,05 = 1,
64.

Com todos os dados disponíveis temos:


PROBABILIDADE E ESTATÍSTICA -3º Ano

Já que o valor de n tem que ser um inteiro, devemos arredondar por excesso para garantir um nível de
confiança no mínimo igual ao desejado. Neste caso, a estimativa apropriada é n = 17.

Exemplo 3:

Na divulgação dos resultados de uma pesquisa, publicou-se o seguinte texto (dados fictícios): “Com o
objectivo de se estimar a média de uma população, estudou-se uma amostra de tamanho n = 45. De
estudos anteriores, sabe-se que essa população é muito bem aproximada por uma distribuição normal
com desvio padrão 3, mas acredita-se que a média tenha mudado desde esse último estudo. Com os
dados amostrais obteve-se o intervalo de confiança [1, 79; 3, 01], com uma margem de erro de 0,61.”
Quais são as informações importantes que não foram divulgadas? Como podemos obtê-las?

Solução

Quando se divulga um intervalo de confiança para um certo parâmetro, é costume publicar também a
estimativa pontual. Nesse caso, temos que informar a média amostral, que pode ser achada observando

que o intervalo de confiança é simétrico em torno da média. Logo, é o ponto médio do intervalo:

Outra informação importante é o nível de confiança que pode ser calculado a partir da abcissa

Consultando a tabela da distribuição normal, encontramos que se zα/2 = 1,36, então 1 – α = 2x0,41308 =
0,82616 ≈ 0,83 que é o nível de confiança.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 105

Reflecte sobre a seguinte afirmação: mantidos o mesmo desvio padrão


populacional e o mesmo nível de confiança, quanto maior o tamanho da amostra, mais
perto vamos ficando da população e, assim, vai diminuindo a nossa margem de erro

1. De uma população N(μ; 9) extrai-se uma amostra aleatória simples de tamanho 25, obtendo-se

. Desenvolva detalhadamente o intervalo de confiança de nível de confiança 99% para a


média da população.

2. Determine o tamanho da amostra necessário para se estimar a média de uma população normal com σ
= 4, 2 para que, com confiança de 95%, o erro máximo de estimação seja ±0, 05.

3. O peso X de um certo artigo é descrito aproximadamente por uma distribuição normal com σ = 0, 58.

Uma amostra de tamanho n = 25 resultou em = 2, 8.

Desenvolva detalhadamente o intervalo de confiança de nível de confiança 0, 90.


PROBABILIDADE E ESTATÍSTICA -3º Ano

4. De uma população normal com σ = 5, retira-se uma amostra aleatória simples de tamanho 50,

obtendo-se = 42.

(a) Obtenha o intervalo de confiança para a média com nível de significância de 5%.

(b) Qual é o erro de estimação?

(c) Para que o erro seja ≤ 1, com probabilidade de acerto de 95%, qual deverá ser o tamanho da
amostra?

5. Os valores da venda mensal de determinado artigo têm distribuição aproximadamente normal com
desvio padrão de R$500,00. O gerente da loja afirma vender, em média, R$34.700,00. O dono da loja,
querendo verificar a veracidade de tal afirmativa, selecciona uma amostra aleatória das vendas em
determinado mês, obtendo os seguintes valores:

33840,00 32960,00 41815,00 35060,00 35050,00

32940,00 32115,00 32740,00 33590,00 33010,00

(a) Obtenha o intervalo de confiança para a venda média mensal com nível de significância de 5%.

(b) Obtenha o intervalo de confiança para a venda média mensal com nível de significância de 1%.

(c) Em qual dos dois níveis de significância podemos afirmar que o gerente se baseou para fazer a
afirmativa?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 107

Unidade 15

Intervalos de Confiança

Introdução
Nesta unidade completarás teu estudo básico sobre intervalos de confiança para a
média de uma população, analisando o problema de estimação da média de uma
população normal quando não se conhece a variância desta população. Verás que, neste
caso, é necessário estimar essa variância e isso introduz mais uma fonte de
variabilidade nas nossas estimativas: com uma única amostra, temos que estimar a
média e a variância da população. O procedimento é simples e análogo ao caso
anteriormente visto; o que muda é a distribuição amostral do estimador . Em vez de
usarmos a distribuição normal para determinar os valores críticos, usaremos a
distribuição t de Student.
Veremos, então, os seguintes conceitos:
 Estimação da variância de uma população;
 Distribuição amostral da média amostral de uma população normal com
variância desconhecida;
 Intervalo de confiança para a média de uma população normal com variância
desconhecida;

No fim desta unidade deves ser capaz de:

Determinar o intervalo de confiaça: Média da N(μ; σ2), com σ2


Objectivos Desconhecida;
PROBABILIDADE E ESTATÍSTICA -3º Ano

15.1.0. Intervalo de Confiança: Média da N(μ; σ2) com σ2 desconhecida


15.1.1. Ideias básicas

Consideremos uma população normal com média μ e variância σ2 : X ~ N (μ; σ2 ). Nosso interesse é
estimar a média μ a partir de uma amostra aleatória simples X1, X2, . . . , Xn. Como vimos

anteriormente, a distribuição amostral de é normal com média μ e variância ou seja,

Assim se o valor do desvio padrão populacional é conhecido resulta que

E com este resultado foi construido o seguinte intervalo de confiança para a média populacional

Uma vez que não conhecemos a variância σ2, temos que estimá-la com os dados amostrais. Um
estimador não viciado de σ2 é S2 . Isso significa que, se calculássemos o valor de S2 para cada uma das
possíveis amostras aleatórias simples de tamanho n, a média desses valores seria igual a σ2. Dessa
forma, S2 é um “bom” estimador de σ2 e podemos usá-lo como uma estimativa pontual de σ2. Como o
desvio padrão é a raiz quadrada da variância, é natural perguntar: S é um “bom” estimador de σ, ou
seja, S é um estimador não-enviesado ou não viciado de σ? A resposta é NÃO, mas, para grandes
amostras, o viés é pequeno, de modo que, em geral, usa-se S como estimador de σ.

Sendo assim, é natural pensarmos em substituir o valor de σ por S na expressão

e utilizarmos a estatística
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 109

na construção de intervalos de confiança para μ. Isso é exactamente o que faremos, mas, ao


introduzirmos S no lugar de σ, a distribuição amostral de T deixa de ser normal e passa a ser uma
distribuição t de Student.

A distribuição t de Student (ou simplesmente distribuição t) foi obtida por William Gosset (1876-1937),
que trabalhava na Cervejaria Guinness na Irlanda. Como a cervejaria não permitia a publicação de
resultados de pesquisa obtidos por seus funcionários, Gosset publicou, sob o pseudônimo de Student, o
artigo “The Probable Error of a Mean” na revista Biometrika (vol. 6, no. 1).

Teorema: Se X1, X2, . . . , Xn é uma amostra aleatória simples de uma população X ~ N (μ; σ2) , então

Em t(n-1), o número de graus de liberdade gl = n − 1 resulta do fato de que, na soma que define S2, há

apenas n −1 parcelas independentes, ou seja, dados S2 e n −1 das parcelas , a n−ésima


parcela fica automaticamente determinada.

Usando a simetria da densidade t, temos o seguinte resultado:

Com este resultado obtemos:


PROBABILIDADE E ESTATÍSTICA -3º Ano

E, portanto, teremos o seguinte intervalo de confiança para a média populacional com a variância
(populacional) desconhecida

Exemplo 1:

De uma população normal com média e variância desconhecidas, extrai-se uma amostra de tamanho 15

obtendo-se Obtenha um intervalo de confiança (IC) para a verdadeira média


populacional, utilizando o nível de confiança de 95%.

Solução

A população é normal e a amostra é pequena. Dessa forma, temos que usar a distribuição t com n − 1 =
14 graus de liberdade. Como o nível de confiança é de 95%, em cada cauda da distribuição temos que
ter 2,5%. Assim, devemos procurar a abcissa t14;0,025 procurando na linha correspondente a 14 graus de
liberdade e na coluna correspondente (na tabela de t de student) à área de 0,025.

Encontramos

,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 111

A margem de erro é

E o intervalo de confiança é

Exemplo 2:

A seguinte amostra foi extraída de uma população normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa o
intervalo de confiança para a média populacional, com nível de significância

de 10%.

Solução

Como antes, temos uma amostra pequena de uma população normal; logo, temos que usar a distribuição
t-Student. Como n = 9, gl = n −1 = 8.

A média amostral é

E a variância amostral é
PROBABILIDADE E ESTATÍSTICA -3º Ano

Completa a resolução do exemplo 2

15.3.0. Intervalo de Confiança da média populacional para amostras


grandes

Vimos que, para populações normais, a distribuição exacta da estatística

é t(n − 1). Mas também quando o número de graus de liberdade é grande, as diferenças entre as
distribuições t e N(0; 1) tornam-se desprezíveis.

Por outro lado, o teorema de limite central nos diz que se a população não é normal, mas tem média μ e

variância σ2, a distribuição de se aproxima de uma normal N(0; 1) à medida que n → ∞.


Pode-se mostrar que esse resultado continua valendo se substituímos σ por seu estimador S.

A conclusão dessas duas observações é a seguinte:

Dada uma amostra aleatória simples X1, X2, . . . , Xn de uma população X com média μ e variância σ2,
então

para n suficientemente grande. Nesse caso, o intervalo de confiança aproximado de nível de confiança 1
− α para μ é
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 113

15.4.0. Intervalo de confiança para a proporção populacional


O procedimento de construção do intervalo de confiança para a proporção populacional é totalmente
análogo ao do intervalo de confiança para a média de uma população normal com variância conhecida,
visto anteriormente. Assim, iremos usar a mesma notação, a saber: vamos representar por zα a abcissa
da curva normal padrão que deixa probabilidade (área) α acima dela. Como foi visto, temos o seguinte
resultado, onde Z ~ N(0; 1) :

Donde teremos

E, portanto,

E, finalmente chegamos ao seguinte intervalo de confiança para a proporção:

Exemplo:
PROBABILIDADE E ESTATÍSTICA -3º Ano

Um gerente de produção deseja estimar a proporção de peças defeituosas em uma de suas linhas de
produção. Para isso, ele selecciona uma amostra aleatória simples de 100 peças dessa linha de
produção, obtendo 30 defeituosas. Determine o intervalo de confiança para a verdadeira proporção de
peças defeituosas nessa linha de produção, a um nível de significância de 5%.

Solução

O primeiro facto a observar é que a amostra é grande, o que nos permite usar a aproximação normal.
Com um nível de significância de α = 0, 05, o nível de confiança é 1 − α = 0, 95 e da tabela da normal
padrão, obtemos que zα/2 = 1, 96. Assim, a margem de erro é

e o intervalo de confiança é

[0, 30 − 0, 0898; 0, 30 + 0, 0898] = [0, 2102; 0, 3898]

Exemplo 2:

Para estudar a viabilidade de lançamento de um novo produto no mercado, o gerente de uma grande
empresa contrata uma firma de consultoria estatística para estudar a aceitação do produto entre os
clientes potenciais. O gerente deseja obter uma estimativa com um erro máximo de 1% com
probabilidade 80% e pede ao consultor estatístico que forneça o tamanho de amostra necessário.

a). De posse das informações dadas, o consultor calcula o tamanho da amostra necessário no pior
cenário. O que significa “pior cenário” nesse caso? Qual o tamanho de amostra obtido pelo consultor?

b). O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a realizar um estudo
piloto com uma amostra de 100 pessoas para obter uma estimativa da verdadeira proporção. O resultado
desse estudo piloto é uma estimativa po = 0, 76 de aceitação do novo produto. Com base nessa
estimativa, o consultor recalcula o tamanho da amostra necessário. Qual é esse tamanho?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 115

c). Seleccionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporção de 72% de
clientes favoráveis ao produto. Construa um intervalo de confiança para a verdadeira proporção com
nível de confiança de 90%.

Solução

a). O pior cenário é quando a população está dividida meio-a-meio em suas preferências,

ou seja, quando p = 0, 5. Com nível de confiança de 80%, obtemos z0,10 = 1, 28. Nesse caso,

b). Vamos, para este caso, utilizar po = 0,76

ou seja, n = 2989

c). 1 − α = 0, 90 =⇒ z0,05 = 1, 64

e o intervalo de confiança é

[0, 72 − 0, 0135; 0, 72 + 0, 0135] = [0, 7065; 0, 7335]


PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 16

Intervalos de Confiança

Introdução
Nesta unidade terás a oportunidade de aprender Nesta secção irás completar o estudo
básico sobre intervalos de confiança, analisando o problema de estimação da variância
de uma população normal. Como antes, este intervalo se baseará na distribuição
amostal de um estimador não enviesado para σ2, a saber, S2. Como a variância é um
número não negativo, essa distribuição não é simétrica e está definida apenas para
valores não-negativos.

No fim desta unidade deves ser capaz de:

Estimar a variância de uma população;


Objectivos
Determinar o Intervalo de confiança para a variância de uma
população normal.

16.1.0. Intervalo de Confiança: Variância da N (μ; σ2)

16.1.1. Conceitos básicos:

• Estimação da variância de uma população

• Intervalo de confiança para a variância de uma população normal

16.1.2. Ideias básicas

O contexto subjacente é o seguinte: a partir de uma amostra aleatória simples X1, X2, . . . , Xn retirada
de uma população normal com média μ e variância σ2 queremos construir um intervalo de confiança
para σ2. A hipótese de normalidade da população é fundamental aqui. Assim como no caso da média,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 117

temos que usar a distribuição amostral de algum estimador. Neste caso, o estimador é S2 e o resultado
importante é o seguinte:

tem distribuição qui-quadrado com n-1 graus de liberdade, isto é,

Como no caso da distribuição t−Student, vamos definir o valor crítico como a abscissa da
distribuição qui-quadrado com n graus de liberdade que deixa probabilidade α acima dela. Veja a
Figura a seguir.

Valor crítico da distribuição qui-quadrado com n graus de liberdade

Tal como podes ver nas duas figuras (a e b) seguintes, a abcissa deixa probabilidade α/2 acima

dela e a abcissa deixa probabilidade α/2 abaixo dela. Logo,

donde vem

E o intevalo de confiança para a variância populacional a nível de confiança de 1 – α é


PROBABILIDADE E ESTATÍSTICA -3º Ano

Valores críticos da distribuição qui-quadrado para construção de intervalos de confiança

Exemplo 1:

De uma população normal com média e variância desconhecidas, extraísse uma amostra de tamanho 15

obtendo-se . Obtenha um intervalo de confiança para a variância populacional,


utilizando o nível de confiança de 95%.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 119

Solução

O requisito para o IC para σ2 é satisfeito, uma vez que a população é normal. Temos que usar a
distribuição χ2 com n −1 = 14 graus de liberdade. Como o nível de confiança é de 95%, em cada cauda
da distribuição temos que ter 2,5%. Assim, para a cauda superior, devemos procurar a abcissa

procurando na linha correspondente a 14 graus de liberdade e na coluna correspondente à

área de 0,025. Encontramos

Para a cauda inferior, devemos procurar a abcissa procurando na linha correspondente a 14

graus de liberdade e na coluna correspondente à área de 0,975. Encontramos

E o intervalo de confiança é

Exemplo 2:

A seguinte amostra foi extraída de uma população normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.

Construa o intervalo de confiança para a variância populacional, com nível de significância

de 10%.

Solução

Temos uma amostra de uma população normal; logo, podemos usar a distribuição χ2. Como n = 9, gl =
n − 1 = 8.

A média amostral é

E a variância amostral é
PROBABILIDADE E ESTATÍSTICA -3º Ano

Como o nível de significância é α = 10%, o nível de confiança é 1 − α = 90%. Em cauda da distribuição


χ28 temos que ter área igual a 5%. Assim, temos que procurar na linha correspondente a 8 graus de
liberdade as abcissas relativas à área superior de 0,05 e de 0,95. Obtemos χ28;0,05 = 15, 507 e χ28;0,95 = 2,
733. Assim, o intervalo de confiança é
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 121

Unidade 17

Testes de Hipóteses

Introdução
Nesta unidade terás a oportunidade de aprender Intervalo de Confiança: Diferença de
médias;

No fim desta unidade deves ser capaz de:

Determinar os intervalos de confiança para diferença de médias.


Objectivos

17.1.0. Intervalo de Confiança: Diferença de médias

A construção de intervalos de confiança para a diferença de médias faz-se de forma análoga a que foi
usada para os casos anteriores. Suponhamos que temos duas populações normais (ou aproximadamente

normais) das quais se tem ~ N (μ1; σ12 /n) e ~ N (μ2; σ22/m). A variável - também terá
distribuição normal com média μ1 - μ2 e variância

Neste caso, o intervalo de confiança vai ser:

Onde n é o tamanho da amostra da qual se obtem , m é o tamanho da amostra da qual se obtem .

É preciso salientar que neste caso supomos que as variâncias das duas populações são conhecidas.
PROBABILIDADE E ESTATÍSTICA -3º Ano

No caso (mais realista) em que as variâncias populacionais são desconhecidas e sabemos que são iguais,
então é preciso estimar a variância comum. Deste modo teremos o seguinte intervalo de confiança:

Em que, neste caso, a variável diferença de médias tem distribuição t com n+m-2 graus de liberdade e
Sc2 é a estimativa da variância comum.

Se as duas variâncias populacionais são desconhecidas e distintas então calcula-se com base nas
amostras as estimativas S12 e S22 e constrói-se o seguinte intervalo:

Onde o k indica o número de graus de liberdade.


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 123

Com base nos conteúdos abordados até este momento, deduz os intervalos de
confiança para os seguintes casos:
a) Quociente de variâncias
b) Diferença de proporções

Usa os resultados apresentados no quadro resumo a seguir

Tabela resumo de intervalos de confiança


Tipo de problema Intervalo de confiança

Média μ, com variância σ2


conhecida

Media μ, com variância σ2


desconhecida

Diferença de medias μ1- μ2 com


variâncias σ12 e σ22 conhecidas

Diferença de medias μ1- μ2 com


variâncias σ12 e σ22
desconhecidas e iguais
PROBABILIDADE E ESTATÍSTICA -3º Ano

Diferença de médias μ1- μ2 com


variâncias σ12 e σ22
desconhecidas e distintas

Variância σ2

Quociente de variâncias σ12/σ22

Proporção p

Diferença de proporções p1- p2


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 125

1. Para uma população de usuários de uma biblioteca que utilizam os computadores disponíveis se
deseja estimar o tempo médio de utilização. Para tal recolhe-se uma amostra aleatória de 38 usuários, da
qual foram obtidos os seguintes dados: tempo médio 3,20 minutos e variância amostral de 0,24.
Aceitando-se que o tempo de utilização se ajusta a uma distribuição normal pede-se:

a) A estimação pontual do tempo médio de utilização dos computadores.

b) A estimação deste parâmetro por intervalo de confiança de 95% e 99% de confiança, comparando a
precisão de ambos.

c) Qual será o máximo erro a cometer na estimação se a amostra é de n = 50 usuários, ao nível de


confiança de 95%?

2. Se deseja estimar a percentagem de famílias de uma grande cidade, que têm conexão de Intenet em
casa. Para isso foi recolhida uma amostra aleatória simples de tamanho n = 170 casas e verificou-se que
97 dessas têm Internet. Pede-se:

a) A estimação pontual da percentagem de casas com Internet em toda Cidade.

b) A um nível de 90% de confiança, a estimação dessa percentagem com base em intervalo de


confiança.

3. Uma amostra aleatória extraída de uma população normal de variância igual a 100, apresenta uma

média amostral = 160.

Com n = 144 :

a) Calcular um intervalo de confiança de 95% para a média populacional.

b) Calcular um intervalo de confiança de 90% para a média populacional.

c) Se se quiser ter uma confiança de 95% de que a sua estimação se encontra a uma distância 1.2 cm
mais ou menos da verdadeira média populacional, quantas observações adicionais devem tomar-se?
PROBABILIDADE E ESTATÍSTICA -3º Ano

4. Uma central de transformação de produtos lácteos recebe diariamente leite dos fornecedores A e B.
Desejando-se estudar a qualidade do produto recebido, extraem duas amostras ao acaso e analisa-se os
conteúdos em matéria de gorduras, obtendo-se os seguintes dados:

Fornecedor A:

Fornecedor B:

Constrói um intervalo de confiança de 95% da diferença de conteúdo médio de gorduras no leite dos
dois fornecedores, supondo que as populações são normais.

5. A resistência à fractura de determinado tipo de vidro segue uma distribuição normal de média 14 e
desvio padrão 2.

a) Qual é a probabilidade de que a resistência média de peças desse vidro seja maior que 14.5?.

b) Determinar um intervalo que abarque à resistência média a fractura de 100 amostras de vidrio com
uma probabilidade de 0.95.

6. Os tempos gastos por quinze funcionários em uma das tarefas de um programa de treinamento
estão listados abaixo. É razoável supor, nesse caso, que essa seja uma amostra aleatória simples de
uma população normal, ou seja, é razoável supor que a população de todos os tempos de funcionários
submetidos a esse treinamento seja aproximadamente normal. Obtenha o intervalo de confiança de
nível de confiança de 95% para o tempo médio populacional.

52 44 55 44 45 59 50 54 62 46 54 58 60 62 63

7. Uma amostra aleatória simples de uma população normal apresenta as seguintes características:

n = 25, e S2 = 900

Construa um intervalo de confiança de nível de confiança de 98% para a média da população.


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 127

8. Em uma fábrica, uma amostra de 30 parafusos apresentou os seguintes diâmetros (em mm):

10 13 14 11 13 14 11 13 14 15

12 14 15 13 14 12 12 11 15 16

13 15 14 14 15 15 16 12 10 15

Supondo que os diâmetros sejam aproximadamente normais, obtenha um intervalo de confiança para
o diâmetro médio de todos os parafusos produzidos nessa fábrica, usando o nível de significância de
2%. Para facilitar a solução do exercício, você pode usar os seguintes resultados:

9. Repita o exercício anterior com os seguintes dados de uma amostra de 100 parafusos:

10. As estaturas de 1 000 estudantes da UCM representam uma amostra ao acaso das estaturas dos
estudantes da universidade, sendo a estatura média amostral igual a 165 cm e a variância amostral 400
cm2. Supondo que as alturas seguem a distribuição normal, determinar:

a) Um estimador não enviesado da verdadeira estatura média dos estudantes.

b) O intervalo de confiança a 99% de confiança, para a verdadeira estatura média dos estudantes.

11. Uma inspecção cuidadosa de 70 suportes de concorre que serão usados numa construção revelou
que 28 têm defeito. Estimar a verdadeira proporção de suportes defeituosos com um intervalo de
confiança de 98%.

12. Um grande consórcio formado por várias companhias instituíu uma nova política de inspecção para
controlar a qualidade. Entre 30 operários seleccionados na companhia A, somente 5 objectaram a nova
política. Entre 35 operários seleccionados na companhia B, 10 objectaram a nova política. Estimar a
PROBABILIDADE E ESTATÍSTICA -3º Ano

verdadeira diferença entre as proporções de trabalhadores que não objectaram a nova política para as
duas companhias, com um coeficiente de confiança igual a 0.98.

13. Calcular o tamanho de amostra necessário para que o intervalo contenha o


parámetro μ, média populacional com uma probabilidade de 0.95 se funcionamos com uma distribuição
N(μ; 45).

14. O departamento de zoologia de um Instituto Politécnico levou a cabo um estudo para estimar a
diferença em cantidade de ortofósforo químico medido em duas estações diferentes. Foram recolhidas
15 amostras da estação 1 e 12 amostras da estação 2. As 15 amostras da estação 1 tiveram um conteúdo
médio de ortofósforo de 3.84mg. por litro, com um desvio típico (padrão) de 3.07mg. por litro,
enquanto que as 12 amostras da estação 2 tiveram uma média de 1.49mg. por litro, com um desvio
padrão de 0.8mg. por litro. Encontrar um intervalo de confiança de 98% para o quociente de variâncias
como forma de estudar se as variâncias são ou não iguais. Supõe populações normais.

15. Calcular um intervalo de confiança ao nível de α = 0,05 para a probabilidade p de que um recém
nascido seja rapaz se em uma amostra de tamanho 123 verificou-se que 67 eram rapazes.

16. As pontuações em um teste de raciocínio abstracto seguem uma distribuição Normal de média 35 e
variância 60. Para avaliar um programa de melhoramento das capacidades intelectuais, a 101 indivíduos
que estão realizando este programa é aplicado o teste, obtendo-se uma média de 50 pontos e uma
variância de 80.

Podemos assegurar, a um nível de confiança de 90% que o programa incrementa as diferencias


individuais nesta variável?

17. Uma amostra de 300 habitantes de uma grande cidade revelou que 180 desejavam a fluoração da
água. Encontre o intervalo de confiança para a verdadeira proporção dos que não desejam a fluoração
da água para:

(a) um nível de significância de 5%;


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 129

(b) um nível de confiança de 96%.

18. Querendo estimar a proporção de peças defeituosas em uma linha de produção, examinou-se uma

amostra de 100 peças, encontrando-se 32 defeituosas. Sabe-se que o estimador para esse
tamanho de amostra tem desvio padrão de 3%.

Calcule o intervalo de confiança ao nível de significância de 3%.

19. Em uma pesquisa de mercado, 57 das 150 pessoas entrevistadas afirmaram que comprariam
determinado produto sendo lançado por uma empresa. Essa amostra é suficiente para se estimar a
verdadeira proporção de futuros compradores, com uma precisão de 0,08 e uma confiança de 90%?
Em caso negativo, calcule o tamanho de amostra necessário.

20. Uma amostra aleatória simples de 400 itens forneceu 100 itens correspondentes ao evento
Sucesso.

(a) Qual é a estimativa pontual para a verdadeira proporção de Sucessos na população?

(b) Qual é o erro padrão estimado de ?

(c) Calcule o intervalo de confiança para a verdadeira proporção de Sucessos na população ao nível de
confiança de 80%.

21. Em uma sondagem, uma estimativa preliminar de “Sucessos” em uma população é de 0,35. Que
tamanho deve ter uma amostra para fornecer um intervalo de confiança de 95% com uma margem de
erro de 0,05?
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 18

Testes de Hipóteses

Introdução
Nesta unidade terás a oportunidade de aprender Região crítica e nível de significância; Testes de
Hipóteses; Estatística de teste, erros e regra de decisão.

No fim desta unidade deves ser capaz de:

Estimar parâmetros de uma população, dentro de um certo intervalo de


Objectivos confiança.

18.2.0. Testes de Hipóteses


Na teoria de estimação, vimos que é possível, através de estatísticas amostrais adequadas,
estimar parâmetros de uma população, dentro de um certo intervalo de confiança.

Nos testes de hipóteses, ao invés de se construir um intervalo de confiança no qual se espera


que o parâmetro da população esteja contido, testa-se a validade de uma afirmação sobre um
parâmetro da população.

18.3.0. Conceitos importantes


• Hipótese nula e hipótese alternativa

• Erro do tipo I e erro do tipo II

• Estatística de teste
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 131

• Regra de decisão

• Região crítica

• Função característica de operação

• Poder do teste

18.4.0. Noções básicas


Vamos trabalhar com alguns exemplos para ilustrar os conceitos básicos que precisamos para
construir testes de hipóteses estatísticos.

Exemplo 1

Um detective de polícia é encarregado da investigação de um crime. Baseado nas evidências


encontradas, o detective suspeita inicialmente do mordomo e precisa decidir, então, se prende
ou liberta o mordomo. Por outro lado, o mordomo pode ser culpado ou inocente.

Assim, há 4 possibilidades que podem ocorrer quando o detective tomar sua decisão:

• Prender o mordomo, quando, na verdade, o mordomo é o assassino −→ decisão correcta

• Prender o mordomo, quando, na verdade, o mordomo é inocente −→ decisão errada

• Libertar o mordomo, quando, na verdade, o mordomo é o assassino −→ decisão errada

• Libertar o mordomo, quando, na verdade, o mordomo é inocente −→ decisão correcta

Se o problema do detective fosse de origem estatística, a primeira providência que ele teria que
tomar seria formular uma hipótese nula, que é uma afirmação sobre um parâmetro da
população. A hipótese nula, normalmente designada por H0, é uma afirmação que é
estabelecida com o objectivo de ser testada; ela pode ser rejeitada ou não. Normalmente, a
hipótese nula é formulada de tal forma que o objectivo é rejeitá-la.

No exemplo, como o detective suspeito do mordomo, a formulação mais adequada é

H0 : mordomo é inocente
PROBABILIDADE E ESTATÍSTICA -3º Ano

Se as evidências são suficientes para se rejeitar a hipótese nula, então aceita-se a hipótese
alternativa, normalmente designada por H1, que será aceite se a hipótese nula for rejeitada. No
exemplo, como só existem 2 possibilidades, temos que

H1 : mordomo é culpado

Observa que o método é aplicado para se testar a hipótese nula. A hipótese alternativa será
aceita se e somente se a hipótese nula for rejeitada, ou seja, a estratégia é tomar uma decisão
com relação à hipótese nula.

Depois de examinar todas as evidências, o detective deve rejeitar H0 (e concluir que o


mordomo é culpado) ou não rejeitar H0 (e concluir que o mordomo é inocente). Nota que as
conclusões são sempre estabelecidas em termos da hipótese nula. Como já foi visto, o detective
pode cometer dois tipos de erro:

• Erro do tipo I: rejeitar a hipótese nula quando é verdadeira;

• Erro do tipo II: não rejeitar a hipótese nula quando é falsa.

Na tabela seguinte estão ilustradas as situações de decisão:

Possibilidades para a decisão

Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hipótese nula. No
exemplo, isso significa que o detective nunca cometeria o erro de condenar um homem
inocente. De forma análoga, o erro tipo II pode ser evitado se sempre rejeitarmos a hipótese
nula e, no exemplo, o detective nunca libertaria um assassino.

A teoria estatística de testes de hipóteses trata de regras de decisão, baseadas em


probabilidades, que tentam balancear esses dois tipos de erro.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 133

Exemplo 2

Uma empresa compra anéis de vedação de dois fabricantes. Segundo informações dos
fabricantes, os anéis do fabricante 1 têm diâmetro médio de 14 cm com desvio padrão de 1,2
cm e os anéis do fabricante 2 têm diâmetro médio de 15 cm com desvio padrão de 2,0 cm.
Ambos os processos de produção geram anéis com diâmetros cuja distribuição é
aproximadamente normal.

Uma caixa com 16 anéis sem identificação é encontrada pelo gerente da empresa.

Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer uma medição dos
anéis e basear sua decisão no diâmetro médio da amostra: se o diâmetro médio for maior que
14,5 cm, ele identificará a caixa como oriunda do fabricante 2; caso contrário, ele identificará a
caixa como oriunda do fabricante 1.

Esse é um problema típico de decisão empresarial. Vamos analisar esse processo decisório sob
o ponto de vista estatístico, estudando os possíveis erros e suas probabilidades de ocorrência.

Uma primeira observação é que existem apenas duas possibilidades para a origem dos anéis de
vedação. Como ele suspeita que a caixa venha do fabricante 1, vamos estabelecer a hipótese
nula de forma que o resultado desejado seja rejeitá-la. Definimos, então, a hipótese nula como
sendo

H0 : anéis vêm do fabricante 2 e, obviamente, a hipótese alternativa será

H1 : anéis vêm do fabricante 1

Se denotamos por X a variável aleatória que representa o diâmetro dos anéis, essas hipóteses se
traduzem como

H0 : X ~ N(15; 22)

H1 : X ~ N(14; 1, 22)

A regra de decisão do gerente é baseada na média amostral observada para os 16 anéis


encontrados. Como dito, nossa decisão deve ser expressa sempre em termos de H0.

Logo, a regra de decisão é


PROBABILIDADE E ESTATÍSTICA -3º Ano

Os erros associados a essa regra de decisão são:

Erro I: rejeitar H0 quando H0 é verdadeira

Erro II: não rejeitar H0 quando H0 é falsa

As probabilidades associadas aos erros podem ser expressas em termos de probabilidade


condicional:

Calculemos essas probabilidades. Em geral, a probabilidade do erro do tipo I é denotada por α


e a probabilidade do erro do tipo II por β. Assim,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 135

A decisão do gerente tem que ser tomada em função do resultado amostral observado; assim,

usamos a notação Lembre-se que usamos letras minúsculas para representar o valor
observado de uma variável aleatória. Quando falamos da probabilidade do erro ou mesmo da
regra de decisão em termos gerais, estamos considerando o procedimento decisório geral.
Como esse procedimento depende da amostra sorteada, temos que expressar as probabilidades
dos erros e a regra de decisão levando em conta as possíveis amostras, ou seja, temos que levar
em conta a variável aleatória que descreve a média amostral de uma possível amostra
aleatória simples de tamanho n.

No exemplo, a regra de decisão geral é: se o gerente classifica como produção


do fabricante 2. Assim, se a caixa em questão tiver uma média de, por exemplo, 14,4 o gerente
classificará a caixa como produzida pelo fabricante 1.

18.5.0. Conceitos básicos


O contexto em que se baseia a teoria de teste de hipótese é basicamente o mesmo da teoria de
estimação por intervalo de confiança. Temos uma população representada por uma variável
aleatória X cuja distribuição de probabilidade depende de algum parâmetro θ. O interesse agora
está em testar a veracidade de alguma afirmação sobre θ.

Hipótese nula

A hipótese nula, representada por H0, é a hipótese básica que queremos testar. Em geral,
definimos a hipótese nula de modo que o nosso objetivo seja rejeitar H0. Nesse texto
consideraremos apenas hipóteses nulas simples, isto é, hipóteses que estabelecem que o
parâmetro de interesse é igual a um determinado valor. A forma geral é

H0 : θ = θ0

Alguns exemplos são:

H0 : μ = 6 H0 : p = 0, 5 H0 : σ2 = 25
PROBABILIDADE E ESTATÍSTICA -3º Ano

O procedimento de teste de hipótese resultará em uma regra de decisão que nos permitirá
rejeitar ou não rejeitar H0.

Hipótese alternativa

A hipótese alternativa, representada por H1, é a hipótese que devemos considerar no caso de
rejeição da hipótese nula. A forma mais geral de H1 é a hipótese bilateral

Em algumas situações, podemos ter informação que nos permita restringir o domínio da
hipótese alternativa. Por exemplo, se uma empresa farmacêutica está testando um novo
medicamento para enxaqueca no intuito de reduzir o tempo entre a ingestão do medicamento e
o alívio dos sintomas, uma possível hipótese alternativa seria

Temos, então, hipóteses unilaterais à esquerda

e hipóteses unilaterais à direita:

A escolha entre essas formas de hipótese alternativa se faz com base no conhecimento sobre o
problema sendo considerado.

A escolha entre essas formas de hipótese alternativa se faz com base no conhecimento sobre o
problema sendo considerado.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 137

18.6.0. Estatística de teste, erros e regra de decisão


Assim como na construção dos intervalos de confiança, iremos usar uma estatística amostral
apropriada para construir o nosso teste de hipótese e nesse contexto, essa estatística é chamada

estatística de teste. As estatísticas de teste usuais são a média amostral e a proporção

amostral que serão usadas na construção de testes sobre a média e a proporção


populacionais, respectivamente.

O procedimento de decisão é definido em termos da hipótese nula H0 : as decisões possíveis


são (i) rejeitar ou (ii) não rejeitar H0. Existem duas possibilidades de erro:

Erro tipo I: rejeitar H0 quando H0 é verdadeira

Erro tipo II: não rejeitar H0 quando H0 é falsa

A decisão sobre a hipótese nula é tomada com base em uma regra que estabelece um conjunto
de valores, chamado região crítica ou região de rejeição, de modo que se, o valor observado da
estatística amostral cair nessa região, rejeitaremos H0; caso contrário, não rejeitaremos H0.
Vamos denotar por RC a região crítica.

Região crítica e nível de significância


Em geral, a definição da região crítica é feita da seguinte forma: RC é o conjunto de valores
cuja probabilidade de ocorrência é pequena sob a hipótese de veracidade de H0.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Unidade 19

Testes de Hipóteses

Introdução
Nesta unidade terás a oportunidade de aprender Teste de Hipótese: Média da N (μ; σ2) –
σ2 Conhecida; Hipóteses nula e alternativa; Estatística de teste; Nível de significância e
região crítica;

No fim desta unidade deves ser capaz de:

Resolver as tarefas apresentadas no módulo com base nos exemplos


Objectivos resolvidos.

19.1.0. Teste de Hipotese: Média da N (μ; σ2) – σ2 conhecida


Iremos aquí aplicar os conceitos básicos sobre a teoria de teste de hipótese a uma situação
específica. Nosso interesse estará concentrado na média de uma população normal. Assim
como no caso dos intervalos de confiança, iremos iniciar nossos estudos supondo que a
variância dessa população seja conhecida. Como já foi dito, essa situação não é muito comum
na prática, mas, em termos didáticos, a apresentação dos conceitos fica simplificada.
Entendendo bem a construção de um teste de hipótese para esse caso particular, a apresentação
para as outras situações é bastante semelhante, mudando apenas a distribuição amostral.

Vamos analisar inicialmente três exemplos que ilustrarão as diversas possibilidades que podem
surgir na prática.

Exemplo 1
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 139

Depois de uma pane geral no sistema de informação de uma empresa, o gerente administrativo

deseja saber se houve alteração no tempo de processamento de determinada atividade. Antes da


pane, o tempo de processamento podia ser aproximado por uma variável aleatória normal com
média de 100 minutos e desvio padrão de 10 minutos.

O gerente acredita que a pane não tenha alterado a variabilidade do processo. Uma amostra de
16 tempos de processamento após a pane revela uma média de 105,5 minutos. Ao nível de
significância de 5%, qual é a conclusão sobre a alteração do tempo médio de processamento?

19.2.0. Hipótese nulas e alternativa


O interesse do gerente é comparar os tempos antes e depois da pane. Antes da pane, o tempo
médio de processamento era de 100 minutos. Como ele não sabe o tipo de alteração que possa
ter ocorrido, ele precisa saber se o tempo médio depois da pane é diferente do tempo anterior.
Isso nos leva às seguintes hipóteses nula e alternativa:

19.3.0. Estatística de teste


Seja X a variável aleatória que representa o tempo de processamento. Então, pelos dados do
problema, temos que X ~ N(μ; 100). Antes da pane, μ = 100. Como a população é normal,
sabemos que a distribuição da média amostral também é normal e como não deve ter havido
alteração na variabilidade do processo, resulta que o desvio padrão é de 10 minutos em
qualquer situação. Logo,

Ou equivalente a
PROBABILIDADE E ESTATÍSTICA -3º Ano

19.4.0. Nível de significância e região crítica


Pelo enunciado do problema, o nível de significância é de 5%. Isso significa que a
probabilidade do erro tipo I é 0,05. Como foi visto, o erro do tipo I consiste em rejeitar a
hipótese nula quando ela é verdadeira. Logo,

α = Pr(rejeitar H0 | H0 verdadeira) = 0, 05

Quando H0 é verdadeira, a estatística de teste tem a seguinte distribuição:

Ou equivalente a

A nossa região crítica consiste nos valores de X com probabilidade pequena de ocorrerem sob

essa hipótese. Ou seja, a região crítica consiste nos valores de muito afastados da média
suposta de μ = 100. Como a hipótese alternativa é bilateral, “muito afastado” significa “muito
maior” ou “muito menor” do que μ = 100. Veja a Figura a seguir:

Região crítica para o teste bilateral de H0 : μ = 100


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 141

Para determinar a região crítica, basta encontrar o valor da constante K tal que

Exemplo 2

Na mesma situação do exemplo anterior, é bastante razoável supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Afinal, se o tempo
diminuir, isso significa que a tarefa vai ser executada mais rapidamente, o que representa um
ganho. Então, as duas possibilidades são:

μ ≤ 100 OK!

μ > 100 Problema!


PROBABILIDADE E ESTATÍSTICA -3º Ano

Para definir qual é a hipótese nula, vamos usar o seguinte procedimento. Como foi dito no
capítulo anterior, neste curso só trabalharemos com hipóteses nulas simples, isto é, hipóteses
nulas que envolvam igualdade do parâmetro a um determinado valor: θ = θ0.

Assim, em um teste unilateral, a hipótese alternativa deve ser aquela que não envolve o sinal de
igualdade. No nosso exemplo, essa é a hipótese μ > 100. A hipótese nula, tendo que ser uma
hipótese simples, passa a ser μ = 100, ou seja:

H0 : μ = 100

H1 : μ > 100

A estatística de teste continua sendo

O que muda é a região crítica, que agora passa a ser

Veja na figura seguinte, a região crítica

Região crítica para o teste de H0 : μ = 100 com alternativa unilateral à direita H1 : μ >
100
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 143

Como no exemplo anterior, temos que rejeitar a hipótese nula de que o tempo de
processamento não se alterou, já que o valor observado da estatística amostral está na região
crítica.

Exemplo 3

O dono de uma média empresa decide investigar a alegação de seus empregados de que o
salário médio na sua empresa é menor que o salário médio nacional. Para isso, ele analisa uma
amostra de 25 salários, obtendo uma média de 894,53 meticais. De informações obtidas junto
ao sindicato patronal, ele sabe que, em nível nacional, o salário médio é de 900 meticais, com
desvio padrão de 32 meticais. Supondo que seja razoável aproximar a distribuição dos salários
por uma distribuição normal com o mesmo desvio padrão nacional, vamos construir um teste
de hipótese apropriado, com um nível de significância de 10%.

O problema aqui consiste em decidir se os salários são menores ou não do que a média
nacional de 900 meticais, ou seja, as situações de interesse são

μ < 900

μ ≥ 900
PROBABILIDADE E ESTATÍSTICA -3º Ano

Como no exemplo anterior, a hipótese alternativa é aquela que não envolve o sinal de
igualdade. Logo, nossas hipóteses são:

H0 : μ = 900

H1 : μ < 900

e a estatística de teste é

A região crítica é

O valor da constante k é determinado pelo nível de significância:

Logo, a região crítica é


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 145

Unidade 20

Testes de Hipóteses

Introdução
Nesta unidade terás a oportunidade de aprender Teste de Hipótese: Proporções -
Amostra Grande;

No fim desta unidade deves ser capaz de:

Aplicar o Teste de Hipoteses: Proporções –Amostra Grande na


Objectivos resolução de divesos problemas.

20.1.0. Teste de Hipótese: Proporções - Amostra Grande

Vimos anteriorimente a construção de testes de hipóteses sobre a média de uma população


normal com variância σ2 conhecida. O procedimento baseou-se na distribuição amostral da
média amostral que, com as hipóteses de normalidade e conhecimento da variância

populacional, sabemos ser normal com a mesma média e variância . Agora iremos fazer uso
do Teorema Limite Central para construir testes de hipóteses sobre proporções com base em
amostras grandes. Vimos que, para amostras grandes, a distribuição amostral da proporção
amostral pode ser aproximada por uma distribuição normal e, assim, o procedimento de teste
de hipótese será idêntico ao estudado anteriormente.

20.2.0. Contexto básico


O contexto de interesse é o seguinte: temos uma população em que cada elemento é
classificado de acordo com a presença ou ausência de determinada característica. Em termos de
PROBABILIDADE E ESTATÍSTICA -3º Ano

variável aleatória, essa população é representada por uma variável aleatória de Bernoulli, isto
é:

Então, Pr(X = 1) = p, E(X) = p e V ar(X) = p(1 − p). O parâmetro p é também

a proporção de elementos da população que possuem a característica de interesse. Em geral,


esse parâmetro é desconhecido e queremos testar hipóteses feitas sobre seu possível valor.

Suponhamos, então, que dessa população seja extraída uma amostra aleatória simples X1, X2, .

. . , Xn com reposição. Vimos que a proporção de elementos na amostra que possuem a


característica de interesse, definida por

Como a proporção amostral é uma média de uma amostra aleatória simples de uma população
com distribuição de Bernoulli com parâmetro p, o Teorema Central do Limite nos diz, então,

que a distribuição de se aproxima de uma nornal com média p e variância . Como


foi visto, a aproximação deve ser feita se np ≥ 5 e n(1 − p) ≥ 5 e, em geral, essas condições são
satisfeitas se n ≥ 30.

Resumindo, temos o seguinte resultado:

Ou equivalentemente
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 147

Vamos ver, agora, como usar esse resultado para construir testes de hipóteses sobre a
verdadeira proporção populacional p.

A hipótese nula que consideraremos será uma hipótese simples:

H0 : p = p 0

As hipóteses alternativas possíveis são

Dado um nível de significância α, a região crítica é definida como o conjunto de valores da


estatística de teste que têm probabilidade pequena de ocorrerem sob a veracidade da hipótese
nula. Assim, a região crítica é definida como o conjunto de valores de

A nossa intenção até este momento foi de criar pressupostos básicos para que possamos
resolver problemas de testes paramétricos de hipóteses.

É de salientar que para além deste tipo de testes podemos considerar os não paramétricos.
A análise destes não cabe neste módulo e recomenda-se ao estudante interessado a
PROBABILIDADE E ESTATÍSTICA -3º Ano

consultar outras obras que tratem deste assunto (Exemplo: Murteira et al. (2002).
Introdução à Estatística. 2ª edição. Editora Mc Graw-Hill. Portugal)

Até agora apresentamos as estatísticas de teste e regiões críticas e também alguns exemplos
de aplicação para os testes da média e proporção (de uma população). É de notar que os
testes de hipótese funcionam de forma parecida a de intervalos de confiança.

Passaremos a apresentar um resumo das estatísticas de teste e regiões críticas para os testes
da média, proporção, variância, diferença de médias, diferença de proporções e diferença
de variâncias.

Teste da média quando conhecemos a variância

Teste da média quando não conhecemos a variância

Teste de hipótese para uma proporção


PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 149

Teste de hipótese para a diferença de médias

Teste de hipótese para a diferença de proporções

Teste de hipótese para a variância de uma população


Para o caso da variância temos como estatística de teste

E as regiões críticas são

para a hipótese
PROBABILIDADE E ESTATÍSTICA -3º Ano

Para um teste unilateral à direita a região crítica é

E para um teste unilateral à esquerda a região crítica é

Para resolver um teste de hipótese é necessário calcular a estatística de teste, identificar a região crítica
e tomar a decisão correcta!

1. A tensão de saída de um determinado circuito eléctrico segue uma distribuição normal. Esta tensão
deve ser 130 de acordo com as especificações. Uma amostra de 40 medições independentes da tensão
deste circuito, deu uma media de 128,6 e desvio padrão amostral de 2,1. Provar a hipótese de que a
tensão média do circuito é 130, contra a de que seja menos de 130. Utilizar um nível de significância de
5%.

2. Se comparam dois projectos para um laboratório com respeito a quantidade média de luz que se tem
na superfície das mesas. Se tomaram 40 medições independentes em cada projecto; os resultados foram
os seguintes:
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 151

Desenho I Desenho II

Desenho 1: n1 = 40 , = 28,9 e s12 = 15,1

Desenho 2: n2 = 40, = 32,6 e s22 = 15,8

Há evidências suficientes para se pensar que os dois desenhos diferem com respeito a quantidade média
de luz que se recebe? Usar o nível de significância de 0,10 e supor populações normais.

3. Uma central recebe diariamente leite de dois fornecedores, A e B. Desejando estudar a qualidade dos
produtos recebidos, se escolhem duas amostras ao acaso do leite proveniente de cada um dos
fornecedores e se analisa e a quantidade de gordura e se obtêm os seguintes resultados:

Supondo a normalidade das populares, e a um nível de significância de 10% responde:

a) São as variâncias populacionais iguais?

b) São os fornecedores semelhantes em termos de conteúdo de gordura no leite?

4.Quando-se comprovar a efectividade de uma determinada vacina contra uma alergia, foram
seleccionados aleatoriamente 100 pacientes que foram subdivides em dois grupos de 50. A um grupo
foi aplicada a vacina e aos outros foi lhes administrado calmante. Dos que foram vacinados, 8 voltaram
a sofrer alergia enquanto dos que não foram vacinados 25 voltaram a sofrer alergia. Podemos concluir
que a vacina é eficaz para combater a alergia? Use um nível de significância 0.05.
PROBABILIDADE E ESTATÍSTICA -3º Ano

Bibliográfia:

FONSECA, J. S. & MARTINS, G. (1995). Curso de Estatística. 5ª Edição. Editora Atlas S.A.
São Paulo

OLIVEIRA, J. TIAGO. (1990). Probabilidade e Estatística: Conceitos métodos e aplicações.


Volume I. Editora Mc Graw-Hill. Portugal

MURTEIRA, B.; RIBEIRO, C.; PIMENTA, C.; & ANDRADE, J. (2002). Introdução à Estatística.
2ª edição. Editora Mc Graw-Hill. Portugal

Módulo de Inferência Estatística de Ana Maria Lima de Farias (2008). Universidade Federal
Fluminense. Brasil

Módulo de Inferência Estatística de Rosa Alonso Sanz (2011). Universidade Complutense de


Madrid. Espanha

REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa & CALAPEZ, Teresa. (2003). Estatística
Aplicada. Volume I. 4ª edição. Edições Sílabo. Lisboa.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 153
PROBABILIDADE E ESTATÍSTICA -3º Ano
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 155

Você também pode gostar