COL - Módulo Probabilidade
COL - Módulo Probabilidade
COL - Módulo Probabilidade
3º ano
Todos os direitos dos autores deste módulo estão reservados. A reprodução, a locação, a
fotocópia e venda deste manual, sem autorização prévia da UCM-CED, são passíveis a
procedimentos judiciais.
Elaborado por:
2010 – Congresso Mundial de Ciências de Educação (México) - The Status of the Educational Research: a survey with
teachers of Pedagogical University, Beira Branch.
2009 – ARIC (Brasil) - O Uso das Tecnologias da Informação e Comunicação no Ensino daMatemática em Sofala
(Moçambique): um olhar para o futuro.
2009 – PME (Grécia) – The teaching of geometry in Mozambique : perspectives of threemathematics’ secondaryteachers.
2008 – ICME (México) - The Mathematics from behind a deck of playing cards.
2007 - AMESA (África do Sul) - Challenge to students’ perceptions of lines relative positions in the spatial geometry in
PedagogicalUniversity.
2005 – ICMI (África do Sul) - The Mathematics from behind a deck of playing cards
Agradeço a colaboração dos seguintes indivíduos e/ou pessoa colectiva na elaboração deste
manual:
Índice
Visão geral 1
Bem-vindo a Probabilidade e Estatística ........................................................................ 1
Objectivos do curso ....................................................................................................... 1
Quem deveria estudar este módulo ................................................................................ 2
Como está estruturado este módulo................................................................................ 2
Ícones de actividade ...................................................................................................... 3
Habilidades de estudo .................................................................................................... 3
Precisa de apoio? ........................................................................................................... 3
Tarefas (avaliação e auto-avaliação) .............................................................................. 3
Unidade 01 5
Introdução às Probabilidade........................................................................................... 5
Introdução ............................................................................................................ 5
1.1.0. Conceitos importantes para o cálculo das probabilidades ..................... 7
1.1.1. Experimento aleatório ................................................................................. 7
1.1.2. Espaço amostral ou Espaço de resultados ou Espaço de acontecimentos ou
Conjunto fundamental (S)..................................................................................... 9
1.1.3. Evento ou acontecimento ............................................................................ 9
Unidade 02 10
Definições ou Conceitos de Probabilidade ................................................................... 10
Introdução .......................................................................................................... 10
2.1.0. Conceito clássico de probabilidade (Teoria clássica de Laplace) ............... 10
2.2.0. Conceito frenquecista de probabilidade..................................................... 11
2.3.0. Conceito subjectivo ou personalista de probabilidade................................ 11
Unidade 03 15
Axiomas da teoria de probabilidades ........................................................................... 15
Introdução .......................................................................................................... 15
3.1.0. Alguns teoremas importantes .................................................................... 17
Unidade 04 25
PROBABILIDADES CONDICIONAIS ...................................................................... 25
Introdução .......................................................................................................... 25
4.1.0. Teorema do produto .................................................................................. 26
4.2.0. Independência ou dependência de eventos ................................................ 26
4.3.0. Multiplicação ou intersecção de probabilidades ........................................ 27
4.4.0. Teorema de Bayes .................................................................................... 28
ii Índice
Unidade 05 31
ANÁLISE COMBINATÓRIA .................................................................................... 31
Introdução .......................................................................................................... 31
5.1.0. Princípio fundamental de contagem (P.F.C.) ............................................. 32
5.2.0. Resumo das principais fórmulas da análise combinatória .......................... 33
Arranjos e Combinações..................................................................................... 33
9. Uma moeda é lançada 10 vezes ao ar. Quantas sequências de caras e coroas existem
com 5 caras e 5 coroas? 36
Unidade 06 37
VARIÁVEIS ALEATÓRIAS ...................................................................................... 37
Introdução .......................................................................................................... 37
Unidade 07 48
Distribuições Discretas ................................................................................................ 48
Introdução .......................................................................................................... 48
7.1.0. Algumas distribuições teóricas .................................................................. 48
7.1.1. Distribuições discretas .............................................................................. 48
7.1.2. Distribuições de Bernoulli e Binomial....................................................... 48
7.1.3. Distribuição geométrica ............................................................................ 50
7.1.4. Distribuição de Poisson............................................................................. 51
7.1.5. Distribuição hipergeométrica .................................................................... 52
Unidade 08 55
Distribuições Contínuas ............................................................................................... 55
Introdução .......................................................................................................... 55
8.1.0. Distribuição uniforme ............................................................................... 55
8.2.0. Distribuição exponencial........................................................................... 56
8.3.0. Distribuição normal ou de Gauss .............................................................. 57
Unidade 09 60
Inferência Estatística ................................................................................................... 60
Introdução .......................................................................................................... 60
9.1.0. Inferência estatística ................................................................................. 61
9.1.0. Introdução ................................................................................................ 61
9.2.0. População ................................................................................................. 61
9.3.0. Amostra aleatória simples ......................................................................... 62
9.4.0. Estatística e parâmetros............................................................................. 63
Unidade 10 66
Distribuições Amostrais .............................................................................................. 66
Introdução .......................................................................................................... 66
10.1.0. Distribuições amostrais ..................................................................... 66
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 iii
Unidade 11 71
Alguns Métodos de Obtenção de Estimadores ............................................................. 71
Introdução .......................................................................................................... 71
11.1.0. Alguns métodos de obtenção de estimadores ........................................... 71
11.2.0. Método dos momentos ............................................................................ 72
11.2.1. Distribuição de Poisson ........................................................................... 72
11.2.2. Distribuição exponencial......................................................................... 73
11.2.3. Distribuição normal ................................................................................ 73
11.3.0. Método da máxima verossimilhança ....................................................... 73
Unidade 12 78
Distribuição Amostral da Média .................................................................................. 78
Introdução .......................................................................................................... 78
12.1.0. Média e variância da distribuição amostral da média ............................... 78
12.2.0. Distribuição amostral da média para populações normais ........................ 80
12.3.0. Distribuição amostral da variância amostral ............................................ 85
Unidade 13 88
Distribuição Amostral da Proporção ............................................................................ 88
Introdução .......................................................................................................... 88
13.1.0. Aproximação normal da distribuição binomial ........................................ 88
13.2.0. Teorema do limite central ....................................................................... 89
Unidade 14 96
Intervalos de Confiança ............................................................................................... 96
Introdução .......................................................................................................... 96
Intervalos de Confiança ...................................................................................... 96
14.1.0. Ideias básicas .......................................................................................... 97
14.2.0. Intervalo de Confiança: média da N(μ; σ2), σ2 conhecida ................... 99
14.3.0. Interpretação do intervalo de confiança para μ ...................................... 101
Unidade 15 107
Intervalos de Confiança ............................................................................................. 107
Introdução ........................................................................................................ 107
15.1.0. Intervalo de Confiança: Média da N(μ; σ2) com σ2 desconhecida .......... 108
15.3.0. Intervalo de Confiança da média populacional para amostras grandes ... 112
15.4.0. Intervalo de confiança para a proporção populacional ........................... 113
Unidade 16 116
Intervalos de Confiança ............................................................................................. 116
Introdução ........................................................................................................ 116
iv Índice
Unidade 17 121
Testes de Hipóteses ................................................................................................... 121
Introdução ........................................................................................................ 121
Unidade 18 130
Testes de Hipóteses ................................................................................................... 130
Introdução ........................................................................................................ 130
18.2.0. Testes de Hipóteses............................................................................... 130
18.3.0. Conceitos importantes ........................................................................... 130
18.4.0. Noções básicas...................................................................................... 131
18.5.0. Conceitos básicos ................................................................................. 135
18.6.0. Estatística de teste, erros e regra de decisão........................................... 137
Região crítica e nível de significância ............................................................... 137
Unidade 19 138
Testes de Hipóteses ................................................................................................... 138
Introdução ........................................................................................................ 138
19.1.0. Teste de Hipotese: Média da N (μ; σ2) – σ2 conhecida .......................... 138
19.2.0. Hipótese nulas e alternativa................................................................... 139
19.3.0. Estatística de teste ................................................................................. 139
19.4.0. Nível de significância e região crítica.................................................... 140
Unidade 20 145
Testes de Hipóteses ................................................................................................... 145
Introdução ........................................................................................................ 145
20.2.0. Contexto básico .................................................................................... 145
Teste da média quando conhecemos a variância ............................................... 148
Teste da média quando não conhecemos a variância ......................................... 148
Teste de hipótese para uma proporção .............................................................. 148
Teste de hipótese para a diferença de médias .................................................... 149
Teste de hipótese para a diferença de proporções .............................................. 149
Teste de hipótese para a variância de uma população ........................................ 149
Bibliográfia: 152
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 1
Visão geral
Bem-vindo a Probabilidade e
Estatística
Objectivos do curso
Quando terminar o estudo de Probabilidade e Estatística será capaz de:
GERAL
Páginas introdutórias
Um índice completo.
Conteúdo do módulo
Outros recursos
Comentários e sugestões
Ícones de actividade
Ao longo deste manual irá encontrar uma série de ícones nas margens das
folhas. Estes ícones servem para identificar diferentes partes do processo
de aprendizagem. Podem indicar uma parcela específica de texto, uma
nova actividade ou tarefa, uma mudança de actividade, etc.
Habilidades de estudo
Para suceder-se bem neste módulo precisará de um pouco mais da sua
dedicação e concentração. A maior dica para alcançar o sucesso é não
ignorar os textos que são apresentados como descrição para obter as
figuras assim como, tentar sempre que resolver uma tarefa apresentar a
descrição de todo o processo. Não ignore as actividades auxiliares pois as
restantes actividades podem depender delas!
Precisa de apoio?
Em caso de dúvidas ou mesmo dificuldades na percepção dos conteúdos
ou resolução das tarefas procure contactar o seu professor/tutor da
cadeira ou ainda a coordenação do curso acessando a plataforma da
UCM-CED Curso de Licenciatura em Ensino de Matemática.
Unidade 01
Introdução às Probabilidade
Introdução
Nesta unidade você aprenderá Conceitos importantes para o cálculo das probabilidades, Experimento
Aleatório e suas características.
Não precisas de decorar estas histórias! Precisas sim de lê-las muitas vezes, para sem muito esforço,
ficarem na tua mente.
Historial
Ouvimos falar desse assunto em situações como: a probabilidade de alguém ser sorteado; de
um jogador acertar numa aposta; de um candidato vencer uma eleição; de alguém acertar num
jogo; de um aluno reprovar, etc. Portanto, usamos probabilidades em situações em que dois ou
mais resultados diferentes podem ocorrer e não é possível saber, prever, qual deles realmente
vai ocorrer em cada situação.
Assim, podemos pensar que o conceito de probabilidades está associado à um certo grau de
incerteza sobre a ocorrência de um determinado fenómeno ou acontecimento.
Evento ou acontecimento
- Não se poder dizer à partida qual o resultado do experimento a se realizar, mas poder descrever-se o
conjunto de todos resultados possíveis;
E1: largar uma pedra de certa altura e verificar o que vai acontecer
E2: Lançar uma moeda, ao ar, e verificar a face voltada para cima quando a moeda já estiver no chão
Aquí, porque a moeda (honesta ou não viciada) tem duas faces, não sabemos à prior qual estará
voltada para cima! Existem duas possibilidades.
Neste experimento, os resultados possíveis são: (C,C); (C,K); (K,C) e (K,K) em que C é a face
coroa e K é a face cara.
E4: Lançar um dado (de 6 faces) e verificar a face voltada para cima
TAREFA PARA TI
Ex: Consideremos para o experimento E3 o acontecimento A: Saída da face cara pelo menos uma vez.
Então A = (C,K); (K,C); (K,K) é o conjunto de resultados favoráveis ao evento A.
Unidade 02
Introdução
Nesta unidade terás a oportunidade de aprender as três definições ou conceitos de
probabilidades;
Ex: No experimento que consiste em lançar duas moedas e verificar a face de cima, o espaço
amostral (S) tem 4 elementos (resultados possíveis). Então N = 4. E os casos favoráveis ao evento
A são 3. Portanto n(A) = 3.
n(A) 3
Então P(A) = =
N 4
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 11
n
P(A) = limf(A) (quando N ∞)
N
Exemplo:
O João diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de seres
corrido por um cão-guarda (dessa casa) é de 90%.
Mas o Paulo diz ao Manuel: Manuel, se tu passares da rua ao lado daquela casa a probabilidade de
seres corrido por um cão-guarda (dessa casa) é de 50%.
Aqui, o João e o Paulo dão alerta ao Manuel sobre o mesmo perigo mas podes ver que eles
atribuem probabilidades diferentes ao evento “ ser corrido...”
PROBABILIDADE E ESTATÍSTICA -3º Ano
Pode ser que de 10 vezes que o João passou daquela rua foi corrido 9 vezes e que o Paulo teve
uma sorte diferente e foi corrido apenas 5 vezes!
Portanto, cada um está usando as suas experiências passadas para definir a probabilidade de
alguém ser corrido ao passar daquela rua.
Uma questão não menos importante aqui no cálculo das probabilidades, é a linguagem usada!
Exemplos:
a) Vida e Morte
Exemplos:
Para o experimento que consiste em lançar um dado (de 6 faces) vimos que S = 1; 2 ; 3; 4; 5; 6.
Podemos, assim, considerar os seguintes eventos:
A: sair um nº par
Ok, agora podemos combinar uma aposta. Tens quatro possibilidades de escolha. Vou mesmo
lançar o dado. Tens que escolher a regra para a aposta: ou A ou B ou C ou D. Se por exemplo
escolhes A, tu ganhas a aposta se e somente se acontecer A. E o mesmo é válido para os outros
acontecimentos.
A = 2 ; 4; 6 B = 4; 5; 6 C = 1 ; 2 ; 3; 4; 5; 6 = S D=
PROBABILIDADE E ESTATÍSTICA -3º Ano
3 3 6
As respectivas probabilidades são P(A) = 6 = 0,5 P(B) = 6 = 0,5 P(C) = 6 = 1
0
P(D) = 6 = 0
Com certeza, para eu apostar escolheria a regra C! Sabes porquê? É que o acontecimento C é um
acontecimento certo.
Mas se tivesse que escolher dentre as regras A e B, uma, qualquer uma podia escolher! Sabes
porquê? É que A e B são acontecimentos equiprováveis. Isto é, têm iguais probabilidades de
ocorrer.
Unidade 03
Introdução
Nesta unidade terás a oportunidade de aprender as três definições ou conceitos de
probabilidades;
- Vamos, aquí, considerar três axiomas bastante importantes para a sistematização dos conceitos
empregues na teoria das probabilidades. Estes axiomas servirão de base para todos os
desenvolvimentos posteriores do campo das probabilidades.
Assim consideramos que P( ) é uma função que associa a todo o acontecimento A definido em S
um nº compreendido no intervalo ; e que satisfaz os seguintes axiomas:
I. P(A) , A S
II. P(S) = 1, ( S é um acontecimento certo)
III. Sendo A e B acontecimentos mutuamente exclusivos definidos em S, ou seja A B ,
tem-se que P(AB) = P(A) P(B)
PROBABILIDADE E ESTATÍSTICA -3º Ano
Em geral, se A1, A2, A3, ..., An são acontecimentos mutuamente exclusivos definidos em S,
n
então P(A1 A2 A3 ... An ) = P(A1) P(A2) P(A3) ... P( An ) = P(Ai)
i=1
Idempotente: A A A, A A A
c
Complementaridade: Ac A
Absorção: A B B A B A A B
Comutativa: A B B A, AB B A
A (B C) = (AB) (AC)
Leis de De Morgan: A B A B e A B A B
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 17
Teorema 1.
Teorema 2.
Demonstração:
FIGURA:
Mas (B A) (B – A) = B
PROBABILIDADE E ESTATÍSTICA -3º Ano
Teorema 4.
Corolário:
Teorema 5.
n n
Aditividade finita: A1 ,..., An disjuntos dois a dois P Ai P( Ai )
i 1 i 1
Teorema 6.
P é monótona: A, B Q, se A B P( A) P( B) e P( B A) P ( B) P( A)
n n
Teorema7. A1 ,.., An Q P Ai P( Ai )
i 1 i 1
n n n
Teorema8. P Ai P ( Ai ) P( Ai A j ) P( Ai A j Ak ) ... (1) n 1 P ( Ai )
i 1 i 1 i j i j k i 1
n n
Desigualdade de Bonferroni: P( Ai ) 1 P( Aic )
i 1 i 1
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 19
EXEMPLO
1. Qual é a probabilidade de não sair um rei na extracção aleatória de uma carta de um baralho de
52 cartas?
Resolução:
Já que num baralho (completo) de 52 cartas existem 4 reis, então, temos 4 possibilidades
n(A) 4
favoráveis ao evento A. Portanto, segundo a definição clássica de Laplace, P(A) = N = 52
4 48
Portanto, P( A ) = 1 – P(A) = 1 – 52 = 52
1. Na produção de uma empresa de artigos de vestuário, 10% dos artigos produzidos têm defeitos
de matéria-prima (tecido); 5% têm defeitos de acabamentos e 2%, defeitos de ambos os tipos.
Qual a probabilidade de uma peça de vestuário retirada ao acaso ter apenas defeito de tecido?
PROBABILIDADE E ESTATÍSTICA -3º Ano
Resolução:
Isto quer dizer que a probabilidade da peça de vestuário ter apenas defeitos de matéria-prima, é
de 8%
2.1. Considerando o problema anterior, qual a probabilidade de uma peça de vestuário extraída
ao acaso apresentar defeitos de tecido ou de acabamentos?
1. Admitindo a equiprobabilidade dos resultados, determinar a probabilidade de, numa prova com
dois dados obter-se a face 6.
Resolução:
Para o experimento: lançar dois dados (de seis faces), temos 36 resultados
Veja:
Dado A
Dado B 1 2 3 4 5 6
De outro modo
1
Da simetria suposta (equiprobabilidade), temos P ( A) P ( B ) 6
; por outro lado, havendo 36
1
combinações do 1º com o 2º dado, é P ( A B ) 36
, o que dá P ( A B ) 16 16 361 11
36
, o que
condiz com o resultado anterior.
1.Numa urna há cinco esferas brancas, duas pretas e cinco vermelhas. Qual a probabilidade de
que uma esfera extraída ao acaso não seja vermelha?
Resolução:
A probabilidade de que uma esfera seja branca é 125 , e de que seja preta é 122 . A probabilidade
pretendida tem duas maneiras de se realizar: a esfera extraída pode ser branca ou preta, e veja
que sair branca ou preta são acontecimentos disjuntos. Então a soma das probabilidades
elementares dá a probabilidade total da extracção de uma esfera que não seja vermelha.
5 7
12
122 12 .
Poder-se-ia também usar o raciocínio pelo complementar: como a probabilidade de sair esfera
5 5 7
vermelha é 12 , então a probabilidade de sair uma esfera não vermelha será 1 12 12 , o que
confere com a resolução anterior.
2.Lançam-se dois dados ao ar. Qual a probabilidade de que cada um tenha a face 6 voltada para
cima?
PROBABILIDADE E ESTATÍSTICA -3º Ano
Resolução:
1
A probabilidade para o primeiro dado é 6 (suponho que já sabes porquê), e para o Segundo
1
dado também é 6 . Veja que, estes dois acontecimentos são independentes, assim sendo a
b) Qual a probabilidade de a carta escolhida ser uma figura (dama, rei ou valete)
Resolução:
Para este caso, primeiro deves ver que o espaço amostral tem 52 elementos, este é o número total
de cartas no baralho e num baralho normal, existem 13 cartas de espada, então 13 será o número
13 1
de casos favoráveis e a probabilidade pretendida será: P 52
4
;
Para a alínea b), deves saber que num baralho normal, existem 12 cartas de figuras ( 4 reis-K, 4
12 3
damas-Q e 4 valetes-J), então a probabilidade pretendida será: P 52
13
2. Para um debate numa escola que lecciona de 8ª à 12ª classe, foram escolhidos 50 estudantes (dez
estudantes de cada classe). Findo o debate, um aluno é escolhido ao acaso para fazer comentários
sobre o debate. Qual a probabilidade de que o escolhido seja estudante da 12ª classe?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 23
3. Na cantina de uma escola, há 20 bolos, dos quais 7 de Coco, 5 Massa folhada e 8 de Arroz, se
alguém compra 3 bolos escolhendo-os aleatoriamente, achar a probabilidade de se escolher:
3. Efectuam-se quatro jogadas com uma moeda equilibrada de cinco meticais. Qual a probabilidade
de ter uma sucessão de, pelo menos, duas faces com emblema da república?
6. Para o lanche, há 9 refrescos, dos quais 3 da marca Coca-cola e 6 da marca Fanta. Se duas pessoas
tiram dois refrescos (um para cada), sem escolher, qual a probabilidade de:
a) Ambas levarem Fanta?
b) Ambas levarem Coca-cola?
c) Cada um levar uma marca diferente do outro?
7. Num grupo de 6 amigos, 3 bebem cerveja e outros 3 não. Se seleccionarmos 3 dos 6 amigos,
aleatoriamente, qual a probabilidade de:
a) Pelo menos dois beberem cerveja?
b) Ao máximo um beber cerveja?
PROBABILIDADE E ESTATÍSTICA -3º Ano
8. Depois de dois bandidos terem praticado um assassinato numa cidade, a polícia local capturou
por suspeita quatro indivíduos. Os indivíduos são submetidos a testes de impressão digital um a
um até que os dois praticantes sejam encontrados. Qual a probabilidade de que o ultimo
bandido seja:
a) O Segundo a ser testado?
b) O terceiro a ser testado?
c) O quarto a ser testado?
9. No fim de um ano, um aluno gastou dois cadernos para a disciplina de Português e três para
Matemática. Deste grupo de cinco cadernos, o aluno escolhe um caderno aleatoriamente e sem
reposição deste, escolhe outro caderno, também ao acaso.
Qual a probabilidade de os dois cadernos ser de Matemática?
10. As letras do termo “taylor” são escritas em cartões, donde, depois de misturados, se retiram
quatro (de uma só vez). Supondo iguais as probabilidades de cada grupo de quatro cartões,
achar a probabilidade de encontrar a palavra “oral”.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 25
Unidade 04
PROBABILIDADES CONDICIONAIS
Introdução
Nesta unidade terás a oportunidade de aprender Teorema do produto probabilidades
condicionais; Independência ou dependência de eventos; MULTIPLICAÇÃO OU
INTERSECÇÃO DE PROBABILIDADES; Teorema de Bayes;
P(A B)
P(A\B) = com P(B) , pois, o acontecimento B já ocorreu.
P(B)
1
Para o acontecimento A, o espaço amostral é B P(A\B) = 3
1 3
Doutro modo: A B = P(A B) = e P(B) =
6 6
1
Então, usando a fórmula P(A\B) =
3
EXEMPLO:
Em um lote de 12 peças, 4 são defeituosas. Duas peças são retiradas uma após outra sem
reposição. Qual a probabilidade de que ambas sejam boas?
Solução:
8
Seja A: Saída de uma peça boa na 1ª extracção P(A) = 12
7
Seja B: Saída de uma peça boa na 2ª extracção P(B) = 11 , porque depois da 1ª extracção o
8 7 14
Logo P(A B) = P(A) P(B\A) = 12 11 = 33
O que diz esse princípio? Mais adiante será retomado este princípio, como lembrete, para
acompanhar o resumo das principais fórmulas da análise combinatória.
Enunciado:
. . .
. . .
. . .
FIGURA:
A1 A2
An
A4
B .
A3
A5
P(B) = P(A1).P( B\A1) + P (A2).P( B\A2) + P (A3).P( B\A3) +... + P (An ).P( B\An)
n
P(B) = P(Ai) P(B\Ai) Fórmula para probabilçidade completa
i=1
P(A B)
Mas sabe-se que P(A B) = P(B)P(A\B) P(A\B) = P(B)
P(Ai B)
Então P (Ai\B) = P(B)
P(Ai B)
P(Ai\B) = Fórmula de Bayes
n
P(Ai) P(B|Ai)
i=1
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 29
EXEMPLO:
a) Tendo sido extraida de B uma nota de100MT, tenha sido extraida de A uma nota de 50MT
b) Tendo sido extraida de B uma nota de 100MT, tenha sido extraida de A uma nota de
100MT.
Resolução:
1 2 4 1 3 2
Mas P(A1) = 3 ; P(A2) = 3 ; P(B1\A1) = 5 ; P(B2\A1) = 5 ; P(B1\A2) = 5 ; P(B2\A2) = 5
P(A1) P(B2/A1) 1
P(A1\B2) = P(A ) P(B /A ) + P(A )P(B /A ) = 5
1 2 1 2 2 2
PROBABILIDADE E ESTATÍSTICA -3º Ano
1.Uma urna contém 12 bolas: 5 brancas, 4 vermelhas e 3 pretas. Outra contém 18 bolas: 5
brancas, 6 vermelhas e 7 pretas. Uma bola é retirada ao acaso de cada urna. Qual a
probabilidade de as duas bolas sejam da mesma cor?
2. A urna nº1 contém: 1bola vermelha e duas brancas. A urna nº2 contém: 2 bolas vermelhas e
uma branca. Tiramos ao acaso uma bola da urna nº1 e colocá-mo- la na urna nº2 e misturamos.
Em seguida tiramos aleatoriamente uma bola da urna nº2. Qual a probabilidade sair uma bola
bola branca (da urna nº2)?
3. São dadas duas urnas A e B. A urna A contém uma bola preta e uma vermelha. A urna B
contém duas bolas pretas e três vermelhas. Uma bola é extraida ao acaso da urna A e colocada
em seguida na urna B. Uma bola é retirada, aleatoriamente, então da urna B. Pergunta-se:
b) Qual a probabilidade de que a 1ª bola seja vermelha sabendo-se que a segunda foi preta?
Unidade 05
ANÁLISE COMBINATÓRIA
Introdução
Nesta unidade terás a oportunidade de aprender Princípio Fundamental de Contagem
(P.F.C);
O QUE É?
As técnicas de contagem indirecta que são tratadas na análise combinatória são bastante úteis
para a resolução de problemas de probabilidades quando se pretende determinar o número de
casos possíveis de experimento e/ou o número de casos favoráveis a um evento.
Ex: Por contagem directa, podemos determinar quantos número de dois algarismos podemos
formar com os dígitos 1; 2 e 3! São eles 11; 12; 13; 21; 22; 23; 31; 32 e 33. Portanto são 9
números. Mas se tivéssemos os dígitos 1; 2; 3; 4; 5; 6; 7 e 8, para sabermos quantos números
com dois algarismos podemos formar, levaríamos muito tempo por contagem directa.
Ex: Para se viajar de uma cidade A para uma outra cidade B deve-se passar necessariamente
pela cidade C ou pela cidade D. A quantidade de caminhos diferentes entre essas cidades está
indicada na figura. Quantos são os possíveis caminhos de A para B?
FIGURA:
A C
B
Solução:
Arranjos e Combinações
Arranjos e Combinações são agrupamentos que se diferem pelas suas características.
A característica principal dos arranjos é o facto de que a ordem dos elementos nos
agrupamentos interessa. Quer dizer, se ABCDE é um agrupamento, BACDE é outro
agrupamento. Enquanto isso, nas Combinações a ordem dos elementos, nos agrupamentos, não
interessa. Portanto, a troca de posições não altera os agrupamentos. Ex: ABCDE e BACDE é o
mesmo agrupamento.
Arranjos
n!
Am;n = (n - m)! ; n ≥ m
n! n!
Pn = An;n = (n - n)! = 0! = n!
A m;n = nm
Permutações de n elementos com um grupo repetido m1 vezes, outro grupo repetido m2 vezes,
… e outro grupo repetido mk vezes
m1
n!
P ... = m !.m !....m !
1 2 k
mk;n
PROBABILIDADE E ESTATÍSTICA -3º Ano
Combinações
n!
Cm;n = (n - m)!.m! ; n ≥ m
C m;n = Cm;n + m - 1
Resolução:
Temos três espaços para colocar os dígitos. Para o 1º espaço existem 4 possibilidades.
Podemos colocar o 2 ou 5 ou 6 ou 7. Para o 2º espaço existem 3 possibilidades, já que os
dígitos devem ser distintos. Isto é, se por exemplo colocarmos o 2 no 1º espaço, só podemos
colocar no 2º espaço os dígitos 5 ou 6 ou 7. Para o 3º espaço, restarão apenas duas
possibilidades. Isto porque se por exemplo colocarmos o 2 no 1º espaço e se colocarmos no 2º
espaço o 5, só poderemos colocar ou 6 ou 7 no 3º espaço.
Assim, pelo princípio fundamental de contagem, com os dígitos disponíveis podemos formar 4
. 3 . 2 = 24 números de algarismos distintos.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 35
Segundo método:
Um dos números pode ser por exemplo 257. Mas se trocarmos 5 por 2 teremos 527, outro
número!
Portanto, a ordem dos elementos interessa nos agrupamentos. Assim vamos determinar o nº de
arranjos simples de 4 elementos tomados 3 a 3.
4! 4!
Assim, A3;4 = (4 - 3)! = 1! = 4! = 4 . 3 . 2. 1 = 24
2. Um grupo tem 10 pessoas. Quantas comissões de 4 pessoas podem ser formadas, com as
disponíveis?
Resolução:
Neste caso, a troca de A por B, por exemplo, não altera a comissão. Quer dizer que a ordem
dos elementos nos agrupamentos não importa. Portanto, vamos calcular o nº de combinações
de 10 elementos tomados 4 a 4.
10!
Assim: C4;10 = (10 - 4)!.4! = 210 é o nº de comissões que podem ser formadas nas
condições dadas.
PROBABILIDADE E ESTATÍSTICA -3º Ano
3. Temos 3 meninos e 3 meninas. De quantas formas eles podem ficar em ficar em fila se
meninos e meninas ficam em posições alternadas?
6. Em uma reunião social, cada pessoa cumprimentou todas as outras, havendo em total 45
apertos de mão. Quantas pessoas havia na reunião?
8. Existem 5 pontos, entre os quais não existem 3 colineares. Quantas rectas eles determinam?
9. Uma moeda é lançada 10 vezes ao ar. Quantas sequências de caras e coroas existem com 5
caras e 5 coroas?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 37
Unidade 06
VARIÁVEIS ALEATÓRIAS
Introdução
Nesta unidade terás a oportunidade de aprender Variável aleatória discreta; Variável absolutamente
contínua; Função de Probabilidade (Variável Discreta); Função de Repartição (função Distribuição); e
Função de uma variável aleatória;
Uma variável aleatória é uma função que transforma cada resultado de um experimento num valor
numérico.
EXEMPLO:
X(s) = 0; 1; 2, isto é, para o resultado (C;C), X(s) = 0; para (C;K) ou (K;C), X(s) = 1 e para (K;K),
X(s) = 2.
Vamos representar as variàveis aleatórias por letras maiúsculas (A, B, C, D, X, M,....) e os seus valores
particulares por letras minúsculas (a, b, c, d, x, m, ....)
Na Estatística Descritiva define três conceitos importantes que são: população, amostra e variável. A
variável foi definida como a característica de interesse (da população) que se pretende estudar.
Quanto à classificação, viu-se que a variável pode qualitativa ou quantitativa. A variável quantitativa
pode ser contínua ou discreta.
Nesta secção trataremos das variáveis aleatórias Discretas, Absolutamente Contínuas (ou
simplesmente contínuas) e variáveis Mistas, partindo do pressuposto de que elas são quantitativas.
Diz-se que uma variável aleatória é Discreta se pode tomar uma quantidade numerável de valores (por
exemplo, números inteiros). Para além da função de massa de probabilidade que também se diz função
de distribuição de probabilidade (f(x) ou P(x)), a variável aleatória também se caracteriza pela função
Distribuição ou função de probabilidades acumuladas (F(x)). A função Distribuição F(x), calcula-se
como a soma da função de massa de probabilidade para valores iguais ou inferiores ao valor x.
F ( x) P( x x )
xi x
i ; x
Diz-se que uma variável aleatória é Absolutamente Contínua ou simplesmente Contínua, se existe
uma função denominada função densidade de probabilidade f(x) tal que sua integral para um
NOTA: f ( x) dx 1 .
Neste tipo de variável, a probabilidade de ocorrência de um valor concreto é igual a zero (P(X= x) = 0).
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 39
A função Distribuição de uma variável continua se calcula como o integral da função densidade no
intervalo [, x] .
x
F ( x) P ( x [ , x]) f ( y) dy ; x
F ( x) f ( x)
As variáveis aleatórias mistas são variáveis que em alguns intervalos se comportam como
absolutamente contínuas e em algum momento como variável discrete (concentram probabilidade em
algum ponto). Para este tipo de variáveis não existe uma outra caracterização teórica válida se não a
função Distribuição, que é continua em todos pontos excepto naqueles em que acumula probabilidade
(onde apresenta salto).
+∞
Nota: P(xi) = 1
-∞
X(s) = 0; 1; 2, isto é, para o resultado (C;C), X(s) = 0; para (C;K) ou (K;C), X(s) = 1 e para (K;K),
X(s) = 2.
PROBABILIDADE E ESTATÍSTICA -3º Ano
1 2 1 1
P(X =0) = 4 ; P(X =1) = 4 = 2 e P(X =2) = 4
Tabela
X 0 1 2
P(x) 1 1 1
4 2 4
GRÁFICO:
P(x)
1/2
1/4
0 1 2 X
1
F(0) = P(X ≤ 0) = P(X = 0) = 4
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 41
1 1 3
F(1) = P(X ≤ 1) = P(X = 0) + P(X = 1) = 4 + 2 = 4
1 1 1 4
F(2) = P(X ≤ 2) = P(X = 0) + P(X = 1) + P(X = 2) = 4 + 2 + 4 = 4 = 1
1 3
Então escreve-se: F(x) = 0 para 0 x; F(x) = 4 para 0 ≤ x 1; F(x) = 4 para 1 ≤ x 2;
F(x) = 1 para x 2
x
1. F ( x ) P ( x [ , x ]) f ( y ) dy ; x
2. F(-∞) = 0
3. F(+∞) = 1
b
4. P(a < X ≤ b) = P(a ≤ X ≤ b) = P(a ≤ X < b) = P(a < X < b) = F(b) – F(a) = f ( x)dx
a
Por exemplo para uma variável aleatória X uniforme no intervalo [0, 1] tem-se que:
1 0 x 1
f ( x)
0 resto
x x
F ( x ) f ( x) dx 1 dx x
0 0
f(x) F(x)
1 1
0 0
1 1
Qualquer função de uma V.a. é também uma variável aleatória, isto é, se X é uma V.a. Y = (x)
também será.
Consideremos a variável
Para dois dados teremos 36 pares de resultados e sendo assim, Y = 1; 2; 3; 4; 5; 6. Por exemplo, para
3
os pares (1, 2); (2, 1) e (2, 2), o máximo é 2. Por isso, P(y=2) = 36
A Função de
Probabilidade da
Y 1 2 3 4 5 6
variável Y é
P(y) 1 3 5 7 9 11
36 36 36 36 36 36
a) Construir a distribuição de probabilidades através de uma tabela e gráfico das seguintes variáveis.
i) W=X–Y
A = 2Y
b) Construir a Função de Repartição da variável W e fazer o gráfico
c) Calcular: i) P(-3 W ≤ 3) ii) P(W ≤ -8)
k
2. Uma v.a discreta tem a distribuição de probabilidade dada por: P(X) = x para x = 1, 3, 5, 7
A média ou valor esperado é um dos conceitos muito importantes na teoria de probabilidade, pois,
permite identificar muitas das características fundamentais de uma distribuição.
Considere-se, por exemplo, uma lotaria com 100 bilhetes com os seguintes prémios: um prémio de 100
mil meticais, dois prémios de 20 mil meticais e 3 prémios de 10 mil meticais. A probabilidade de um
1
comprador de um bilhete ganhar 100 mil meticais é 100 , a probabilidade de ganhar 20 mil meticais é
2 3
100 e a de ganhar 10 mil meticais é de 100 . Portanto, o valor esperado (valor da sorte) do comprador
1 2 3
de um bilhete será: 100milx100 + 20milx 100 + 10milx100 = 1,7mil
Define-se Esperança matemática ou média ou valor esperado de uma v.a. discreta como:
∞
E(X) = x = = P(xi).Xi
i
PROBABILIDADE E ESTATÍSTICA -3º Ano
6.9.0. Mediana
Mediana de uma v.a é o valor que divide a distribuição em duas partes iguais, ou seja, F(Md) = 0,5 ;
onde Md é mediana.
6.10.0. Moda
Moda é o valor da variável com maior probabilidade, se X for discreta ou com maior densidade se X for
contínua.
6.11.0. Momentos
Dentro do conjunto dos caracterizadores dos parâmetros de uma variável aleatória ou da respectiva
distribuição, os momentos assumem particular importância.
Podemos distinguir dois tipos de momentos: momentos em relação a origem (ou ordinários) e
momentos em relação a média (ou centrados)
r
x i . fi
ar = E( x ) =
r i
n
, onde r = 1, 2, ... indica a ordem do momento, fi é a frequência de
Sendo assim, a1 = µ = x . f i
i i
= E(X) é a esperança matemática ou valor esperado da
n
variável X.
(x i )r . fi
mr = E(Xi - µ ) = i
(x i )2. fi
Sendo assim, m2 = i
= Var(X) = σ2 , que se chama variância.
n
Em estatística descritiva viu-se que a variância é uma medida que indica o grau de dispersão dos
valores de uma variável aleatória. Por conveniência, usa-se frequentemente o desvio padrão para medir-
se o grau de concentração ou dispersão dos valores da variável.
2
Desvio padrão x = x = Var(X)
1. Var(k) = 0
2
2. Var(kX) = k .Var(X)
3. Var(X k) = Var(X)
4. Var(X Y) = Var(X) Var(Y)
X 0 1 2 3 4
2. Uma empresa de aluguer de aviões para executivos estima que a procura diária tem um
comportamento aleatório, que pode ser descrito pela varável X « nº de aviões procurados por dia»,
com a seguinte função de probabilidade:
X 0 1 2 3
3. A procura diária de uma determinada peça X é uma v.a. com a seguinte distribuição de
x
2
probabilidade: f(x) = k. x! ; x = 1; 2; 3; 4
4.Uma moeda é viciada de tal modo que a probabilidade de obter cara é duas vezes a de obter
coroa. Se a moeda é atirada 10 vezes ao ar, determine a probabilidade de se obter exactamente 5
coroas.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 47
5.O número de unidades de um produto procuradas diariamente por uma empresa é uma variável
1
aleatória com função de probabilidade f(x) = , (x = 0, 1, 2, 3, 4)
5
Unidade 07
Distribuições Discretas
Introdução
Nesta unidade terás a oportunidade de aprender Distribuições Discretas; Distribuições de
Bernoulli e Binomial; Distribuição Geométrica; Distribuição de Poisson; Distribuição
Hipergeométrica.
Um experimento deste tipo, em que nos interessa conhecer se um determinado evento ocorreu
ou não, se denomina prova de Bernoulli. A variável aleatória X que assume somente dois
valores (1 quando há sucesso e 0 quando há fracasso), diz-se que tem distribuição de Bernoulli.
Suponhamos que, nas mesmas condições descritas antes, o experimento se repete n vezes de
maneira independente; ou seja, nas mesmas condições iniciais. Seja a variável aleatória Y =
número de sucessos obtidos. A distribuição da variável aleatória Y é conhecida como
distribuição binomial de parâmetros n e p.
n n k n
P(Y k ) p k 1 p p k q n k k 0,..., n
k k
n
Note que é a combinação de n elementos tomados k a k.
k
EXEMPLO:
Resolução:
Portanto, queremos:
5 2 5-2
a) P(X = 2) = 2 .(0,1) .(0,9) = 0,0729
0.6- 0.6-
p(x) p(x)
0.5- 0.5-
p=0.25 p=0.5
0.4- 0.4-
0.3- 0.3-
0.2- 0.2-
0.1- 0.1-
1 3 4 5 6 7 8 1 2 3 4 5 6 7 8
EXEMPLO:
Um indivíduo que faz anos em 25 de Junho dispõe-se a inquirir pessoas ao aca até encontrar
uma que faça anos também no mesmo mês.
Resolução:
a). Admitindo que os doze meses do ano têm a mesma probabilidade, a probabilidade de
1
alguém fazer anos no mês de Junho é . Como para a distribuição geométrica a média E(x) =
12
1
, substituindo tem-se que E(x) = 12. Portanto, o número médio de inquirições para se ter o
p
primeiro sucesso é 12. Ou seja, a pessoa terá de inquirir em média 12 pessoas até encontrar a 1ª
pessoa que faça anos no mês de Junho
1 5
b). P(x ˂ 6) = P(x ≤ 5) = 1 – (1 - ) = 0,3528
12
Se usa, por exemplo para contar o número de chamadas que uma central telefónica recebe num
determinado intervalo de tempo, o número de doentes de malária que fazem consulta numa
unidade hospitalar por dia, o número de erros ortográficos de uma monografia científica por
página, etc.
e x
Sua função de massa é P( X x) x 0,1,... com λ ˃ 0.
x!
Observação:
Seja X é uma variável com distribuição Binomial. Se n aumenta e p diminui, X→B(n,p) ≈ P(λ).
Recomenda-se utilizar esta aproximação para n > 50, p < 0,1 e np < 5.
EXEMPLO:
Resolução:
a). Seja X: nº de chamadas de reclamação por dia. X tem distribuição de Poisson com λ = 4.
e 4 .4 0
Pretende-se a probabilidade de x = 0. P(x=0) = = e-4
0!
c). Para P(x = 15) é preciso calcular a média para 5 dias que será λ = 4.5 = 20 chamadas por
semana (2ª a 6ª feira) e aplicar a formula.
Se a extracção fosse feita com reposição dos elementos, então a probabilidade de existir x
x n x
n D N D
elementos na amostra com a característica D seria P ( X x) que teria
x N N
distribuição binomial B(n,D/N)
D
Observação: é a combinação de D elementos tomados x a x
x
N D
é a combinação de (N-D) elementos tomados (n-x) a (n-x)
n x
N
é a combinação de N elementos tomados n a n
n
nD( N D )( N n)
A esperança matemática é E(X) = nD/N, e a variância é V ( X ) .
N 2 ( N 1)
EXEMPLO:
De um grupo de 1000 peças de uma fábrica há 50 que apresentam defeito de fabrico. Recolhida
uma amostra de 100 peças (com ou sem reposição), qual a probabilidade de se observar 10 peças
defeituosas?
Resolução:
100
a). Com reposição P (x = 10) = .(0.05)10.(0.95)40
10
50 950
.
b). Sem reposição (distribuição Hipergeométrica) P(x = 10) = 10 1000
90
100
PROBABILIDADE E ESTATÍSTICA -3º Ano
2. Da produção diária de uma máquina retiram-se, para efeito de controlo, 10 peças e verifica-se que
80% estavam boas. Calcular a probabilidade de nas 10 peças mais de 8 estarem boas.
3. Um jovem casal deseja ter exactamente duas filhas. Considere que a probabilidade de ser rapaz ou
rapariga é igual, e que o casal terá filhos (rapazes e raparigas) até realizar o desejo.
a) Qual a função de probabilidade do número de rapazes?
b) Qual a probabilidade de ter quatro crianças?
c) Qual a probabilidade de ter no máximo quatro crianças?
4. O número de erros ortográficos que um aluno dá por página, numa prova escrita de Estatística,
segue a distribuição de Poisson com média 1,5 erros.
a) Qual a percentagem de provas de duas páginas sem erros de ortografia?
b) Se um aluno escreveu quatro páginas, qual a probabilidade de ter cometido mais de 8 erros?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 55
Unidade 08
Distribuições Contínuas
Introdução
Nesta unidade terás a oportunidade de aprender Distribuição Normal ou de Gauss;
Distribuição Exponencial; e Distribuição Uniforme.
QUAIS AS MAIS
IMPORTANTES?
Vamos iniciar, aquí, a exposição dos modelos probabilísticos de maior utilização para a
modelação de fenómenos aleatórios de tipo contínuo.
0 xa
x a
F ( x) a xb
b a
1 xb
PROBABILIDADE E ESTATÍSTICA -3º Ano
1,2
0,8
F(x)
0,6
0,4
0,2
0
-3 -2 -1 0 1 2 3 4 5
x
a b
A media desta variável coincide com o ponto médio do intervalo (a,b), E[ X ] , e a
2
2
variância é V[X ]
b a
12
Diz-se que uma variável aleatórian X ten uma distribuição exponencial de parámetro 0 , se
sua função de densidade é da forma f ( x) .e x , sendo x ≥ 0.
0 x0
F ( x) x
1 e x0
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 57
1,2
5 Exp(2)
1 Exp(3)
Exp(2)
4 Exp(3) 0,8 Exp(4)
Exp(4)
3 F(x)
0,6
2 0,4
1 0,2
0 0
0 0,4 0,8 1,2 1,6 2 0 0,5 1 1,5 2
x x
Diz-se que a distribuição exponencial não tem memória. É a única distribuição continua com
esta propriedade, que se pode interpretar no sentido de que a história do passado só influencia
na história futura através do presente.
1 1 t- 2
f(t) = exp(-2 ); tR
. 2
E escreve-se X N( , )
Seja Z uma variável aleatória normal com parámetros 0 e 1, isto é, Z N(0 , 1)
1 1 2
A sua função densidade de probabilidade (f.d.p) é : f(t) = exp(-2 t ); tR
2
t t
1 1 2
E a respectiva função de repartição (f.d) é: F(t) = P(Z ≤ t) = f(u)du = exp(-2 u ) du
2
- -
As funções F(t) e f(t) são funções tabeladas.
A função F(t) tem aparecido como (t) ou N(t)
N(t) = F(t) = P(Z ≤ t)
(t) = P(0 ≤ Z ≤ t) = P(-t ≤ Z ≤ 0)
N(Z) = P(Z ≤ z)
PROBABILIDADE E ESTATÍSTICA -3º Ano
v) À esquerda de Z = -0,6
a) O peso médio de 500 estudantes do sexo masculino de uma dada universidade é de 75,5
kg e o desvio padrão é 7,5 kg. Admitindo-se que os pesos dos estudantes estão normalmente
distribuídos, determinar quantos estudantes pesam:
b) Entre 60 e 77,5 kg
2. Faça Z uma v.a. com distribuição normal padronizada e encontre ( use a tabela):
a) P(0 ≤ Z ≤ 1,44)
b) P( -0,85 Z 0)
c) P(0,72 Z 1,89)
d) P(Z 1,08)
e) P(Z -0,66)
f) P( Z ≤ 0,5)
3. A duração de um certo componente electrónico tem média 850 dias e desvio padrão 45
dias. Calcular a probabilidade desse componente durar:
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 59
4. Em uma distribuição normal, 28% dos elementos são superiores a 34 e 12% inferiores a 19.
Encontre a média e a variância da distribuição.
PROBABILIDADE E ESTATÍSTICA -3º Ano
Unidade 09
Inferência Estatística
Introdução
No estudo de métodos estatísticos, já foi visto como resumir um conjunto de dados através
de tabelas de freqüências, gráficos e medidas de posição e dispersão. Depois, foram
estudados modelos probabilísticos, discretos ou contínuos, para descrever determinados
fenômenos. Agora, essas ferramentas serão utilizadas no estudo de um importante ramo da
Estatística, conhecido como Inferência Estatística, que busca métodos de fazer afirmações
sobre características de uma população, conhecendo-se apenas resultados de uma
amostra.Neste capítulo você estudará os seguintes conceitos:
• população e amostra
• amostra aleatória simples
• estatísticas e parâmetros
• estimador
• distribuição amostral de um estimador
• método dos momentos
• método da máxima verossimilhança
9.1.0. Introdução
9.2.0. População
A inferência estatística trata do problema de se obter informação sobre uma população a partir
de uma amostra. Embora a população real possa ser constituída de pessoas, empresas, animais,
etc., as pesquisas estatísticas buscam informações sobre determinadas características dos
sujeitos, características essas que podem ser representadas por números. Sendo assim, a cada
sujeito da população está associado um número, o que nos permite apresentar a seguinte
definição.
Definição: A população de uma pesquisa estatística pode ser representada por uma variável
aleatória X que descreve a característica de interesse.
Embora existam vários métodos de selecção de amostras, vamos nos concentrar aqui no caso
mais simples, que é a amostragem aleatória simples. Segundo tal método, toda amostra de
mesmo tamanho n tem igual chance (probabilidade) de ser sorteada. É possível extrair
amostras aleatórias simples com e sem reposição. Quando estudamos as distribuições
binomiais e hipergeométrica, vimos que a distribuição binomial correspondia a extracções com
reposição e a distribuição hipergeométrica correspondia a extracções sem reposição. No
entanto, para populações grandes - ou infinitas - extracções com e sem reposição não levam a
resultados muito diferentes. Assim, no estudo da Inferência Estatística, lidaremos sempre com
amostragem aleatória simples com reposição. Este método de selecção atribui a cada elemento
da população a mesma probabilidade de ser seleccionado e esta probabilidade se mantém
constante ao longo do processo de selecção da amostra (se as extracções fossem sem reposição
isso não aconteceria). No restante desse curso omitiremos a expressão “com reposição”, ou
seja, o termo amostragem (ou amostra) aleatória simples sempre se referirá à amostragem com
reposição. Por simplicidade, muitas vezes abreviaremos o termo amostra aleatória simples por
amostra aleatória simples.
Uma forma de se obter uma amostra aleatória simples é escrever os números ou nomes dos
elementos da população em cartões iguais, colocar estes cartões em uma urna misturando-os
bem e fazer os sorteios necessários, tendo o cuidado de colocar cada cartão sorteado na urna
antes do próximo sorteio. Na prática, em geral são usados programas de computador, uma vez
que as populações tendem a ser muito grandes.
Agora vamos formalizar o processo de selecção de uma amostra aleatória simples, de forma a
relacioná-lo com os problemas de inferência estatística que iremos estudar.
Seja uma população representada por uma variável aleatória X. De tal população será sorteada
uma amostra aleatória simples com reposição de tamanho n. Como visto nos exemplos
anteriores, cada sorteio dá origem a uma variável aleatória Xi e, como os sorteios são com
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 63
reposição, todas essas variáveis têm a mesma distribuição de X. Isso nos leva à seguinte
definição.
Definição: Uma amostra aleatória simples (aas) de tamanho n de uma variável aleatória X
(população) é um conjunto de n variáveis aleatórias X1, X2, ..., Xn independentes e
identicamente distribuídas (i.i.d.).
Definição: Uma estatística amostral ou estimador T é qualquer função da amostra X1, X2, ...,
Xn, isto é, T = g(X1, X2, ..., Xn) onde g é uma função qualquer.
PROBABILIDADE E ESTATÍSTICA -3º Ano
Para uma amostra específica, o valor obtido para o estimador será denominado estimativa e,
em geral, será representada por letras minúsculas. Por exemplo, temos as seguintes notações
correspondentes à média amostral e à variância:
Outras estatísticas possíveis são o mínimo amostral, o máximo amostral, a amplitude amostral,
etc.
Unidade 10
Distribuições Amostrais
Introdução
Nesta unidade terás a oportunidade de aprender Distribuições Amostrais.
Consideremos o seguinte exemplo, onde nossa população é o conjunto {1, 3, 6, 8}, isto é, este
é o conjunto dos valores da característica de interesse da população em estudo.
Assim, para esta população, ou seja, para essa variável aleatória X temos
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 67
Suponha que dessa população iremos extrair uma amostra aleatória simples de tamanho 2 e a
estatística que iremos calcular é a média amostral. Algumas possibilidades de amostra são
{1,1}, {1,3}, {6,8}, para as quais os valores da média amostral são 1, 2 e 7, respectivamente.
Podemos ver, então, que há uma variabilidade nos valores d estatística e, assim, seria
interessante que conhecêssemos tal variabilidade. Conhecendo tal variabilidade, temos
condições de saber “quão infelizes” podemos ser no sorteio da amostra. No exemplo acima, as
amostras {1,1} e {8,8} são as que têm média amostral mais afastada da verdadeira média
populacional. Se esses valores tiverem chance muito mais alta do que os valores mais próximos
de E(X), podemos ter sérios problemas.
Lembre-se do nosso estudo de análise combinatória: como o sorteio é feito com reposição, em
cada um dos sorteios temos 4 possibilidades. Logo, o número total de amostras aleatórias
simples é 4 × 4 = 16. Por outro lado, em cada sorteio, cada elemento da população tem a
mesma chance de ser sorteado; como são 4 elementos, cada elemento tem probabilidade 1/4 de
ser sorteado. Finalmente, como os sorteios são independentes, para obter a probabilidade de
um par de elementos pertencer à amostra basta multiplicar as probabilidades (lembre-se que
P(A ∩ B) = P(A)P(B) quando A e B são independentes).
Na tabela a seguir listamos todas as possíveis amostras, com suas respectivas probabilidades e
para cada uma delas, apresentamos o valor da média amostral.
Analisando esta tabela, podemos ver que os possíveis valores de X(média) são 1; 2; 3; 3,5;
4,5;5,5; 6; 7; 8 e podemos construir a sua função de distribuição de probabilidade, notando, por
exemplo, que o valor 2 pode ser obtido através de duas amostras: (1,3) ou (3,1). Como essas
PROBABILIDADE E ESTATÍSTICA -3º Ano
Definição:
Definição: Uma sequência {Tn} de estimadores de um parâmetro θ é consistente se, para todo
ε>0
Unidade 11
Introdução
Nesta unidade terás a oportunidade de aprender Alguns Métodos de Obtenção de
Estimadores; Método dos momentos; Distribuição de Poisson; Distribuição Exponencial;
Distribuição Normal; Método da máxima verossimilhança; Distribuição Amostral da
Média; Média e variância da distribuição amostral da média; . Distribuição amostral da
média para populações normais; . Distribuição amostral da média para populações
normais; Distribuição amostral da variância amostral;
O contexto geral é o seguinte: de uma população representada pela variável aleatória X extrai-
se uma amostra aleatória simples X1, X2, . . . , Xn. com o objetivo de se estimar um parâmetro
θ = (θ1, θ2, . . . , θr) . A distribuição de probabilidade f da variável X depende de tal parâmetro,
o que representaremos por f (x; θ).
PROBABILIDADE E ESTATÍSTICA -3º Ano
Definição: Dada uma amostra aleatória simples X1, X2, . . . , Xn de uma população X, o
momento amostral mk de ordem k é definido como
Definição: θ é o estimador para θ obtido pelo método dos momentos se ele for solução das
equações mk = μk ; k = 1, 2, . . . , r
estimar o parâmetro θ pelo valor que maximiza a probabilidade de se observar esses valores
da amostra.
A título de ilustração deste conceito, vamos considerar uma amostra aleatória simples de
tamanho 1 retirada de uma população N(μ; 1). Nosso objectivo é estimar a média a partir desta
amostra de tamanho 1. Suponhamos que a amostra sorteada resulte na observação x = 2. Essa
observação poderia ter vindo de qualquer distribuição normal com variância 1. Na Figura a
seguir temos 3 dessas possíveis distribuições: todas têm variância 1 mas suas médias são
diferentes. Os pontos coloridos correspondem ao valor da respectiva função de densidade no
Definição: Sejam X1, X2, . . . , Xn os valores observados de uma amostra aleatória simples X1,
X2, . . . , Xn retirada de uma população X ~ fX(x; θ). A função de verossimilhança é definida
por
PROBABILIDADE E ESTATÍSTICA -3º Ano
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 77
PROBABILIDADE E ESTATÍSTICA -3º Ano
Unidade 12
Introdução
Nesta unidade você irá aprofundar seus conhecimentos sobre a distribuição amostral da
média amostral. No capítulo anterior analisamos, através de alguns exemplos, o
comportamento da média amostral; mas naqueles exemplos, a população era pequena e
foi possível obter a distribuição amostral exata.Veremos agora resultados teóricos sobre a
distribuição amostral da média amostral, que nos permitirão fazer análises sem ter que
listar todas as amostras.Os principais resultados que estudaremos são:
Teorema: Seja X1, X2, . . . , Xn uma amostra aleatória simples de tamanho n de uma
população representada pela variável aleatória X com média μ e variância σ2. Então,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 79
DEMONSTRAÇÂO
É importante notar que esse resultado se refere a qualquer população X. O que ele estabelece é
que as médias amostrais das diferentes amostras aleatórias simples de tamanho n tendem a ser
iguais a média populacional μ. Além disso, à medida que o tamanho amostral n aumenta, a
dispersão em torno da média, medida por , vai diminuindo e tende a zero quando n
→ ∞.
Esse teorema não permite ver que é consistente para estimar a média populacional μ.
PROBABILIDADE E ESTATÍSTICA -3º Ano
Teorema: Seja X1, X2, . . . , Xn uma amostra aleatória simples de tamanho n de uma população
normal, isto é, uma população representada por uma variável aleatória normal X com média μ
e variância σ2. Então, a distribuição amostral da média amostral é normal com média μ e
2
variância σ /n, ou seja
dispersa que a distribuição amostral de , mas ambas estão centradas no verdadeiro valor
populacional μ = 2.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 81
Exemplo
A capacidade máxima de um elevador é de 500 kg. Se a distribuição dos pesos dos usuários é
N(70; 100), qual é a probabilidade de que 7 pessoas ultrapassem este limite? E de 6 pessoas?
Solução
Logo
Podemos ver que existe uma probabilidade alta (0,32 ou 32% de chance) de 7 pessoas
ultrapassarem o limite de segurança. Já com 6 pessoas, essa probabilidade é bastante pequena.
Assim, o número máximo de pessoas no elevador deve ser estabelecido como 6 ou menos.
Os resultados vistos anteriormente são válidos para populações normais, isto é, se uma
O teorema de limite central que veremos a seguir nos fornece um resultado análogo para
qualquer distribuição populacional, desde que o tamanho da amostra seja suficientemente
grande.
Teorema de Limite Central: Seja X1, X2, . . . , Xn uma amostra aleatória simples de uma
população X tal que E(X) = μ e Var(X) = σ2. Então, a distribuição de converge para a
2
distribuição normal com média μ e variância σ /n quando n → ∞.
Quão grande deve ser a amostra para se obter uma boa aproximação depende das
características da distribuição populacional. Se a distribuição populacional não se afastar muito
de uma distribuição normal, a aproximação será boa, mesmo para tamanhos pequenos de
amostra. Na Figura a seguir ilustra-se esse teorema para a distribuição exponencial, ou seja,
para uma população distribuída segundo uma exponencial com parâmetro λ = 1. O gráfico
superior representa a distribuição populacional e os histogramas representam a distribuição
amostral de ao longo de 5000 amostras de tamanhos 10, 50, 100 e 250. Assim, podemos
ver que, embora a população seja completamente diferente da normal, a distribuição amostral
de vai se tornando cada vez mais próxima da normal à medida que n aumenta.
Em termos práticos, esse teorema é de extrema importância, daí ser chamado de teorema
central e, em geral, amostras de tamanho n > 30 já fornecem uma aproximação razoável.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 83
Exemplo:
Uma moeda é lançada 50 vezes, com o objectivo de se verificar sua honestidade. Se ocorrem
36 caras nos 50 lançamentos, o que podemos concluir?
Solução
Neste caso, a população pode ser representada por uma variável de Bernoulli X com parâmetro
p, isto é, X assume o valor 1 com probabilidade p na ocorrência de cara e assume o valor 0
com probabilidade 1 − p na ocorrência de coroa. Para uma variável Bernoulli, temos que E(X)
= p e Var(X) = p(1 − p). Como são feitos 50 lançamentos, o tamanho da amostra é 50 (n
e variância
Suponhamos que a moeda seja honesta, isto é, que p = 1/2. Nestas condições, qual é a
probabilidade de obtermos 36 caras em 50 lançamentos? Com a hipótese de honestidade da
moeda, o teorema limite central nos diz que
Note que essa probabilidade é bastante pequena, ou seja, há uma pequena probabilidade de
obtermos 36 ou mais caras em um lançamento de uma moeda honesta. Isso pode nos levar a
suspeitar sobre a honestidade da moeda!
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 85
Teorema: Seja X1, X2, . . . , Xn uma amostra aleatória simples extraída de uma população com
N elementos e variância populacional
PROBABILIDADE E ESTATÍSTICA -3º Ano
Teorema: Se X1, X2, . . . , Xn é uma amostra aleatória simples extraída de uma população X
~ N(μ; σ2) então
(b) Se a população é normal com σ = 20, que proporção das amostras de tamanho
(c) Neste caso, qual deve ser o valor de δ para que Pr(| e | > δ) = 0, 01?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 87
(d) Qual deve ser o tamanho da amostra para que 95% dos erros amostrais absolutos sejam
inferiores a 1 unidade?
4. Uma fábrica produz parafusos especiais, para atender um determinado cliente, que devem ter
comprimento de 8,5 cm. Como os parafusos grandes podem ser reaproveitados a um custo
muito baixo, a fábrica precisa controlar apenas a proporção de parafusos pequenos. Para que o
processo de produção atinja o lucro mínimo desejável, é necessário que a proporção de
parafusos pequenos seja no máximo de 5%.
(a) Supondo que a máquina que produz os parafusos o faça de modo que os comprimentos
tenham distribuição normal com média μ e desvio padrão de 1,0 cm, em quanto deve ser
regulada a máquina para satisfazer as condições de lucratividade da empresa?
(b) Para manter o processo sob controle, é programada uma carta de qualidade. A cada hora
será sorteada uma amostra de 4 parafusos e, se o comprimento médio dessa amostra for menor
que 9,0 cm, o processo de produção é interrompido para uma nova regulagem da máquina.
Qual é a probabilidade de uma parada desnecessária?
(c) Se a máquina se desregulou de modo que o comprimento médio passou a ser 9,5 cm, qual é
a probabilidade de se continuar o processo de produção fora dos padrões desejados?
Unidade 13
Introdução
Aqui, você verá uma importante aplicação do Teorema de Limite Central. Vamos estudar a
distribuição amostral de proporções. Assim, você verá os resultados referentes à
aproximação da distribuição binomial pela distribuição normal. Veremos os seguintes
resultados:
Aproximação da binomial pela normal;
Correção de continuidade;
Distribuição amostral da proporção amostral;
quando n → ∞. Esse teorema nos diz que, se X é uma população com média μ e variância σ2,
então a distribuição amostral da média de uma amostra aleatória simples de tamanho n se aproxima de
A variável aleatória binomial foi definida como “número de sucessos em n repetições independentes de
um experimento de Bernoulli com parâmetro p”. Então, uma variável binomial é a soma de n variáveis
independentes Bern(p). Pelo teorema acima e usando o fato de que se X ~ Bern(p) então E(X) = p e
Var(X) = p(1 − p), podemos dizer que a distribuição binomial com parâmetros n e p se aproxima de
uma normal com média np e variância np(1 − p) quando n → ∞.
Alguns cuidados devem ser tomados na aproximação da binomial pela normal. Um fato importante a
observar é que a distribuição binomial é discreta, enquanto a variável normal é contínua. Veja a Figura
a seguir. Aí o histograma representa uma variável aleatória X com distribuição binomial com n = 12 e p
= 0, 5. OS retângulos, centrados nos possíveis valores de X, têm base 1 e altura igual a Pr(X = k), de
modo que a área de cada retângulo é igual a Pr(X = k). A curva normal aí representada é de uma
variável aleatória Y com média μ = 12 × 0,5 = 6 e variância σ2 = 12 × 0, 5 × 0,5 = 3.
Suponha que queiramos calcular Pr(X ≥ 8). Isso equivale a somar as áreas dos 4 últimos retângulos
superiores. Pela aproximação normal, no entanto, temos que calcular a área (probabilidade) acima do
ponto 7,5, de modo a incluir os 4 retângulos. Assim, teremos
PROBABILIDADE E ESTATÍSTICA -3º Ano
Vamos, agora, calcular Pr(X > 10). Isso equivale à área dos 2 rectângulos superiores, centrados em 11
e 12 (este último não é visível, pois Pr(X = 12) = 0, 000244); logo, pela distribuição normal temos que
calcular Pr(Y ≥ 10, 5) :
É interessante observar que para uma variável binomial faz sentido calcular Pr(X = k); no caso da
normal, essa probabilidade é nula, qualquer que seja k. Para usar a aproximação normal para calcular,
por exemplo, Pr(X = 5), devemos notar que essa probabilidade equivale à área do retângulo centrado
em 5 e, em termos da curva normal, temos que calcular a área compreendida entre 4,5 e 5,5:
1. np ≥ 5
2. n(1 − p) ≥ 5
PROBABILIDADE E ESTATÍSTICA -3º Ano
(a) Pr(X = k) (b) Pr(X ≤ k) (c) Pr(X < k) (d) Pr(X ≥ k) (e) Pr(X > k)
Considere uma população em que cada elemento é classificado de acordo com a presença ou ausência
de determinada característica. Por exemplo, podemos pensar em eleitores escolhendo entre 2
candidatos, pessoas classificadas de acordo com o sexo, trabalhadores classificados como trabalhador
com carteira assinada ou não, e assim por diante. Em termos de variável aleatória, essa população é
representada por uma variável aleatória de Bernoulli, isto é:
Vamos denotar por p a proporção de elementos da população que possuem a característica de interesse.
Então, Pr(X = 1) = p, E(X) = p e Var(X) = p(1 −p). Em geral, esse parâmetro é desconhecido e
precisamos estimá-lo a partir de uma amostra.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 93
Suponha, então, que dessa população seja extraída uma amostra aleatória simples X1, X2 , . . . , Xn com
reposição. Essas n extracções correspondem a n variáveis aleatórias de Bernoulli independentes e, como
foi visto,
Justifique que
Como a proporção amostral é uma média de uma amostra aleatória simples de uma população com
distribuição de Bernoulli com parâmetro p, o Teorema de Limite Central nos diz, então, que a
Exemplo:
De um lote de produtos manufacturados, extrai-se uma amostra aleatória simples de 100 itens. Se 10%
dos itens do lote são defeituosos, calcule a probabilidade de serem sorteados no máximo 12 itens
defeituosos.
Solução
As condições para utilização da aproximação normal são válidas: com n = 100 e p = 0, 1 temos que
1. Use a aproximação normal para calcular as probabilidades pedidas tendo o cuidado de verificar que
as condições para essa aproximação são realmente satisfeitas.
2.Em uma sondagem, perguntou-se a 1002 membros de determinado sindicato se eles haviam votado na
última eleição para a direcção do sindicato e 701 responderam afirmativamente. Os registros oficiais
obtidos depois da eleição mostram que 61% dos membros aptos a votar de fato votaram. Calcule a
probabilidade de que, dentre 1002 membros selecionados aleatoriamente, no mínimo 701 tenham votado,
considerando que a verdadeira taxa de votantes seja de 61%. O que o resultado sugere?
3.Supondo que meninos e meninas sejam igualmente prováveis, qual é a probabilidade de nascerem 36
meninas em 64 partos? Em geral, um resultado é considerado não-usual se a sua probabilidade de
ocorrência é pequena, digamos, menor que 0,05. É não-usual nascerem 36 meninas em 64 partos?
4.Com base em dados históricos, uma companhia aérea estima em 15% a taxa de desistência entre seus
clientes, isto é, 15% dos passageiros com reserva não aparecem na hora do vôo. Para otimizar a
ocupação de suas aeronaves, essa companhia decide aceitar 400 reservas para os vôos em aeronaves que
comportam apenas 350 passageiros. Calcule a probabilidade de que essa companhia não tenha assentos
suficientes em um desses vôos. Essa probabilidade é alta o suficiente para a companhia rever sua
política de reserva?
Unidade 14
Intervalos de Confiança
Introdução
Nesta unidade terás a oportunidade de aprender os intervalos de confiança constituem um método muito
importante de estimação de parâmetros. Vimos anteriormente que a média amostral é um bom
estimador da média populacional μ. Mas vimos, também, que existos e métodos:
Intervalo de confiança;
Margem de erro;
Nível de confiança;
Nível de seignificância;
Intervalo de confiança para a média de uma população N (μ; σ2) com variância conhecida.
Na prática, temos apenas uma amostra e, assim, é importante que se dê alguma informação sobre essa
O que vamos estudar agora é como obter esse intervalo, de modo a “acertar na maioria das vezes”, isto
é, queremos um procedimento que garanta que, na maioria das vezes (ou das amostras possíveis), o
intervalo obtido conterá o verdadeiro valor do parâmetro. A expressão “na maioria das vezes” será
traduzida como “probabilidade alta”. Dessa forma, estaremos lidando com afirmativas do seguinte tipo:
A interpretação correcta de tal afirmativa é a seguinte: se 1 −α = 0, 95, por exemplo, então isso significa
que o procedimento de construção do intervalo é tal que, em 95% das possíveis amostras, o intervalo
Aí dois dos intervalos não contêm o parâmetro θ. O valor 1 − α é chamado nível de confiança, enquanto
Tendo clara a interpretação do intervalo de confiança, podemos resumir a frase acima da seguinte
maneira:
Mais uma vez, a probabilidade se refere à probabilidade dentre as diversas possíveis amostras, ou seja,
dependem de , que depende da amostra sorteada, ou seja, os limites do intervalo de confiança são
variáveis aleatórias. Cada amostra dá origem a um intervalo diferente, mas o procedimento de obtenção
dos intervalos garante probabilidade 1 − α de acerto.
Consideremos uma população descrita por uma variável aleatória normal com média μ e variância σ2 :
X ~ N(μ; σ2). Suponhamos que o valor de σ2 seja conhecido e que nosso interesse seja estimar a média
μ a partir de uma amostra aleatória simples X1 , X2, . . . , Xn. Como já deves saber do que foi visto
Da definição de distribuição amostral, isso significa que os diferentes valores de obtidos a partir
das diferentes possíveis amostras se distribuem normalmente em torno de μ com variância σ2/ n .
Com base nisso, vamos estabelecer a seguinte notação: indiquemos por a abcissa da curva normal
padrão que deixa probabilidade (área) igual a α acima dela. Vê as Figuras seguintes. Temos, então, que
Considerando, agora, o valor crítico podemos ver que, se Z ~ N(0; 1), então
Definição:
Seja X ~ N(μ; σ2) uma população normal com variância σ2 conhecida. Se X1 , X2, . . . , Xn é uma
amostra aleatória simples dessa população, então o intervalo de confiança de nível de confiança 1 − α
para a média populacional μ é dado por
fornecem diferentes valores de cuja média é igual a μ. As diferentes amostras fornecem diferentes
intervalos de confiança, mas uma proporção de 100×(1 − α)% desses intervalos irá conter o verdadeiro
valor de μ. Note que aqui é fundamental a interpretação de probabilidade como frequência relativa:
estamos considerando os diferentes intervalos que seriam obtidos, caso sorteássemos todas as possíveis
amostras.
Assim, o nível de confiança está associado à confiabilidade do processo de obtenção do intervalo: esse
processo é tal que acertamos (isto é, o intervalo contém μ) em 100×(1 − α)% das vezes.
Na prática, temos apenas uma amostra e o intervalo obtido com essa amostra específica, ou contém ou
não contém o verdadeiro valor de μ. A afirmativa
é válida porque ela envolve a variável aleatória que tem diferentes valores para as diferentes
amostras. Quando substituímos o estimador por uma estimativa específica obtida a partir de
uma amostra particular, temos apenas um intervalo e não faz mais sentido falar em probabilidade.
Para ajudar na interpretação do intervalo de confiança, suponha que, com uma amostra de tamanho 25,
tenha sido obtido o seguinte intervalo de confiança com nível de confiança de 0,95:
PROBABILIDADE E ESTATÍSTICA -3º Ano
Esse intervalo específico contém ou não contém o verdadeiro valor de μ. O que estamos dizendo é que,
se repetíssemos o mesmo procedimento de sorteio de uma amostra aleatória simples da população e
conseqüente construção do intervalo de confiança, 95% dos intervalos construídos conteriam o
verdadeiro valor de μ.
Sendo assim, é errado dizer que há uma probabilidade de 0,95 de o intervalo específico [4, 216; 5, 784]
conter o verdadeiro valor de μ. Mas é certo dizer que com probabilidade 0,95 o intervalo
Solução
Analisando a Figura anterior, vemos que nas duas caudas da distribuição normal padrão tem que ter 5%
da área (α = 0, 05); logo, em cada cauda temos que ter 2,5% (α/2 = 0, 025) da área total. Em termos da
nossa tabela da distribuição normal padrão (apresentada ao final da módulo como Tabela distribuição
normal), isso significa que entre 0 e z0,025 temos que ter (50 − 2, 5)% = 47,5% e, assim, temos que
procurar no corpo da tabela o valor de 0,475 para determinar a abcissa z0,025. Veja a Figura seguinte.
Procurando no corpo da tabela da distribuição normal padrão, vemos que o valor 0,475 corresponde à
abcissa z0,025 = 1, 96. Logo, nosso intervalo de confiança é
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 103
Esse intervalo contém ou não o verdadeiro valor de μ, mas o procedimento utilizado para sua obtenção
nos garante que há 95% de chance de estarmos certos.
Exemplo 2:
De uma população normal co-variância 25 extrai-se uma amostra aleatória simples de tamanho n com o
objectivo de se estimar a média populacional μ com um nível de confiança de 90% e margem de erro de
2. Qual deve ser o tamanho da amostra?
Solução
Para um nível de confiança 0,90, o valor do nível de significância é α = 0, 10. Então, na cauda superior
da distribuição normal padrão temos que ter uma área (probabilidade) de 0,05 e, portanto, para
encontrarmos o valor de z0,05 temos que procurar no corpo da tabela o valor 0,45. Resulta que z0,05 = 1,
64.
Já que o valor de n tem que ser um inteiro, devemos arredondar por excesso para garantir um nível de
confiança no mínimo igual ao desejado. Neste caso, a estimativa apropriada é n = 17.
Exemplo 3:
Na divulgação dos resultados de uma pesquisa, publicou-se o seguinte texto (dados fictícios): “Com o
objectivo de se estimar a média de uma população, estudou-se uma amostra de tamanho n = 45. De
estudos anteriores, sabe-se que essa população é muito bem aproximada por uma distribuição normal
com desvio padrão 3, mas acredita-se que a média tenha mudado desde esse último estudo. Com os
dados amostrais obteve-se o intervalo de confiança [1, 79; 3, 01], com uma margem de erro de 0,61.”
Quais são as informações importantes que não foram divulgadas? Como podemos obtê-las?
Solução
Quando se divulga um intervalo de confiança para um certo parâmetro, é costume publicar também a
estimativa pontual. Nesse caso, temos que informar a média amostral, que pode ser achada observando
que o intervalo de confiança é simétrico em torno da média. Logo, é o ponto médio do intervalo:
Outra informação importante é o nível de confiança que pode ser calculado a partir da abcissa
Consultando a tabela da distribuição normal, encontramos que se zα/2 = 1,36, então 1 – α = 2x0,41308 =
0,82616 ≈ 0,83 que é o nível de confiança.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 105
1. De uma população N(μ; 9) extrai-se uma amostra aleatória simples de tamanho 25, obtendo-se
2. Determine o tamanho da amostra necessário para se estimar a média de uma população normal com σ
= 4, 2 para que, com confiança de 95%, o erro máximo de estimação seja ±0, 05.
3. O peso X de um certo artigo é descrito aproximadamente por uma distribuição normal com σ = 0, 58.
4. De uma população normal com σ = 5, retira-se uma amostra aleatória simples de tamanho 50,
obtendo-se = 42.
(a) Obtenha o intervalo de confiança para a média com nível de significância de 5%.
(c) Para que o erro seja ≤ 1, com probabilidade de acerto de 95%, qual deverá ser o tamanho da
amostra?
5. Os valores da venda mensal de determinado artigo têm distribuição aproximadamente normal com
desvio padrão de R$500,00. O gerente da loja afirma vender, em média, R$34.700,00. O dono da loja,
querendo verificar a veracidade de tal afirmativa, selecciona uma amostra aleatória das vendas em
determinado mês, obtendo os seguintes valores:
(a) Obtenha o intervalo de confiança para a venda média mensal com nível de significância de 5%.
(b) Obtenha o intervalo de confiança para a venda média mensal com nível de significância de 1%.
(c) Em qual dos dois níveis de significância podemos afirmar que o gerente se baseou para fazer a
afirmativa?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 107
Unidade 15
Intervalos de Confiança
Introdução
Nesta unidade completarás teu estudo básico sobre intervalos de confiança para a
média de uma população, analisando o problema de estimação da média de uma
população normal quando não se conhece a variância desta população. Verás que, neste
caso, é necessário estimar essa variância e isso introduz mais uma fonte de
variabilidade nas nossas estimativas: com uma única amostra, temos que estimar a
média e a variância da população. O procedimento é simples e análogo ao caso
anteriormente visto; o que muda é a distribuição amostral do estimador . Em vez de
usarmos a distribuição normal para determinar os valores críticos, usaremos a
distribuição t de Student.
Veremos, então, os seguintes conceitos:
Estimação da variância de uma população;
Distribuição amostral da média amostral de uma população normal com
variância desconhecida;
Intervalo de confiança para a média de uma população normal com variância
desconhecida;
Consideremos uma população normal com média μ e variância σ2 : X ~ N (μ; σ2 ). Nosso interesse é
estimar a média μ a partir de uma amostra aleatória simples X1, X2, . . . , Xn. Como vimos
E com este resultado foi construido o seguinte intervalo de confiança para a média populacional
Uma vez que não conhecemos a variância σ2, temos que estimá-la com os dados amostrais. Um
estimador não viciado de σ2 é S2 . Isso significa que, se calculássemos o valor de S2 para cada uma das
possíveis amostras aleatórias simples de tamanho n, a média desses valores seria igual a σ2. Dessa
forma, S2 é um “bom” estimador de σ2 e podemos usá-lo como uma estimativa pontual de σ2. Como o
desvio padrão é a raiz quadrada da variância, é natural perguntar: S é um “bom” estimador de σ, ou
seja, S é um estimador não-enviesado ou não viciado de σ? A resposta é NÃO, mas, para grandes
amostras, o viés é pequeno, de modo que, em geral, usa-se S como estimador de σ.
e utilizarmos a estatística
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 109
A distribuição t de Student (ou simplesmente distribuição t) foi obtida por William Gosset (1876-1937),
que trabalhava na Cervejaria Guinness na Irlanda. Como a cervejaria não permitia a publicação de
resultados de pesquisa obtidos por seus funcionários, Gosset publicou, sob o pseudônimo de Student, o
artigo “The Probable Error of a Mean” na revista Biometrika (vol. 6, no. 1).
Teorema: Se X1, X2, . . . , Xn é uma amostra aleatória simples de uma população X ~ N (μ; σ2) , então
Em t(n-1), o número de graus de liberdade gl = n − 1 resulta do fato de que, na soma que define S2, há
E, portanto, teremos o seguinte intervalo de confiança para a média populacional com a variância
(populacional) desconhecida
Exemplo 1:
De uma população normal com média e variância desconhecidas, extrai-se uma amostra de tamanho 15
Solução
A população é normal e a amostra é pequena. Dessa forma, temos que usar a distribuição t com n − 1 =
14 graus de liberdade. Como o nível de confiança é de 95%, em cada cauda da distribuição temos que
ter 2,5%. Assim, devemos procurar a abcissa t14;0,025 procurando na linha correspondente a 14 graus de
liberdade e na coluna correspondente (na tabela de t de student) à área de 0,025.
Encontramos
,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 111
A margem de erro é
E o intervalo de confiança é
Exemplo 2:
A seguinte amostra foi extraída de uma população normal: 6, 6, 7, 8, 9, 9, 10, 11, 12. Construa o
intervalo de confiança para a média populacional, com nível de significância
de 10%.
Solução
Como antes, temos uma amostra pequena de uma população normal; logo, temos que usar a distribuição
t-Student. Como n = 9, gl = n −1 = 8.
A média amostral é
E a variância amostral é
PROBABILIDADE E ESTATÍSTICA -3º Ano
é t(n − 1). Mas também quando o número de graus de liberdade é grande, as diferenças entre as
distribuições t e N(0; 1) tornam-se desprezíveis.
Por outro lado, o teorema de limite central nos diz que se a população não é normal, mas tem média μ e
Dada uma amostra aleatória simples X1, X2, . . . , Xn de uma população X com média μ e variância σ2,
então
para n suficientemente grande. Nesse caso, o intervalo de confiança aproximado de nível de confiança 1
− α para μ é
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 113
Donde teremos
E, portanto,
Exemplo:
PROBABILIDADE E ESTATÍSTICA -3º Ano
Um gerente de produção deseja estimar a proporção de peças defeituosas em uma de suas linhas de
produção. Para isso, ele selecciona uma amostra aleatória simples de 100 peças dessa linha de
produção, obtendo 30 defeituosas. Determine o intervalo de confiança para a verdadeira proporção de
peças defeituosas nessa linha de produção, a um nível de significância de 5%.
Solução
O primeiro facto a observar é que a amostra é grande, o que nos permite usar a aproximação normal.
Com um nível de significância de α = 0, 05, o nível de confiança é 1 − α = 0, 95 e da tabela da normal
padrão, obtemos que zα/2 = 1, 96. Assim, a margem de erro é
e o intervalo de confiança é
Exemplo 2:
Para estudar a viabilidade de lançamento de um novo produto no mercado, o gerente de uma grande
empresa contrata uma firma de consultoria estatística para estudar a aceitação do produto entre os
clientes potenciais. O gerente deseja obter uma estimativa com um erro máximo de 1% com
probabilidade 80% e pede ao consultor estatístico que forneça o tamanho de amostra necessário.
a). De posse das informações dadas, o consultor calcula o tamanho da amostra necessário no pior
cenário. O que significa “pior cenário” nesse caso? Qual o tamanho de amostra obtido pelo consultor?
b). O gerente acha que o custo de tal amostra seria muito alto e autoriza o consultor a realizar um estudo
piloto com uma amostra de 100 pessoas para obter uma estimativa da verdadeira proporção. O resultado
desse estudo piloto é uma estimativa po = 0, 76 de aceitação do novo produto. Com base nessa
estimativa, o consultor recalcula o tamanho da amostra necessário. Qual é esse tamanho?
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 115
c). Seleccionada a amostra com o tamanho obtido no item anterior, obteve-se uma proporção de 72% de
clientes favoráveis ao produto. Construa um intervalo de confiança para a verdadeira proporção com
nível de confiança de 90%.
Solução
a). O pior cenário é quando a população está dividida meio-a-meio em suas preferências,
ou seja, quando p = 0, 5. Com nível de confiança de 80%, obtemos z0,10 = 1, 28. Nesse caso,
ou seja, n = 2989
c). 1 − α = 0, 90 =⇒ z0,05 = 1, 64
e o intervalo de confiança é
Unidade 16
Intervalos de Confiança
Introdução
Nesta unidade terás a oportunidade de aprender Nesta secção irás completar o estudo
básico sobre intervalos de confiança, analisando o problema de estimação da variância
de uma população normal. Como antes, este intervalo se baseará na distribuição
amostal de um estimador não enviesado para σ2, a saber, S2. Como a variância é um
número não negativo, essa distribuição não é simétrica e está definida apenas para
valores não-negativos.
O contexto subjacente é o seguinte: a partir de uma amostra aleatória simples X1, X2, . . . , Xn retirada
de uma população normal com média μ e variância σ2 queremos construir um intervalo de confiança
para σ2. A hipótese de normalidade da população é fundamental aqui. Assim como no caso da média,
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 117
temos que usar a distribuição amostral de algum estimador. Neste caso, o estimador é S2 e o resultado
importante é o seguinte:
Como no caso da distribuição t−Student, vamos definir o valor crítico como a abscissa da
distribuição qui-quadrado com n graus de liberdade que deixa probabilidade α acima dela. Veja a
Figura a seguir.
Tal como podes ver nas duas figuras (a e b) seguintes, a abcissa deixa probabilidade α/2 acima
donde vem
Exemplo 1:
De uma população normal com média e variância desconhecidas, extraísse uma amostra de tamanho 15
Solução
O requisito para o IC para σ2 é satisfeito, uma vez que a população é normal. Temos que usar a
distribuição χ2 com n −1 = 14 graus de liberdade. Como o nível de confiança é de 95%, em cada cauda
da distribuição temos que ter 2,5%. Assim, para a cauda superior, devemos procurar a abcissa
E o intervalo de confiança é
Exemplo 2:
A seguinte amostra foi extraída de uma população normal: 6, 6, 7, 8, 9, 9, 10, 11, 12.
de 10%.
Solução
Temos uma amostra de uma população normal; logo, podemos usar a distribuição χ2. Como n = 9, gl =
n − 1 = 8.
A média amostral é
E a variância amostral é
PROBABILIDADE E ESTATÍSTICA -3º Ano
Unidade 17
Testes de Hipóteses
Introdução
Nesta unidade terás a oportunidade de aprender Intervalo de Confiança: Diferença de
médias;
A construção de intervalos de confiança para a diferença de médias faz-se de forma análoga a que foi
usada para os casos anteriores. Suponhamos que temos duas populações normais (ou aproximadamente
normais) das quais se tem ~ N (μ1; σ12 /n) e ~ N (μ2; σ22/m). A variável - também terá
distribuição normal com média μ1 - μ2 e variância
É preciso salientar que neste caso supomos que as variâncias das duas populações são conhecidas.
PROBABILIDADE E ESTATÍSTICA -3º Ano
No caso (mais realista) em que as variâncias populacionais são desconhecidas e sabemos que são iguais,
então é preciso estimar a variância comum. Deste modo teremos o seguinte intervalo de confiança:
Em que, neste caso, a variável diferença de médias tem distribuição t com n+m-2 graus de liberdade e
Sc2 é a estimativa da variância comum.
Se as duas variâncias populacionais são desconhecidas e distintas então calcula-se com base nas
amostras as estimativas S12 e S22 e constrói-se o seguinte intervalo:
Com base nos conteúdos abordados até este momento, deduz os intervalos de
confiança para os seguintes casos:
a) Quociente de variâncias
b) Diferença de proporções
Variância σ2
Proporção p
1. Para uma população de usuários de uma biblioteca que utilizam os computadores disponíveis se
deseja estimar o tempo médio de utilização. Para tal recolhe-se uma amostra aleatória de 38 usuários, da
qual foram obtidos os seguintes dados: tempo médio 3,20 minutos e variância amostral de 0,24.
Aceitando-se que o tempo de utilização se ajusta a uma distribuição normal pede-se:
b) A estimação deste parâmetro por intervalo de confiança de 95% e 99% de confiança, comparando a
precisão de ambos.
2. Se deseja estimar a percentagem de famílias de uma grande cidade, que têm conexão de Intenet em
casa. Para isso foi recolhida uma amostra aleatória simples de tamanho n = 170 casas e verificou-se que
97 dessas têm Internet. Pede-se:
3. Uma amostra aleatória extraída de uma população normal de variância igual a 100, apresenta uma
Com n = 144 :
c) Se se quiser ter uma confiança de 95% de que a sua estimação se encontra a uma distância 1.2 cm
mais ou menos da verdadeira média populacional, quantas observações adicionais devem tomar-se?
PROBABILIDADE E ESTATÍSTICA -3º Ano
4. Uma central de transformação de produtos lácteos recebe diariamente leite dos fornecedores A e B.
Desejando-se estudar a qualidade do produto recebido, extraem duas amostras ao acaso e analisa-se os
conteúdos em matéria de gorduras, obtendo-se os seguintes dados:
Fornecedor A:
Fornecedor B:
Constrói um intervalo de confiança de 95% da diferença de conteúdo médio de gorduras no leite dos
dois fornecedores, supondo que as populações são normais.
5. A resistência à fractura de determinado tipo de vidro segue uma distribuição normal de média 14 e
desvio padrão 2.
a) Qual é a probabilidade de que a resistência média de peças desse vidro seja maior que 14.5?.
b) Determinar um intervalo que abarque à resistência média a fractura de 100 amostras de vidrio com
uma probabilidade de 0.95.
6. Os tempos gastos por quinze funcionários em uma das tarefas de um programa de treinamento
estão listados abaixo. É razoável supor, nesse caso, que essa seja uma amostra aleatória simples de
uma população normal, ou seja, é razoável supor que a população de todos os tempos de funcionários
submetidos a esse treinamento seja aproximadamente normal. Obtenha o intervalo de confiança de
nível de confiança de 95% para o tempo médio populacional.
52 44 55 44 45 59 50 54 62 46 54 58 60 62 63
7. Uma amostra aleatória simples de uma população normal apresenta as seguintes características:
n = 25, e S2 = 900
8. Em uma fábrica, uma amostra de 30 parafusos apresentou os seguintes diâmetros (em mm):
10 13 14 11 13 14 11 13 14 15
12 14 15 13 14 12 12 11 15 16
13 15 14 14 15 15 16 12 10 15
Supondo que os diâmetros sejam aproximadamente normais, obtenha um intervalo de confiança para
o diâmetro médio de todos os parafusos produzidos nessa fábrica, usando o nível de significância de
2%. Para facilitar a solução do exercício, você pode usar os seguintes resultados:
9. Repita o exercício anterior com os seguintes dados de uma amostra de 100 parafusos:
10. As estaturas de 1 000 estudantes da UCM representam uma amostra ao acaso das estaturas dos
estudantes da universidade, sendo a estatura média amostral igual a 165 cm e a variância amostral 400
cm2. Supondo que as alturas seguem a distribuição normal, determinar:
b) O intervalo de confiança a 99% de confiança, para a verdadeira estatura média dos estudantes.
11. Uma inspecção cuidadosa de 70 suportes de concorre que serão usados numa construção revelou
que 28 têm defeito. Estimar a verdadeira proporção de suportes defeituosos com um intervalo de
confiança de 98%.
12. Um grande consórcio formado por várias companhias instituíu uma nova política de inspecção para
controlar a qualidade. Entre 30 operários seleccionados na companhia A, somente 5 objectaram a nova
política. Entre 35 operários seleccionados na companhia B, 10 objectaram a nova política. Estimar a
PROBABILIDADE E ESTATÍSTICA -3º Ano
verdadeira diferença entre as proporções de trabalhadores que não objectaram a nova política para as
duas companhias, com um coeficiente de confiança igual a 0.98.
14. O departamento de zoologia de um Instituto Politécnico levou a cabo um estudo para estimar a
diferença em cantidade de ortofósforo químico medido em duas estações diferentes. Foram recolhidas
15 amostras da estação 1 e 12 amostras da estação 2. As 15 amostras da estação 1 tiveram um conteúdo
médio de ortofósforo de 3.84mg. por litro, com um desvio típico (padrão) de 3.07mg. por litro,
enquanto que as 12 amostras da estação 2 tiveram uma média de 1.49mg. por litro, com um desvio
padrão de 0.8mg. por litro. Encontrar um intervalo de confiança de 98% para o quociente de variâncias
como forma de estudar se as variâncias são ou não iguais. Supõe populações normais.
15. Calcular um intervalo de confiança ao nível de α = 0,05 para a probabilidade p de que um recém
nascido seja rapaz se em uma amostra de tamanho 123 verificou-se que 67 eram rapazes.
16. As pontuações em um teste de raciocínio abstracto seguem uma distribuição Normal de média 35 e
variância 60. Para avaliar um programa de melhoramento das capacidades intelectuais, a 101 indivíduos
que estão realizando este programa é aplicado o teste, obtendo-se uma média de 50 pontos e uma
variância de 80.
17. Uma amostra de 300 habitantes de uma grande cidade revelou que 180 desejavam a fluoração da
água. Encontre o intervalo de confiança para a verdadeira proporção dos que não desejam a fluoração
da água para:
18. Querendo estimar a proporção de peças defeituosas em uma linha de produção, examinou-se uma
amostra de 100 peças, encontrando-se 32 defeituosas. Sabe-se que o estimador para esse
tamanho de amostra tem desvio padrão de 3%.
19. Em uma pesquisa de mercado, 57 das 150 pessoas entrevistadas afirmaram que comprariam
determinado produto sendo lançado por uma empresa. Essa amostra é suficiente para se estimar a
verdadeira proporção de futuros compradores, com uma precisão de 0,08 e uma confiança de 90%?
Em caso negativo, calcule o tamanho de amostra necessário.
20. Uma amostra aleatória simples de 400 itens forneceu 100 itens correspondentes ao evento
Sucesso.
(c) Calcule o intervalo de confiança para a verdadeira proporção de Sucessos na população ao nível de
confiança de 80%.
21. Em uma sondagem, uma estimativa preliminar de “Sucessos” em uma população é de 0,35. Que
tamanho deve ter uma amostra para fornecer um intervalo de confiança de 95% com uma margem de
erro de 0,05?
PROBABILIDADE E ESTATÍSTICA -3º Ano
Unidade 18
Testes de Hipóteses
Introdução
Nesta unidade terás a oportunidade de aprender Região crítica e nível de significância; Testes de
Hipóteses; Estatística de teste, erros e regra de decisão.
• Estatística de teste
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 131
• Regra de decisão
• Região crítica
• Poder do teste
Exemplo 1
Assim, há 4 possibilidades que podem ocorrer quando o detective tomar sua decisão:
Se o problema do detective fosse de origem estatística, a primeira providência que ele teria que
tomar seria formular uma hipótese nula, que é uma afirmação sobre um parâmetro da
população. A hipótese nula, normalmente designada por H0, é uma afirmação que é
estabelecida com o objectivo de ser testada; ela pode ser rejeitada ou não. Normalmente, a
hipótese nula é formulada de tal forma que o objectivo é rejeitá-la.
H0 : mordomo é inocente
PROBABILIDADE E ESTATÍSTICA -3º Ano
Se as evidências são suficientes para se rejeitar a hipótese nula, então aceita-se a hipótese
alternativa, normalmente designada por H1, que será aceite se a hipótese nula for rejeitada. No
exemplo, como só existem 2 possibilidades, temos que
H1 : mordomo é culpado
Observa que o método é aplicado para se testar a hipótese nula. A hipótese alternativa será
aceita se e somente se a hipótese nula for rejeitada, ou seja, a estratégia é tomar uma decisão
com relação à hipótese nula.
Evidentemente, o erro tipo I pode ser evitado se nunca rejeitarmos a hipótese nula. No
exemplo, isso significa que o detective nunca cometeria o erro de condenar um homem
inocente. De forma análoga, o erro tipo II pode ser evitado se sempre rejeitarmos a hipótese
nula e, no exemplo, o detective nunca libertaria um assassino.
Exemplo 2
Uma empresa compra anéis de vedação de dois fabricantes. Segundo informações dos
fabricantes, os anéis do fabricante 1 têm diâmetro médio de 14 cm com desvio padrão de 1,2
cm e os anéis do fabricante 2 têm diâmetro médio de 15 cm com desvio padrão de 2,0 cm.
Ambos os processos de produção geram anéis com diâmetros cuja distribuição é
aproximadamente normal.
Uma caixa com 16 anéis sem identificação é encontrada pelo gerente da empresa.
Embora ele suspeite que a caixa seja oriunda do fabricante 1, ele decide fazer uma medição dos
anéis e basear sua decisão no diâmetro médio da amostra: se o diâmetro médio for maior que
14,5 cm, ele identificará a caixa como oriunda do fabricante 2; caso contrário, ele identificará a
caixa como oriunda do fabricante 1.
Esse é um problema típico de decisão empresarial. Vamos analisar esse processo decisório sob
o ponto de vista estatístico, estudando os possíveis erros e suas probabilidades de ocorrência.
Uma primeira observação é que existem apenas duas possibilidades para a origem dos anéis de
vedação. Como ele suspeita que a caixa venha do fabricante 1, vamos estabelecer a hipótese
nula de forma que o resultado desejado seja rejeitá-la. Definimos, então, a hipótese nula como
sendo
Se denotamos por X a variável aleatória que representa o diâmetro dos anéis, essas hipóteses se
traduzem como
H0 : X ~ N(15; 22)
H1 : X ~ N(14; 1, 22)
A decisão do gerente tem que ser tomada em função do resultado amostral observado; assim,
usamos a notação Lembre-se que usamos letras minúsculas para representar o valor
observado de uma variável aleatória. Quando falamos da probabilidade do erro ou mesmo da
regra de decisão em termos gerais, estamos considerando o procedimento decisório geral.
Como esse procedimento depende da amostra sorteada, temos que expressar as probabilidades
dos erros e a regra de decisão levando em conta as possíveis amostras, ou seja, temos que levar
em conta a variável aleatória que descreve a média amostral de uma possível amostra
aleatória simples de tamanho n.
Hipótese nula
A hipótese nula, representada por H0, é a hipótese básica que queremos testar. Em geral,
definimos a hipótese nula de modo que o nosso objetivo seja rejeitar H0. Nesse texto
consideraremos apenas hipóteses nulas simples, isto é, hipóteses que estabelecem que o
parâmetro de interesse é igual a um determinado valor. A forma geral é
H0 : θ = θ0
H0 : μ = 6 H0 : p = 0, 5 H0 : σ2 = 25
PROBABILIDADE E ESTATÍSTICA -3º Ano
O procedimento de teste de hipótese resultará em uma regra de decisão que nos permitirá
rejeitar ou não rejeitar H0.
Hipótese alternativa
A hipótese alternativa, representada por H1, é a hipótese que devemos considerar no caso de
rejeição da hipótese nula. A forma mais geral de H1 é a hipótese bilateral
Em algumas situações, podemos ter informação que nos permita restringir o domínio da
hipótese alternativa. Por exemplo, se uma empresa farmacêutica está testando um novo
medicamento para enxaqueca no intuito de reduzir o tempo entre a ingestão do medicamento e
o alívio dos sintomas, uma possível hipótese alternativa seria
A escolha entre essas formas de hipótese alternativa se faz com base no conhecimento sobre o
problema sendo considerado.
A escolha entre essas formas de hipótese alternativa se faz com base no conhecimento sobre o
problema sendo considerado.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 137
A decisão sobre a hipótese nula é tomada com base em uma regra que estabelece um conjunto
de valores, chamado região crítica ou região de rejeição, de modo que se, o valor observado da
estatística amostral cair nessa região, rejeitaremos H0; caso contrário, não rejeitaremos H0.
Vamos denotar por RC a região crítica.
Unidade 19
Testes de Hipóteses
Introdução
Nesta unidade terás a oportunidade de aprender Teste de Hipótese: Média da N (μ; σ2) –
σ2 Conhecida; Hipóteses nula e alternativa; Estatística de teste; Nível de significância e
região crítica;
Vamos analisar inicialmente três exemplos que ilustrarão as diversas possibilidades que podem
surgir na prática.
Exemplo 1
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 139
Depois de uma pane geral no sistema de informação de uma empresa, o gerente administrativo
O gerente acredita que a pane não tenha alterado a variabilidade do processo. Uma amostra de
16 tempos de processamento após a pane revela uma média de 105,5 minutos. Ao nível de
significância de 5%, qual é a conclusão sobre a alteração do tempo médio de processamento?
Ou equivalente a
PROBABILIDADE E ESTATÍSTICA -3º Ano
α = Pr(rejeitar H0 | H0 verdadeira) = 0, 05
Ou equivalente a
A nossa região crítica consiste nos valores de X com probabilidade pequena de ocorrerem sob
essa hipótese. Ou seja, a região crítica consiste nos valores de muito afastados da média
suposta de μ = 100. Como a hipótese alternativa é bilateral, “muito afastado” significa “muito
maior” ou “muito menor” do que μ = 100. Veja a Figura a seguir:
Para determinar a região crítica, basta encontrar o valor da constante K tal que
Exemplo 2
Na mesma situação do exemplo anterior, é bastante razoável supor que o gerente esteja
interessado apenas no caso de aumento do tempo de processamento. Afinal, se o tempo
diminuir, isso significa que a tarefa vai ser executada mais rapidamente, o que representa um
ganho. Então, as duas possibilidades são:
μ ≤ 100 OK!
Para definir qual é a hipótese nula, vamos usar o seguinte procedimento. Como foi dito no
capítulo anterior, neste curso só trabalharemos com hipóteses nulas simples, isto é, hipóteses
nulas que envolvam igualdade do parâmetro a um determinado valor: θ = θ0.
Assim, em um teste unilateral, a hipótese alternativa deve ser aquela que não envolve o sinal de
igualdade. No nosso exemplo, essa é a hipótese μ > 100. A hipótese nula, tendo que ser uma
hipótese simples, passa a ser μ = 100, ou seja:
H0 : μ = 100
H1 : μ > 100
Região crítica para o teste de H0 : μ = 100 com alternativa unilateral à direita H1 : μ >
100
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 143
Como no exemplo anterior, temos que rejeitar a hipótese nula de que o tempo de
processamento não se alterou, já que o valor observado da estatística amostral está na região
crítica.
Exemplo 3
O dono de uma média empresa decide investigar a alegação de seus empregados de que o
salário médio na sua empresa é menor que o salário médio nacional. Para isso, ele analisa uma
amostra de 25 salários, obtendo uma média de 894,53 meticais. De informações obtidas junto
ao sindicato patronal, ele sabe que, em nível nacional, o salário médio é de 900 meticais, com
desvio padrão de 32 meticais. Supondo que seja razoável aproximar a distribuição dos salários
por uma distribuição normal com o mesmo desvio padrão nacional, vamos construir um teste
de hipótese apropriado, com um nível de significância de 10%.
O problema aqui consiste em decidir se os salários são menores ou não do que a média
nacional de 900 meticais, ou seja, as situações de interesse são
μ < 900
μ ≥ 900
PROBABILIDADE E ESTATÍSTICA -3º Ano
Como no exemplo anterior, a hipótese alternativa é aquela que não envolve o sinal de
igualdade. Logo, nossas hipóteses são:
H0 : μ = 900
H1 : μ < 900
e a estatística de teste é
A região crítica é
Unidade 20
Testes de Hipóteses
Introdução
Nesta unidade terás a oportunidade de aprender Teste de Hipótese: Proporções -
Amostra Grande;
populacional, sabemos ser normal com a mesma média e variância . Agora iremos fazer uso
do Teorema Limite Central para construir testes de hipóteses sobre proporções com base em
amostras grandes. Vimos que, para amostras grandes, a distribuição amostral da proporção
amostral pode ser aproximada por uma distribuição normal e, assim, o procedimento de teste
de hipótese será idêntico ao estudado anteriormente.
variável aleatória, essa população é representada por uma variável aleatória de Bernoulli, isto
é:
Suponhamos, então, que dessa população seja extraída uma amostra aleatória simples X1, X2, .
Como a proporção amostral é uma média de uma amostra aleatória simples de uma população
com distribuição de Bernoulli com parâmetro p, o Teorema Central do Limite nos diz, então,
Ou equivalentemente
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 147
Vamos ver, agora, como usar esse resultado para construir testes de hipóteses sobre a
verdadeira proporção populacional p.
H0 : p = p 0
A nossa intenção até este momento foi de criar pressupostos básicos para que possamos
resolver problemas de testes paramétricos de hipóteses.
É de salientar que para além deste tipo de testes podemos considerar os não paramétricos.
A análise destes não cabe neste módulo e recomenda-se ao estudante interessado a
PROBABILIDADE E ESTATÍSTICA -3º Ano
consultar outras obras que tratem deste assunto (Exemplo: Murteira et al. (2002).
Introdução à Estatística. 2ª edição. Editora Mc Graw-Hill. Portugal)
Até agora apresentamos as estatísticas de teste e regiões críticas e também alguns exemplos
de aplicação para os testes da média e proporção (de uma população). É de notar que os
testes de hipótese funcionam de forma parecida a de intervalos de confiança.
Passaremos a apresentar um resumo das estatísticas de teste e regiões críticas para os testes
da média, proporção, variância, diferença de médias, diferença de proporções e diferença
de variâncias.
para a hipótese
PROBABILIDADE E ESTATÍSTICA -3º Ano
Para resolver um teste de hipótese é necessário calcular a estatística de teste, identificar a região crítica
e tomar a decisão correcta!
1. A tensão de saída de um determinado circuito eléctrico segue uma distribuição normal. Esta tensão
deve ser 130 de acordo com as especificações. Uma amostra de 40 medições independentes da tensão
deste circuito, deu uma media de 128,6 e desvio padrão amostral de 2,1. Provar a hipótese de que a
tensão média do circuito é 130, contra a de que seja menos de 130. Utilizar um nível de significância de
5%.
2. Se comparam dois projectos para um laboratório com respeito a quantidade média de luz que se tem
na superfície das mesas. Se tomaram 40 medições independentes em cada projecto; os resultados foram
os seguintes:
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 151
Desenho I Desenho II
Há evidências suficientes para se pensar que os dois desenhos diferem com respeito a quantidade média
de luz que se recebe? Usar o nível de significância de 0,10 e supor populações normais.
3. Uma central recebe diariamente leite de dois fornecedores, A e B. Desejando estudar a qualidade dos
produtos recebidos, se escolhem duas amostras ao acaso do leite proveniente de cada um dos
fornecedores e se analisa e a quantidade de gordura e se obtêm os seguintes resultados:
4.Quando-se comprovar a efectividade de uma determinada vacina contra uma alergia, foram
seleccionados aleatoriamente 100 pacientes que foram subdivides em dois grupos de 50. A um grupo
foi aplicada a vacina e aos outros foi lhes administrado calmante. Dos que foram vacinados, 8 voltaram
a sofrer alergia enquanto dos que não foram vacinados 25 voltaram a sofrer alergia. Podemos concluir
que a vacina é eficaz para combater a alergia? Use um nível de significância 0.05.
PROBABILIDADE E ESTATÍSTICA -3º Ano
Bibliográfia:
FONSECA, J. S. & MARTINS, G. (1995). Curso de Estatística. 5ª Edição. Editora Atlas S.A.
São Paulo
MURTEIRA, B.; RIBEIRO, C.; PIMENTA, C.; & ANDRADE, J. (2002). Introdução à Estatística.
2ª edição. Editora Mc Graw-Hill. Portugal
Módulo de Inferência Estatística de Ana Maria Lima de Farias (2008). Universidade Federal
Fluminense. Brasil
REIS, Elizabeth; MELO, Paulo; ANDRADE, Rosa & CALAPEZ, Teresa. (2003). Estatística
Aplicada. Volume I. 4ª edição. Edições Sílabo. Lisboa.
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 153
PROBABILIDADE E ESTATÍSTICA -3º Ano
PROBABILIDADE ESTATÍSTICA Beira, Agosto de 2011 155