Introdução À Estatística T2
Introdução À Estatística T2
Introdução À Estatística T2
Recomendações de Melhoria:
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
______________________________________________________________________________
Índice
1. Introdução............................................................................................................................... 3
1.1. Objectivos............................................................................................................................4
1.1.1. Geral................................................................................................................................ 4
1.1.2. Específicos....................................................................................................................... 4
1.2. Metodologia.........................................................................................................................4
6. Distribuições bidimensionais.............................................................................................12
8. Acontecimentos equiprováveis..........................................................................................17
9. Probabilidade Condicional.................................................................................................17
Parte II:......................................................................................................................................... 19
10. Conclusão.......................................................................................................................... 25
11. Bibliografia........................................................................................................................26
1. Introdução
Sendo a estatística um ramo de grande importância da matemática, desenvolvendo técnicas como
a colecta de dados, sua organização e interpretação, no trabalho presente vai-se abordar sobre a
sua aplicação, olhando para sua complexidade na área em que se faz menção, oi seja, na
matemática. Ela pode ser aplicada em praticamente todas as áreas do conhecimento humano e em
algumas áreas recebe um nome especial.
Considerando isto, o presente trabalho dado faz-se um resumo dos conteúdos ligados a
introdução de estatística. Olhando atentamente para os outros tipos de Média; Outras medidas de
Localização; Medidas de dispersão ou de variabilidade; Medidas de assimetria e curtose;
Distribuições Bidimensionais; Noção intuitiva e frequencista das probabilidades; Acontecimentos
equiprovaveis e por fim sobre Probabilidade condicionada. Como qualquer trabalho científico
traz consigo uma estrutura como foram de organização, o presente trabalho apresenta a seguinte
estrutura: introdução, desenvolvimento dos temas e subtemas, conclusão e por fim a bibliografia,
espera-se que no final da materialidade tenhamos noções básicas relativamente ao tema a ser
apresentado.
3
1.1. Objectivos
1.1.1. Geral
Conhecer os conteúdos básicos a Estatística.
1.1.2. Específicos
Apresentar os conteúdos básicos da estatística;
Resumir os conteúdos do Modulo de Estatística a partir da unidade 9 a unidade 16;
Resolver os exercícios propostos na segunda parte do trabalho.
1.2. Metodologia
O presente trabalho foi feito através do método bibliográfico, que consistiu na consulta
bibliográficas relacionadas a esta área de pesquisa cujas mesmas facilitaram o desenvolvimento
autêntico e completo do trabalho tornando-o possível a compilação, sendo que as obras
consultadas se encontram listadas por ordem alfabética no final do trabalho.
4
2. Outros tipos de Médias
2.1. Média Geométrica (Mg)
A média geométrica dos valores observados x1, x2, x3, …,xn é a raiz de índice n do produto
desses números. Na média geométrica, nós multiplicamos os valores disponibilizados e extraímos
a raiz de índice igual à quantidade de números multiplicados:
Se os valores x1, x2, x3, …, xn estiverem com as suas respectivas frequências absolutas f1, f2,
f3, …, fn; a média geométrica será dada:
Se os valores x1, x2, x3, …, xn estiverem com as suas respectivas frequências f1, f2, f3, …, fn; a
média harmónica será dada por: MH =
5
2.3. Média quadrática
Consideremos os valores observados, x1, x2, x3, …, xn. A média quadrática é a raiz quadrada da
média aritmética dos quadrados da variável.
No caso dos valores observados estiverem acompanhados com as suas respectivas frequências f1,
f2, f3, …, fn; a média quadrática será dada por:
De acordo com Sande (s/d, pp. 59-60) as três medidas de tendência central média, moda e
mediana, pretendem localizar os valores em torno dos quais os dados se agrupam.
Média - É uma medida de precisão, cuja definição e propriedades são tratadas por meios
algébricos e que intervém em cálculos estatísticos avançados. É uma medida complexa, isto é, faz
intervir todos os dados, pelo que é muito sensível a qualquer alteração de um ou mais valores. O
seu valor não pertence, geralmente ao conjunto inicial de dados (pode não ter existência real). É a
medida mais usada para comprar distribuição, serve de padrão de comparação.
6
3. Outras medidas de Localização
Segundo Sande (s/d, p. 62) os quartis, decís e percentis, são medidas de localização muito usadas
no estudo das séries estatísticas. É sobre esse assunto que vamos falar nesta unidade, quer para
variável descrita, quer para contínua. A mediana é o valor que separa a quantidade de dados em
duas partes iguais: 50% dos dados abaixo dela e 50% acima. Assim como a mediana, existem
outros valores que separam os dados em partes iguais. Eles são chamados genericamente de
quantis. Os quantis mais importantes e usados são:
Quartis: dividem os dados em quartas partes (cada parte tem 25% dos dados). São indicados por
Q1, Q2 = Md e Q3.
Decis: dividem os dados em décimas partes (cada parte tem 10% dos dados). São indicados por
D1, D2, ..., D9.
Percentis: dividem os dados em centésimas partes (cada parte tem 1% dos dados). São indicados
por P1, P2, ..., P99.
Um conjunto de dados pode ser dividido em 3 quartis, 9 decis e 99 percentis. Vejamos o exemplo
a seguir para os quartis.
Para uma colecção de n dados discretos, os postos dos quartis, decis e percentis são calculados
como:
Decis: 1º decil (D1): n/10; 2o decil: 2n/10; ...; i-ésimo decil: in/10; ...; 9o decil: 9n/10.
Percentis: 1º percentil (P1): n/100; 2o percentil: 2n/100; ...; i-ésimo percentil: in/100; ... ; 99o
percentil: 99n/100.
A partir do posto, pode-se calcular o valor do quartil, do decil ou do percentil desejado. Como
regra geral, se o posto coincide com um número inteiro i o valor a ser usado é o da média
7
aritmética entre os dados que ocupam as posições i e i+1. Já se o posto não for um número inteiro
a convenção que vamos usar é arredondar para a posição do número inteiro acima do posto e
tomar o valor correspondente.
Quartis Enquanto a mediana divide um conjunto de dados estatísticos ordenados em duas partis
iguais, os quartis dividem-no em quatro. São, por isso, em número de três e representam-se,
respectivamente, por Q1, Q2 e Q3. O segundo quartil corresponde a mediana, ou seja, Q2=Me.
Para a determinação dos quartis, teremos que atender ao tipo de distribuição apresentada. O
cálculo de Q2 = Me já foi tratado anteriormente vejamos como determinar Q1 e Q3.
Para dados não agrupados, o primeiro quartil é a mediana da primera metade da distribuição.
Supondo que esta apresenta um número de observação igual a N` , ordem de Q1 será:
O terceiro, quaril é a mediana da última metade da distribuição. A ordem de Q3 pode ser obtida
do seguinte modo:
8
Diagrama de extremos e quartis e quartis é um esquema que nos permite ver se há
concentração ou dispersão dos dados ao longo de toda a distribuição.
As medidas de tendência central estudadas reduzem a série de dados a um só valor típico (media,
mediana e moda). O valor central mais usado é o valor médio, que contudo, nem sempre dá uma
ideia suficiente da série estatística. É necessário completar o estudo de uma distribuição com
outras medidas que permitem determinar o grau de dispersão dos dados em torno dos valores
centrais. As medidas de dispersão mais usadas são: Amplitude total, Desvio quartílico, desvio
médio, variância e desvio padrão.
R Xmáx Xmín
d x xi
9
Chama – se desvio médio de uma distribuição (Dx) a média aritmética dos valores absolutos dos
desvios em relação a média.
Chama-se Variância, a média aritmética dos quadrados dos desvios em relação a média
aritmética. A variância é tanto maior quanto maior for a dispersão. A representatividade dos
valores centrais diminui quando a variância aumenta.
O desvio padrão informa sobre dispersão, isto é, sobre o afastamento dos dados em relação a
média. - O intervalo contém sempre mais de 50% dos dados; isto significa
que mais de metade dos dados se situam a uma distância da média que é inferior a um desvio
padrão.
Coeficiente de variação ou de dispersão Cv, é uma medida de dispersão útil para a comparação
em termos relativos, do grau de concentração em torno da média de séries distintas e as vezes o
Cv é dado em percentagem, e é dado por:
10
5. Medidas de Assimetria e Curtose
Sande (s/d, p. 79) afiança que assimetria é o grau de desvio em relação a uma distribuição
simétrica. É nesta unidade onde vamos falar dos diferentes casos de assimetria e dos graus de
achatamento curtose de uma distribuição.
Karl Pearson citado Sande (s/d, p. 80) por propôs duas maneiras de avaliar o grau de achatamento
ou de formação da curva de uma distribuição de frequências, cujo objectivo principal é
justamente indicar a grandeza do afastamento em termos relativos.
a) Primeiro coeficiente
b) Segundo coeficiente
As 0 A distribuição é simétrica.
As 0 A distribuição é assimétrica positiva.
As 0 A distribuição é assimétrica negativa.
5.2. Medidas de Achatamento-Curtose
Curtose nada mais é do que o grau de achatamento da curva de uma distribuição de frequências.
Isto considerando que uma curva pode apresentar-se mais achatada ou mais afilada em relação a
uma curva considerada curva – padrão ou curva normal. Assim, dentro destas especificações,
uma curva normal deve apresentar um coeficiente de curtose igual a 0,263 (mesocurtica), e se o
mesmo coeficiente for menor que 0,263, a curva devera-se apresentar mais aguda que a normal
(Leptocúrtica). O cálculo deste coeficiente é dado pela seguinte expressão:
6. Distribuições bidimensionais
De acordo com Ferreira (2008, p. 43) o estado estatístico refere-se muitas vezes a dois caracteres
da mesma população visando investigar em que medida eles se relacionam, isto é, de que modo a
variação de um deles exerce influência na variação da outro. As distribuições estatísticas
envolvendo o estudo da relação entre duas variáveis chamam-se distribuições bidimensionais.
Há caracteres entre os quais é impossível descobrir qualquer relação, como por exemplo, o peso
dos alunos e a respectiva nota em Português. Diz-se que estes são caracteres independentes. Diz-
se que há influência de um carácter neutro. O maior ou menor grau de dependência estatística
entre duas variáveis traduz-se por um número, o coeficiente de correlação que só varia de -1 a 1.
Correlação negativa – as variáveis evoluem em sentido contrário quando uma aumenta a outra
tende a diminuir. Exemplo: intensidade da chuva e a temperatura do ar.
12
Correlação nula – não há influência de uma variável na outra, as variáveis são independentes.
Exemplo: a idade do pai e a nota de desenho de cada aluno.
Se o coeficiente de correlação for igual a 1 ou a -1, então a dependência entre duas variáveis é tão
rigorosa que se pode traduzir por uma lei matemática: diz-se que há uma dependência funcional.
Intuitivamente podemos prever a existência de correlação entre duas variáveis. Para quantificar a
relação usa - se o coeficiente de correlação linear de Pearson que se representa por .
De acordo com Sande (s/d, p. 94) os jogos de azar que se praticam há milhares de anos, estão na
origem das primeiras obras escritas sobre probabilidades e que começaram a surgir no século
XVIII. O dado é um instrumento dos jogos de azar por excelência, a tal ponto que duas das
palavras mais usadas para lidar com o que é casual, ou fortuito, ou contingente são: Azar de az –
13
zãr e Aleatório de álea, ambas com origem na palavra dado, respectivamente em árabe e latim.
Por esta sua origem concreta, a teoria das probabilidades utiliza uma linguagem própria que é
preciso conhecer.
Uma experiência diz-se aleatória se pode ter vários resultados cujo aparecimento, em cada prova
da experiência, é impossível prever. Diz-se que o resultado depende do “acaso” ou da “sorte” ou
do “azar”. Os fenómenos aleatórios são o objecto de estudo da teoria das probabilidades. Acaso
significa ausência de causa conhecida. São aleatórias todas as experiências que se fazem nos
jogos. As experiências do laboratório que se fazem na escola, cujo resultado já é conhecido e é
sempre o mesmo, não são experiências aleatórias.
Lançamento de um dado sobre uma superfície lisa, plana e horizontal. Qualquer das 6 faces pode
ficar voltada para cima. Diz-se que esta experiência tem 6 resultados possíveis ou 6 casos
possíveis. O conjunto E = {1, 2, 3, 4, 5, 6} é de todos os resultados possíveis, é o espaço amostral
desta experiência aleatória. Qualquer elemento de E, é então um caso possível. 3 E logo 3 é um
caso possível. A saída de 3 é um acontecimento elementar que se designa por {3}.
A saída de um número par também é um acontecimento mas não é elementar porque sair par
equivale a sair 2, ou sair 4, ou sair 6. Tratando os acontecimentos em termos de conjunto de
resultados termos: Acontecimento sair número par>> = {2} {4} {6}; logo é uma reunião de
acontecimentos elementares. Acontecimento é qualquer subconjunto de E, incluindo A numa
prova, significa que o resultado dessa prova é um elemento de A. Nota: Diz-se que A se realizou
quando o resultado é elemento A. A B verifica – se quando ou se realiza A ou B. A B verifica
– se quando A e B se realizam simultaneamente.
14
Suponha que o dado é perfeito, ou seja, rigorosamente simétrico, sem faces privilegiadas, então, é
natural esperar que jogando o dado muitas vezes, o resultado de cada face seja aproximadamente
o mesmo, visto que todas tem a mesma possibilidade de ficar para cima.
0 PA 1
Acontecimentos contrários:
Seja A = «sair menos 4» e B = «sair mais do que 5». Temos A B = Ø Seja A = «sair número
par» e B = «sair número impar». Vemos também que A B= Ø; mas este último exemplo tem
uma diferença importante em relação aos anteriores. Se não se realiza A, então ocorre B (se não
sai par, sai impar) o que significa que A B engloba todos resultados possíveis desta experiência.
Então os acontecimentos além de incompatíveis, dizem-se contrários.
A B = Ø ^ A B =
15
Definição Axiomática das Probabilidades Acabamos de ver atrás intuitivamente, como a lógica
dos conjuntos e noção da frequência relativa intervêm na construção do conceito de
«Probabilidade de um Acontecimento». Foi com base nesses acontecimentos que Kolmogrov
concebeu a primeira construção axiomática geral para a teoria das probabilidades. Em 1950, esta
obra foi dada a conhecer a todo o Mundo cientifico pela tradução inglesa «Foundations of the
theory of Probability» e a partir de então a teoria das probabilidades não parou de ganhar
importância.
Então P (A B) = P (A) + P (B) Os axiomas A1 e A3 fazem com que a probabilidade seja uma
«mediana». O axioma A2 fixa a «quantidade» total da probabilidade em 1, a semelhança das
frequências relativas. Assim, podemos dizer que a probabilidade mede até que ponto se pode
esperar que ocorra um acontecimento e que a medida máxima é 1.
16
Quaisquer que sejam os acontecimentos A, B, C,…. Incompatíveis dois a dois tem-se P(A B
C ...) = P(A) + P(B) + P(C) +…
8. Acontecimentos equiprováveis
Na maior parte das experiências aleatórias, a única forma de avaliar a probabilidade de cada
acontecimento elementar consiste em repetir a experiência muitas vezes em condições análogas:
por exemplo, experiências com objectos irregulares, acidentes na estrada, eleições e as
experiências científicas com adubos e medicamentos. Só uma experimentação prolongada
permite achar valores aproximados das suas probabilidades. Mas pensemos agora nas
experiências em que é possível calcular as probabilidades a priori, mesmo antes de realizar
quaisquer provas. Em geral estão ligadas a jogos de azar que usam objectos regulares construídos
com grande perfeição como dados, roletas, urnas com bolas, moedas, baralho de cartas, … nestes
casos a experimentação reiterada, limita-se a confirmar os cálculos feitos a priori. Por exemplo
no dado perfeito.
Se é perfeito, P(1) = P(2) = P(3) = P(4) = P(5) = P(6), isto é, os acontecimentos elementares são
equiprováveis. Como são 6, a probabilidade de cada um deles é 1/6. Qualquer outro
acontecimento é reunião de acontecimentos elementares equiprováveis.
9. Probabilidade Condicional
9.1. Probabilidade Condicionada
P (B)>0 dado
Assim, a probabilidade de A muda após o evento B ter acontecido. Isso porque o resultado de A é
uma das possibilidades de B. Precisamos calcular os eventos que são comuns a B e também a A,
ou seja A∩B.
Dados em rol:
55 55 56 57 57 57 57 58 59 60 60 60 61 61
61 61 62 62 62 63 64 64 64 64 65 65 65 65
65 65 65 65 66 66 66 66 67 67 68 68 68 68
69 69 69 71 72 72 73 74 75 75 75 76 76 77
80 80 80 83
Resolução:
n=60
k =√ n
k =√ 60
k =7 , 74 ≅ 8
R 28
h= = =3 , 5 ≅ 4
K 8
Classes xi fi Fi xi f i fr 2
xi . f i
[55;59[ 57 8 8 456 0,13 25992
[59;63[ 61 11 19 671 0,183 40931
[63;67[ 65 17 36 1105 0,283 71825
[67;71[ 69 9 45 621 0,15 42849
[71;75[ 73 5 50 365 0,083 26645
20
[75;79[ 77 6 56 462 0,10 35574
[79;83[ 81 4 60 324 0,067 26244
Σ 60 4004 1 270060
2.a) R:
No que usaram as No de adolescentes F iac xi f i
Drogas ( x i) ( f i)
0 47 47 0
1 29 76 29
2 13 89 26
3 8 97 24
Σ 97 ---------------- 79
M 0=0 , Porque olhando para tabela nas freqüências absolutas simples. Constata-se que 0 repete
acerca de 47 vezes na distribuição.
Significa que no presente estudo notou-se que o numero de adolescente que não usam drogas é
mais grande em relação aos números de adolescentes que usam drogas.
2.b) R:
Dados:
𝑛 = 97
𝑥=?
Como n é impar, significa que o numero de posições ira coincidir com a mediana.
97 + 1 98
𝑃𝑥 = = = 49º
2 2
Olhando
na freqüência acumulada 49º, obteremos a
~
x=1 , a mediana é igual a 1.
Significa que o numero médio de adolescentes entrevistado sobre o numero de vezes que
utilizaram as drogas é 1.
21
2.c) R:
Dados: formula/ Resolução:
𝚺𝒙𝒊 𝒇𝒊 79
𝑛 =97 𝑥ҧ= =
𝑛 97
Σ𝑥𝑖 𝑓𝑖 = 79 Σ𝑥𝑖 𝑓𝑖 = 79
𝑥ҧ=? 𝑥ഥ = 0,814
3.a) R:
Dados em rol:
103,114,114,114,121,125,125,130,130,132,135,139,169,169,146
Dados: formula\Resolução:
1966
𝑛 = 15 𝑥ҧ= = 131,07
15
𝑥ҧ=?
𝑀0 =?
𝑥=?
Ca
lculo da mediana:
Dados em rol
103, 114, 114, 114, 121, 125, 125, 130, 130, 132, 135, 139, 169, 169, 146.
Como o nosso n=15 ee impar, entao a mediana sera igual o valor da posicao
n+ 1 15+1
P~x = = =¿ 8º posição. Portanto olhando para o rol o 8o valor é 130.
2 2
~
x=130.
3.b)
Dados: Formula/Resolução:
σ 𝑛𝑖=1 (𝑥 𝑖 −𝑥ҧ
)2
σ 𝑛𝑖=1(𝑥𝑖 − 𝑥ҧ
)2 = 5018,934 𝑠2 = 𝑛−1
5018,934.
𝑛 = 15 𝑠2 = 15−1
1966
𝑥ҧ= = 131,07 𝑠 2 = 358,495
15
𝑆 2 =?
4. Em uma empresa que contém 4000 colaboradores, deseja-se fazer uma pesquisa de satisfação.
Quantos colaboradores devem ser entrevistados para tal estudo? Considere o erro amostral
tolerável é de 4%.
Dados: Formula/Resolução:
𝜎 𝑍 𝐶. 𝜎 2
𝑛 = 4000 𝐸 = 𝑍𝐶 . ⟺𝑛=ቀ ቁ
ξ𝑛 𝐸
𝐸.ξ 𝑛
𝐸 = 4% = 0,04 𝜎= 𝑍𝐶
0,04.ξ 4000
𝛼 = 0,05 𝜎= 1,96
𝑍𝐶 = 1,9 𝜎 = 1,290
23
R: Os colaboradores que devem ser entrevistados para tal estudo são 4000. Com um desvio de
padrão de 1,290.
5. a
Dados: Formula/Resolução
𝑠 𝑠
𝑛 = 30 𝐼𝐶𝜇 95% = [𝑥ҧ
− 𝑡0,975 ; 𝑥ҧ
+ 𝑡0,975 ]
ξ𝑛 ξ𝑛
𝛼 = 0,05
𝑡0,975 = 2,045
𝑥ҧ
= 151,9
𝑆 = 9,7 mm.
𝑠 9,7
E =𝑡0,975 √𝑛 = 2,045 × √30 = 3,6
R: O verdadeiro parâmetro para media esta no intervalo IC μ95 % =[148 , 3; 155 , 5].
Há 22 observações entre 144 e 160 mm. Logo a proporção amostral de pecas dentro das
X 22
especificações é: ^
P= = =0 , 73 ; q=1− ^p =0 , 27
n 30
24
Dados: Formula/Resolução
𝑝ො
(1−𝑝ො
) 𝑝ො
(1−𝑝ො
)
𝑛 = 30 𝐼𝐶𝜇 98% = [𝑝Ƹ− 𝑍𝑐 ට 𝑛
; 𝑥ҧ
+ 𝑍𝑐 ට 𝑛
]
0,73×0,27 0,73×0,27
1 − 𝛼 = 0,98 𝐼𝐶𝜇 98% = [0,73 − 2,33ට 30
; 0,73 + 2,33ට 30
]
𝑍𝑐 = 2,33
𝑋 = 22
P(1−P)
E =𝑍0,49 ට 𝑛
R: O
verdadeiro parâmetro para proporção esta no intervalo IC μ98 % =[0 , 65 ; 0 , 81].
25
10. Conclusão
Por fim, conclui-se que a Estatística não se limita somente a um conjunto de indicadores
numéricos relativos a um determinado facto social, nem somente ao uso de tabelas e gráficos para
o resumo, a organização e apresentação dos dados de uma dada investigação. Como se pode
verificar, a estatística tem sido aplicada nas mais diversas dimensões, entretanto, mais importante
do que defini-la é poder identificar sua importância e o aumento de sua utilização, pois a
Estatística evoluiu, tornando-se uma ampla e complexa ciência, tirando conclusões sobre o
conjunto todo a partir de amostras representativas, o que faz com que as decisões sejam baseadas
na incerteza. Falar da estatística hoje, é uma valia grande que serve para explicar se não, expor
diversas realidades que ocorrem. Em várias áreas, tem sido usada a estatística para clarificar
algumas particularidades. Compreende-se desde já, que a estatística é um ramo crucial não só em
matemática, mas também na área da saúde, população e outras áreas afins.
26
11. Bibliografia
Ferreira, Eric Batista & Oliveira, Marcelo Silva. (2008). Introdução à Estatística Básica com R.
1ª Ed. Lavras, UFLA/FAEPE.
Sande, Lazaro Domingos. (s/d). Estatistica. Módulo de Tronco Comum. Beira: UCM-CED.
27