Roadmap Dados PDF
Roadmap Dados PDF
Roadmap Dados PDF
PARA
AS ÁREAS
DE DADOS
Vem cá ver o que você precisa
saber para começar!
CIÊNCIA DE DADOS
Uma das profissões que vamos
conhecer por aqui é a Ciência de
Dados, uma profissão onde você vai
poder trabalhar com machine learning
e muitas coisas incríveis. Bora lá?
O QUE É CIÊNCIA
DE DADOS?
A ciência de dados é uma área
multidisciplinar que nos permite
transformar dados brutos em
conhecimento, principalmente através
de modelos.
*
Hard skills
necessárias
l ad C
o
o
ã
a r hn
ça
o a ice
m
a
á
ar
ed em
p
e
g
ci
n
or
t
ç
o
P
Estatística
+
Python
Python 1
1. Variáveis
2. Operadores
3. Estrutura básica de dados
4. Loop de repetições
5. Estrutura de condições
6. Métodos de funções
7. Bibliotecas básicas:
numpy, math, SciPy.
8. Tratamento de erros
2 SQL
1. Introdução a banco de dados
2. Consultas em geral
3. Manipulação de dados
4. Joins
5. Funções
3 Manipulação de dados com Python
1.Biblioteca: Pandas
5
Modelagem de dados com Python*
Biblioteca: Scikit Learn
1. Regressão Linear – Simples
2. Regressão Linear – Múltipla
3. Análise de Resíduos
4. Regularização L1 e L2
5. Modelos Lineares Generalizados
6. Regressão polinomial
7. Naives Bayes
8. Arvores de Decisão
9. KNN
10. Regressão Logística
11. SVM (Máquinas de vetores de suporte)
12. K-means
13. DBSCAN
14. PCA
15. Métricas de avaliação de modelos:
Acurácia, F1 Score, Precisão, Recall, Matriz de Confusão,
Area Under the ROC Curve, Log Loss, Mean Squared
Error, Mean Absolute Error, Mean Absolute
Percentage Error, R2, Kolmogorov Smirnov.
O aprendizado é 4
contínuo e deve
ser compartilhado
Mesmo depois de estar na
área, suas soft skills vão
continuar evoluindo.
Compartilhe seus
aprendizados com mais
mulheres - além de ajudá-las,
você estará se
desenvolvendo também.
ANÁLISE DE DADOS
A segunda profissão que vamos
conhecer por aqui é a análise de
dados, área na qual você vai poder
trabalhar com visualizações de dados,
trazendo muito conhecimento para
compartilhar. Vem com a gente!
O QUE É ANÁLISE
DE DADOS?
A análise de dados também é uma área
multidisciplinar que nos permite
transformar dados brutos em
conhecimento, mas com o foco em
visualização dos dados.
* Hard skills
necessárias
e o
l ad C
o
s ã
o
a r hn
da
o a ice
d il
ç
a
á
a
ed au
ed em
p
z
e
i
oc siv
tn
n
o
a
ã
B
Estatística
Excel 1
1. Funções de análises
2. Gráficos
3. Manipulação de dados
2 SQL
1. Introdução a banco de dados
2. Consultas em geral
3. Manipulação de dados
4. Joins
5. Funções
Ferramentas de 3
visualização de dados
1. Tableau
2. PowerBI
3. Qlik Sense
4. Google Data Studio
2. Estatística
Vamos passar pela segunda etapa das
hard skills: a estatística. Este tópico é
idêntico ao tópico de estatística de
ciência de dados.
O aprendizado é 4
contínuo e deve
ser compartilhado
Mesmo depois de estar na
área, suas soft skills vão
continuar evoluindo.
Compartilhe seus
aprendizados com mais
mulheres - além de ajudá-las,
você estará se
desenvolvendo também.
ENGENHARIA DE
DADOS
A última profissão que vamos conhecer
por aqui é a engenharia de dados, área
onde você vai poder ajudar a construir
uma infraestrutura robusta para que os
dados sejam acessíveis. Vamos lá?
O QUE É
ENGENHARIA DE
DADOS?
A engenharia de dados é uma área
multidisciplinar onde você arquiteta e/ou
integra sistemas que coletam,
gerenciam e convertem dados brutos
em informações.
* Hard skills
necessárias
l ad C
o
o
ã
a r hn
ça
o a ice
m
a
á
ar
ed em
p
e
g
ci
n
or
t
ç
o
P
Arquitetura
+ + +
Python NoSQL Big Data
Python 1
1. Variáveis
2. Operadores
3. Estrutura básica de dados
4. Loop de repetições
5. Estrutura de condições
6. Métodos de Funções
7. Bibliotecas básicas:
numpy, math, SciPy
8. Tratamento de erros
2 SQL
1. Introdução a banco de dados
2. Consultas em geral
3. Manipulação de dados
4. Joins
5. Funções
3 NoSQL
1.Manipulação de Dados
a) Não Estruturados
b) Semi-Estruturados
2.MongoDB
4 Big Data
1. Ecossistema Hadoop
2. Pig e Flume
3. Processamento com Spark
5 ETL
1. Transformação de Dados
2. Criação de Data Warehouse
3. Exportação de Dados
2. Arquitetura
Vamos passar pela segunda etapa das
hard skills: a arquitetura.
Clould Computing 1
1. Introdução a Cloud
2. Modelos de Cloud
3. Nuvem pública
4. Cloud Builders
5. Segurança de dados
6. Banco de dados
7. Virtualização de infraestrutura
8. Soluções Multicloud
9. Orquestração de Serviços e
Kubernetes
2
GitHub
1. Arquitetura do GitHub
2. Comandos
3
APIs
1. Desenvolvimento de APIs
2. Modelagem de APIs
3. Conhecimento da
área de aplicação
Essa é nossa última etapa de hard skills
em engenharia de dados. No entanto,
assim como nas outras duas profissões
que vimos, ela é uma etapa que
depende muito da área de aplicação que
escolhemos seguir.
O aprendizado é 4
contínuo e deve
ser compartilhado
Mesmo depois de estar na
área, suas soft skills vão
continuar evoluindo.
Compartilhe seus
aprendizados com mais
mulheres - além de ajudá-las,
você estará se
desenvolvendo também.
DICAS
FINAIS
s
r ed rp
a
c
C
m
o a r
u
t
r
n
i
e o l
so
m
t
di
n ev
a e er
a
s
ed
n
v
eP
os
Boa comunicação e
trabalho em equipe
Alguns fatores
relevantes
1 ano
Tempo médio de dedicação para
ingressar na área
5 mil reais
Salário médio da área
64,9%
É a porcentagem de equipes de
tech onde as
mulheres representam no máximo
20% do time. Tech precisa de você!
Referências
para estudar
Playlist completa de Estatística básica da
UFPR
Estatística e Probabilidade (Khan Academy)
Estatística (Univesp)
Curso de Python
Python para Machine Learning
Matemática para Machine Learning
Algoritmos de Machine Learning
Tutoriais para Python e SQL (W3schools)
Cursos da Kaggle
PlayList de SQL (Curso)
Playlist Excel
Google Data Studio
Tableau
Power BI
MongoDB
Spark
Hadoop
Big Data
APIs
GitHub
Azure