dados-de-insumo
dados-de-insumo
dados-de-insumo
https://www.nucleodoconhecimento.com.br
ARTIGO ORIGINAL
RESUMO
24
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
1. INTRODUÇÃO
São exemplos que colaboram para demonstrar que as inovações nos processos
empresariais e ações para ampliar a vantagem competitiva das organizações
requerem as soluções oferecidas pela “economia do conhecimento, economia digital,
indústria 4.0, inteligência artificial, robotização e tecnologias limpas” (Lima, 2020, p.4).
No que se refere ao intenso volume de dados obtidos por meio da Inteligência Artificial,
a segurança desses dados e seu armazenamento adequado requerem mudanças
culturais dentro das empresas, sendo necessária a implantação de recursos como
frameworks, permitindo que os dados obtidos sejam transformados em ativos
gerenciáveis (Lima, 2020).
Por sua vez, a IA Generativa é um sistema que pode captar informações valiosas que
podem passar despercebidas pelos seres humanos, e oferecer soluções reais (Moura,
2023). Exemplo recente noticiado pela grande mídia foi o caso de um menino norte-
americano, que, já tendo passado por 17 médicos e especialidades diferentes, sem
25
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
resultados satisfatórios para seu quadro, a mãe da criança realizou buscas sobre os
sintomas apresentados pela criança ao ChatGPT, que comparando exames e
sintomas, forneceu um diagnóstico real, identificando tratar-se de espinha bífida (O
Globo, 2023).
O presente artigo original foi desenvolvido com base em ampla pesquisa bibliográfica
e dados científicos. Tem o objetivo de demonstrar a relevância da análise de dados,
como forma de aplicar as práticas do compliance para a IA. Como resultado desta
pesquisa, verificou-se a necessidade de maior atenção aos processos de qualidade
de dados de insumo para treinamentos de IA generativas.
Lima (2020) explica que são quatro as etapas evolutivas da humanidade desde a
década de 1940, quando existiam três eixos setoriais na economia global: o
26
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
Foi em 1956 que a expressão Inteligência Artificial (IA) foi utilizada a primeira vez, pelo
cientista em computação John McCarthy (BUARQUE, 2023). No pós-guerra, Turing
continuou suas pesquisas sobre a inteligência das máquinas, desenvolvendo a
Descriptografia Automatizada, e descrevendo estudos sobre a Lógica Computacional
e as técnicas de aprendizado da máquina; trabalhou também em projetos para robôs
inteligentes que percorrem o campo e aprendem com suas experiências, para ajudar
na agricultura informatizada (MUGGLETON, 2014, apud LOPES, 2019, p.20).
27
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
28
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
“1. Sistemas que pensam como humanos; 2. Sistemas que agem como humanos; 3.
Sistemas que pensam racionalmente; 4. Sistemas que agem racionalmente”.
Essa analogia às habilidades humanas torna único o sistema da IA, a partir de alguns
fatores distintos: comunicação como se fosse uma entidade, conhecimento interno de
si mesma, conhecimento externo, comportamento orientado a objetivos prévios, e
criatividade para adotar determinada ação alternativa, caso a ação inicial venha a
falhar. Neste sentido, Buarque (2023, p.2) reporta a definição dada por Patrick
Winston sobre a IA: “...o estudo da computação que lhe permite perceber, raciocinar
e agir”.
Honório (2022, p.9) refere que a Indústria 4.0 se caracteriza pela “miniatuarização,
barateamento e evolução dos sensores eletrônicos, inteligência artificial e geração
massiva de dados”. A digitalização industrial é composta de importantes pilares,
descritos por Auletta et al. (2023, p.1), entre eles a “Inteligência Artificial (IA), análise
de dados, aprendizado de máquina, computação na nuvem e Internet das Coisas
(IoT)”.
29
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
Venturelli (2018, apud Auletta et al., 2023, p.3) explica que a Pirâmide de Automação
consiste em uma estrutura de camadas contendo diversas interfaces em modelo
vertical, que, em sendo limitadas ao ambiente local, são pouco flexíveis; porém, com
alta influência na tomada de decisão.
Esses cuidados com segurança, privacidade e ética podem ser aliados às práticas de
Gestão da Informação – ou Governança do Conhecimento – que é representada por
vários mecanismos formais, dados esses que são gerados pela Governança
Corporativa, os quais requerem qualidade em sua gestão, para serem otimizados, do
ponto de vista econômico. Em outras palavras, é por meio de sistemas de otimização
e valoração sistemática de dados que se pode “cocriar os ativos de conhecimento”
(Honório, 2022, p.17).
https://www.nucleodoconhecimento.com.br
• raciocínio baseado em casos: utilizando uma base de dados, local onde são
armazenadas tanto as soluções eficazes como as desastrosas, são soluções
que, ao serem processadas, vão avaliar qual das soluções é mais adequada a
cada caso;
• lógica difusa: é um tipo de tecnologia que se baseia em regras que
representam a imprecisão, e que vai criar regras com valores aproximados para
a solução mais adequada;
• redes neurais artificiais: são dispositivos que imitam os padrões de
processamento do cérebro humano, que seguindo padrões em relações
complexas, constroem modelos e revisam eventuais erros, a partir das grandes
quantidades de dados coletados;
• algoritmos genéticos: ideais para solucionar problemas que requeiram
soluções ideais, assemelhando-se às redes neurais;
31
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
Como consequência, para se ter uma visão estratégica empresarial que permita
manter a competitividade é fundamental que a Gestão das Informações (GI)
demonstre aos gestores que é preciso deixar de considerar o volume de dados
coletados como itens colaterais e implantar “... um framework de governança de
dados, transformando-os em insumo de negócios”. Neste sentido, Redman (2016,
apud Auletta et al., 2023, p.2) corrobora este conceito, explicando que o
armazenamento de dados é tão importante quanto saber analisar e criar modelos para
esse armazenamento, evitando que dados ruins ocasionem prejuízos às grandes
organizações.
A qualidade dos dados é fator crucial para que modelos confiáveis de Machine
Learning (ML) sejam implantados pelas organizações, já que é a qualidade desses
dados que vai ocasionar o desempenho ideal de ML (Rangineni, 2023). Porém,
verifica-se na literatura que existem inúmeros benefícios trazidos pela IA, assim como
riscos ou desvantagens (Wach et al., 2023).
As etapas que permitem uma análise profunda das fases do pipeline de ML são:
“coleta de dados, pré-processsamento, treinamento de modelo de validação”
(Rangineni, 2023, p. 16).
32
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
Ainda sobre a qualidade de dados e sua gestão Budac (2022, p.1) explica que, além
dos modelos de ML já existentes, são necessários sistemas que visem “precisão,
integridade e consistência de dados”. A preocupação consiste em evitar-se o uso de
dados incompletos, errôneos ou inadequados, os quais conduzem a treinamentos
inadequados de ML e assim, resultados não desejáveis.
https://www.nucleodoconhecimento.com.br
Por sua vez, as ameaças do uso de dados que podem prejudicar os modelos de ML,
que se resumem em 7 grupos principais, como descreve Wach et al. (2023, p.7):
Wach et al. (2023) defende ser fundamental que determinadas medidas práticas e
legais sejam adotadas: regulação do mercado de IA/GAI; garantia da segurança e
proteção de dados de usuários e organizações; promoção da concorrência leal,
proteção dos direitos intelectuais e privacidade de riscos geopolíticos.
34
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
7. CONCLUSÃO
É cada vez mais verdade que os dados eletrônicos representam o ativo mais valioso
do mundo moderno, concepção que se amplia para a IA Generativa. Contudo,
precisamos ter a máxima atenção sobre os dados utilizados para o treinamento de
modelos de I, já que o crescente volume de dados atual, sendo que o potencial da
evolução desses modelos aponta para uma rápida evolução. Todavia, o desafio de
cuidar desses dados, que são o “combustível” para esses modelos, consiste no
acompanhamento desse crescimento. Os benefícios trazidos pela AI Generativa são
claros, assunto que é o foco do presente artigo. Porém, nos dias atuais, o mundo
passou a perceber também os riscos associados a essa nova tecnologia, sobretudo,
aos aspectos relacionados a conteúdos indesejados, ou àqueles que trazem algum
prejuízo à humanidade.
A utilização de dados sem qualidade, ou seja, dados que possam conter problemas
reais, como racismo e/ou preconceito, ou até mesmo algum tipo de viés
discriminatório, político, entre outros, pode fazer com que esses modelos de
aprendizagem gerem respostas contendo esses problemas.
35
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
AGRADECIMENTOS
REFERÊNCIAS
36
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
O GLOBO. Criança é diagnosticada com doença rara pelo ChatGPT após passar
por 17 médicos. O Globo, 2023. Disponível em:
https://oglobo.globo.com/saude/medicina/noticia/2023/09/13/crianca-e-
diagnosticada-com-doenca-rara-pelo-chatgpt-apos-passar-por-17-medicos-
entenda.ghtml. Acesso em: 31 out. 2023.
37
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959
https://www.nucleodoconhecimento.com.br
WACH, Krzysztof et al. The dark side of generative artificial intelligence: A critical
analysis of controversies and risks of ChatGPT. Entrepreneurial Business
Magazine, vol.11, n. 2, p. 7-30, Jun. 2023. DOI:10.15678/EBER.2023.110201.
Disponível em:
https://www.researchgate.net/publication/371987305_The_dark_side_of_generative_
artificial_intelligence_A_critical_analysis_of_controversies_and_risks_of_ChatGPT.
Acesso em: 16 out. 2023.
38
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo