Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

dados-de-insumo

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 15

REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO

CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

SEGURANÇA NA INTELIGÊNCIA ARTIFICIAL POR MEIO DE ETAPAS


DE QUALIDADE DE DADOS DE INSUMO

ARTIGO ORIGINAL

GADELHA, Isaque Araujo1

GADELHA, Isaque Araujo. Segurança na inteligência artificial por meio de etapas


de qualidade de dados de insumo. Revista Científica Multidisciplinar Núcleo do
Conhecimento. Ano 08, Ed. 12, Vol. 02, pp. 24-38. Dezembro de 2023. ISSN: 2448-
0959, Link de acesso: https://www.nucleodoconhecimento.com.br/ciencia-da-
computacao/dados-de-insumo, DOI:
10.32749/nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo

RESUMO

Em tempos de transformação digital, a geração de dados se constitui em um novo tipo


de ativo, pois requerer novas formas de aprendizagem organizacional, ensejando
novos modelos de negócios. O foco de toda essa transformação é a Inteligência
Artificial (IA), subárea da Ciência da Computação responsável pela criação de
recursos computacionais com habilidades similares ao raciocínio humano para a
resolução de problemas, de forma automatizada. São utilizados elementos da
matemática e engenharia, para reproduzir aspectos da inteligência humana, mas
também de outras áreas, como filosofia, matemática, economia, neurociência,
psicologia, engenharia de computadores, teoria de controle e cibernética e linguística.
Daí o nome IA. As máquinas aprendem a falar, escrever, interpretar dados e
solucionar problemas por meio da IA, ferramenta que hoje é fundamental para
Indústria 4.0, enquanto transição da sociedade industrial para a sociedade do
conhecimento e da economia digital. Por sua vez, a IA Generativa utiliza-se de
ferramentas multimodais, para trabalhar elementos como a língua falada, imagens,
sons, movimentos corporais, etc. Toda essa tecnologia requer inovações nas
empresas, por meio da adoção de frameworks, que permitam selecionar e guardar
dados qualificados. O presente artigo original foi desenvolvido com base em ampla
pesquisa bibliográfica e materiais científicos. Tem o objetivo de demonstrar a
relevância da análise de dados, como forma de aplicar as práticas do compliance para
a IA. Como resultado desta pesquisa, verificou-se a necessidade de maior atenção
aos processos de qualidade de dados de insumo para treinamentos de IA generativas.

Palavras-chave: Inteligência Artificial, Indústria 4.0, Governança de Dados,


Frameworks, Qualidade de dados.

24
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

1. INTRODUÇÃO

Com a intensidade e velocidade das interações eletrônicas que percorrem os sistemas


informacionais das organizações, tais sistemas precisam deter capacidade
tecnológica de analisar e selecionar esse denso volume de dados, tendo como
alicerce a melhoria contínua e as inovações necessárias, que permitam aos gestores
manterem a competitividade mercadológica, impulsionada pelo novo capital social,
que é a informação (Molina e Santos, 2019).

Honório (2022, p.15) traz a questão da importância da geração de dados eletrônicos,


demonstrando a velocidade das mudanças pelas quais a sociedade vem passando:
“[...] o telefone levou 75 anos para chegar a 50 milhões de pessoas; o rádio, 38 anos
para chegar ao mesmo número de pessoas; a televisão, 13 anos; a internet, 4 anos;
o iPhone apenas 3 anos; o Instagram, 2 anos; o Angry Birds, 35 dias, e o Pokémon
Go, 15 dias”. Segundo a autora, as riquezas que antes eram representadas por bens
físicos, agora residem também no produto do conhecimento, já que os dados são o
novo ativo das organizações.

São exemplos que colaboram para demonstrar que as inovações nos processos
empresariais e ações para ampliar a vantagem competitiva das organizações
requerem as soluções oferecidas pela “economia do conhecimento, economia digital,
indústria 4.0, inteligência artificial, robotização e tecnologias limpas” (Lima, 2020, p.4).

No que se refere ao intenso volume de dados obtidos por meio da Inteligência Artificial,
a segurança desses dados e seu armazenamento adequado requerem mudanças
culturais dentro das empresas, sendo necessária a implantação de recursos como
frameworks, permitindo que os dados obtidos sejam transformados em ativos
gerenciáveis (Lima, 2020).

Por sua vez, a IA Generativa é um sistema que pode captar informações valiosas que
podem passar despercebidas pelos seres humanos, e oferecer soluções reais (Moura,
2023). Exemplo recente noticiado pela grande mídia foi o caso de um menino norte-
americano, que, já tendo passado por 17 médicos e especialidades diferentes, sem

25
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

resultados satisfatórios para seu quadro, a mãe da criança realizou buscas sobre os
sintomas apresentados pela criança ao ChatGPT, que comparando exames e
sintomas, forneceu um diagnóstico real, identificando tratar-se de espinha bífida (O
Globo, 2023).

Fatos como esse demonstram que o desenvolvimento tecnológico da IA colabora para


a eficiência e produtividade na solução de situações de variados graus de dificuldade,
cuja eficácia é potencializada pela análise adequada de dados que vem conduzindo a
humanidade por caminhos cada vez mais inesperados.

O presente artigo original foi desenvolvido com base em ampla pesquisa bibliográfica
e dados científicos. Tem o objetivo de demonstrar a relevância da análise de dados,
como forma de aplicar as práticas do compliance para a IA. Como resultado desta
pesquisa, verificou-se a necessidade de maior atenção aos processos de qualidade
de dados de insumo para treinamentos de IA generativas.

2. AS FASES DA REVOLUÇÃO INDUSTRIAL

Quatro foram os grandes saltos no desenvolvimento humano e social até o presente,


detalhados por Santos (2019) e Lopes (2019): a 1ª. Revolução Industrial (1760 a
1840) trouxe a invenção das máquinas a vapor e energia mecânica; 2ª. Revolução
Industrial (1850 a 1945) quando surgem a rede elétrica, as indústrias química, de
petróleo e de aço; as transformações nos meios de transportes (automóveis,
caminhões e aviões) e na comunicação (telefone); 3ª. Revolução Industrial (1950 –
2010): nasce a internet e as Tecnologias da Informação e Comunicação (TICs);
surgem a robótica, a engenharia genética, biotecnologia, os aparelhos celulares, a
energia solar, eólica e a nuclear; a mecânica analógica é substituída pela digital; 4ª.
Revolução Industrial (2011 - atual), denominada como Indústria 4.0, modelo que
conjuga as várias tecnologias: físicas, digitais e biológicas. É um modelo empresarial
para gerar conhecimento e produtividade.

Lima (2020) explica que são quatro as etapas evolutivas da humanidade desde a
década de 1940, quando existiam três eixos setoriais na economia global: o

26
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

primário, que concentrava as atividades extrativas; o secundário, relativo à produção


manufatureira, e o terciário, com o crescimento da prestação de serviços. As
diferentes revoluções tecnológicas podem ser visualizadas na figura 1.

Figura 1 – As 4 Fases da Revolução industrial

Fonte: Lopes (2019, p. 26).

No decorrer da 2ª. guerra mundial o governo inglês lançou mão de especialistas em


física, matemática, linguística, fisiologia, biologia e engenharia eletrônica, para decifrar
os códigos alemães, resultando no modelo teórico desenvolvido pelo matemático
inglês Alan Turing, que criou a calculadora de válvulas Colossus, decodificando as
mensagens do exército alemão (LOPES, 2019).

Foi em 1956 que a expressão Inteligência Artificial (IA) foi utilizada a primeira vez, pelo
cientista em computação John McCarthy (BUARQUE, 2023). No pós-guerra, Turing
continuou suas pesquisas sobre a inteligência das máquinas, desenvolvendo a
Descriptografia Automatizada, e descrevendo estudos sobre a Lógica Computacional
e as técnicas de aprendizado da máquina; trabalhou também em projetos para robôs
inteligentes que percorrem o campo e aprendem com suas experiências, para ajudar
na agricultura informatizada (MUGGLETON, 2014, apud LOPES, 2019, p.20).

27
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

3. INTELIGÊNCIA ARTIFICIAL (IA)

“A Inteligência Artificial consiste na ciência e na engenharia de fazer máquinas


inteligentes serem capazes de atingir objetivos do mundo” (McCarthy, 2007, p.2, apud
Lopes, 2019, p.22). Surgiu a partir das pesquisas de especialistas pela decodificação
das comunicações alemãs, durante a 2ª. guerra mundial. Foi pelas mãos de Alan
Turing, matemático inglês, que nasceu a Ciência da Computação, quando foram
concebidas possíveis técnicas de aprendizagem pelas máquinas (Lopes, 2019).

Naquele momento, os Estados Unidos tinham desenvolvido um sistema privado como


estratégia de proteção de suas comunicações durante a guerra, sistema que veio a
expandir-se mundialmente, conhecido como rede mundial de computadores. Surgem
os microcomputadores individuais, essas criações modificaram a forma de viver,
trabalhar e interagir de toda a humanidade, transformando-a na Sociedade
Informacional. Dá-se a conjugação das inovações no âmbito institucional, tecnológico,
organizacional, econômico, político e social, que foi denominado como a Era da
Informação (Puc-Rio, 2010).

John McCarthy criou o termo Inteligência Artificial em 1956, tendo desenvolvido


estudos sobre “a natureza matemática do processo do pensamento, incluindo a teoria
das máquinas de Turing, a velocidade dos computadores, a relação de um modelo
cerebral com seu ambiente e uso de linguagens por máquinas” (Lopes, 2019, p. 22).

A IA consiste no uso da informação de forma eficiente, permitindo que se reconheçam


as estratégias do mercado, e permitindo que os gestores se antecipem na tomada de
decisão, resolvendo os problemas de modo satisfatório. Há um consenso nas
organizações sobre manter alicerces em inovações e melhorias contínuas, tendo em
vista que na atualidade, informação é valor (Molina e Santos, 2019).

Além de armazenar e manipular dados, em seus processos, a IA adquire, representa


e manipula conhecimento, devido à sua capacidade de deduzir novos conhecimentos
a partir dos conhecimentos que já existem, utilizando-se dos algoritmos existentes.
Buarque (2023, p.2) refere quatro conceitos categorizados para a Inteligência Artificial:

28
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

“1. Sistemas que pensam como humanos; 2. Sistemas que agem como humanos; 3.
Sistemas que pensam racionalmente; 4. Sistemas que agem racionalmente”.

Essa analogia às habilidades humanas torna único o sistema da IA, a partir de alguns
fatores distintos: comunicação como se fosse uma entidade, conhecimento interno de
si mesma, conhecimento externo, comportamento orientado a objetivos prévios, e
criatividade para adotar determinada ação alternativa, caso a ação inicial venha a
falhar. Neste sentido, Buarque (2023, p.2) reporta a definição dada por Patrick
Winston sobre a IA: “...o estudo da computação que lhe permite perceber, raciocinar
e agir”.

4. REVOLUÇÃO DIGITAL OU INDÚSTRIA 4.0

Honório (2022, p.9) refere que a Indústria 4.0 se caracteriza pela “miniatuarização,
barateamento e evolução dos sensores eletrônicos, inteligência artificial e geração
massiva de dados”. A digitalização industrial é composta de importantes pilares,
descritos por Auletta et al. (2023, p.1), entre eles a “Inteligência Artificial (IA), análise
de dados, aprendizado de máquina, computação na nuvem e Internet das Coisas
(IoT)”.

É neste contexto que as empresas passam a utilizar-se dos recursos e ferramentas


da IA, porque “o uso da Inteligência Artificial para automatizar o mapeamento de
processos da unidade de análise, visando otimizar e inovar na gestão, e obter redução
de custos da empresa” (Lacerda, 2022, p.7).

Entre os benefícios da Indústria 4.0, destacam-se a otimização do tempo e do custo,


devido à rapidez e precisão das informações que as ferramentas tecnológicas
produzem; a flexibilidade pela criação de sistemas, e a integração e desenvolvimento
do produto, denominada fabricação digital, pela rapidez com que se fabrica um
produto, de custo reduzido e maior qualidade (Lopes, 2019). A despeito das várias
nomenclaturas para os avanços tecnológicos, todos os especialistas concordam entre
si que “a geração e a difusão da informação e do conhecimento são fontes de valor e
poder neste terceiro milênio do século XXI” (Puc-Rio, 2010, p.16).

29
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

A Revolução Digital ou 4ª. Revolução Industrial, consiste na “[...] fusão de tecnologias


e a interação entre os domínios físicos, digitais e biológicos” (Auletta et al., 2023, p.3).

Venturelli (2018, apud Auletta et al., 2023, p.3) explica que a Pirâmide de Automação
consiste em uma estrutura de camadas contendo diversas interfaces em modelo
vertical, que, em sendo limitadas ao ambiente local, são pouco flexíveis; porém, com
alta influência na tomada de decisão.

Todos esses recursos levam à questão da Gestão da Informação ou Governança de


Dados é uma “estrutura multifuncional para gerenciar dados como um ativo
organizacional, possui foco na qualidade de dados em um sentido duplo, além dos
aspectos críticos de segurança, privacidade e ética” (Honório, 2022, p.9).

Apesar da necessidade e importância do cuidado com os dados obtidos, Barbieri


(2019, apud Honório, 2022, p.17) explica que devido à complexidade e à forma como
os dados são gerenciados, eles têm sido negligenciados pela gestão de diferentes
empresas, o que pode ocasionar perdas da ordem de 15 a 25% do faturamento.

Esses cuidados com segurança, privacidade e ética podem ser aliados às práticas de
Gestão da Informação – ou Governança do Conhecimento – que é representada por
vários mecanismos formais, dados esses que são gerados pela Governança
Corporativa, os quais requerem qualidade em sua gestão, para serem otimizados, do
ponto de vista econômico. Em outras palavras, é por meio de sistemas de otimização
e valoração sistemática de dados que se pode “cocriar os ativos de conhecimento”
(Honório, 2022, p.17).

5. INTELIGÊNCIA ARTIFICIAL GENERATIVA

A Inteligência Artificial Generativa “é baseada em algoritmos de heurística


computacional, utilizando-se de técnicas avançadas de machine learning e de redes
neurais baseadas em deep learning, que é alimentada por redes neurais generativas”
(Moura, 2023, p.2). São sistemas que criam hipóteses partindo de dados
padronizados, sistemas esses que aprendem de forma autônoma, reconhecendo os
padrões existentes em várias camadas de processamento.
30
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

São muitas as aplicações possíveis para a IA Generativa, já que se utiliza de


ferramentas multimodais, que trabalham a língua, imagens, sons, movimentos
corporais, como: “desenvolver textos (texto-para-texto), por meio de um comando de
entrada (input – ou prompt), produzindo, como resposta, um texto de saída (output),
isto se dá por meio de robôs de conversação, ou chatbots. Há modelos para texto-
para-imagem, texto-para-3D, texto-para-tarefa e texto-para-vídeo” (Duque-Pereira e
Moura, 2023, p.3).

O aprendizado da máquina é uma das abordagens da IA, que permite treinar e


aprender a partir de uma base de dados, e realizar modificações para melhorar tarefas
específicas. Pode analisar situações e dados de séries temporais, a partir de modelos
matemáticos, ou elaborar análises com base em tendências de mercado, como por
exemplo, mudanças no comportamento do consumidor. Entre as técnicas de
aprendizado estão as redes neurais e as árvores de decisão, capazes de analisar
padrões e prever demandas futuras (Sanches e França, 2023).

O aperfeiçoamento da tomada de decisão orientado pela Inteligência Artificial conta


com (Laudon, 2011, p. 338, apud Lopes, 2019, p.28-29):

• raciocínio baseado em casos: utilizando uma base de dados, local onde são
armazenadas tanto as soluções eficazes como as desastrosas, são soluções
que, ao serem processadas, vão avaliar qual das soluções é mais adequada a
cada caso;
• lógica difusa: é um tipo de tecnologia que se baseia em regras que
representam a imprecisão, e que vai criar regras com valores aproximados para
a solução mais adequada;
• redes neurais artificiais: são dispositivos que imitam os padrões de
processamento do cérebro humano, que seguindo padrões em relações
complexas, constroem modelos e revisam eventuais erros, a partir das grandes
quantidades de dados coletados;
• algoritmos genéticos: ideais para solucionar problemas que requeiram
soluções ideais, assemelhando-se às redes neurais;

31
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

• agentes inteligentes: são softwares de retaguarda, sem intervenção humana


direta, executando atividades específicas, repetitivas e previsíveis, utilizados
em processos de negócios;
• sistemas especialistas: utilizam-se de fatos, conhecimentos e técnicas de
raciocínio para solucionar problemas que requeiram habilidades humanas
especiais.

Na atualidade, “o volume, a velocidade e a variedade de produção de dados eleva-se


à dimensão de análise como qualidade, aspectos legais, ética no tratamento e
capacidade de transformação em valores diretos à organização, dentro do conceito
de monetização e transformação digital” (Barbieri, 2019, apud Auletta et al., 2023, p.2).

Como consequência, para se ter uma visão estratégica empresarial que permita
manter a competitividade é fundamental que a Gestão das Informações (GI)
demonstre aos gestores que é preciso deixar de considerar o volume de dados
coletados como itens colaterais e implantar “... um framework de governança de
dados, transformando-os em insumo de negócios”. Neste sentido, Redman (2016,
apud Auletta et al., 2023, p.2) corrobora este conceito, explicando que o
armazenamento de dados é tão importante quanto saber analisar e criar modelos para
esse armazenamento, evitando que dados ruins ocasionem prejuízos às grandes
organizações.

6. IMPORTÂNCIA DA QUALIDADE DE DADOS E IA

A qualidade dos dados é fator crucial para que modelos confiáveis de Machine
Learning (ML) sejam implantados pelas organizações, já que é a qualidade desses
dados que vai ocasionar o desempenho ideal de ML (Rangineni, 2023). Porém,
verifica-se na literatura que existem inúmeros benefícios trazidos pela IA, assim como
riscos ou desvantagens (Wach et al., 2023).

As etapas que permitem uma análise profunda das fases do pipeline de ML são:
“coleta de dados, pré-processsamento, treinamento de modelo de validação”
(Rangineni, 2023, p. 16).

32
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

Entre os critérios de qualidade dos dados estão a precisão, consistência, integridade,


relevância e as questões éticas, enquanto as dificuldades na falta da qualidade são o
ruído, incompletude e vieses dos dados. Todos esses fatores são alvo de pesquisas
de especialistas para o desenvolvimento de ferramentas de ML, e criação de modelos
confiáveis (Rangineni, 2023)

Ainda sobre a qualidade de dados e sua gestão Budac (2022, p.1) explica que, além
dos modelos de ML já existentes, são necessários sistemas que visem “precisão,
integridade e consistência de dados”. A preocupação consiste em evitar-se o uso de
dados incompletos, errôneos ou inadequados, os quais conduzem a treinamentos
inadequados de ML e assim, resultados não desejáveis.

Existem seis dimensões para classificar a qualidade de dados, as quais foram


desenvolvidas pelos especialistas e descritas por Budac (2022, p. 2-5):

• Representação consistente: cada entidade do mundo real tem apenas uma


forma de ser representada. Por exemplo, para o recurso “cidade”, Nova York,
não será representada como NYC ou NY, mas somente Nova York;
• Completude: Quando faltam valores no contexto real, por exemplo, um sensor
médico para monitorar pressão arterial, e seu sensor falhar por algum intervalo
de tempo, impactando o resultado dessa aferição;
• Precisão de recursos: a precisão pode cair na medida em que os dados do
mundo real contenham erros ou imprecisões em seus valores, já que os dados
podem advir de várias fontes. Dessa forma, quanto maior o desvio do valor real,
menor será a precisão desses dados;
• Precisão do alvo: há um recurso de destino para cada conjunto de dados, isto
é, há uma classe/rótulo em tarefas de classificação ou um número valor em
tarefas de regressão. Como exemplo, “um cachorro bravo pode ser rotulado
como “lobo””;
• Singularidade: A redundância de dados é outro fator de grande relevância,
sendo utilizado o recurso da desduplicação, para evitar ajustes excessivos;
• Saldo da classe alvo: “é o conjunto de dados balanceado para alcançar um
desempenho satisfatório”. Refere-se o algoritmo k-Means, porque ele
33
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

“reconhece os agrupamentos de tamanhos aproximadamente uniformes


mesmo que não seja o caso nos dados de entrada”.

Por sua vez, as ameaças do uso de dados que podem prejudicar os modelos de ML,
que se resumem em 7 grupos principais, como descreve Wach et al. (2023, p.7):

1. ausência de qualquer regulamentação do mercado de IA e necessidade


urgente de regulamentação;
2. má qualidade, falta de controle de qualidade, desinformação, conteúdo
deepfake, viés algorítmico;
3. perda de vagas de emprego, estimulada pela automação;
4. violação de dados pessoais, vigilância social e violação da privacidade;
5. manipulação social, enfraquecimento da ética e da boa vontade;
6. aumento das desigualdades socioeconômicas;
7. estresse tecnológico da IA.

Rangineni (2023) defende que empresas públicas e privadas já têm a consciência


sobre a importância da qualidade dos dados, no sentido de diminuição dos riscos
sociais, na redução dos custos e na facilitação do uso eficiente das tecnologias do ML.
A este respeito, Honório (2022, p.18) refere que não basta gerar conhecimento,
porque também é preciso “criar formas de governá-lo”.

Neste sentido, da proteção quanto á violação dos direitos humanos, em especial


crianças e jovens entre 9 e 17 anos, Buarque (2023) refere o manifesto publicado pela
Declaração de Toronto, defendendo que não se permita qualquer tipo de distinção ou
discriminação, exclusão, restrição ou preferência com base em motivos como raça,
cor, sexo, idioma, religião, opinião política ou de qualquer outra natureza.

Wach et al. (2023) defende ser fundamental que determinadas medidas práticas e
legais sejam adotadas: regulação do mercado de IA/GAI; garantia da segurança e
proteção de dados de usuários e organizações; promoção da concorrência leal,
proteção dos direitos intelectuais e privacidade de riscos geopolíticos.

34
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

7. CONCLUSÃO

É cada vez mais verdade que os dados eletrônicos representam o ativo mais valioso
do mundo moderno, concepção que se amplia para a IA Generativa. Contudo,
precisamos ter a máxima atenção sobre os dados utilizados para o treinamento de
modelos de I, já que o crescente volume de dados atual, sendo que o potencial da
evolução desses modelos aponta para uma rápida evolução. Todavia, o desafio de
cuidar desses dados, que são o “combustível” para esses modelos, consiste no
acompanhamento desse crescimento. Os benefícios trazidos pela AI Generativa são
claros, assunto que é o foco do presente artigo. Porém, nos dias atuais, o mundo
passou a perceber também os riscos associados a essa nova tecnologia, sobretudo,
aos aspectos relacionados a conteúdos indesejados, ou àqueles que trazem algum
prejuízo à humanidade.

A utilização de dados sem qualidade, ou seja, dados que possam conter problemas
reais, como racismo e/ou preconceito, ou até mesmo algum tipo de viés
discriminatório, político, entre outros, pode fazer com que esses modelos de
aprendizagem gerem respostas contendo esses problemas.

A utilização de etapas de qualidade de dados previa ao consumo por modelos de


aprendizagem é necessária não apenas para tratar da integridade e confiabilidade dos
dados, mas também para identificação e tratamento de problemas éticos e legais,
através de análises de dados desenvolvidas especificamente com esse propósito,
dessa forma, possibilitando a identificação de massa de dados com potencial de gerar
resultados indesejados com a utilização da IA generativa.

Os dados são o ponto de partida de tudo, são acontecimentos apresentados através


de diversas perspectivas. Para garantir uma evolução segura da Inteligência Artificial,
frente a evolução que experimentamos, deve-se ter o cuidado para que esses
modelos não repliquem problemas por consumirem dados de má qualidade, o que
consiste nas etapas de processamento prévio e análise de dados de insumo, que é o
fator chave para alcançarmos esse objetivo.

35
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

AGRADECIMENTOS

Agradeço a Deus e a minha esposa Graciane Gadelha por todo o apoio.

REFERÊNCIAS

AULETTA, Guilhermo Bellido et al. Governança de Dados e a Indústria 4.0. Revista


Científica Senai-SP – Tecnologia, Inovação & Educação, São Paulo, SP, vol. 1, n.
2, p.01-12, 2023. Disponível em:
https://periodicos.sp.senai.br/index.php/rcsenaisp/article/view/23. Acesso em: 16 out.
2023.

BUARQUE, Gabriela. Artificial intelligence and algorithmic discrimination: a reflection


on risk and vulnerability in childhood. Brazilian Journal of Law Technology and
Innovation, vol. 2, n. 2, p. 63-84, set. 2023. DOI:10.59224/bjlti.v1i2.63-86. Disponível
em:
https://www.researchgate.net/publication/373887331_Artificial_intelligence_and_algo
rithmic_discrimination_a_reflection_on_risk_and_vulnerability_in_childhood. Acesso
em: 18 out. 2023.

BUDACH, Lukas et al. The Effects of Data Quality on Machine Learning


Performance. arXiv, 2022. Disponível em: https://arxiv.org/pdf/2207.14529.pdf.
Acesso em: 16 out. 2023.

DUQUE-PEREIRA, Ives da Silva; MOURA, Sergio Arruda de. Compreendendo a


Inteligência Artificial Generativa na perspectiva da língua. SciELOPreprints, 2023.
https://doi.org/10.1590/SciELOPreprints.7077. Disponível em:
https://preprints.scielo.org/index.php/scielo/preprint/view/7077/13284. Acesso em: 31
out 2023.

HONORIO, Roseli. Modelo Conceitual de Governança de Dados como suporte à


Governança do Conhecimento Organizacional. 2022. Dissertação [Mestrado em
Engenharia e Gestão do Conhecimento] apresentada ao Programa de Pós-Graduação
da Universidade Federal de Santa Catarina. Florianópolis, 2022. Disponível em:
https://repositorio.ufsc.br/bitstream/handle/123456789/243667/PEGC0739-
D.pdf?sequence=-1&isAllowed=y. Acesso em: 16 out. 2023.

LACERDA, Lidia Correa de. O uso da inteligência artificial na gestão da inovação


tecnológica: automatização do processo de mapeamento de dados. 2022. Trabalho
de Conclusão de Curso [Graduação em Engenharia de Produção] apresentado à
Escola de Engenharia de Petrópolis da Universidade Federal Fluminense. Petrópolis,
2022. Disponível em: https://app.homologacao.uff.br/riuff/handle/1/25224. Acesso em:
16 out. 2023.

36
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

LIMA, Jean Santos. A Vantagem Competitiva das Nações no Limiar da 4ª


Revolução Industrial: A Importância da Economia do Conhecimento, da Sinergia
entre Indústria e Serviços, e da Política Internacional. 2020. Tese [Doutorado em
Relações Internacionais] apresentada ao curso de Pós-graduação em Relações
Internacionais do Instituto de Relações Internacionais da Universidade de Brasília
(UnB). Brasília, 2020. Disponível em:
http://icts.unb.br/jspui/bitstream/10482/39098/1/2020_JeanSantosLima.pdf. Acesso
em: 19 out. 2023.

LOPES, Roberta da Silva. Inteligência Artificial na Contabilidade em


Organizações Públicas: Potencialidades e Desafios. Dissertação [Mestrado em
Controle de Gestão] apresentada à Universidade do Estado do Rio de Janeiro. Rio de
Janeiro, 2019. Disponível em: https://www.bdtd.uerj.br:8443/handle/1/8054. Acesso
em: 16 out. 2023.

MOLINA, Leticia Gorri; SANTOS, Juliana Cardoso dos. Gestão da Informação e a 4a


Revolução Industrial. AtoZ: novas práticas em informação e conhecimento, vol. 8,
n.2, p 39-48, jul./dez. 2019. DOI: 10.5380/atoz.v8i2.65784. Acesso em: 19 out. 2023.

MOURA, Mariana Vasques. A Inteligência Artificial Generativa como autora de


invenções patenteáveis: um estudo analítico do “Caso Dabus”. O Globo, 2023.
Disponível em:
https://repositorio.animaeducacao.com.br/bitstream/ANIMA/36309/1/2023.06.04%20-
%20TCC%20Mariana%20Moura%20-%20VF%20-%20PDF-A.pdf. Acesso em: 31 out
2023.

O GLOBO. Criança é diagnosticada com doença rara pelo ChatGPT após passar
por 17 médicos. O Globo, 2023. Disponível em:
https://oglobo.globo.com/saude/medicina/noticia/2023/09/13/crianca-e-
diagnosticada-com-doenca-rara-pelo-chatgpt-apos-passar-por-17-medicos-
entenda.ghtml. Acesso em: 31 out. 2023.

PUC RIO. Conhecimento Tecnológico e Informação: a Era da Sociedade


Informacional. Puc-Rio, 2010. Disponível em: https://www.maxwell.vrac.puc-
rio.br/16712/16712_3.PDF. Acesso em: 19 out. 2023.

RANGINENI, Sandeep. An Analysis of Data Quality Requirements for Machine


Learning Development Pipelines Frameworks. International Journal of Computer
Trends and Technology, v.71, n. 8, ago. 2023, p.16-27.
DOI:10.14445/22312803/IJCTT-V71I8P103. Disponível em:
https://www.researchgate.net/publication/373821198_An_Analysis_of_Data_Quality_
Requirements_for_Machine_Learning_Development_Pipelines_Frameworks. Acesso
em: 16 out. 2023.

SANCHES, Felipe Norato; FRANÇA, Celso Ap. de. O uso de algoritmos de


classificação para determinar estoques de segurança. Repositório Institucional

37
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo
REVISTA CIENTÍFICA MULTIDISCIPLINAR NÚCLEO DO
CONHECIMENTO ISSN: 2448-0959

https://www.nucleodoconhecimento.com.br

UFSCar, 2023. Disponível em:


https://repositorio.ufscar.br/handle/ufscar/18405. Acesso em: 16 out. 2023.

SANTOS, Leon. Conheça as quatro Revoluções Industriais que moldaram a


trajetória do mundo. CFA, 2019. Disponível em: https://cfa.org.br/as-outras-
revolucoes-industriais/. Acesso em 19 out. 2023.

WACH, Krzysztof et al. The dark side of generative artificial intelligence: A critical
analysis of controversies and risks of ChatGPT. Entrepreneurial Business
Magazine, vol.11, n. 2, p. 7-30, Jun. 2023. DOI:10.15678/EBER.2023.110201.
Disponível em:
https://www.researchgate.net/publication/371987305_The_dark_side_of_generative_
artificial_intelligence_A_critical_analysis_of_controversies_and_risks_of_ChatGPT.
Acesso em: 16 out. 2023.

Enviado: 14 de novembro de 2023.

Aprovado: 27 de novembro, 2023.

1Pós-graduação Lato Sensu em Gerenciamento de Projetos e Processos; Graduação Bacharel em


Sistemas de Informação. ORCID: 0009-0005-4593-7897.

38
RC: 150602
Disponível em: https://www.nucleodoconhecimento.com.br/ciencia-da-computacao/dados-de-insumo

Você também pode gostar