Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Busca avançada
Ano de início
Entree

Aprimorando a caracterização de conjuntos de dados públicos utilizando o OpenML

Processo: 23/11801-6
Modalidade de apoio:Bolsas no Exterior - Estágio de Pesquisa - Iniciação Científica
Vigência (Início): 01 de dezembro de 2023
Vigência (Término): 29 de fevereiro de 2024
Área do conhecimento:Ciências Exatas e da Terra - Ciência da Computação
Pesquisador responsável:Ana Carolina Lorena
Beneficiário:Nathan Falcão Carvalho
Supervisor: Joaquin Vanschoren
Instituição Sede: Divisão de Ciência da Computação (IEC). Instituto Tecnológico de Aeronáutica (ITA). Ministério da Defesa (Brasil). São José dos Campos , SP, Brasil
Local de pesquisa: Eindhoven University of Technology (TU/e), Holanda  
Vinculado à bolsa:23/03958-2 - Reunindo meta-data de repositórios públicos, BP.IC
Assunto(s):Ciência de dados   Aprendizado computacional   Meta-aprendizado computacional   Metadados
Palavra(s)-Chave do Pesquisador:AutoML | Meta-Aprendizado | Meta-atributos | OpenML | Ciência de Dados e Aprendizado de Máquina

Resumo

Nos últimos anos, Aprendizado de Máquina (AM) se tornou uma solução popular para problemas em uma variada gama de áreas, como Informática Biomédica, Processamento de Linguagem Natural e sistemas de recomendação em websites. Um passo essencial em AM é determinar qual algoritmo é melhor adaptado para a resolução de um problema específico, assim como quais parâmetros maximizam o resultado desejado. A área de Meta-Aprendizado (MA) resolve esse problema de seleção de algoritmos analisando uma variedade de performances de algoritmos em uma seleção diversa de conjuntos de dados. A partir do aprendizado com esses metadados, informações úteis a respeito do processo de selecionar um algoritmo para resolver um problema são obtidas. Para que um estudo de MA seja feito, é necessário reunir metadados, que consistem em performances de algoritmos e características de conjuntos de dados. Uma vez que executar localmente uma ampla gama de algoritmos de AM em vários conjuntos de dados pode ser computacionalmente inviável, uma forma comum de adquirir esses dados é usar repositórios públicos, dos quais OpenML é uma opção popular. No entanto, ainda há limitações para essa abordagem, uma vez que caracterizações de conjuntos de dados, chamadas meta-atributos, mais atualizadas com as pesquisas atuais podem ser desafiadores de conseguir. Visto que várias ferramentas para extração de meta-atributos mais úteis e representativos de conjuntos de dados já estão presentes na literature, planejamos enriquecer o repositório OpenML diversificando a gama de metadados disponível. (AU)

Matéria(s) publicada(s) na Agência FAPESP sobre a bolsa:
Mais itensMenos itens
Matéria(s) publicada(s) em Outras Mídias ( ):
Mais itensMenos itens
VEICULO: TITULO (DATA)
VEICULO: TITULO (DATA)