A formação em Ciência da Informação (CI) caracteriza-se pela diversidade de modelos com repercuss... more A formação em Ciência da Informação (CI) caracteriza-se pela diversidade de modelos com repercussão nos respetivos cursos de Mestrado e Doutoramento. Dada a importância destes para a afirmação da área pretende-se fornecer subsídios para uma reflexão sobre a mesma, contextualizando-a na contemporaneidade a partir dos referenciais fornecidos pelos referidos cursos em Portugal e no Brasil. Objetivou-se: i. Identificar nestes dois países, os cursos ativos (2016) certificados pelas respetivas agências; ii. Verificar o enquadramento oficial; iii. Contextualizar a CI nas classificações em uso nas estruturas oficiais educativas. Seguiu-se uma metodologia qualitativa exploratória assente na análise e síntese dos dados obtidos nas fontes oficiais. Identificaram-se, respetivamente, em Portugal e no Brasil: mestrados – 4 e 16 e doutoramentos – 3 e 9. A área, em Portugal, apresenta-se como em passagem das «Ciências Documentais» para uma CI mais abrangente; no Brasil, observa-se um complexo relac...
EnglishThe Web is the privileged place for seeking information. The potential of the so-called se... more EnglishThe Web is the privileged place for seeking information. The potential of the so-called semantic web to enhance retrieval of relevant information seems essential. In Information Science (IS), this idea was developed from the Otlet’s “analogic semantic web”, justifying the connection between the Semantic Web (SW) and the field of IS. We aimed to exam and analyze the presence of subjects related to SW in the output of IS master and PhD courses in Portugal and Brazil (2005-2015). Specifically, we aimed to: identify IS courses, master's dissertations (MD) and PhD thesis (PD) associated to SW; identify the points of confluence between the IS and the SW in these works; characterize the academic profile of these works’ authors and advisors. Based on a qualitative approach, we performed a literature review and an empirical study focused on content analysis of the retrieved works (RCAAP and OASISbr). As results, we have: verified 4 unique records in RCAAP and 40 in OASISbr; identi...
Dissertacao de mestrado em Ciencia da Informacao, apresentado a Faculdade de Letras da Universida... more Dissertacao de mestrado em Ciencia da Informacao, apresentado a Faculdade de Letras da Universidade de Coimbra
Revista Ibero-Americana de Ciência da Informação, 2018
O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação (CI) tem... more O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação (CI) tem aproximado às das técnicas de Deep Learning, sendo relacionadas à representação, descrição e recuperação de imagens na Web, e assim, aferir da mais valia destas pesquisas quando aplicadas aos métodos da área da CI. A partir de uma revisão integrativa de literatura nacional e internacional de modo contextualizado na CI, os documentos recuperados foram analisados conforme os critérios da revisão integrativa, identificando um conjunto de operações que poderiam ser integrados nas metodologias de representação e descrição de imagens desenvolvidas e consolidadas no campo da CI. Conclui-se que ainda há uma lacuna nas pesquisas em CI tanto no âmbito nacional como internacional sobre Deep Learning e que recursos desta nova estrutura de programação podem ser aproximados aos métodos já validados pela área.
A indexacao, humana e automatica, foi desde sempre uma preocupacao da area da ciencia da informac... more A indexacao, humana e automatica, foi desde sempre uma preocupacao da area da ciencia da informacao (CI). A falta de consistencia na indexacao humana e de semântica na automatica sao apontadas como as grandes desvantagens. Uma possibilidade de dotar sistemas computacionais com maior capacidade de inferencia reside na utilizacao de ontologias. Desta proposicao objetiva-se identificar e analisar os estudos na area da CI que abordem as contribuicoes das antologias na indexacao automatica. Pretende-se (i) identificar os trabalhos cientificos, nas bases Library & Information Science Source e Library, Information Science & Technology Abstracts que abordem este assunto, a sua distribuicao temporal e geografica; (ii) identificar e descrever a centralidade da abordagem tematica aos dois conceitos (indexacao automatica e ontologias), e a abordagem metodologica dos respetivos artigos; (iii) identificar as contribuicoes presentes nos artigos que constituem o corpus relativamente as potencialida...
Purpose The purpose of this paper is to discuss the literature on concept theory in library and i... more Purpose The purpose of this paper is to discuss the literature on concept theory in library and information science (LIS) from an epistemological perspective, ascribing each paper to an epistemological family and discussing their relevance in the context of the knowledge organization (KO) domain. Design/methodology/approach This paper adopts a hermeneutic approach for the analysis of the texts that compose the corpus of study following contingency and categorical analyses. More specifically, the paper works with Bardin’s contingency analysis and follows Hjørland’s families of epistemologies for the categorization. Findings The analysis corroborates the observations made for the last ten years about the scarcity of studies on concept theory in LIS and KO. However, the study also reveals an epistemological turn on concept theory since 2009 that could be considered a departure from the rationalist views that dominated the field and a continuation of a broader paradigm shift in LIS and ...
Journal of the Association for Information Science and Technology
The web has been, in the last decades, the place where information retrieval achieved its maximum... more The web has been, in the last decades, the place where information retrieval achieved its maximum importance, given its ubiquity and the sheer volume of information. However, its exponential growth made the retrieval task increasingly hard, relying in its effectiveness on idiosyncratic and somewhat biased ranking algorithms. To deal with this problem, a “new” web, called the Semantic Web (SW), was proposed, bringing along concepts like “Web of Data” and “Linked Data,” although the definitions and connections among these concepts are often unclear. Based on a qualitative approach built over a literature review, a definition of SW is presented, discussing the related concepts sometimes used as synonyms. It concludes that the SW is a comprehensive and ambitious construct that includes the great purpose of making the web a global database. It also follows the specifications developed and/or associated with its operationalization and the necessary procedures for the connection of data in an open format on the web. The goals of this comprehensive SW are the union of two outcomes still tenuously connected: the virtually unlimited possibility of connections between data—the web domain—with the potentiality of the automated inference of “intelligent” systems—the semantic component.
AtoZ: novas práticas em informação e conhecimento, 2016
Introdução: Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente ... more Introdução: Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente para a rede, para sites conhecidos como “Redes Sociais”. Nessa replicação, certos modos de comunicar e se representar, inócuos em estado offline, podem ser bastante prejudiciais profissionalmente quando reproduzidos em linha. Assim, o objetivo desta investigação é refletir sobre a importância - em termos profissionais - do perfil que é criado nas, ou pelo uso das, Redes Sociais em Linha (como o Facebook e outros sites similares), considerando a influência da atividade aí desenvolvida na obtenção de uma contratação laboral. Método: Foi realizada uma revisão da literatura, em forma de pesquisa exploratória, incluindo fontes bibliográficas e documentais, entre as quais 16 estudos primários efetuados entre 2008 e 2014, abrangendo a perspetiva de investigadores e recrutadores sobre esta problemática de forma a responder três questões, a saber: a) Os responsáveis pelos recursos humanos e/ou outros com poder de decisão em termos de gestão de funcionários, procuram efetivamente informação em linha sobre potenciais funcionários? b) A informação encontrada tem um papel relevante na decisão desses gestores de recursos humanos? c) Quem procura trabalho deve cuidar da sua “imagem digital” mesmo nas Redes Sociais em Linha não consideradas profissionais? Resultados: A procura de informação nas chamadas “Redes Sociais” sobre os candidatos a ofertas de emprego é efetivamente realizada ao longo de todo o processo de seleção e recrutamento. Essa prática, denominada de cybervetting, também abrange as Redes Sociais em Linha tidas como não profissionais e, atendendo aos estudos analisados, é de esperar um aumento da sua frequência. A informação encontrada nas “Redes Sociais em Linha” é também considerada na avaliação dos candidatos às ofertas de emprego, uma vez que é entendida, por muitos recrutadores, como parte da “identidade digital” do indivíduo em questão. Verifica-se, igualmente, que a influência da informação obtida por essa via tende a não ser favorável aos candidatos. Conclusão: Do ponto de vista dos recrutadores a prática de cybervetting é, frequentemente, encarada como um dever profissional no sentido de encontrar o candidato mais adequado. Pelo lado dos candidatos urge uma maior consciencialização da repercussão que a atividade desenvolvida em linha pode ter em termos profissionais. Os efeitos na sua “imagem digital” são similares aos de uma tatuagem, deixa marcas dificilmente removíveis.
Wikipedia, as "social machine", is a privileged place to observe the collective constru... more Wikipedia, as "social machine", is a privileged place to observe the collective construction of concepts without central control. Based on Dahlberg's theory of concept, and anchored in the pragmatism of Hjørland - in which the concepts are socially negotiated meanings - the evolution of the concept of Semantic Web (SW) was analyzed in the English version of Wikipedia. An exploratory, descriptive and qualitative study was designed and we identified 26 different definitions (between 7-12-2001 and 12/31/2017) of which 8 are of particular relevance for their duration, with the latter being the two recorded at the end of the analyzed period. According to them, SW: "is a extension of the web"and "is a Web of Data"; the latter, used as a complementary definition, links to Berners-Lee's publications. In Wikipedia, the evolution of the SW concept appears to be based on the search for the use of non-technical vocabulary and the control of authority...
Wikipedia, as a "social machine", is a privileged place to observe the collective construction of... more Wikipedia, as a "social machine", is a privileged place to observe the collective construction of concepts without central control. Based on Dahlberg's theory of concept, and anchored in the pragmatism of Hjørland-in which the concepts are socially negotiated meanings-the evolution of the concept of semantic web (SW) was analyzed in the English version of Wikipedia. An exploratory, descriptive, and qualitative study was designed and we identified 26 different definitions (between 12 July 2001 and 31 December 2017), of which eight are of particular relevance for their duration, with the latter being the two recorded at the end of the analyzed period. According to them, SW: "is an extension of the web" and "is a Web of Data"; the latter, used as a complementary definition, links to Berners-Lee's publications. In Wikipedia, the evolution of the SW concept appears to be based on the search for the use of non-technical vocabulary and the control of authority carried out by the debate. As a space for collective bargaining of meanings, the Wikipedia study may bring relevant contributions to a community's understanding of a particular concept and how it evolves over time.
Purpose – The purpose of this paper is to discuss the literature on concept theory in Library and... more Purpose – The purpose of this paper is to discuss the literature on concept theory in Library and Information Science from an epistemological perspective, ascribing each paper to an epistemological family and discussing their relevance in the context of the knowledge organization domain. Design/methodology/approach – This paper adopts a hermeneutic approach for the analysis of the texts that compose the corpus of study following contingency and categorical analyses. More specifically, the paper works with Bardin’s contingency analysis and follows Hjørland’s families of epistemologies for the categorization. Findings – The analysis corroborates the observations made for the last ten years about the scarcity of studies on concept theory in Library and Information Science and Knowledge Organization. However, the study also reveals an epistemological turn on concept theory since 2009 that could be considered a departure from the rationalist views that dominated the field and a continuation of a broader paradigm shift in LIS and KO. All analyzed papers except two follow pragmatist or historicist approaches. Originality/value – This paper follows-up and systematize the contributions to the Library and Information Science and Knowledge Organization fields on concept theory mainly during the last decade. The epistemological analysis reveals the dominant views in this paradigm shift and the main authors and trends that are present in the Library and Information Science literature on concept theory.
JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY, 2019
The web has been, in the last decades, the place whereinformation retrieval achieved its maximum ... more The web has been, in the last decades, the place whereinformation retrieval achieved its maximum importance,given its ubiquity and the sheer volume of information.However, its exponential growth made the retrieval taskincreasingly hard, relying in its effectiveness on idio-syncratic and somewhat biased ranking algorithms. Todeal with this problem, a“new”web, called the Seman-tic Web (SW), was proposed, bringing along conceptslike“Web of Data”and“Linked Data,”although the defi-nitions and connections among these concepts areoften unclear. Based on a qualitative approach builtover a literature review, a definition of SW is presented,discussing the related concepts sometimes used assynonyms. It concludes that the SW is a comprehensiveand ambitious construct that includes the great purposeof making the web a global database. It also follows thespecifications developed and/or associated with its oper-ationalization and the necessary procedures for the con-nection of data in an open format on the web. The goalsof this comprehensive SW are the union of two out-comes still tenuously connected: the virtually unlimitedpossibility of connections between data—the webdomain—with the potentiality of the automated inferenceof“intelligent”systems—the semantic component.
Resumo: O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação ... more Resumo: O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação (CI) tem aproximado às das técnicas de Deep Learning, sendo relacionadas à representação, descrição e recuperação de imagens na Web, e assim, aferir da mais valia destas pesquisas quando aplicadas aos métodos da área da CI. A partir de uma revisão integrativa de literatura nacional e internacional de modo contextualizado na CI, os documentos recuperados foram analisados conforme os critérios da revisão integrativa, identificando um conjunto de operações que poderiam ser integrados nas metodologias de representação e descrição de imagens desenvolvidas e consolidadas no campo da CI. Conclui-se que ainda há uma lacuna nas pesquisas em CI tanto no âmbito nacional como internacional sobre Deep Learning e que recursos desta nova estrutura de programação podem ser aproximados aos métodos já validados pela área. Palavras-chave: deep learning; indexação de imagens; machine learning; recuperação de imagens na web. Automatic indexing of web images: trends and challenges in deep learning context Abstract: The objective of this study is to investigate the extent to which research in Information Science (IS) has approximated those techniques of the Deep Learning, being related to representation, description and retrieval of images on the Web, and thus, to assess the value of these researches when applied to IS methods. From an integrative review of national and international literature contextualized in the IS, the recovered documents were analyzed according to the criteria of the integrative review, identifying a set of operations that could be attached in the methodologies of representation and description of images developed and consolidated in the field of IS. It is concluded that there is still a gap in research of IS area both at national and international level on Deep Learning and that resources of this new programming structure can be approximated to the methods already validated by the area. Keywords: deep learning; image retrieval on the web; indexing of images; machine learning. Indexación automática de imágenes en la web: tendencias y desafíos en el contexto deep learning
RESUMO A Web é o local privilegiado para procurar informação. As potencialidades de uma web semân... more RESUMO A Web é o local privilegiado para procurar informação. As potencialidades de uma web semântica para recuperar informação afiguram-se essenciais. Na Ciência da Informação (CI), esta ideia surge com Otlet ao desenvolver uma " web semântica analógica " , justificando a ligação entre: Web Semântica (WS) e CI. Procura-se verificar e refletir sobre a presença da WS no output dos cursos de mestrado/doutoramento em CI, Portugal e Brasil (2005-2015). Para tanto: identificam-se os cursos, dissertações de mestrado (DM) e teses de doutoramento (TD) em CI associados à WS; identificam-se pontos de confluência entre as duas áreas nestes trabalhos; caraterizam-se o perfil académico dos autores e orientadores dos mesmos. Partiu-se do paradigma qualitativo: revisão bibliográfica e estudo empírico, centrado na análise de conteúdo dos trabalhos recuperados (RCAAP e OASISbr). Verificou-se 4 registos únicos no RCAAP; 40 no OASISbr. Identificaram-se 4 cursos de mestrado e 3 de doutoramento (Portugal), e 16 de mestrado e 9 de doutoramento (Brasil). Recuperaram-se 0 DM/TD (Portugal) e 16 DM, 5 TD (Brasil). Identificaram-se 3 pontos de confluência: a) contribuição mútua (62%), b) WS enquanto tema interdisciplinar (29%) e c) complementaridade de conhecimentos (9%). Contabilizaram-se 11 trabalhos (52%) onde os investigadores responsáveis apresentam, no conjunto, formação nas áreas CI/Informática. O estudo aponta para a WS como um campo de investigação da CI, embora essencialmente teórico, sendo o trabalho prático interdisciplinar, CI/Informática, incipiente e pouco representativo. ABSTRACT The Web is the privileged place for seeking information. The potential of the so-called semantic web to enhance retrieval of relevant information seems essential. In Information Science (IS), this idea was developed from the Otlet's " analogic semantic web " , justifying the connection between the Semantic Web (SW) and the field of IS. We aimed to exam and analyze the presence of subjects related to SW in the output of IS master and PhD courses in Portugal and Brazil (2005-2015). Specifically, we aimed to: identify IS courses, master's dissertations (MD) and PhD thesis (PD) associated to SW; identify the points of confluence between the IS and the SW in these works; characterize the academic profile of these works' authors and advisors. Based on a qualitative approach, we performed a literature review and an empirical study focused on content analysis of the retrieved works (RCAAP and OASISbr). As results, we have: verified 4 unique records in RCAAP and 40 in OASISbr; identified 4 Master's and 3 PhD courses (Portugal) and 16 masters and 9 PhD courses (Brazil); retrieved no MD/PD in Portugal, 16 MD and 5 PD in Brazil; identified 3 confluence points: a) mutual contribution (62%), b) WS as an interdisciplinary theme (29%) and c) complementary knowledge (9%); identified 11 works (52%) were the respective researchers have training in IS and Computer Science (CS). The study points to the WS as a field of investigation in IS, although essentially theoretical, insofar as practical interdisciplinary works in CI/CS are incipient and not representative.
A indexação, humana e automática, foi desde sempre uma preocupação da área da ciência da informaç... more A indexação, humana e automática, foi desde sempre uma preocupação da área da ciência da informação (CI). A falta de consistência na indexação humana e de semântica na automática são apontadas como as grandes desvantagens. Uma possibilidade de dotar sistemas computacionais com maior capacidade de inferência reside na utilização de ontologias. Desta proposição objetiva-se identificar e analisar os estudos na área da CI que abordem as contribuições das antologias na indexação automática. Pretende-se (i) identificar os trabalhos científicos, nas bases Library & Information Science Source e Library, Information Science & Technology Abstracts que abordem este assunto, a sua distribuição temporal e geográfica; (ii) identificar e descrever a centralidade da abordagem temática aos dois conceitos (indexação automática e ontologias), e a abordagem metodológica dos respetivos artigos; (iii) identificar as contribuições presentes nos artigos que constituem o corpus relativamente às potencialidades da utilização conjunta dos dois conceitos. Partiu-se de um estudo exploratório assente numa revisão sistemática da literatura. Os resultados apontam como contribuições das ontologias na indexação automática: (i) desambiguar termos homógrafos e polissémicos; (ii) maior capacidade de integração de relações semânticas de forma automatizada; (iii) uma navegação e expansão de consultas através de relações semânticas; (iv) uma recuperação mais precisa e exaustiva da informação. Conclui-se que o desenvolvimento de sistemas que utilizam o potencial das ontologias na indexação automática procura contornar a sua falta de capacidade semântica. Apesar dos resultados promissores nesta matéria, infere-se que é ainda prematuro e inadequado falar de uma indexação semântica efetiva.
A influência da informação publicada nas " redes sociais " no processo de seleção e recrutamento:... more A influência da informação publicada nas " redes sociais " no processo de seleção e recrutamento: um estudo exploratório na literatura The influence of the information published in " social networks " in the process of selection and recruitment: an exploratory study in the literature
Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente para a rede,... more Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente para a rede, para sites conhecidos como " Redes Sociais ". Nessa replicação, certos modos de comunicar e se representar, inócuos em estado offline, podem ser bastante prejudiciais quando reproduzidos em linha. Exemplos vão aparecendo nas notícias quando funcionários são despedidos devido a comentários efetuados em sites como o Facebook. No intuito de refletir sobre a influência da atividade desenvolvida em linha, no Facebook e noutros sites similares, na obtenção de uma contratação laboral, foi realizada uma revisão da literatura, que incluiu 12 estudos efetuados entre 2008 e 2014, abrangendo a perspetiva de investigadores e recrutadores sobre esta problemática. Desse trabalho concluiu-se que a verificação dos perfis de utilizador, nas chamadas " Redes Sociais " , é efetuada ao longo do processo de seleção e recrutamento dos candidatos a ofertas de emprego. Nalguns casos essa verificação é aconselhada e incentivada como fator competitivo entre empresas de recursos humanos. A informação obtida por essa via tem influência, aparentemente de forma mais negativa que positiva, na decisão dos profissionais responsáveis pela contratação de colaboradores. Do ponto de vista desses profissionais essa verificação é, frequentemente, encarada como um dever profissional no sentido de encontrar o candidato mais adequado. Pelo lado dos candidatos urge uma maior consciencialização da repercussão que a atividade desenvolvida em linha pode ter em termos profissionais. Os efeitos na sua " imagem digital " são similares aos de uma tatuagem, deixa marcas dificilmente removíveis.
A formação em Ciência da Informação (CI) caracteriza-se pela diversidade de modelos com repercuss... more A formação em Ciência da Informação (CI) caracteriza-se pela diversidade de modelos com repercussão nos respetivos cursos de Mestrado e Doutoramento. Dada a importância destes para a afirmação da área pretende-se fornecer subsídios para uma reflexão sobre a mesma, contextualizando-a na contemporaneidade a partir dos referenciais fornecidos pelos referidos cursos em Portugal e no Brasil. Objetivou-se: i. Identificar nestes dois países, os cursos ativos (2016) certificados pelas respetivas agências; ii. Verificar o enquadramento oficial; iii. Contextualizar a CI nas classificações em uso nas estruturas oficiais educativas. Seguiu-se uma metodologia qualitativa exploratória assente na análise e síntese dos dados obtidos nas fontes oficiais. Identificaram-se, respetivamente, em Portugal e no Brasil: mestrados – 4 e 16 e doutoramentos – 3 e 9. A área, em Portugal, apresenta-se como em passagem das «Ciências Documentais» para uma CI mais abrangente; no Brasil, observa-se um complexo relac...
EnglishThe Web is the privileged place for seeking information. The potential of the so-called se... more EnglishThe Web is the privileged place for seeking information. The potential of the so-called semantic web to enhance retrieval of relevant information seems essential. In Information Science (IS), this idea was developed from the Otlet’s “analogic semantic web”, justifying the connection between the Semantic Web (SW) and the field of IS. We aimed to exam and analyze the presence of subjects related to SW in the output of IS master and PhD courses in Portugal and Brazil (2005-2015). Specifically, we aimed to: identify IS courses, master's dissertations (MD) and PhD thesis (PD) associated to SW; identify the points of confluence between the IS and the SW in these works; characterize the academic profile of these works’ authors and advisors. Based on a qualitative approach, we performed a literature review and an empirical study focused on content analysis of the retrieved works (RCAAP and OASISbr). As results, we have: verified 4 unique records in RCAAP and 40 in OASISbr; identi...
Dissertacao de mestrado em Ciencia da Informacao, apresentado a Faculdade de Letras da Universida... more Dissertacao de mestrado em Ciencia da Informacao, apresentado a Faculdade de Letras da Universidade de Coimbra
Revista Ibero-Americana de Ciência da Informação, 2018
O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação (CI) tem... more O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação (CI) tem aproximado às das técnicas de Deep Learning, sendo relacionadas à representação, descrição e recuperação de imagens na Web, e assim, aferir da mais valia destas pesquisas quando aplicadas aos métodos da área da CI. A partir de uma revisão integrativa de literatura nacional e internacional de modo contextualizado na CI, os documentos recuperados foram analisados conforme os critérios da revisão integrativa, identificando um conjunto de operações que poderiam ser integrados nas metodologias de representação e descrição de imagens desenvolvidas e consolidadas no campo da CI. Conclui-se que ainda há uma lacuna nas pesquisas em CI tanto no âmbito nacional como internacional sobre Deep Learning e que recursos desta nova estrutura de programação podem ser aproximados aos métodos já validados pela área.
A indexacao, humana e automatica, foi desde sempre uma preocupacao da area da ciencia da informac... more A indexacao, humana e automatica, foi desde sempre uma preocupacao da area da ciencia da informacao (CI). A falta de consistencia na indexacao humana e de semântica na automatica sao apontadas como as grandes desvantagens. Uma possibilidade de dotar sistemas computacionais com maior capacidade de inferencia reside na utilizacao de ontologias. Desta proposicao objetiva-se identificar e analisar os estudos na area da CI que abordem as contribuicoes das antologias na indexacao automatica. Pretende-se (i) identificar os trabalhos cientificos, nas bases Library & Information Science Source e Library, Information Science & Technology Abstracts que abordem este assunto, a sua distribuicao temporal e geografica; (ii) identificar e descrever a centralidade da abordagem tematica aos dois conceitos (indexacao automatica e ontologias), e a abordagem metodologica dos respetivos artigos; (iii) identificar as contribuicoes presentes nos artigos que constituem o corpus relativamente as potencialida...
Purpose The purpose of this paper is to discuss the literature on concept theory in library and i... more Purpose The purpose of this paper is to discuss the literature on concept theory in library and information science (LIS) from an epistemological perspective, ascribing each paper to an epistemological family and discussing their relevance in the context of the knowledge organization (KO) domain. Design/methodology/approach This paper adopts a hermeneutic approach for the analysis of the texts that compose the corpus of study following contingency and categorical analyses. More specifically, the paper works with Bardin’s contingency analysis and follows Hjørland’s families of epistemologies for the categorization. Findings The analysis corroborates the observations made for the last ten years about the scarcity of studies on concept theory in LIS and KO. However, the study also reveals an epistemological turn on concept theory since 2009 that could be considered a departure from the rationalist views that dominated the field and a continuation of a broader paradigm shift in LIS and ...
Journal of the Association for Information Science and Technology
The web has been, in the last decades, the place where information retrieval achieved its maximum... more The web has been, in the last decades, the place where information retrieval achieved its maximum importance, given its ubiquity and the sheer volume of information. However, its exponential growth made the retrieval task increasingly hard, relying in its effectiveness on idiosyncratic and somewhat biased ranking algorithms. To deal with this problem, a “new” web, called the Semantic Web (SW), was proposed, bringing along concepts like “Web of Data” and “Linked Data,” although the definitions and connections among these concepts are often unclear. Based on a qualitative approach built over a literature review, a definition of SW is presented, discussing the related concepts sometimes used as synonyms. It concludes that the SW is a comprehensive and ambitious construct that includes the great purpose of making the web a global database. It also follows the specifications developed and/or associated with its operationalization and the necessary procedures for the connection of data in an open format on the web. The goals of this comprehensive SW are the union of two outcomes still tenuously connected: the virtually unlimited possibility of connections between data—the web domain—with the potentiality of the automated inference of “intelligent” systems—the semantic component.
AtoZ: novas práticas em informação e conhecimento, 2016
Introdução: Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente ... more Introdução: Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente para a rede, para sites conhecidos como “Redes Sociais”. Nessa replicação, certos modos de comunicar e se representar, inócuos em estado offline, podem ser bastante prejudiciais profissionalmente quando reproduzidos em linha. Assim, o objetivo desta investigação é refletir sobre a importância - em termos profissionais - do perfil que é criado nas, ou pelo uso das, Redes Sociais em Linha (como o Facebook e outros sites similares), considerando a influência da atividade aí desenvolvida na obtenção de uma contratação laboral. Método: Foi realizada uma revisão da literatura, em forma de pesquisa exploratória, incluindo fontes bibliográficas e documentais, entre as quais 16 estudos primários efetuados entre 2008 e 2014, abrangendo a perspetiva de investigadores e recrutadores sobre esta problemática de forma a responder três questões, a saber: a) Os responsáveis pelos recursos humanos e/ou outros com poder de decisão em termos de gestão de funcionários, procuram efetivamente informação em linha sobre potenciais funcionários? b) A informação encontrada tem um papel relevante na decisão desses gestores de recursos humanos? c) Quem procura trabalho deve cuidar da sua “imagem digital” mesmo nas Redes Sociais em Linha não consideradas profissionais? Resultados: A procura de informação nas chamadas “Redes Sociais” sobre os candidatos a ofertas de emprego é efetivamente realizada ao longo de todo o processo de seleção e recrutamento. Essa prática, denominada de cybervetting, também abrange as Redes Sociais em Linha tidas como não profissionais e, atendendo aos estudos analisados, é de esperar um aumento da sua frequência. A informação encontrada nas “Redes Sociais em Linha” é também considerada na avaliação dos candidatos às ofertas de emprego, uma vez que é entendida, por muitos recrutadores, como parte da “identidade digital” do indivíduo em questão. Verifica-se, igualmente, que a influência da informação obtida por essa via tende a não ser favorável aos candidatos. Conclusão: Do ponto de vista dos recrutadores a prática de cybervetting é, frequentemente, encarada como um dever profissional no sentido de encontrar o candidato mais adequado. Pelo lado dos candidatos urge uma maior consciencialização da repercussão que a atividade desenvolvida em linha pode ter em termos profissionais. Os efeitos na sua “imagem digital” são similares aos de uma tatuagem, deixa marcas dificilmente removíveis.
Wikipedia, as "social machine", is a privileged place to observe the collective constru... more Wikipedia, as "social machine", is a privileged place to observe the collective construction of concepts without central control. Based on Dahlberg's theory of concept, and anchored in the pragmatism of Hjørland - in which the concepts are socially negotiated meanings - the evolution of the concept of Semantic Web (SW) was analyzed in the English version of Wikipedia. An exploratory, descriptive and qualitative study was designed and we identified 26 different definitions (between 7-12-2001 and 12/31/2017) of which 8 are of particular relevance for their duration, with the latter being the two recorded at the end of the analyzed period. According to them, SW: "is a extension of the web"and "is a Web of Data"; the latter, used as a complementary definition, links to Berners-Lee's publications. In Wikipedia, the evolution of the SW concept appears to be based on the search for the use of non-technical vocabulary and the control of authority...
Wikipedia, as a "social machine", is a privileged place to observe the collective construction of... more Wikipedia, as a "social machine", is a privileged place to observe the collective construction of concepts without central control. Based on Dahlberg's theory of concept, and anchored in the pragmatism of Hjørland-in which the concepts are socially negotiated meanings-the evolution of the concept of semantic web (SW) was analyzed in the English version of Wikipedia. An exploratory, descriptive, and qualitative study was designed and we identified 26 different definitions (between 12 July 2001 and 31 December 2017), of which eight are of particular relevance for their duration, with the latter being the two recorded at the end of the analyzed period. According to them, SW: "is an extension of the web" and "is a Web of Data"; the latter, used as a complementary definition, links to Berners-Lee's publications. In Wikipedia, the evolution of the SW concept appears to be based on the search for the use of non-technical vocabulary and the control of authority carried out by the debate. As a space for collective bargaining of meanings, the Wikipedia study may bring relevant contributions to a community's understanding of a particular concept and how it evolves over time.
Purpose – The purpose of this paper is to discuss the literature on concept theory in Library and... more Purpose – The purpose of this paper is to discuss the literature on concept theory in Library and Information Science from an epistemological perspective, ascribing each paper to an epistemological family and discussing their relevance in the context of the knowledge organization domain. Design/methodology/approach – This paper adopts a hermeneutic approach for the analysis of the texts that compose the corpus of study following contingency and categorical analyses. More specifically, the paper works with Bardin’s contingency analysis and follows Hjørland’s families of epistemologies for the categorization. Findings – The analysis corroborates the observations made for the last ten years about the scarcity of studies on concept theory in Library and Information Science and Knowledge Organization. However, the study also reveals an epistemological turn on concept theory since 2009 that could be considered a departure from the rationalist views that dominated the field and a continuation of a broader paradigm shift in LIS and KO. All analyzed papers except two follow pragmatist or historicist approaches. Originality/value – This paper follows-up and systematize the contributions to the Library and Information Science and Knowledge Organization fields on concept theory mainly during the last decade. The epistemological analysis reveals the dominant views in this paradigm shift and the main authors and trends that are present in the Library and Information Science literature on concept theory.
JOURNAL OF THE ASSOCIATION FOR INFORMATION SCIENCE AND TECHNOLOGY, 2019
The web has been, in the last decades, the place whereinformation retrieval achieved its maximum ... more The web has been, in the last decades, the place whereinformation retrieval achieved its maximum importance,given its ubiquity and the sheer volume of information.However, its exponential growth made the retrieval taskincreasingly hard, relying in its effectiveness on idio-syncratic and somewhat biased ranking algorithms. Todeal with this problem, a“new”web, called the Seman-tic Web (SW), was proposed, bringing along conceptslike“Web of Data”and“Linked Data,”although the defi-nitions and connections among these concepts areoften unclear. Based on a qualitative approach builtover a literature review, a definition of SW is presented,discussing the related concepts sometimes used assynonyms. It concludes that the SW is a comprehensiveand ambitious construct that includes the great purposeof making the web a global database. It also follows thespecifications developed and/or associated with its oper-ationalization and the necessary procedures for the con-nection of data in an open format on the web. The goalsof this comprehensive SW are the union of two out-comes still tenuously connected: the virtually unlimitedpossibility of connections between data—the webdomain—with the potentiality of the automated inferenceof“intelligent”systems—the semantic component.
Resumo: O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação ... more Resumo: O objetivo deste estudo é investigar em que medida as pesquisas na Ciência da Informação (CI) tem aproximado às das técnicas de Deep Learning, sendo relacionadas à representação, descrição e recuperação de imagens na Web, e assim, aferir da mais valia destas pesquisas quando aplicadas aos métodos da área da CI. A partir de uma revisão integrativa de literatura nacional e internacional de modo contextualizado na CI, os documentos recuperados foram analisados conforme os critérios da revisão integrativa, identificando um conjunto de operações que poderiam ser integrados nas metodologias de representação e descrição de imagens desenvolvidas e consolidadas no campo da CI. Conclui-se que ainda há uma lacuna nas pesquisas em CI tanto no âmbito nacional como internacional sobre Deep Learning e que recursos desta nova estrutura de programação podem ser aproximados aos métodos já validados pela área. Palavras-chave: deep learning; indexação de imagens; machine learning; recuperação de imagens na web. Automatic indexing of web images: trends and challenges in deep learning context Abstract: The objective of this study is to investigate the extent to which research in Information Science (IS) has approximated those techniques of the Deep Learning, being related to representation, description and retrieval of images on the Web, and thus, to assess the value of these researches when applied to IS methods. From an integrative review of national and international literature contextualized in the IS, the recovered documents were analyzed according to the criteria of the integrative review, identifying a set of operations that could be attached in the methodologies of representation and description of images developed and consolidated in the field of IS. It is concluded that there is still a gap in research of IS area both at national and international level on Deep Learning and that resources of this new programming structure can be approximated to the methods already validated by the area. Keywords: deep learning; image retrieval on the web; indexing of images; machine learning. Indexación automática de imágenes en la web: tendencias y desafíos en el contexto deep learning
RESUMO A Web é o local privilegiado para procurar informação. As potencialidades de uma web semân... more RESUMO A Web é o local privilegiado para procurar informação. As potencialidades de uma web semântica para recuperar informação afiguram-se essenciais. Na Ciência da Informação (CI), esta ideia surge com Otlet ao desenvolver uma " web semântica analógica " , justificando a ligação entre: Web Semântica (WS) e CI. Procura-se verificar e refletir sobre a presença da WS no output dos cursos de mestrado/doutoramento em CI, Portugal e Brasil (2005-2015). Para tanto: identificam-se os cursos, dissertações de mestrado (DM) e teses de doutoramento (TD) em CI associados à WS; identificam-se pontos de confluência entre as duas áreas nestes trabalhos; caraterizam-se o perfil académico dos autores e orientadores dos mesmos. Partiu-se do paradigma qualitativo: revisão bibliográfica e estudo empírico, centrado na análise de conteúdo dos trabalhos recuperados (RCAAP e OASISbr). Verificou-se 4 registos únicos no RCAAP; 40 no OASISbr. Identificaram-se 4 cursos de mestrado e 3 de doutoramento (Portugal), e 16 de mestrado e 9 de doutoramento (Brasil). Recuperaram-se 0 DM/TD (Portugal) e 16 DM, 5 TD (Brasil). Identificaram-se 3 pontos de confluência: a) contribuição mútua (62%), b) WS enquanto tema interdisciplinar (29%) e c) complementaridade de conhecimentos (9%). Contabilizaram-se 11 trabalhos (52%) onde os investigadores responsáveis apresentam, no conjunto, formação nas áreas CI/Informática. O estudo aponta para a WS como um campo de investigação da CI, embora essencialmente teórico, sendo o trabalho prático interdisciplinar, CI/Informática, incipiente e pouco representativo. ABSTRACT The Web is the privileged place for seeking information. The potential of the so-called semantic web to enhance retrieval of relevant information seems essential. In Information Science (IS), this idea was developed from the Otlet's " analogic semantic web " , justifying the connection between the Semantic Web (SW) and the field of IS. We aimed to exam and analyze the presence of subjects related to SW in the output of IS master and PhD courses in Portugal and Brazil (2005-2015). Specifically, we aimed to: identify IS courses, master's dissertations (MD) and PhD thesis (PD) associated to SW; identify the points of confluence between the IS and the SW in these works; characterize the academic profile of these works' authors and advisors. Based on a qualitative approach, we performed a literature review and an empirical study focused on content analysis of the retrieved works (RCAAP and OASISbr). As results, we have: verified 4 unique records in RCAAP and 40 in OASISbr; identified 4 Master's and 3 PhD courses (Portugal) and 16 masters and 9 PhD courses (Brazil); retrieved no MD/PD in Portugal, 16 MD and 5 PD in Brazil; identified 3 confluence points: a) mutual contribution (62%), b) WS as an interdisciplinary theme (29%) and c) complementary knowledge (9%); identified 11 works (52%) were the respective researchers have training in IS and Computer Science (CS). The study points to the WS as a field of investigation in IS, although essentially theoretical, insofar as practical interdisciplinary works in CI/CS are incipient and not representative.
A indexação, humana e automática, foi desde sempre uma preocupação da área da ciência da informaç... more A indexação, humana e automática, foi desde sempre uma preocupação da área da ciência da informação (CI). A falta de consistência na indexação humana e de semântica na automática são apontadas como as grandes desvantagens. Uma possibilidade de dotar sistemas computacionais com maior capacidade de inferência reside na utilização de ontologias. Desta proposição objetiva-se identificar e analisar os estudos na área da CI que abordem as contribuições das antologias na indexação automática. Pretende-se (i) identificar os trabalhos científicos, nas bases Library & Information Science Source e Library, Information Science & Technology Abstracts que abordem este assunto, a sua distribuição temporal e geográfica; (ii) identificar e descrever a centralidade da abordagem temática aos dois conceitos (indexação automática e ontologias), e a abordagem metodológica dos respetivos artigos; (iii) identificar as contribuições presentes nos artigos que constituem o corpus relativamente às potencialidades da utilização conjunta dos dois conceitos. Partiu-se de um estudo exploratório assente numa revisão sistemática da literatura. Os resultados apontam como contribuições das ontologias na indexação automática: (i) desambiguar termos homógrafos e polissémicos; (ii) maior capacidade de integração de relações semânticas de forma automatizada; (iii) uma navegação e expansão de consultas através de relações semânticas; (iv) uma recuperação mais precisa e exaustiva da informação. Conclui-se que o desenvolvimento de sistemas que utilizam o potencial das ontologias na indexação automática procura contornar a sua falta de capacidade semântica. Apesar dos resultados promissores nesta matéria, infere-se que é ainda prematuro e inadequado falar de uma indexação semântica efetiva.
A influência da informação publicada nas " redes sociais " no processo de seleção e recrutamento:... more A influência da informação publicada nas " redes sociais " no processo de seleção e recrutamento: um estudo exploratório na literatura The influence of the information published in " social networks " in the process of selection and recruitment: an exploratory study in the literature
Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente para a rede,... more Numa sociedade cada vez mais online a relação entre pessoas alastrou-se naturalmente para a rede, para sites conhecidos como " Redes Sociais ". Nessa replicação, certos modos de comunicar e se representar, inócuos em estado offline, podem ser bastante prejudiciais quando reproduzidos em linha. Exemplos vão aparecendo nas notícias quando funcionários são despedidos devido a comentários efetuados em sites como o Facebook. No intuito de refletir sobre a influência da atividade desenvolvida em linha, no Facebook e noutros sites similares, na obtenção de uma contratação laboral, foi realizada uma revisão da literatura, que incluiu 12 estudos efetuados entre 2008 e 2014, abrangendo a perspetiva de investigadores e recrutadores sobre esta problemática. Desse trabalho concluiu-se que a verificação dos perfis de utilizador, nas chamadas " Redes Sociais " , é efetuada ao longo do processo de seleção e recrutamento dos candidatos a ofertas de emprego. Nalguns casos essa verificação é aconselhada e incentivada como fator competitivo entre empresas de recursos humanos. A informação obtida por essa via tem influência, aparentemente de forma mais negativa que positiva, na decisão dos profissionais responsáveis pela contratação de colaboradores. Do ponto de vista desses profissionais essa verificação é, frequentemente, encarada como um dever profissional no sentido de encontrar o candidato mais adequado. Pelo lado dos candidatos urge uma maior consciencialização da repercussão que a atividade desenvolvida em linha pode ter em termos profissionais. Os efeitos na sua " imagem digital " são similares aos de uma tatuagem, deixa marcas dificilmente removíveis.
A Web é o local privilegiado para procurar informação. As potencialidades de uma web semântica pa... more A Web é o local privilegiado para procurar informação. As potencialidades de uma web semântica para recuperar informação afiguram-se essenciais. Na Ciência da Informação (CI), esta ideia surge com Otlet ao desenvolver uma “web semântica analógica”, justificando a ligação entre: Web Semântica (WS) e CI. Procura-se verificar e refletir sobre a presença da WS no output dos cursos de mestrado/doutoramento em CI, Portugal e Brasil (2005-2015). Para tanto: identificam-se os cursos, dissertações de mestrado (DM) e teses de doutoramento (TD) em CI associados à WS; identificam-se pontos de confluência entre as duas áreas nestes trabalhos; caraterizam-se o perfil académico dos autores e orientadores dos mesmos. Partiu-se do paradigma qualitativo: revisão bibliográfica e estudo empírico, centrado na análise de conteúdo dos trabalhos recuperados (RCAAP e OASISbr). Verificou-se 4 registos únicos no RCAAP; 40 no OASISbr. Identificaram-se 4 cursos de mestrado e 3 de doutoramento (Portugal), e 16 de mestrado e 9 de doutoramento (Brasil). Recuperaram-se 0 DM/TD (Portugal) e 16 DM, 5 TD (Brasil). Identificaram-se 3 pontos de confluência: a) contribuição mútua (62%), b) WS enquanto tema interdisciplinar (29%) e c) complementaridade de conhecimentos (9%). Contabilizaram-se 11 trabalhos (52%) onde os investigadores responsáveis apresentam, no conjunto, formação nas áreas CI/Informática. O estudo aponta para a WS como um campo de investigação da CI, embora essencialmente teórico, sendo o trabalho prático interdisciplinar, CI/Informática, incipiente e pouco representativo.
Introdução: A Web é o local privilegiado da procura de informação. As potencialidades de uma web ... more Introdução: A Web é o local privilegiado da procura de informação. As potencialidades de uma web semântica para recuperar informação eficazmente afigura-se essencial. No âmbito da Ciência da Informação (CI), esta ideia surge com Otlet ao desenvolver uma “web semântica analógica”, justificação para a ligação entre a Web Semântica (WS) e as fundações teóricas da CI. Objetivos: Apresenta-se como objetivo geral, verificar e refletir sobre a presença da WS no output dos cursos de mestrado/doutoramento em CI, Portugal e Brasil (2005/2015); objetivos específicos, identificar: i) cursos em funcionamento no ano (2014/2015); ii) número de dissertações de mestrado (DM) e teses de doutoramento (TD) em CI associado à WS (2005/2015); iii) pontos de confluência entre a CI e a WS nestes trabalhos; e iv) caraterizar o perfil académico dos orientadores dos mesmos. Metodologia: Partiu-se de uma metodologia qualitativa: revisão bibliográfica (contextualização teórica dos objetos de estudo: WS e CI) e estudo de caso, centrado na análise de conteúdo dos trabalhos recuperados (RCAAP e OASISbr). Resultados: Identificaram-se 4 cursos de mestrado e 3 de doutoramento em Portugal e, no Brasil, 16 de mestrado e 9 de doutoramento; recuperaram-se 0 DM/TD (Portugal) e 17 DM, 5 TD (Brasil); pontos de confluência identificados: contribuição mútua (62%), WS enquanto tema interdisciplinar (29%) e complementaridade de conhecimentos (9%); dos 20 orientadores: 2 (10%) apresentam formação só em CI, 12 (60%) em CI e outras áreas e 6 (30%) só em outras áreas. Conclusões: o estudo não reflete o carácter interdisciplinar da WS enquanto trabalho conjunto da CI/Informática. Reforça a ideia que a WS se configura como um campo de direito próprio da CI. A WS é um constructo que incluiu a Web of Data e a Web of Linked Data; a CI define-se como o estudo da mediação dos fenómenos: dado, informação, conhecimento e respetiva implementação no domínio cultural, definição que não é consensual, especialistas da área apresentam outras conceções baseadas nas relações disciplinares desta, particularmente com a Informática no que respeita à organização do conhecimento.
Organização e representação do conhecimento em múltiplas abordagens, 2022
In the context of Knowledge Organization (KO) the ontological focus is sometimes overlooked in st... more In the context of Knowledge Organization (KO) the ontological focus is sometimes overlooked in studies related to the nature of the concept. This study presents an analysis with this purpose, questioning possible modes of existence of concepts (such as mental representations, cognitive abilities or abstract objects), framed in four different readings: a linguistic one, the psychological one, the epistemological one, and the ontological one; and focuses on the two first ones. The suitability of using the concept as an elementary unit of Knowledge Organization Systems (KOS) is analyzed according to the different perspectives. From a mental entity, passing to another one that exists in a non-mental realm, although also non-physical, moving on to another one with an objective linguistic existence.
Uploads
Papers by Luis M O Machado
passing to another one that exists in a non-mental realm, although also non-physical, moving on to another one with an objective linguistic existence.