Relation Extraction is an important Information Extraction task and the literature is vast. A num... more Relation Extraction is an important Information Extraction task and the literature is vast. A number of excellent surveys of the field exist. The first one was proposed by Bach and Badaskar (2007), followed by Sharma et al. (2016) who focused on binary and complex relation extraction techniques in the biomedical domain. Recently, Pawar et al. (2017) surveyed advances in supervised and semi-supervised methods while Smirnova and Cudre-Mauroux (2018), Niklaus et al. (2018) and Kumar (2017)delt with distant supervision, Open IE and deep learning methods for RE, respectively. Finally, a very good survey of RE (and IE in general) in a semantic web settings has been proposed by Martinez-Rodriguez et al. (2018). Based on these surveys and relevant literature in the field, this document attempts to review main existing techniques on first-order relation extraction, discussing in particular: . Binary RE, although this was not initially the focus of the project (cf. Chapter 1). As most techniq...
Cette thèse s'inscrit dans le cadre d'un projet interdisciplinaire appelé SemPedia qui a ... more Cette thèse s'inscrit dans le cadre d'un projet interdisciplinaire appelé SemPedia qui a fait l'objet d'un partenariat entre les équipes Melodi et ERSS de l'Institut de Recherche en Informatique de Toulouse (IRIT) et du laboratoire Cognition, Langue, Langage, Ergonomie (CLLE). L'objectif est de mettre en commun des compétences en informatique, linguistique et traitement automatique des langues pour le développement d'outils d'extraction de connaissances à partir de textes visant l'enrichissement du Web des données en français. Le Web des données permet la publication de données structurées pour constituer un réseau de connaissances à l'échelle du Web. Or, les contenus relatifs au français restent très insuffisants par rapport à leurs équivalents en anglais. Ainsi, la ressource DBPedia en français est 20 000 fois plus pauvre que la version anglaise de DBPedia. Ce rapport rend compte des méthodes mises au point dans le cadre du projet SemPedia p...
Modern information systems are changing the idea of "data processing" to the idea of &q... more Modern information systems are changing the idea of "data processing" to the idea of "concept processing", meaning that instead of processing words, such systems process semantic concepts which carry meaning and share contexts with other concepts. Ontology is commonly used as a structure that captures the knowledge about a certain area via providing concepts and relations between them. Traditionally, concept hierarchies have been built manually by knowledge engineers or domain experts. However, the manual construction of a concept hierarchy suffers from several limitations such as its coverage and the enormous costs of its extension and maintenance. Ontology learning, usually referred to the (semi-)automatic support in ontology development, is usually divided into steps, going from concepts identification, passing through hierarchy and non-hierarchy relations detection and, seldom, axiom extraction. It is reasonable to say that among these steps the current front...
Ce document documente succinctement le livrable 4.2.2 : V1 des ontologies des métadonnées des ima... more Ce document documente succinctement le livrable 4.2.2 : V1 des ontologies des métadonnées des images satellite. Ce livrable correspond au fichier SP4-livrable4₂₂ontmodel_v6.owl qui peut être ouvert avec un éditeur d'ontologie ou avec toute application capable d'ouvrir un fichier XML. Cette première version de l'ontologie est en fait un vocabulaire en OWL-DRF qui ne possède pas encore toutes les propriétés d'une ontologie, qui réutilise certains des vocabulaires identifiés dans le livrable 4.2.1 et qui est utilisé pour décrire les méta-données des images fournies dans le livrable 4.3.2
L'équipe Melodi de l'IRIT travaille sur la comprehension automatique du langage humain, pour faci... more L'équipe Melodi de l'IRIT travaille sur la comprehension automatique du langage humain, pour faciliter l'acces aux grandes quantites d'informations disponibles dans les textes, techniques ou grand public, ou bien aider a la communication homme-machine par la creation d'assistant par exemple. En utilisant des techniques d'intelligence artificielle, notamment de l'apprentissage automatique, on peut construire des representations qui permettent de modeliser une partie du sens de phrases ou de textes, pour dire si deux textes sont similaires, parlent des memes themes, ou caracteriser certains de leurs aspects, comme les opinions le sentiment ou le style. L'équipe travaille aussi a representer automatiquement l'organisation d'un texte ou d'une conversation, par exemple pour aider a en faire un resume. Enfin l'analyse de documents (notamment techniques) est utilise pour construire des bases de connaissances structurées dans le cadre d'ap...
A report that summarizes the evaluation of Synop data using the FAIR maturity model proposed by t... more A report that summarizes the evaluation of Synop data using the FAIR maturity model proposed by the RDA (Research Data Alliance). Synop data are french meteorological data produced and published by météo-France, the official weather service in France. We have performed this evaluation in the context of Semantics4FAIR project.
Relation Extraction is an important Information Extraction task and the literature is vast. A num... more Relation Extraction is an important Information Extraction task and the literature is vast. A number of excellent surveys of the field exist. The first one was proposed by Bach and Badaskar (2007), followed by Sharma et al. (2016) who focused on binary and complex relation extraction techniques in the biomedical domain. Recently, Pawar et al. (2017) surveyed advances in supervised and semi-supervised methods while Smirnova and Cudre-Mauroux (2018), Niklaus et al. (2018) and Kumar (2017)delt with distant supervision, Open IE and deep learning methods for RE, respectively. Finally, a very good survey of RE (and IE in general) in a semantic web settings has been proposed by Martinez-Rodriguez et al. (2018). Based on these surveys and relevant literature in the field, this document attempts to review main existing techniques on first-order relation extraction, discussing in particular: . Binary RE, although this was not initially the focus of the project (cf. Chapter 1). As most techniq...
Cette thèse s'inscrit dans le cadre d'un projet interdisciplinaire appelé SemPedia qui a ... more Cette thèse s'inscrit dans le cadre d'un projet interdisciplinaire appelé SemPedia qui a fait l'objet d'un partenariat entre les équipes Melodi et ERSS de l'Institut de Recherche en Informatique de Toulouse (IRIT) et du laboratoire Cognition, Langue, Langage, Ergonomie (CLLE). L'objectif est de mettre en commun des compétences en informatique, linguistique et traitement automatique des langues pour le développement d'outils d'extraction de connaissances à partir de textes visant l'enrichissement du Web des données en français. Le Web des données permet la publication de données structurées pour constituer un réseau de connaissances à l'échelle du Web. Or, les contenus relatifs au français restent très insuffisants par rapport à leurs équivalents en anglais. Ainsi, la ressource DBPedia en français est 20 000 fois plus pauvre que la version anglaise de DBPedia. Ce rapport rend compte des méthodes mises au point dans le cadre du projet SemPedia p...
Modern information systems are changing the idea of "data processing" to the idea of &q... more Modern information systems are changing the idea of "data processing" to the idea of "concept processing", meaning that instead of processing words, such systems process semantic concepts which carry meaning and share contexts with other concepts. Ontology is commonly used as a structure that captures the knowledge about a certain area via providing concepts and relations between them. Traditionally, concept hierarchies have been built manually by knowledge engineers or domain experts. However, the manual construction of a concept hierarchy suffers from several limitations such as its coverage and the enormous costs of its extension and maintenance. Ontology learning, usually referred to the (semi-)automatic support in ontology development, is usually divided into steps, going from concepts identification, passing through hierarchy and non-hierarchy relations detection and, seldom, axiom extraction. It is reasonable to say that among these steps the current front...
Ce document documente succinctement le livrable 4.2.2 : V1 des ontologies des métadonnées des ima... more Ce document documente succinctement le livrable 4.2.2 : V1 des ontologies des métadonnées des images satellite. Ce livrable correspond au fichier SP4-livrable4₂₂ontmodel_v6.owl qui peut être ouvert avec un éditeur d'ontologie ou avec toute application capable d'ouvrir un fichier XML. Cette première version de l'ontologie est en fait un vocabulaire en OWL-DRF qui ne possède pas encore toutes les propriétés d'une ontologie, qui réutilise certains des vocabulaires identifiés dans le livrable 4.2.1 et qui est utilisé pour décrire les méta-données des images fournies dans le livrable 4.3.2
L'équipe Melodi de l'IRIT travaille sur la comprehension automatique du langage humain, pour faci... more L'équipe Melodi de l'IRIT travaille sur la comprehension automatique du langage humain, pour faciliter l'acces aux grandes quantites d'informations disponibles dans les textes, techniques ou grand public, ou bien aider a la communication homme-machine par la creation d'assistant par exemple. En utilisant des techniques d'intelligence artificielle, notamment de l'apprentissage automatique, on peut construire des representations qui permettent de modeliser une partie du sens de phrases ou de textes, pour dire si deux textes sont similaires, parlent des memes themes, ou caracteriser certains de leurs aspects, comme les opinions le sentiment ou le style. L'équipe travaille aussi a representer automatiquement l'organisation d'un texte ou d'une conversation, par exemple pour aider a en faire un resume. Enfin l'analyse de documents (notamment techniques) est utilise pour construire des bases de connaissances structurées dans le cadre d'ap...
A report that summarizes the evaluation of Synop data using the FAIR maturity model proposed by t... more A report that summarizes the evaluation of Synop data using the FAIR maturity model proposed by the RDA (Research Data Alliance). Synop data are french meteorological data produced and published by météo-France, the official weather service in France. We have performed this evaluation in the context of Semantics4FAIR project.
Uploads
Papers by Nathalie Aussenac-Gilles