Assessing rules with interestingness measures is the cornerstone of successful applications of as... more Assessing rules with interestingness measures is the cornerstone of successful applications of association rule discovery. However, as numerous measures may be found in the literature, choosing the measures to be applied for a given application is a difficult task. In this chapter, we present a novel and useful classification of interestingness measures according to three criteria: the subject, the scope, and the nature of the measure. These criteria seem to us essential to grasp the meaning of the measures, and therefore to help the user to choose the ones (s)he wants to apply. Moreover, the classification allows one to compare the rules to closely related concepts such as similarities, implications, and equivalences. Finally, the classification shows that some interesting combinations of the criteria are not satisfied by any index.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this p... more The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication does not imply, even in the absence of a specific statement, that such names are exempt from the relevant protective laws and regulations and therefore free for general use. While the advice and information in this book are believed to be true and accurate at the date of publication, neither the authors nor the editors nor the publisher can accept any legal responsibility for any errors or omissions that may be made. The publisher makes no warranty, express or implied, with respect to the material contained herein.
Dossier - Flous de Mémoire ISSN 1954-1872Article de vulgarisation scientifique pour Têtes Cherche... more Dossier - Flous de Mémoire ISSN 1954-1872Article de vulgarisation scientifique pour Têtes Chercheuses, Actualité et culture des sciences en Pays de la Loire, numéro
nantes.fr Résumé. Le web peut être considéré comme une grande base de connaissances. La recherche... more nantes.fr Résumé. Le web peut être considéré comme une grande base de connaissances. La recherche des informations pertinentes sur la toile est rendue de plus en plus difficile, voire impossible avec l'accroissement de la volumétrie des pages disponibles. Le problème réside dans le fait que les outils existants ne peuvent pas s'appuyer actuellement sur une description du contenu des documents. Le web sémantique utilise différents langages pour mieux exploiter et traiter les contenus des ressources web. Dans le but de passer de UML vers OWL, il est intéressant d'étudier la possibilité de transformer chacun des concepts du diagramme de classe UML en OWL.
Olfactometry is a valuable methodology commonly used to investigate odorant active compounds in f... more Olfactometry is a valuable methodology commonly used to investigate odorant active compounds in food aroma profiles. Considering the number of studies using this technique, little is done to improve olfactometric data acquisition, although it is essential for quality outcomes. Efforts were mainly done to automate recording of moment and duration of perceptions but their intensity and description are still often communicate orally, which disrupt judge’s breathing rhythm during analysis. Solutions that integrate intensity and description parameters recording, result in a multiple steps acquisition procedure, scarcely compatible with the transience of the perceptions evaluated during olfactometry experiment. This work aims to present an olfactometry dedicated software developed to simplify the user task, overcoming constraints and bias of existing systems, and associating data treatment capabilities. More specifically the WheelOscent software, coded with Java technologies, implements innovative components: - a data acquisition interface based on adaptable aroma wheels, which permits judges to characterize all parameters related to odors perceived, in a single and intuitive move (patented sensory system), - a data store, which stores collected data into adapted representation describing aroma wheels, experiments, products, judges, and aromagrams, - a data analysis interface, providing a direct and interactive visualization of data resulting from several processing such as data aggregation over judges. The WheelOstat module also provides a straight statistical comparison of aroma profiles. Assessment of the software was performed on food products with complex aroma such as wines or coffee. Providing a good usability for judges, it enables a precise aromatic characterization. Moreover, the statistical comparison module allows to point out singular features of products. Finally, judges take advantage of this wheel aroma presentation, already used for sensory characterization. This consistent presentation for olfactometric and sensory analysis facilitate approaches that attempt to determine contribution of compounds to an overall aroma and apprehend existing interactions.
Advances in Intelligent Systems and Computing, 2016
The objective interestingness measures play an important role in data mining because they are use... more The objective interestingness measures play an important role in data mining because they are used for mining, filtering and ranking the patterns. However, there is no research that collects the measures fully as well as there is no tool that can: automatically calculate the interestingness values of the patterns by using those measures, and is the framework for rapidly developing the applications related to objective interestingness measures. This paper describes Interestingnesslab - a tool of the objective interestingness measures is developed in the R language. The main functions of the tool are: mining a set of association rules and presenting them by the cardinalities (\(n,n_{X},n_{Y},n_{X\overline{Y}}\)), calculating the interestingness value of an association rule according to 1 of 109 collected measures; calculating the interestingness values of the whole rule set in many measures selected by the user; discovering the tendencies in a data set and recommending the top N items to the user; and studying the specific behavior of a set of interestingness measures in the context of a specific dataset and in an exploratory data analysis perspective. With Interestingnesslab, the user can easily and quickly reuse its functions to develop his/her own applications.
Stabilité en A.S.I. de l'intensité d'implication et comparaisons avec d'autres indices de qualité... more Stabilité en A.S.I. de l'intensité d'implication et comparaisons avec d'autres indices de qualité de règles d'association
Les methodes actuelles de la maitrise de qualite de processus industriels s'appuient essentie... more Les methodes actuelles de la maitrise de qualite de processus industriels s'appuient essentiellement sur l'etude de leurs caracteristiques physiques. Elles permettent soit d'analyser le processus apres modelisation de son fonctionnement, soit de le surveiller en observant des points de mesures representatifs de la qualite de son fonctionnement. Or, les processus industriels ne sont pas des systemes isoles: chacun d'eux est commande par un operateur qui doit assurer la viabilite des resultats obtenus, sous respect des contraintes de qualite. Ainsi, il apparait plus realiste de considerer les processus industriels comme etant des associations operateur-machine. Nous proposons donc une extension des methodologies actuelles afin de prendre en compte les connaissances d'un operateur expert et de s'orienter vers un suivi de l'expertise durant le cycle de vie du processus. Un aspect innovant de ce travail est de proposer la formalisation d'un processus non p...
HAL (Le Centre pour la Communication Scientifique Directe), 2017
L’analyse statistique implicative (ASI) est, initialement, une methode d’analyse de donnees non s... more L’analyse statistique implicative (ASI) est, initialement, une methode d’analyse de donnees non symetrique, concue par Regis Gras, il y a pres de quarante ans. A travers theses, articles de revues, livres et colloques, elle presente maintenant un veritable cadre paradigmatique de traitement statistique de la causalite et de la complexite. Ce cadre est developpe encore par son premier auteur, mais aussi par des doctorants et avec la collaboration d’equipes de recherche universitaires francaises et etrangeres. Puisant ses origines epistemologiques en didactique des mathematiques, son point de depart est l’evaluation scolaire et, en particulier, une interrogation sur la complexite ressentie au cours de l’apprentissage des mathematiques. A visee predictive, le support de l’ASI est un modele mathematique conduisant a une mesure de qualite des relations implicatives entre deux observations comportementales a et b, du type « si on observe a alors on a aussi tendance a observer b, de maniere statistiquement significative ». Son extension progressive, toujours en reponse a des attentes applicatives, a permis d’extraire, a partir des donnees croisant ensemble de variables et ensemble de sujets, deux structures dynamiques des relations entre les variables en jeu sous forme de graphe et de hierarchie. La nature des variables, initialement binaires, est maintenant elargie a differents types de variables observables, discretes ou continues (numerique, intervalle, flou, vectoriel, rang,…). Une structure originale duale entre les ensembles variables-sujets, qu’ils soient eux aussi discrets ou continus, est etablie. Cet ouvrage represente le 5e memorandum d’etudes portant sur le concept d’Analyse Statistique Implicative. Il elargit, en les enrichissant, les editions precedentes, avec pour objectif de dresser un panorama recent des concepts, modeles, methodes et applications de l’ASI. Afin de faciliter l’acces a son contenu, les 40 chapitres qui le composent sont regroupes, ponctuees par des interludes souvent metaphoriques – pas de cote moins academiques – en 4 parties principales dont la dynamique est la suivante : • Une introduction en 5 temps offre autant de points de vue sur la nature profonde et les motivations originelles de l’ASI ; • La Partie 1 constitue une sorte de cours, comme un manuel, qui etablit, en les regenerant, les elargissant, l’ensemble des concepts qui forment le coeur de l’ASI ; • La Partie 2 aborde des complements et des extensions theoriques de ces concepts en en montrant le caractere stimulant et fecond, tout en s’appuyant sur des exemples ; • La Partie 3 presente une selection d’applications qui illustrent les apports de la demarche developpee par l’ASI dans des domaines varies, a la recherche de pistes causales, par exemple en psychologie du developpement ou en art. Cette nouvelle edition, a laquelle ont contribue plus de 30 auteurs de disciplines diverses, ouvre a d’originales perspectives sur l’art, la psychologie de l’apprentissage, les lois de l’evolution, mais aussi sur les fractals, la logique paracoherente, etc. Elle est prefacee par le Professeur Djamel Zighed.
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific re... more HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Proceedings of the 10th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management, 2018
This paper aims to use term clustering to build a modular ontology according to core ontology fro... more This paper aims to use term clustering to build a modular ontology according to core ontology from domainspecific text. The acquisition of semantic knowledge focuses on noun phrase appearing with the same syntactic roles in relation to a verb or its preposition combination in a sentence. The construction of this cooccurrence matrix from context helps to build feature space of noun phrases, which is then transformed to several encoding representations including feature selection and dimensionality reduction. In addition, the content has also been presented with the construction of word vectors. These representations are clustered respectively with K-Means and Affinity Propagation (AP) methods, which differentiate into the term clustering frameworks. Due to the randomness of K-Means, iteration efforts are adopted to find the optimal parameter. The frameworks are evaluated extensively where AP shows dominant effectiveness for cooccurred terms and NMF encoding technique is salient by its promising facilities in feature compression.
This paper aims to analyze and adopt the term clustering method for building a modular ontology a... more This paper aims to analyze and adopt the term clustering method for building a modular ontology according to its core ontology. The acquisition of semantic knowledge focuses on noun phrase appearing with the same syntactic roles in relation to a verb or its preposition combination in a sentence. The construction of this co-occurrence matrix from context helps to build feature space of noun phrases, which is then transformed to several encoding representations including feature selection and dimensionality reduction. In addition, word embedding techniques are also presented as feature representation. These representations are clustered respectively with K-Means, K-Medoids, Affinity Propagation, DBscan and co-clustering algorithms. The feature representation and clustering methods constitute the major sections of term clustering frameworks. Due to the randomness of clustering approaches, iteration efforts are adopted to find the optimal parameter and provide convinced value for evalua...
Résumé. Le choix de mesures d’intérêt pour la validation des règles d’association constitue un dé... more Résumé. Le choix de mesures d’intérêt pour la validation des règles d’association constitue un défi important dans le contexte de l’évaluation de la qualité en fouille de données. Mais, comme l’intérêt dépend à la fois de la structure des données et des buts de l’utilisateur (décideur, analyste), certaines mesures peuvent s’avérer pertinentes dans un contexte donné, et ne plus l’être dans un autre. Dans cet article, nous proposons un outil original ARQAT afin d’étudier le comportement spécifique de 34 mesures d’intérêt dans le contexte d’un jeu de règles, selon une approche résolument exploratoire mettant en avant l’interactivité et les représentations graphiques.
Assessing rules with interestingness measures is the cornerstone of successful applications of as... more Assessing rules with interestingness measures is the cornerstone of successful applications of association rule discovery. However, as numerous measures may be found in the literature, choosing the measures to be applied for a given application is a difficult task. In this chapter, we present a novel and useful classification of interestingness measures according to three criteria: the subject, the scope, and the nature of the measure. These criteria seem to us essential to grasp the meaning of the measures, and therefore to help the user to choose the ones (s)he wants to apply. Moreover, the classification allows one to compare the rules to closely related concepts such as similarities, implications, and equivalences. Finally, the classification shows that some interesting combinations of the criteria are not satisfied by any index.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this p... more The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication does not imply, even in the absence of a specific statement, that such names are exempt from the relevant protective laws and regulations and therefore free for general use. While the advice and information in this book are believed to be true and accurate at the date of publication, neither the authors nor the editors nor the publisher can accept any legal responsibility for any errors or omissions that may be made. The publisher makes no warranty, express or implied, with respect to the material contained herein.
Dossier - Flous de Mémoire ISSN 1954-1872Article de vulgarisation scientifique pour Têtes Cherche... more Dossier - Flous de Mémoire ISSN 1954-1872Article de vulgarisation scientifique pour Têtes Chercheuses, Actualité et culture des sciences en Pays de la Loire, numéro
nantes.fr Résumé. Le web peut être considéré comme une grande base de connaissances. La recherche... more nantes.fr Résumé. Le web peut être considéré comme une grande base de connaissances. La recherche des informations pertinentes sur la toile est rendue de plus en plus difficile, voire impossible avec l'accroissement de la volumétrie des pages disponibles. Le problème réside dans le fait que les outils existants ne peuvent pas s'appuyer actuellement sur une description du contenu des documents. Le web sémantique utilise différents langages pour mieux exploiter et traiter les contenus des ressources web. Dans le but de passer de UML vers OWL, il est intéressant d'étudier la possibilité de transformer chacun des concepts du diagramme de classe UML en OWL.
Olfactometry is a valuable methodology commonly used to investigate odorant active compounds in f... more Olfactometry is a valuable methodology commonly used to investigate odorant active compounds in food aroma profiles. Considering the number of studies using this technique, little is done to improve olfactometric data acquisition, although it is essential for quality outcomes. Efforts were mainly done to automate recording of moment and duration of perceptions but their intensity and description are still often communicate orally, which disrupt judge’s breathing rhythm during analysis. Solutions that integrate intensity and description parameters recording, result in a multiple steps acquisition procedure, scarcely compatible with the transience of the perceptions evaluated during olfactometry experiment. This work aims to present an olfactometry dedicated software developed to simplify the user task, overcoming constraints and bias of existing systems, and associating data treatment capabilities. More specifically the WheelOscent software, coded with Java technologies, implements innovative components: - a data acquisition interface based on adaptable aroma wheels, which permits judges to characterize all parameters related to odors perceived, in a single and intuitive move (patented sensory system), - a data store, which stores collected data into adapted representation describing aroma wheels, experiments, products, judges, and aromagrams, - a data analysis interface, providing a direct and interactive visualization of data resulting from several processing such as data aggregation over judges. The WheelOstat module also provides a straight statistical comparison of aroma profiles. Assessment of the software was performed on food products with complex aroma such as wines or coffee. Providing a good usability for judges, it enables a precise aromatic characterization. Moreover, the statistical comparison module allows to point out singular features of products. Finally, judges take advantage of this wheel aroma presentation, already used for sensory characterization. This consistent presentation for olfactometric and sensory analysis facilitate approaches that attempt to determine contribution of compounds to an overall aroma and apprehend existing interactions.
Advances in Intelligent Systems and Computing, 2016
The objective interestingness measures play an important role in data mining because they are use... more The objective interestingness measures play an important role in data mining because they are used for mining, filtering and ranking the patterns. However, there is no research that collects the measures fully as well as there is no tool that can: automatically calculate the interestingness values of the patterns by using those measures, and is the framework for rapidly developing the applications related to objective interestingness measures. This paper describes Interestingnesslab - a tool of the objective interestingness measures is developed in the R language. The main functions of the tool are: mining a set of association rules and presenting them by the cardinalities (\(n,n_{X},n_{Y},n_{X\overline{Y}}\)), calculating the interestingness value of an association rule according to 1 of 109 collected measures; calculating the interestingness values of the whole rule set in many measures selected by the user; discovering the tendencies in a data set and recommending the top N items to the user; and studying the specific behavior of a set of interestingness measures in the context of a specific dataset and in an exploratory data analysis perspective. With Interestingnesslab, the user can easily and quickly reuse its functions to develop his/her own applications.
Stabilité en A.S.I. de l'intensité d'implication et comparaisons avec d'autres indices de qualité... more Stabilité en A.S.I. de l'intensité d'implication et comparaisons avec d'autres indices de qualité de règles d'association
Les methodes actuelles de la maitrise de qualite de processus industriels s'appuient essentie... more Les methodes actuelles de la maitrise de qualite de processus industriels s'appuient essentiellement sur l'etude de leurs caracteristiques physiques. Elles permettent soit d'analyser le processus apres modelisation de son fonctionnement, soit de le surveiller en observant des points de mesures representatifs de la qualite de son fonctionnement. Or, les processus industriels ne sont pas des systemes isoles: chacun d'eux est commande par un operateur qui doit assurer la viabilite des resultats obtenus, sous respect des contraintes de qualite. Ainsi, il apparait plus realiste de considerer les processus industriels comme etant des associations operateur-machine. Nous proposons donc une extension des methodologies actuelles afin de prendre en compte les connaissances d'un operateur expert et de s'orienter vers un suivi de l'expertise durant le cycle de vie du processus. Un aspect innovant de ce travail est de proposer la formalisation d'un processus non p...
HAL (Le Centre pour la Communication Scientifique Directe), 2017
L’analyse statistique implicative (ASI) est, initialement, une methode d’analyse de donnees non s... more L’analyse statistique implicative (ASI) est, initialement, une methode d’analyse de donnees non symetrique, concue par Regis Gras, il y a pres de quarante ans. A travers theses, articles de revues, livres et colloques, elle presente maintenant un veritable cadre paradigmatique de traitement statistique de la causalite et de la complexite. Ce cadre est developpe encore par son premier auteur, mais aussi par des doctorants et avec la collaboration d’equipes de recherche universitaires francaises et etrangeres. Puisant ses origines epistemologiques en didactique des mathematiques, son point de depart est l’evaluation scolaire et, en particulier, une interrogation sur la complexite ressentie au cours de l’apprentissage des mathematiques. A visee predictive, le support de l’ASI est un modele mathematique conduisant a une mesure de qualite des relations implicatives entre deux observations comportementales a et b, du type « si on observe a alors on a aussi tendance a observer b, de maniere statistiquement significative ». Son extension progressive, toujours en reponse a des attentes applicatives, a permis d’extraire, a partir des donnees croisant ensemble de variables et ensemble de sujets, deux structures dynamiques des relations entre les variables en jeu sous forme de graphe et de hierarchie. La nature des variables, initialement binaires, est maintenant elargie a differents types de variables observables, discretes ou continues (numerique, intervalle, flou, vectoriel, rang,…). Une structure originale duale entre les ensembles variables-sujets, qu’ils soient eux aussi discrets ou continus, est etablie. Cet ouvrage represente le 5e memorandum d’etudes portant sur le concept d’Analyse Statistique Implicative. Il elargit, en les enrichissant, les editions precedentes, avec pour objectif de dresser un panorama recent des concepts, modeles, methodes et applications de l’ASI. Afin de faciliter l’acces a son contenu, les 40 chapitres qui le composent sont regroupes, ponctuees par des interludes souvent metaphoriques – pas de cote moins academiques – en 4 parties principales dont la dynamique est la suivante : • Une introduction en 5 temps offre autant de points de vue sur la nature profonde et les motivations originelles de l’ASI ; • La Partie 1 constitue une sorte de cours, comme un manuel, qui etablit, en les regenerant, les elargissant, l’ensemble des concepts qui forment le coeur de l’ASI ; • La Partie 2 aborde des complements et des extensions theoriques de ces concepts en en montrant le caractere stimulant et fecond, tout en s’appuyant sur des exemples ; • La Partie 3 presente une selection d’applications qui illustrent les apports de la demarche developpee par l’ASI dans des domaines varies, a la recherche de pistes causales, par exemple en psychologie du developpement ou en art. Cette nouvelle edition, a laquelle ont contribue plus de 30 auteurs de disciplines diverses, ouvre a d’originales perspectives sur l’art, la psychologie de l’apprentissage, les lois de l’evolution, mais aussi sur les fractals, la logique paracoherente, etc. Elle est prefacee par le Professeur Djamel Zighed.
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific re... more HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d'enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.
Proceedings of the 10th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management, 2018
This paper aims to use term clustering to build a modular ontology according to core ontology fro... more This paper aims to use term clustering to build a modular ontology according to core ontology from domainspecific text. The acquisition of semantic knowledge focuses on noun phrase appearing with the same syntactic roles in relation to a verb or its preposition combination in a sentence. The construction of this cooccurrence matrix from context helps to build feature space of noun phrases, which is then transformed to several encoding representations including feature selection and dimensionality reduction. In addition, the content has also been presented with the construction of word vectors. These representations are clustered respectively with K-Means and Affinity Propagation (AP) methods, which differentiate into the term clustering frameworks. Due to the randomness of K-Means, iteration efforts are adopted to find the optimal parameter. The frameworks are evaluated extensively where AP shows dominant effectiveness for cooccurred terms and NMF encoding technique is salient by its promising facilities in feature compression.
This paper aims to analyze and adopt the term clustering method for building a modular ontology a... more This paper aims to analyze and adopt the term clustering method for building a modular ontology according to its core ontology. The acquisition of semantic knowledge focuses on noun phrase appearing with the same syntactic roles in relation to a verb or its preposition combination in a sentence. The construction of this co-occurrence matrix from context helps to build feature space of noun phrases, which is then transformed to several encoding representations including feature selection and dimensionality reduction. In addition, word embedding techniques are also presented as feature representation. These representations are clustered respectively with K-Means, K-Medoids, Affinity Propagation, DBscan and co-clustering algorithms. The feature representation and clustering methods constitute the major sections of term clustering frameworks. Due to the randomness of clustering approaches, iteration efforts are adopted to find the optimal parameter and provide convinced value for evalua...
Résumé. Le choix de mesures d’intérêt pour la validation des règles d’association constitue un dé... more Résumé. Le choix de mesures d’intérêt pour la validation des règles d’association constitue un défi important dans le contexte de l’évaluation de la qualité en fouille de données. Mais, comme l’intérêt dépend à la fois de la structure des données et des buts de l’utilisateur (décideur, analyste), certaines mesures peuvent s’avérer pertinentes dans un contexte donné, et ne plus l’être dans un autre. Dans cet article, nous proposons un outil original ARQAT afin d’étudier le comportement spécifique de 34 mesures d’intérêt dans le contexte d’un jeu de règles, selon une approche résolument exploratoire mettant en avant l’interactivité et les représentations graphiques.
Uploads
Papers by Fabrice Guillet