TXM
TXM est un logiciel de textométrie open-source et gratuit utilisé dans le traitement automatique du langage naturel, l'analyse de données textuelles, l'analyse du discours, l'analyse de contenu, la logométrie, la littérométrie, ou autres fouilles de textes effectuées en linguistique, mais aussi et de plus en plus, en sciences humaines et sociales (par exemple en sociologie[1] et en géographie) et dans les autres disciplines connexes que regroupe le champ des humanités numériques.
Dernière version | 0.8.1 () |
---|---|
Écrit en | Java, Groovy, R, C |
Système d'exploitation | Linux, macOS et Microsoft Windows |
Environnement | Windows, macOS, Linux |
Formats lus | TXT, ODT, DOCX, XML, TEI, TMX, TRS, XLSX, ODS, MP4, MP3 |
Formats écrits | XLSX, ODS, CSV, SVG, PNG, JPEG, BMP, GIF, PDF, XML, TEI |
Langues | français, anglais, russe |
Type | Analyse de texte (d) |
Politique de distribution | gratuit |
Licence | GNU GPL v3 |
Site web | www.textometrie.org |
Ce logiciel peut être installé tant sur un ordinateur personnel que sur un serveur informatique. Il intègre notamment un moteur statistique basé sur le logiciel libre « R »[2] et un moteur de lemmatisation basé sur TreeTagger.
Depuis 2007, le logiciel TXM est co-développé par le laboratoire IHRIM de l'École normale supérieure de Lyon (groupe de recherche Cactus mené par Serge Heiden)[3] et le laboratoire ELLIADD[4] de l'université de Franche-Comté.
Notes et références
modifier- Corentin Roquebert, « Tutoriel: Constituer un corpus Europresse utilisable dans R, Iramuteq et TXM », quanti, (lire en ligne, consulté le )
- Serge Heiden, Jean-Philippe Magué et Bénédicte Pincemin, « TXM : Une plateforme logicielle open-source pour la textométrie - conception et développement », sur Archive ouverte en Sciences de l'Homme et de la Société, (consulté le )
- « Serge Heiden | "Culture & Technology" - The European Summer School in Digital Humanities », sur esu.culintec.de (consulté le )
- « elliadd | Plateforme technologique NuAnCES » (consulté le )