About: UIMA

An Entity of Type: software, from Named Graph: http://dbpedia.org, within Data Space: dbpedia.org

UIMA (/juˈiːmə/ yoo-EE-mə), short for Unstructured Information Management Architecture, is an OASIS standard for content analytics, originally developed at IBM. It provides a component software architecture for the development, discovery, composition, and deployment of for the analysis of unstructured information and integration with search technologies.

Property	Value
dbo:abstract	UIMA (Unstructured Information Management Architecture, deutsch Architektur zur Verwaltung unstrukturierter Informationen) ist ein Framework zur Programmierung von Data-Mining-Anwendungen, d. h. zur Wissensextraktion. Das Projekt UIMA wurde 2005 von IBM gestartet und wird seit Oktober 2006 von Apache betreut.Ziel des Projekts ist es, ein standardisiertes Framework zum Erstellen von Anwendungen zur Verarbeitung unstrukturierter Informationen, insbesondere natürlicher Sprache (Natural Language Processing, NLP) zu bieten.Unstrukturierte Informationen können in beliebigen Formaten vorliegen, z. B. Bild- oder Audio-Daten, jedoch sind Texte die gängigsten Informationen. Das Konzept von UIMA sieht vor, dass eine Pipeline implementiert wird, in der zunächst Daten eingelesen werden, diese dann verschiedene Analyse- und Verarbeitungsschritte durchlaufen und schließlich an einen oder mehrere sogenannte Verbraucher geliefert werden, die die Ergebnisse verarbeiten, z. B. in einer Datenbank speichern.In jedem einzelnen Analyse-Schritt werden die Daten mit bestimmten Annotationen versehen, d. h. ein definierter Bereich der Datenmenge, also beispielsweise ein Teil des Texts, bekommt eine Anmerkung.Durch die starke Modularisierung in Pipelinestufen können die einzelnen Stufen leicht wiederverwendet werden. Ein Beispiel für eine Pipeline ist eine simple Anwendung, die die durchschnittliche Anzahl von Wörtern pro Satz in einem Text berechnen soll.Hierzu wird zunächst eine Pipelinestufe benötigt, die den Text einliest, z. B. aus einer Datei. Die zweite Stufe durchläuft den Text und markiert alle Wörter, indem alle Positionen von Leerzeichen im Text ermittelt werden. Die dritte Stufe führt analog dazu eine Satz-Erkennung durch, indem Markierungen von Satzzeichen zu Satzzeichen gesetzt werden. Diese beiden Schritte sind unabhängig voneinander und könnten demnach auch vertauscht werden. Die letzte Pipelinestufe muss nun nur noch die Anzahl markierter Wörter durch die Anzahl markierter Sätze teilen und ausgeben. Eine Erweiterung könnte nun sein, die Anzahl der Verben pro Satz zu zählen, hierzu würde nach der dritten Stufe eine Wortart-Erkennung eingebaut, die jedes Wort mit einer Annotation wie „Verb“, „Nomen“ usw. versieht, und der Verbraucher würde statt der Wort-Annotationen die Wortart-Annotationen zählen, die „Verb“ entsprechen; alle anderen Teile der Pipeline können wiederverwendet werden.UIMA übernimmt in dieser Anwendung die Verwaltung der Pipeline und die interne Repräsentation der zu verarbeitenden Daten samt Annotationen, außerdem bietet es dem Entwickler alle nötigen Schnittstellen zum Einlesen und Auslesen der Informationen. UIMA wird insbesondere in der Forschung eingesetzt, entwickelt sich aber auch immer mehr zum Industrie-Standard. Eine der bekanntesten Anwendungen von UIMA ist der Einsatz im IBM Watson. (de) UIMA (Unstructured Information Management applications, Aplicaciones para la administración de información no estructurada) son sistemas de software que analizan grandes volúmenes de información no estructurada con el fin de descubrir que es lo relevante para el usuario final. Un ejemplo de aplicación UIM, podría ingerir texto plano e identificar identidades, como personas, lugares, organizaciones; o relaciones, como trabajos-para o ubicados-en. Watson (inteligencia_artificial), el supercomputador de IBM que participó en un programa especial del show televisivo estadounidense Jeopardy!, utiliza Apache UIMA para escalar su procesamiento del lenguaje natural en paralelo a través de procesadores POWER7 de IBM, lo que permite a Watson realizar miles de cálculos analíticos simultáneamente en todo el clúster de servidores para responder a cada pregunta lo más rápido posible. (es) UIMA (/juˈiːmə/ yoo-EE-mə), short for Unstructured Information Management Architecture, is an OASIS standard for content analytics, originally developed at IBM. It provides a component software architecture for the development, discovery, composition, and deployment of for the analysis of unstructured information and integration with search technologies. (en) Apache UIMA (dall'inglese Unstructured Information Management Architecture) è un framework, sviluppato nei linguaggi di programmazione Java e C++, per il trattamento e l'analisi di informazioni semi-strutturate, e l'estrazione di informazioni da esse. Fa parte dei software sviluppati dalla Apache Software Foundation. UIMA definisce un'interfaccia per le varie componenti di analisi (Analysis Engine) che lo sviluppatore può implementare (ad esempio, conversione di file binario in testo, annotazione di concetti o di nomi propri, conversione in formato XML...). In sintesi, una volta definiti dei descriptors (file in formato XML) per i diversi componenti (che indicano tra l'altro i dati in entrata ed in uscita) ed un descriptor che definisce la pipeline completa (sequenza ordinata di trattamenti ad effettuare), tramite una semplice API è possibile lanciare il trattamento dei dati. (it) UIMA（全称Unstructured Information Management Architecture，即非结构化信息管理架构）于2009年3月作为，是一个组件化的软件架构，用于分析同终端用户相关联的大容量非结构化信息。 (zh)
dbo:developer	dbr:IBM dbr:Apache_Software_Foundation
dbo:genre	dbr:Information_extraction dbr:Text_mining
dbo:latestReleaseDate	2019-11-08 (xsd:date)
dbo:latestReleaseVersion	3.1.1
dbo:license	dbr:Apache_License
dbo:operatingSystem	dbr:Cross-platform
dbo:programmingLanguage	dbr:Java_(programming_language)
dbo:thumbnail	wiki-commons:Special:FilePath/Apache_UIMA_logo.svg?width=300
dbo:wikiPageExternalLink	https://uima.apache.org/
dbo:wikiPageID	2422681 (xsd:integer)
dbo:wikiPageLength	3409 (xsd:nonNegativeInteger)
dbo:wikiPageRevisionID	1085866372 (xsd:integer)
dbo:wikiPageWikiLink	dbc:Apache_Software_Foundation_projects dbr:Information_extraction dbr:Cross-platform dbr:General_Architecture_for_Text_Engineering dbr:Apache_License dbr:Pipeline_(software) dbr:Unstructured_data dbr:C++ dbr:Data_Discovery_and_Query_Builder dbr:Watson_(computer) dbr:LanguageWare dbc:Software_architecture dbc:Data_mining_and_machine_learning_software dbr:Java_(programming_language) dbr:Reference_implementation dbr:IBM dbr:Apache_Software_Foundation dbr:OASIS_(organization) dbr:Search_algorithm dbr:CTAKES dbr:XML dbr:Ubiquitous_Knowledge_Processing_Lab dbr:IBM_Omnifind dbr:IBM_Research dbr:Text_mining dbr:Unstructured_information dbr:Entity_extraction dbr:Content_analytics dbr:Design_pattern_(computer_science) dbr:Component_software dbr:Multi-modal_analytics
dbp:developer	dbr:IBM dbr:Apache_Software_Foundation
dbp:genre	dbr:Information_extraction dbr:Text_mining
dbp:latestReleaseDate	2019-11-08 (xsd:date)
dbp:latestReleaseVersion	3.100000 (xsd:double)
dbp:license	Apache License 2.0 (en)
dbp:logo	Apache UIMA logo.svg (en)
dbp:name	Apache UIMA (en)
dbp:operatingSystem	dbr:Cross-platform
dbp:programmingLanguage	Java with C++ enablement (en)
dbp:website	https://uima.apache.org/
dbp:wikiPageUsesTemplate	dbt:IPAc-en dbt:Infobox_software dbt:Reflist dbt:Respell dbt:Start_date_and_age dbt:Apache_Software_Foundation
dcterms:subject	dbc:Apache_Software_Foundation_projects dbc:Software_architecture dbc:Data_mining_and_machine_learning_software
rdf:type	owl:Thing dbo:Software schema:CreativeWork dbo:Work wikidata:Q386724 wikidata:Q7397 yago:Abstraction100002137 yago:Code106355894 yago:CodingSystem106353757 yago:Cognition100023271 yago:Communication100033020 yago:Datum105816622 yago:Information105816287 yago:PsychologicalFeature100023100 yago:Writing106359877 yago:WrittenCommunication106349220 yago:Software106566077 yago:WikicatDataMiningAndMachineLearningSoftware
rdfs:comment	UIMA (/juˈiːmə/ yoo-EE-mə), short for Unstructured Information Management Architecture, is an OASIS standard for content analytics, originally developed at IBM. It provides a component software architecture for the development, discovery, composition, and deployment of for the analysis of unstructured information and integration with search technologies. (en) UIMA（全称Unstructured Information Management Architecture，即非结构化信息管理架构）于2009年3月作为，是一个组件化的软件架构，用于分析同终端用户相关联的大容量非结构化信息。 (zh) UIMA (Unstructured Information Management Architecture, deutsch Architektur zur Verwaltung unstrukturierter Informationen) ist ein Framework zur Programmierung von Data-Mining-Anwendungen, d. h. zur Wissensextraktion. UIMA wird insbesondere in der Forschung eingesetzt, entwickelt sich aber auch immer mehr zum Industrie-Standard. Eine der bekanntesten Anwendungen von UIMA ist der Einsatz im IBM Watson. (de) UIMA (Unstructured Information Management applications, Aplicaciones para la administración de información no estructurada) son sistemas de software que analizan grandes volúmenes de información no estructurada con el fin de descubrir que es lo relevante para el usuario final. Un ejemplo de aplicación UIM, podría ingerir texto plano e identificar identidades, como personas, lugares, organizaciones; o relaciones, como trabajos-para o ubicados-en. (es) Apache UIMA (dall'inglese Unstructured Information Management Architecture) è un framework, sviluppato nei linguaggi di programmazione Java e C++, per il trattamento e l'analisi di informazioni semi-strutturate, e l'estrazione di informazioni da esse. Fa parte dei software sviluppati dalla Apache Software Foundation. UIMA definisce un'interfaccia per le varie componenti di analisi (Analysis Engine) che lo sviluppatore può implementare (ad esempio, conversione di file binario in testo, annotazione di concetti o di nomi propri, conversione in formato XML...). (it)
rdfs:label	UIMA (de) UIMA (es) Apache UIMA (it) UIMA (en) UIMA (zh)
owl:sameAs	freebase:UIMA yago-res:UIMA wikidata:UIMA dbpedia-de:UIMA dbpedia-es:UIMA dbpedia-it:UIMA dbpedia-zh:UIMA https://global.dbpedia.org/id/YFQY
prov:wasDerivedFrom	wikipedia-en:UIMA?oldid=1085866372&ns=0
foaf:depiction	wiki-commons:Special:FilePath/Apache_UIMA_logo.svg
foaf:homepage	https://uima.apache.org/
foaf:isPrimaryTopicOf	wikipedia-en:UIMA
foaf:name	Apache UIMA (en)
is dbo:wikiPageRedirects of	dbr:Uima dbr:Unstructured_Information_Management_Architecture
is dbo:wikiPageWikiLink of	dbr:American_National_Corpus dbr:Prolog dbr:Entity–attribute–value_model dbr:Apache_cTAKES dbr:Unstructured_data dbr:Data_mining dbr:LanguageWare dbr:List_of_Java_frameworks dbr:Averbis dbr:Manually_Annotated_Sub-Corpus dbr:OASIS_(organization) dbr:IBM_Omnifind dbr:IBM_Watson dbr:Sophia_Ananiadou dbr:Outline_of_machine_learning dbr:Outline_of_natural_language_processing dbr:Uima dbr:Unstructured_Information_Management_Architecture
is foaf:primaryTopic of	wikipedia-en:UIMA

This content was extracted from Wikipedia and is licensed under the Creative Commons Attribution-ShareAlike 3.0 Unported License