La tarea de Desambiguación de Entidades Nombradas, junto con la de Reconocimiento de ... more La tarea de Desambiguación de Entidades Nombradas, junto con la de Reconocimiento de Entidades Nombradas, ha venido a intentar automatizar el proceso de construcción de la Web Semántica aun cuando se cuenta con la realidad de que los sistemas actuales que responden a ambas, están lejos de prescindir de una etapa de supervisión humana para corregir los errores que pudieran surgir en su aplicación. Por su complejidad, ambos problemas, siguen abiertos a la comunidad de investigación, sin solución completa para dominios generales de textos en Lenguaje Natural. Es por eso que este trabajo, a modo de aproximación, además de un sistema de Desambiguación de Entidades Nombradas para español e inglés, brinda un conjunto de ideas y medidas de similaridad que pudieran ser de mucha utilidad para tal tarea. Estas métricas de similaridad entre una entidad nombrada y una entidad, combinan algoritmos de Inteligencia Artificial como el de aprendizaje supervisado Multinomial Naive Bayes, con la distancia de Levenshtein y la similitud coseno del Modelo Vectorial de Recuperación de Información. En el sistema implementado, buscando poner en práctica las métricas diseñadas, se realizó el enlace con DBpedia a través de Wikipedia, y se probó el desempeño de varias configuraciones de dicho sistema en un pequeño corpus manual para el idioma inglés, estas configuraciones respondieron a las medidas y técnicas de Procesamiento del Lenguaje Natural utilizadas para la desambiguación.
La tarea de Desambiguación de Entidades Nombradas, junto con la de Reconocimiento de ... more La tarea de Desambiguación de Entidades Nombradas, junto con la de Reconocimiento de Entidades Nombradas, ha venido a intentar automatizar el proceso de construcción de la Web Semántica aun cuando se cuenta con la realidad de que los sistemas actuales que responden a ambas, están lejos de prescindir de una etapa de supervisión humana para corregir los errores que pudieran surgir en su aplicación. Por su complejidad, ambos problemas, siguen abiertos a la comunidad de investigación, sin solución completa para dominios generales de textos en Lenguaje Natural. Es por eso que este trabajo, a modo de aproximación, además de un sistema de Desambiguación de Entidades Nombradas para español e inglés, brinda un conjunto de ideas y medidas de similaridad que pudieran ser de mucha utilidad para tal tarea. Estas métricas de similaridad entre una entidad nombrada y una entidad, combinan algoritmos de Inteligencia Artificial como el de aprendizaje supervisado Multinomial Naive Bayes, con la distancia de Levenshtein y la similitud coseno del Modelo Vectorial de Recuperación de Información. En el sistema implementado, buscando poner en práctica las métricas diseñadas, se realizó el enlace con DBpedia a través de Wikipedia, y se probó el desempeño de varias configuraciones de dicho sistema en un pequeño corpus manual para el idioma inglés, estas configuraciones respondieron a las medidas y técnicas de Procesamiento del Lenguaje Natural utilizadas para la desambiguación.
Uploads
Papers by Javier Labori
Entidades Nombradas, ha venido a intentar automatizar el proceso de construcción de la Web
Semántica aun cuando se cuenta con la realidad de que los sistemas actuales que responden
a ambas, están lejos de prescindir de una etapa de supervisión humana para corregir los errores
que pudieran surgir en su aplicación. Por su complejidad, ambos problemas, siguen abiertos a
la comunidad de investigación, sin solución completa para dominios generales de textos en
Lenguaje Natural. Es por eso que este trabajo, a modo de aproximación, además de un sistema
de Desambiguación de Entidades Nombradas para español e inglés, brinda un conjunto de
ideas y medidas de similaridad que pudieran ser de mucha utilidad para tal tarea. Estas métricas
de similaridad entre una entidad nombrada y una entidad, combinan algoritmos de Inteligencia
Artificial como el de aprendizaje supervisado Multinomial Naive Bayes, con la distancia de
Levenshtein y la similitud coseno del Modelo Vectorial de Recuperación de Información. En el
sistema implementado, buscando poner en práctica las métricas diseñadas, se realizó el enlace
con DBpedia a través de Wikipedia, y se probó el desempeño de varias configuraciones de
dicho sistema en un pequeño corpus manual para el idioma inglés, estas configuraciones
respondieron a las medidas y técnicas de Procesamiento del Lenguaje Natural utilizadas para
la desambiguación.
Entidades Nombradas, ha venido a intentar automatizar el proceso de construcción de la Web
Semántica aun cuando se cuenta con la realidad de que los sistemas actuales que responden
a ambas, están lejos de prescindir de una etapa de supervisión humana para corregir los errores
que pudieran surgir en su aplicación. Por su complejidad, ambos problemas, siguen abiertos a
la comunidad de investigación, sin solución completa para dominios generales de textos en
Lenguaje Natural. Es por eso que este trabajo, a modo de aproximación, además de un sistema
de Desambiguación de Entidades Nombradas para español e inglés, brinda un conjunto de
ideas y medidas de similaridad que pudieran ser de mucha utilidad para tal tarea. Estas métricas
de similaridad entre una entidad nombrada y una entidad, combinan algoritmos de Inteligencia
Artificial como el de aprendizaje supervisado Multinomial Naive Bayes, con la distancia de
Levenshtein y la similitud coseno del Modelo Vectorial de Recuperación de Información. En el
sistema implementado, buscando poner en práctica las métricas diseñadas, se realizó el enlace
con DBpedia a través de Wikipedia, y se probó el desempeño de varias configuraciones de
dicho sistema en un pequeño corpus manual para el idioma inglés, estas configuraciones
respondieron a las medidas y técnicas de Procesamiento del Lenguaje Natural utilizadas para
la desambiguación.