Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
Skip to main content
Francisco Gago-Jover

    Francisco Gago-Jover

    ... En Esparza Torres, MA et alii (eds.): Estudios de Historiografía Lingüística. Actas del III Congreso Internacional de Historiografía Lingüística [Vigo, 7-10 de febrero de 2001]. Hamburg, Helmut Buske Verlag, págs. 777-787. ...
    Este trabajo expone los aspectos relacionados con el procesamiento de las formas, lemas, analisis gramatical y textos en el Old Spanish Textual Archive (OSTA), un corpus linguistico de mas de 32 millones de palabras, basado en las mas de... more
    Este trabajo expone los aspectos relacionados con el procesamiento de las formas, lemas, analisis gramatical y textos en el Old Spanish Textual Archive (OSTA), un corpus linguistico de mas de 32 millones de palabras, basado en las mas de 400 transcripciones semi-paleograficas de textos medievales escritos en castellano, asturiano, leones, navarro-aragones y aragones realizadas por los colaboradores del Hispanic Seminary of Medieval Studies (HSMS). Se describe ademas el proceso de etiquetado y lematizacion mediante el uso de Freeling, una herramienta de Procesamiento del Lenguaje Natural, y de HSMS-app, una herramienta de analisis textual desarrollada para este proyecto.
    espanolEn este trabajo ofrecemos un breve panorama historico del desarrollo de OSTA, desde la idea inicial (Nitti 1978) hasta la Biblioteca Digital de Textos del Espanol Antiguo (Gago Jover 2015), su mas reciente precedente. Exponemos... more
    espanolEn este trabajo ofrecemos un breve panorama historico del desarrollo de OSTA, desde la idea inicial (Nitti 1978) hasta la Biblioteca Digital de Textos del Espanol Antiguo (Gago Jover 2015), su mas reciente precedente. Exponemos ademas los problemas encontrados y las soluciones propuestas para el procesado de transcripciones, codices y obras. EnglishIn this paper we offer a brief historical overview of the development of OSTA, from the initial idea (Nitti 1978) to the Biblioteca Digital de Textos del Espanol Antiguo (Gago Jover 2015), its most recent precedent. We also discuss the problems encountered and the proposed solutions for the processing of transcriptions, codices and works
    El articulo ofrece una descripcion pormenorizada de la historia, caracteristicas de funcionamiento y contenidos de la Biblioteca Digital de Textos del Espanol Antiguo (BiDTEA) preparada por el Hispanic Seminary of Medieval Studies. BiDTEA... more
    El articulo ofrece una descripcion pormenorizada de la historia, caracteristicas de funcionamiento y contenidos de la Biblioteca Digital de Textos del Espanol Antiguo (BiDTEA) preparada por el Hispanic Seminary of Medieval Studies. BiDTEA ofrece acceso interactivo a transcripciones semi-paleograficas de testimonios concretos de obras producidas en el periodo medieval, una serie de indices (alfabetico, frecuencia, alfabetico inverso) yconcordancias en formato KWIC.
    1. To these three cancioneiros one can add the folios of a miscellany at the Vatican Library (Vat. Lat. 7182) and two manuscripts containing both text and music known as Vindel and Sharrer, each named after its discoverer and held by the... more
    1. To these three cancioneiros one can add the folios of a miscellany at the Vatican Library (Vat. Lat. 7182) and two manuscripts containing both text and music known as Vindel and Sharrer, each named after its discoverer and held by the Pierpont Morgan Library and the Portuguese National Archive (Torre de Tombo), respectively (Dias 99). For a detailed bibliography of the cantigas’ manuscript tradition, see Cohen (15). 2. For a bibliography and critical appraisal of this editorial tradition, see Cohen 16–20, 33–36). 3. The authors note that search parameters, particularly the thematic ones, will be broadened and deepened in the future (“Presentation”).
    This article offers a detailed description of the Colonial Texts Corpus, one of eleven subcorpora of the Digital Library of Old Spanish Texts published by the Hispanic Seminary of Medieval Studies. Launched in 2018, the corpus allows... more
    This article offers a detailed description of the Colonial Texts Corpus, one of eleven subcorpora of the Digital Library of Old Spanish Texts published by the Hispanic Seminary of Medieval Studies. Launched in 2018, the corpus allows interactive access to semi-paleographic transcriptions of texts produced in the Americas during the colonial period, a textual type that is under-represented in existing electronic corpora. The rationale of the project is provided, as well as the criteria for the selection of texts to be included and their method of preparation. Finally, the interface of the corpus is illustrated, and its functionality is exemplified.
    Las voces militares en los diccionarios de español: el caso de yelmo.
    Reseña: "Tesoro de la lengua castellana". Major Authors on CD-ROM: Miguel de Cervantes. Ed. Roberto González Echevarría. Woodbridge: Primary Source Media, 1997.
    Reseña: Real Academia Española: Nuevo Tesoro Lexicográfico de la Lengua Española. DVD-ROM. Madrid, Espasa-Calpe, 2001. ISBN: 84-239-2185-9.
    Reseña: Antônio Geraldo da Cunha (coord.) (2002): Vocabulário do Português Medieval. Versão 1.0. CD-ROM, Rio de Janeiro, Fundação Casa de Rui Barbosa-Ministério da Cultura.
    Reseña: Antônio Houaiss, Mauro de Salles Villar y Francisco Manoel de Mello Franco (eds.) (2001): Dicionário eletrônico Houaiss da língua portuguesa. CD-ROM. Rio de Janeiro, Editora Objetiva.
    Reseña: Boyd-Bowman, Peter (2003): Léxico Hispanoamericano (1493-1993), eds. Ray Harris-Northall y John Nitti, CD-ROM, Nueva York, Hispanic Seminary of Medieval Studies.
    This article is a comprehensive inventory of all the lexicographical works produced in Spain between 1749—date of the publication of the first military dictionary in Spanish, the Diccionario militar de Raimundo Sanz—and the First World... more
    This article is a comprehensive inventory of all the lexicographical works produced in Spain between 1749—date of the publication of the first military dictionary in Spanish, the Diccionario militar de Raimundo Sanz—and the First World War—which saw tremendous advances in the military sciences, making obsolete many of the previously used weapons and tactics. Previous inventories had only identified 18 such lexicographical works, and I was able to bring that number to 47. The inventory offers the same information for all works included: 1) complete bibliographical description, 2) description of the contents and macrostructure, 3) description of the microstructure, 4) comments on specific aspects of each work: history, location, relationship with other dictionaries, etc.
    The Poema de Alfonso Onceno, composed around 1348 by Rodrigo Yáñez, narrates the principal events of Alfonso XI’s life and reign (1312-50), from his childhood until his triumphal entrance into Algeciras (1344), and it is one of the best... more
    The Poema de Alfonso Onceno, composed around 1348 by Rodrigo Yáñez, narrates the principal events of Alfonso XI’s life and reign (1312-50), from his childhood until his triumphal entrance into Algeciras (1344), and it is one of the best sources for the study of mid fourteenth-century military terminology. This article is divided into two parts. The first constitutes a complete glossary of the military terminology contained in the Poema de Alfonso XI. The second is a more detailed study of twenty terms that have not been recorded into any existing dictionaries or that have presented interpretation problems in some of the editions of the Poema.
    Este trabajo expone los aspectos relacionados con el procesamiento de las formas, lemas, análisis gramatical y textos en el Old Spanish Textual Archive (OSTA), un corpus lingüístico de más de 32 millones de palabras, basado en las más de... more
    Este trabajo expone los aspectos relacionados con el procesamiento de las formas, lemas, análisis gramatical y textos en el Old Spanish Textual Archive (OSTA), un corpus lingüístico de más de 32 millones de palabras, basado en las más de 400 transcripciones semi-paleográficas de textos medievales escritos en castellano, asturiano, leonés, navarro-aragonés y aragonés realizadas por los colaboradores del Hispanic Seminary of Medieval Studies (HSMS). Se describe además el proceso de etiquetado y lematización mediante el uso de Freeling, una herramienta de Procesamiento del Lenguaje Natural, y de HSMS-app, una herramienta de análisis textual desarrollada para este proyecto.

    This paper presents aspects related to the processing of forms, lemmas, grammatical analysis and texts in the Old Spanish Textual Archive (OSTA), a linguistic corpus of more than 32 million words, based on the more than 400 semi-paleographic transcriptions of medieval texts written in Castilian, Asturian, Leonese, Navarro-Aragonese and Aragonese prepared by the collaborators of the Hispanic Seminary of Medieval Studies (HSMS). It also describes the process of tagging and lemmatization using Freeling, a Natural Language Processing tool, and HSMS-app, a textual analysis tool developed for this project.
    En este trabajo ofrecemos un breve panorama histórico del desarrollo de OSTA, desde la idea inicial (Nitti 1978) hasta la Biblioteca Digital de Textos del Español Antiguo (Gago Jover 2015), su más reciente precedente. Exponemos además... more
    En este trabajo ofrecemos un breve panorama histórico del desarrollo de OSTA, desde la idea inicial (Nitti 1978) hasta la Biblioteca Digital de Textos del Español Antiguo (Gago Jover 2015), su más reciente  precedente. Exponemos además los problemas encontrados y las soluciones propuestas para el procesado de transcripciones, códices y obras.

    In this paper we offer a brief historical overview of the development of OSTA, from the initial idea (Nitti 1978) to the Biblioteca Digital de Textos del Español Antiguo (Gago Jover 2015), its most recent precedent. We also discuss the problems encountered and the proposed solutions for the processing of transcriptions, codices and works.
    RESUMEN: El artículo ofrece una descripción pormenorizada de la historia, características de funcionamiento y contenidos de la Biblioteca Digital de Textos del Español Antiguo (BiDTEA) preparada por el Hispanic Seminary of Medieval... more
    RESUMEN: El artículo ofrece una descripción pormenorizada de la historia, características de funcionamiento y contenidos de la Biblioteca Digital de Textos del Español Antiguo (BiDTEA) preparada por el Hispanic Seminary of Medieval Studies. BiDTEA ofrece acceso interactivo a transcripciones semi-paleográficas de testimonios concretos de obras producidas en el periodo medieval, una serie de índices (alfabético, frecuencia, alfabético inverso) y concordancias en formato KWIC.

    The article offers a detailed description of the history, operating characteristics, and contents of the Biblioteca Digital de Textos del Español Antiguo (BiDTEA) prepared by the Hispanic Seminary of Medieval Studies. BiDTEA offers interactive access to semi-paleographical transcriptions of texts produced during the medieval period, a series of indices (alphabetic, frequency, reverse alphabetic), and KWIC concordances.