La aventura de los generadores automáticos del lenguaje natural
del análisis lingüístico al procesamiento automático de datos
DOI:
https://doi.org/10.17561/rilex.6.3.8105Palabras clave:
lexicografía, anotación valencial, interfaz sintáctico-semántica, generadores automáticos del lenguaje naturalResumen
Este capítulo ofrece una visión panorámica de los generadores Xera, XeraWord, Combinatoria y CombiContext. En el apartado 2 se explican los motivos que condujeron al equipo de investigación del diccionario Portlex a explorar una vía de trabajo hasta el momento desconocida para nosotros: la generación automática de datos lingüístico-valenciales anotados semánticamente junto con sus ejemplos. El apartado 3 sirve de descripción general de los fundamentos de los generadores en su conjunto: aspectos como su tipología, las estructuras de acceso a la información o los niveles informativos. Una breve sinopsis de su estructura desde la perspectiva de su uso se encuentra en el apartado 4.
Descargas
Referencias
Ágel, V. (2000). Valenztheorie. Narr.
Bojanowski, P., Grave, E., Joulin, A. & Mikolov, T. (2017). Enriching word vectors with subword information. Transactions of the Association for Computational Linguistics, 5, 135–146. https://doi.org/10.1162/tacl_a_00051
Díaz Hormigo, M.ª T. (2002). Sintaxis y semántica de la construcción con sustantivo en posición nuclear. Estudios de Lingüística Española, 16. http://elies.rediris.es/elies16/
Domínguez Vázquez, M.ª J. (2011). Kontrastive Grammatik und Lexikographie: spanisch-deutsches Wörterbuch zur Valenz des Nomens. Iudicium.
Domínguez Vázquez, M.ª J. (2021). Zur Darstellung eines mehrstufigen Prototypbegriffs in der multilingualen automatischen Sprachgenerierung: vom Korpus über word embeddings bis zum automatischen Wörterbuch. Lexikos, 31, 20–50. https://doi.org/10.5788/31-1-1623
Domínguez Vázquez, M.ª J. (2022a). Estructura argumental del nombre: generación automática. Revista Signos. Estudios de Lingüística, 55(110), 732–761. https://doi.org/10.4067/S0718-09342022000300732
Domínguez Vázquez, M.ª J. (2022b). Contribución de la semántica combinatoria al desarrollo de herramientas digitales multilingües. Círculo de Lingüística Aplicada a la Comunicación, 90, 171–18.
Domínguez Vázquez, M.ª J., Bardanca Outeiriño, D. & Simões, A. (2021). Automatic Lexicographic Content Creation: Automating Multilingual Resources Development for Lexicographers. En I. Kosem, M. Cukr, M. Jakubíček, J. Kallas, S. Krek & C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2021 conference (pp. 269–287). Lexical Computing CZ. https://elex.link/elex2021/wp-content/uploads/2021/08/eLex_2021_16_pp269-287.pdf
Domínguez Vázquez, M.ª J. & Caíña Hurtado, M. (2021). Aplicación de recursos de xeración automática da lingua para estudos comparativos. Estudos de Lingüística Galega, 130, 139–172. https://doi.org/10.15304/elg.13.7409
Domínguez Vázquez, M.ª J. & Gouws, R. (2023). The definition, presentation, and automatic generation of contextual data in lexicography. International Journal of Lexicography, 1–27. https://doi.org/10.1093/ijl/ecac020
Domínguez Vázquez, M.ª J., Solla Portela, M. A. & Valcárcel Riveiro, C. (2019). Resources interoperability: Exploiting lexicographic data to automatically generate dictionary examples. En I. Kosem, M. Cukr, M. Jakubíček, J. Kallas, S. Krek & C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference (pp. 51–71). Lexical Computing CZ. https://elex.link/elex2019/wp-content/uploads/2019/09/eLex_2019_4.pdf
Domínguez Vázquez, M.ª J. & Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Rivero (eds.), Studies on Multilingual Lexicography (pp. 135–158). De Gruyter. https://doi.org/10.1515/9783110607659-008
Engel, U. (1996). Semantische Relatoren. Ein Entwurf für künftige Valenzwörterbücher. En N. Weber (ed.), Semantik, Lexikographie und Computeranwendungen (pp. 223–236). Niemeyer. https://doi.org/10.1515/9783111555522.223
Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. Iudicium.
Kubczak, J. & Schumacher, H. (1998). Verbvalenz – Nominalvalenz. En D. Bresson & J. Kubczak (eds.), Abstrakte Nomina. Vorarbeiten zu ihrer Erfassung in einem zweisprachigen syntagmatischen Wörterbuch (pp. 273–286). Gunter Narr Verlag.
Mikolov, T., Chen, K., Corrado, G. & Dean, J. (2013). Efficient estimation of word representations in vector space. En Y. Bengio & Y. LeCun (eds.), Proceeding of the International Conference on Learning Representations. Workshop Track (pp. 1–12). Conference Track Proceedings. https://arxiv.org/pdf/1301.3781.pdf
Müller-Spitzer, C., Domínguez Vázquez, M.ª J., Nied Curcio, M., Silva Dias, M. & Wolfer, S. (2018). Correct Hypotheses and Careful Reading Are Essential: Results of an Observational Study on Learners Using Online Language Resources. Lexikos, 28, 287–315. https://doi.org/10.5788/28-1-1466
Teubert, W. (1979). Valenz des Substantivs. Attributive Ergänzungen und Angaben. Schwann.
Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En M.ª J. Domínguez Vázquez & S. Kutscher (eds.), Estudios contrastivos y multicontrastivos: Interacción entre gramática, didáctica y lexicografía (pp. 193–207). De Gruyter. https://doi.org/10.1515/9783110420784-015
Valcárcel Riveiro, C. & Pino Serrano, L. (2023). Application d’une méthodologie d’analyse des prédicats nominaux: l’exemple du lexème MORT1. Çédille. Revista de estudios franceses, 24 (en prensa).
Recursos
CombiContext = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. & Pino Serrano, L. (2021). CombiContext. Prototipo online para la generación automática de contextos frasales y oraciones de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. Instituto da Lingua Galega. Consultado el 30 de mayo de 2023. http://portlex.usc.gal/combinatoria/verbal
Combinatoria = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., López Iglesias, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M. T. & Pino Serrano, L. (2020). Combinatoria. Prototipo online para la generación biargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. Consultado el 30 de mayo de 2023. http://portlex.usc.gal/combinatoria/usuario
E-Valbu = Elektronisches Valenzwörterbuch deutscher Verben. Consultado el 30 de mayo de 2023. https://grammis.ids-mannheim.de/verbvalenz
Ontología léxica = Domínguez Vázquez, M. J., Valcárcel Riveiro, C. & Bardanca Outeiriño, D. (2021). Ontología léxica. Universidade de Santiago de Compostela. Consultado el 30 de mayo de 2023. http://portlex.usc.gal/ontologia/
Portlex = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Mirazo Balsa, M., Sanmarco Bande, M.ª T., Simões, A. & Vale, M. J. (2018). Portlex. Diccionario multilingüe de la valencia del nombre. Universidade de Santiago de Compostela. Consultado el 30 de mayo de 2023. http://portlex.usc.gal/portlex/
Traduword = Consultado el 30 de mayo de 2023. https://ilg.usc.gal/es/proxectos/interoperabilidad-de-recursos-y-produccion-automatica-de-lenguaje-natural-0
WordNet = WordNet. Princeton University. Consultado el 30 de mayo de 2023. https://wordnet.princeton.edu/
Xera = Domínguez Vázquez, M.ª J. (dir.), Valcárcel Riveiro, C., Bardanca Outeiriño, D., Calañas Continente, J. A., Catalá Torres, N., López Iglesias, N., Martín Gascueña, R., Mirazo Balsa, M., Sanmarco Bande, M.T. & Pino Serrano, L. (2020). Xera. Prototipo online para la generación automática monoargumental de la frase nominal en alemán, español y francés. Universidade de Santiago de Compostela. Consultado el 30 de mayo de 2023. http://portlex.usc.gal/combinatoria/usuario
XeraWord = Domínguez Vázquez, M.ª J. (dir.), Bardanca Outeiriño, D., Caíña Hurtado, M., Gómez Guinovart, X., Iglesias Allones, J. J., Simões, A., Valcárcel Riveiro, C., Álvarez de la Granja, M. & Cidrás Escaneo, F. A. (2020). XeraWord. Prototipo de xeración automática da argumentación da frase nominal en galego e portugués. Santiago de Compostela: Instituto da Lingua Galega. Consultado el 30 de mayo de 2023. http://ilg.usc.gal/xeraword/
Publicado
Número
Sección
Licencia
Derechos de autor 2023 María José Domínguez Vázquez
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
1. Política propuesta para revistas que ofrecen acceso abierto
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cual estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación en esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase El efecto del acceso abierto).