Herramientas y dificultades en el análisis del grupo nominal en francés para su procesamiento computacional
DOI:
https://doi.org/10.17561/rilex.6.3.8392Palabras clave:
francés, PLN, herramientas, recursos, lexicografíaResumen
La presente contribución presenta el trabajo desarrollado sobre la lengua francesa en el portal lexicográfico multilingüe PORTLEX. Concretamente, el artículo se centra en las herramientas utilizadas por los equipos de francés de tres proyectos de investigación: el diccionario PORTLEX y el desarrollo de prototipos para la generación automática de sintagmas nominales en los proyectos MultiGenera y MultiComb. Se detallan los recursos utilizados distinguiendo las herramientas de consulta (diccionarios, gramáticas) de las computacionales (corpus, bases de datos). Asimismo, se describen las principales dificultades asociadas al uso de cada herramienta o recurso y se explican las decisiones adoptadas para solventarlas o minimizarlas.
Descargas
Referencias
Abeillé, A. & Godard, D. (dirs.) (2021). La grande grammaire du français. Actes Sud.
Alonso-Ramos, M. (2004). Diccionario de colocaciones del español (DICE). http://www.dicesp.com/paginas
Alonso-Ramos, M. (2017). Diccionarios combinatorios. Estudios de Lingüística del Español, 38, 173–201. https://doi.org/10.36950/elies.2017.38.8651
Barrios Rodríguez, M. A. (2010). El dominio de las funciones léxicas en el marco de la Teoría Sentido-Texto. Estudios de Lingüística del español (ELiEs), 30. http://elies.rediris.es/elies30/index30.html
Blanco, X. (1997). De las clases de objetos a las clases de predicados. Verba, 24, 371–385.
Blanco, X. (1999). Lexicographie bilingue français-espagnol et classes d'objets. Universitat Autònoma de Barcelona.
Cerquiglini, B. (dir.) (1999). Femme, j’écris ton nom… Guide d’aide à la féminisation des noms de métiers, titres, grades et fonctions. Centre National de la Recherche Scientifique & Institut de la Langue Française. https://medias.vie-publique.fr/data_storage_s3/rapport/pdf/994001174.pdf
Charaudeau, P. (1992). Grammaire du sens et de l'expression. Hachette-Éducation.
Condette, M. H., Marín, R. & Merlo, A. (2012). La structure argumentale des noms déverbaux: du corpus au lexique et du lexique au corpus. En F. Neveu, V. M. Toke, P. Blumenthal, T. Klingler, P. Ligas, S. Prévost & S. Teston-Bonnard (eds.), Actes du 3ème Congrès Mondial de Linguistique Française, Lyon, France, 4-7 juillet 2012 (pp. 845–858). SHS Web of conferences. https://doi.org/10.1051/shsconf/20120100271.
Dendien, J. (2020). Le TLFi Trésor de la langue française informatisé. Analyse et traitement informatique de la langue française. http://atilf.atilf.fr/tlfv3.htm
Domínguez Vázquez, M.ª J. (2011). Kontrastive Grammatik und Lexikographie: spanisch-deutsches Wörterbuch zur Valenz des Nomens. Iudicium
Domínguez Vázquez, M.ª J. (2018). Was sind Valenzwörterbücher? Sprachwissenschaft, 43(3), 309–342.
Domínguez Vázquez, M.ª J., Bardanca Outeiriño, D. & Simões, A. (2021). Automatic Lexicographic Content Creation: Automating Multilingual Resources Development for Lexicographers. En I. Kosem, M. Cukr, M. Jakubíček, J. Kallas, S. Krek & C. Tiberius (eds.), Post-editing Lexicography – Elex 2021. Proceedings of the eLex 2021 conference (pp. 269–287). European Lexicographic Infrastructure. https://elex.link/elex2021/wp-content/uploads/eLex_2021-proceedings.pdf
Domínguez Vázquez, M.ª J., Solla Portela, M. A. & Valcárcel Riveiro, C. (2019). Resources interoperability: exploiting lexicographic data to automatically generate dictionary examples. En I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreira, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek, C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1-3 October 2019, Sintra, Portugal (pp. 51–71). Lexical Computing CZ, s.r.o.
Domínguez Vázquez, M.ª J. & Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Riveiro (eds.), Studies on multilingual lexicography (pp. 135–158). De Gruyter. https://doi.org/10.1515/9783110607659-008
Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Bardanca Outeiriño, D. (2021), Ontología léxica. Santiago de Compostela. http://portlex.usc.gal/ontologia
Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Lindemann, D. (2018). Multilingual Generation of Noun Valency Patterns for Extracting Syntactic-Semantical Knowledge from Corpora (MultiGenera). En J. Čibej, V. Gorjanc, I. Kosem & S. Krek (eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, Ljubljana, Slovenia (pp. 847–854). Ljubljana University Press.
Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. Iudicium.
Gómez Guinovart, X. & Solla Portela, M. A. (2018). Building the Galician WordNet: methods and applications. Language Resources & Evaluation 52(1), 317–339. https://doi.org/10.1515/9783110607659-010
Gómez Guinovart, X. & Solla Portela, M. A. (2020). Construction of a WordNet-based multilingual lexical ontology for Galician. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Riveiro (eds.), Studies on multilingual lexicography (pp. 179–196). De Gruyter.
Grevisse, M. & Goosse, A. (2008). Le bon usage. Grammaire française. De Boeck-Duculot.
Gross, G. (1991). Syntaxe du complément de nom. Linguisticae Investigationes, 15, 255–284. https://doi.org/10.1075/li.15.2.02gro
Gross, G. (2002). Analyse de compléments du nom en termes de classes d’objets. Le français moderne, 70(2), 187–209.
Gross, G. (2004). Réflexions sur le traitement automatique des langues. En G. Purnelle, C. Fairon & A. Dister (eds.), Le Poids des mots. Actes des 7es Journées internationales d’Analyse Statistique des Données Textuelles (JADT 2004) (545–556). Presses Universitaires de Louvain.
Gross, G. (2008). Les classes d’objets. Lalies, 28, 111–165.
Gross, G. (2012). Manuel d’analyse linguistique. Presses Universitaires du Septentrion. https://doi.org/10.4000/books.septentrion.115128
Iordanskaja, L., Kim, M. & Polguère, A. (1996). Some Procedural Problems in the Implementation of Lexical Functions for Text Generation. En L. Wanner (ed.), Lexical functions in lexicography and natural language processing (pp. 279–297). John Benjamins.
Jakubíček, M., Kilgarriff, A., Kovář, V., Rychlý, P. & Suchomel, V. (2013). The Tenten Corpus Family. En A. Hardie & R. Love (eds.), Proceedings of the 7th International Corpus Linguistics Conference CL (pp. 125–127). Lancaster University. https://www.sketchengine.eu/wp-content/uploads/The_TenTen_Corpus_2013.pdf
Lazard, G. (1988). Définition des actants dans les langues européennes. En J. Feuillet (ed.), Actance et valence dans les langues de l’Europe (pp. 11–146). Mouton de Gruyter. https://doi.org/10.1515/9783110804485.11
Lazard, G. (1994). L’actance. Presses Universitaires de France.
Lexical Computing (2023a). CQL - Corpus Query Language. Sketch Engine. https://www.sketchengine.eu/documentation/corpus-querying/
Lexical Computing (2023b). Concordance - a tool to search corpus. Sketch Engine. https://www.sketchengine.eu/guide/concordance-a-tool-to-search-a-corpus/
Mel’čuk, I. (1997). Vers une linguistique Sens-Texte. Leçon inaugurale. Collège de France. http://olst.ling.umontreal.ca/pdf/melcukColldeFr.pdf
Mel′čuk, I., Arbatchewsky-Jumarie, N., Iordanskaja, L., Mantha, S. & Polguère, A. (eds.) (1984-1999). Dictionnaire explicatif et combinatoire du français contemporain: recherches lexico-sémantiques I-IV. Presses de l’Université de Montréal. https://doi.org/10.2307/j.ctv69t5n2
Mel′čuk, I., Clas, A. & Polguère, A. (1995). Introduction à la lexicologie explicative et combinatoire. Éditions Duculot.
Mel′čuk, I. & Milićević, J. (2014). Introduction à la linguistique. Volume 1. Éditions Hermann.
Mel′čuk, I. & Polguère, A. (2007). Lexique actif du français: l'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français. De Boeck.
Miller, G. A., Beckwith, R., Fellbaum, C, Gross, D & Miller, K. J. (1990). Introduction to WordNet: An On-line Lexical Database. International Journal of Lexicography, 3(4), 235–244. https://doi.org/10.1093/ijl/3.4.235
Montémont, V. (2020). De Frantext 1 à Frantext 2: la cure de jouvence d’une vieille dame. En D. Aquino-Weber & Y. Greub (eds.), La lexicographie informatisée: les vocabulaires nationaux dans un contexte européen (pp. 41–66). Académie suisse des sciences humaines et sociales.
Padró, L. & Stanilovsky, E. (2012). FreeLing 3.0: Towards Wider Multilinguality. En N. Calzolari, K. Choukri, T. Declerck, M. U. Doğan, B Maegaard, J. Mariani, A. Moreno, J. Odijk & S. Piperidis (eds.), Proceedings of the Language Resources and Evaluation Conference (LREC 2012). European Language Resources Association. https://nlp.lsi.upc.edu/publications/papers/padro12.pdf
Picallo, M. C. (1999). La estructura del sintagma nominal: las nominalizaciones y otros sustantivos con complementos argumentales. En I. Bosque & V. Demonte (dirs.), Gramática descriptiva de la lengua española (pp. 363–393). Espasa Calpe.
Pierrel, J. M. (2003). Un ensemble de ressources de référence pour l’étude du français: TLFI, FRANTEXT et le logiciel STELLA. Revue québécoise de linguistique, 32, 155–176. https://doi.org/10.7202/012248ar
Riegel M., Pellat, J.C. & Rioul, R. (2009). Grammaire méthodique du français. Presses Universitaires de France.
Rigau, G. (1999). La estructura del sintagma nominal: los modificadores del nombre. En I. Bosque & V. Demonte (dirs.), Gramática descriptiva de la lengua española (pp. 311–362). Espasa Calpe.
Sagot, B. & Fišer, D. (2008). Building a free French wordnet from multilingual resources. En N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis & D. Tapias (eds.), Proceedings of the Sixth International Language Resources and Evaluation (LREC’08). European Language Resources Association. https://inria.hal.science/inria-00614708/document
Stage, L. (1994). La valence des noms en français, En M. Herslund (ed.), Noun Phrase Structures (pp. 93–131). Samfundslitteratur.
Stage, L. (1997). La transposition des actants dans le syntagme nominal. Étude sur la nominalisation nucléaire et l’emploi des prépositions. Revue Romane, 32(1), 51–86.
Tesnière, L. (1959). Éléments de syntaxe structurale. Klincksieck.
Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En M.ª J. Domínguez Vázquez & S. Kutscher (eds.), Interacción entre gramática, didáctica y lexicografía (pp. 193–207). De Gruyter. https://doi.org/10.1515/9783110420784-015
Valcárcel Riveiro, C. & Pino Serrano, L. (2023). Application d’une méthodologie d’analyse des prédicats nominaux: l’exemple du lexème ᴍᴏʀᴛ1. Çédille. Revista de estudios franceses, 24 (en prensa).
Vossen, P. (ed.) (1999). EuroWordNet. General Document 1, Final. University of Amsterdam. https://archive.illc.uva.nl/EuroWordNet/docs/GeneralDocDOC.zip
Wilmet, M. (1997). Grammaire critique du français. Duculot.
Publicado
Número
Sección
Licencia
Derechos de autor 2023 Carlos Valcárcel Riveiro
Esta obra está bajo una licencia internacional Creative Commons Atribución 4.0.
1. Política propuesta para revistas que ofrecen acceso abierto
Aquellos autores/as que tengan publicaciones con esta revista, aceptan los términos siguientes:
- Los autores/as conservarán sus derechos de autor y garantizarán a la revista el derecho de primera publicación de su obra, el cual estará simultáneamente sujeto a la Licencia de reconocimiento de Creative Commons que permite a terceros compartir la obra siempre que se indique su autor y su primera publicación en esta revista.
- Los autores/as podrán adoptar otros acuerdos de licencia no exclusiva de distribución de la versión de la obra publicada (p. ej.: depositarla en un archivo telemático institucional o publicarla en un volumen monográfico) siempre que se indique la publicación inicial en esta revista.
- Se permite y recomienda a los autores/as difundir su obra a través de Internet (p. ej.: en archivos telemáticos institucionales o en su página web) antes y durante el proceso de envío, lo cual puede producir intercambios interesantes y aumentar las citas de la obra publicada. (Véase El efecto del acceso abierto).