Tools and Difficulties in the Analysis of the French Noun Phrase for Computational Processing

Authors

  • Carlos Valcárcel Riveiro Universidad de Vigo
  • Laura Pino Serrano Universidade de Santiago de Compostela

DOI:

https://doi.org/10.17561/rilex.6.3.8392

Keywords:

French, Tools, Resources, Lexicography, NLP

Abstract

This paper presents the work carried out on the French language within the multilingual lexicographic portal PORTLEX. In particular, the article focuses on the tools used by the teams working on French in three research projects: the PORTLEX dictionary and the development of prototypes for the automatic generation of noun phrases within MultiGenera and MultiComb projects. The resources used are described in detail, distinguishing between reference tools (dictionaries, grammars) and computational tools (corpora, databases). In addition, the main difficulties associated with the use of each tool or resource are described and the choices made to resolve or minimise them are explained.

Downloads

Download data is not yet available.

References

Abeillé, A. & Godard, D. (dirs.) (2021). La grande grammaire du français. Actes Sud.

Alonso-Ramos, M. (2004). Diccionario de colocaciones del español (DICE). http://www.dicesp.com/paginas

Alonso-Ramos, M. (2017). Diccionarios combinatorios. Estudios de Lingüística del Español, 38, 173–201. https://doi.org/10.36950/elies.2017.38.8651

Barrios Rodríguez, M. A. (2010). El dominio de las funciones léxicas en el marco de la Teoría Sentido-Texto. Estudios de Lingüística del español (ELiEs), 30. http://elies.rediris.es/elies30/index30.html

Blanco, X. (1997). De las clases de objetos a las clases de predicados. Verba, 24, 371–385.

Blanco, X. (1999). Lexicographie bilingue français-espagnol et classes d'objets. Universitat Autònoma de Barcelona.

Cerquiglini, B. (dir.) (1999). Femme, j’écris ton nom… Guide d’aide à la féminisation des noms de métiers, titres, grades et fonctions. Centre National de la Recherche Scientifique & Institut de la Langue Française. https://medias.vie-publique.fr/data_storage_s3/rapport/pdf/994001174.pdf

Charaudeau, P. (1992). Grammaire du sens et de l'expression. Hachette-Éducation.

Condette, M. H., Marín, R. & Merlo, A. (2012). La structure argumentale des noms déverbaux: du corpus au lexique et du lexique au corpus. En F. Neveu, V. M. Toke, P. Blumenthal, T. Klingler, P. Ligas, S. Prévost & S. Teston-Bonnard (eds.), Actes du 3ème Congrès Mondial de Linguistique Française, Lyon, France, 4-7 juillet 2012 (pp. 845–858). SHS Web of conferences. https://doi.org/10.1051/shsconf/20120100271.

Dendien, J. (2020). Le TLFi Trésor de la langue française informatisé. Analyse et traitement informatique de la langue française. http://atilf.atilf.fr/tlfv3.htm

Domínguez Vázquez, M.ª J. (2011). Kontrastive Grammatik und Lexikographie: spanisch-deutsches Wörterbuch zur Valenz des Nomens. Iudicium

Domínguez Vázquez, M.ª J. (2018). Was sind Valenzwörterbücher? Sprachwissenschaft, 43(3), 309–342.

Domínguez Vázquez, M.ª J., Bardanca Outeiriño, D. & Simões, A. (2021). Automatic Lexicographic Content Creation: Automating Multilingual Resources Development for Lexicographers. En I. Kosem, M. Cukr, M. Jakubíček, J. Kallas, S. Krek & C. Tiberius (eds.), Post-editing Lexicography – Elex 2021. Proceedings of the eLex 2021 conference (pp. 269–287). European Lexicographic Infrastructure. https://elex.link/elex2021/wp-content/uploads/eLex_2021-proceedings.pdf

Domínguez Vázquez, M.ª J., Solla Portela, M. A. & Valcárcel Riveiro, C. (2019). Resources interoperability: exploiting lexicographic data to automatically generate dictionary examples. En I. Kosem, T. Zingano Kuhn, M. Correia, J. P. Ferreira, M. Jansen, I. Pereira, J. Kallas, M. Jakubíček, S. Krek, C. Tiberius (eds.), Electronic lexicography in the 21st century. Proceedings of the eLex 2019 conference. 1-3 October 2019, Sintra, Portugal (pp. 51–71). Lexical Computing CZ, s.r.o.

Domínguez Vázquez, M.ª J. & Valcárcel Riveiro, C. (2020). PORTLEX as a multilingual and cross-lingual online dictionary. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Riveiro (eds.), Studies on multilingual lexicography (pp. 135–158). De Gruyter. https://doi.org/10.1515/9783110607659-008

Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Bardanca Outeiriño, D. (2021), Ontología léxica. Santiago de Compostela. http://portlex.usc.gal/ontologia

Domínguez Vázquez, M.ª J., Valcárcel Riveiro, C. & Lindemann, D. (2018). Multilingual Generation of Noun Valency Patterns for Extracting Syntactic-Semantical Knowledge from Corpora (MultiGenera). En J. Čibej, V. Gorjanc, I. Kosem & S. Krek (eds.), Proceedings of the XVIII EURALEX International Congress: Lexicography in Global Contexts, Ljubljana, Slovenia (pp. 847–854). Ljubljana University Press.

Engel, U. (2004). Deutsche Grammatik – Neubearbeitung. Iudicium.

Gómez Guinovart, X. & Solla Portela, M. A. (2018). Building the Galician WordNet: methods and applications. Language Resources & Evaluation 52(1), 317–339. https://doi.org/10.1515/9783110607659-010

Gómez Guinovart, X. & Solla Portela, M. A. (2020). Construction of a WordNet-based multilingual lexical ontology for Galician. En M.ª J. Domínguez Vázquez, M. Mirazo Balsa & C. Valcárcel Riveiro (eds.), Studies on multilingual lexicography (pp. 179–196). De Gruyter.

Grevisse, M. & Goosse, A. (2008). Le bon usage. Grammaire française. De Boeck-Duculot.

Gross, G. (1991). Syntaxe du complément de nom. Linguisticae Investigationes, 15, 255–284. https://doi.org/10.1075/li.15.2.02gro

Gross, G. (2002). Analyse de compléments du nom en termes de classes d’objets. Le français moderne, 70(2), 187–209.

Gross, G. (2004). Réflexions sur le traitement automatique des langues. En G. Purnelle, C. Fairon & A. Dister (eds.), Le Poids des mots. Actes des 7es Journées internationales d’Analyse Statistique des Données Textuelles (JADT 2004) (545–556). Presses Universitaires de Louvain.

Gross, G. (2008). Les classes d’objets. Lalies, 28, 111–165.

Gross, G. (2012). Manuel d’analyse linguistique. Presses Universitaires du Septentrion. https://doi.org/10.4000/books.septentrion.115128

Iordanskaja, L., Kim, M. & Polguère, A. (1996). Some Procedural Problems in the Implementation of Lexical Functions for Text Generation. En L. Wanner (ed.), Lexical functions in lexicography and natural language processing (pp. 279–297). John Benjamins.

Jakubíček, M., Kilgarriff, A., Kovář, V., Rychlý, P. & Suchomel, V. (2013). The Tenten Corpus Family. En A. Hardie & R. Love (eds.), Proceedings of the 7th International Corpus Linguistics Conference CL (pp. 125–127). Lancaster University. https://www.sketchengine.eu/wp-content/uploads/The_TenTen_Corpus_2013.pdf

Lazard, G. (1988). Définition des actants dans les langues européennes. En J. Feuillet (ed.), Actance et valence dans les langues de l’Europe (pp. 11–146). Mouton de Gruyter. https://doi.org/10.1515/9783110804485.11

Lazard, G. (1994). L’actance. Presses Universitaires de France.

Lexical Computing (2023a). CQL - Corpus Query Language. Sketch Engine. https://www.sketchengine.eu/documentation/corpus-querying/

Lexical Computing (2023b). Concordance - a tool to search corpus. Sketch Engine. https://www.sketchengine.eu/guide/concordance-a-tool-to-search-a-corpus/

Mel’čuk, I. (1997). Vers une linguistique Sens-Texte. Leçon inaugurale. Collège de France. http://olst.ling.umontreal.ca/pdf/melcukColldeFr.pdf

Mel′čuk, I., Arbatchewsky-Jumarie, N., Iordanskaja, L., Mantha, S. & Polguère, A. (eds.) (1984-1999). Dictionnaire explicatif et combinatoire du français contemporain: recherches lexico-sémantiques I-IV. Presses de l’Université de Montréal. https://doi.org/10.2307/j.ctv69t5n2

Mel′čuk, I., Clas, A. & Polguère, A. (1995). Introduction à la lexicologie explicative et combinatoire. Éditions Duculot.

Mel′čuk, I. & Milićević, J. (2014). Introduction à la linguistique. Volume 1. Éditions Hermann.

Mel′čuk, I. & Polguère, A. (2007). Lexique actif du français: l'apprentissage du vocabulaire fondé sur 20000 dérivations sémantiques et collocations du français. De Boeck.

Miller, G. A., Beckwith, R., Fellbaum, C, Gross, D & Miller, K. J. (1990). Introduction to WordNet: An On-line Lexical Database. International Journal of Lexicography, 3(4), 235–244. https://doi.org/10.1093/ijl/3.4.235

Montémont, V. (2020). De Frantext 1 à Frantext 2: la cure de jouvence d’une vieille dame. En D. Aquino-Weber & Y. Greub (eds.), La lexicographie informatisée: les vocabulaires nationaux dans un contexte européen (pp. 41–66). Académie suisse des sciences humaines et sociales.

Padró, L. & Stanilovsky, E. (2012). FreeLing 3.0: Towards Wider Multilinguality. En N. Calzolari, K. Choukri, T. Declerck, M. U. Doğan, B Maegaard, J. Mariani, A. Moreno, J. Odijk & S. Piperidis (eds.), Proceedings of the Language Resources and Evaluation Conference (LREC 2012). European Language Resources Association. https://nlp.lsi.upc.edu/publications/papers/padro12.pdf

Picallo, M. C. (1999). La estructura del sintagma nominal: las nominalizaciones y otros sustantivos con complementos argumentales. En I. Bosque & V. Demonte (dirs.), Gramática descriptiva de la lengua española (pp. 363–393). Espasa Calpe.

Pierrel, J. M. (2003). Un ensemble de ressources de référence pour l’étude du français: TLFI, FRANTEXT et le logiciel STELLA. Revue québécoise de linguistique, 32, 155–176. https://doi.org/10.7202/012248ar

Riegel M., Pellat, J.C. & Rioul, R. (2009). Grammaire méthodique du français. Presses Universitaires de France.

Rigau, G. (1999). La estructura del sintagma nominal: los modificadores del nombre. En I. Bosque & V. Demonte (dirs.), Gramática descriptiva de la lengua española (pp. 311–362). Espasa Calpe.

Sagot, B. & Fišer, D. (2008). Building a free French wordnet from multilingual resources. En N. Calzolari, K. Choukri, B. Maegaard, J. Mariani, J. Odijk, S. Piperidis & D. Tapias (eds.), Proceedings of the Sixth International Language Resources and Evaluation (LREC’08). European Language Resources Association. https://inria.hal.science/inria-00614708/document

Stage, L. (1994). La valence des noms en français, En M. Herslund (ed.), Noun Phrase Structures (pp. 93–131). Samfundslitteratur.

Stage, L. (1997). La transposition des actants dans le syntagme nominal. Étude sur la nominalisation nucléaire et l’emploi des prépositions. Revue Romane, 32(1), 51–86.

Tesnière, L. (1959). Éléments de syntaxe structurale. Klincksieck.

Valcárcel Riveiro, C. (2017). Las construcciones N1N2 como realizaciones actanciales del sustantivo en francés y su tratamiento en el diccionario multilingüe PORTLEX. En M.ª J. Domínguez Vázquez & S. Kutscher (eds.), Interacción entre gramática, didáctica y lexicografía (pp. 193–207). De Gruyter. https://doi.org/10.1515/9783110420784-015

Valcárcel Riveiro, C. & Pino Serrano, L. (2023). Application d’une méthodologie d’analyse des prédicats nominaux: l’exemple du lexème ᴍᴏʀᴛ1. Çédille. Revista de estudios franceses, 24 (en prensa).

Vossen, P. (ed.) (1999). EuroWordNet. General Document 1, Final. University of Amsterdam. https://archive.illc.uva.nl/EuroWordNet/docs/GeneralDocDOC.zip

Wilmet, M. (1997). Grammaire critique du français. Duculot.

Published

2023-12-18

How to Cite

Tools and Difficulties in the Analysis of the French Noun Phrase for Computational Processing. (2023). RILEX. Revista Sobre Investigaciones léxicas, 6(3), 107-138. https://doi.org/10.17561/rilex.6.3.8392