Cantero Romero, M.ª V. (2025). El léxico ELE en los modelos de lenguaje. RILEX. Revista sobre investigaciones léxicas, 8/I. pp. 155-185
María Victoria Cantero Romero
Universidad de Jaén
RESUMEN
Este trabajo se encuentra enmarcado en el vocabulario generado por los grandes modelos de lenguaje como ChatGPT, y en concreto, en el especializado en español como lengua extranjera. Para ello, se le ha solicitado a dos grandes modelos de lenguaje, ChatGPT y LlaMa que genere textos de comprensión escrita para estudiantes de nivel de español desde A1 hasta B2. Para ello, es necesario el uso de una entrada específica que genere la respuesta más cercana a nuestra finalidad. Tras la petición, se han analizado las muestras siguiendo las referencias del apartado de nociones específicas del Plan Curricular del Instituto Cervantes (2006). Asimismo, se ha realizado una comparación entre ambos modelos, esperando encontrar diferencias entre las respuestas proporcionadas. Con este análisis, hemos querido comprobar si las muestras textuales generadas siguen los estándares del Plan Curricular del Instituto Cervantes (2006) con respecto al vocabulario. En conclusión, se ha comprobado que los modelos de lenguaje pueden ser de utilidad para la elaboración de materiales didácticos, no obstante, requieren de una revisión manual.
Palabras clave: Español Lengua Extranjera (ELE), vocabulario, comprensión lectora, modelos de lenguaje.
ABSTRACT
This work is framed in the vocabulary generated by large language models such as ChatGPT, and specifically, in the one specialized in Spanish as a foreign language. For this purpose, two large language models, ChatGPT and LlaMa, have been asked to generate written comprehension texts for students of Spanish level from A1 to B2. For this purpose, it is necessary to use a specific input that generates the closest response to our purpose. After the request, the samples have been analyzed following the references of the specific notions section of the Plan Curricular del Instituto Cervantes (2006). Likewise, a comparison has been made between both models, hoping to find differences between the answers provided. With this analysis, we wanted to check whether the textual samples generated follow the standards of the Plan Curricular del Instituto Cervantes (2006) with respect to vocabulary. In conclusion, it has been proven that language models can be useful for the development of teaching materials, however, they require manual revision.
Keywords: Spanish Foreign Language (SFL), vocabulary, reading comprehension, language models.
Recibido: 07-10-2024
Aceptado: 22-11-2024
DOI: https://doi.org/10.17561/rilex.8.1.9235
El estudio del vocabulario en la enseñanza de español como lengua extranjera (ELE) ha sido un área de interés clave para los docentes, quienes buscan optimizar el proceso de adquisición léxica en los estudiantes. En este sentido, la Inteligencia Artificial (IA), y más específicamente los Grandes Modelos de Lenguaje (LLMs), se presentan como una herramienta valiosa para el diseño de actividades y la mejora de las competencias comunicativas en el aula de ELE.
La irrupción de ChatGPT en diciembre de 2022 supuso un hito significativo en el ámbito del procesamiento del lenguaje natural y su impacto se ha hecho sentir también en el campo de la enseñanza de idiomas (Jiménez Linares, López-Gómez, Martín-Baos, Romero & Serrano-Guerrero, 2023, p. 113). Este modelo ha comenzado a ser utilizado por docentes como recurso para la creación de actividades (Fredholm, 2024, p. 8), aunque su uso entre los estudiantes ha planteado desafíos, al ser empleado en algunos casos como un sustituto del esfuerzo personal en la producción escrita.
Este artículo parte de una experiencia en la que un grupo de estudiantes de ELE utilizó ChatGPT para redactar sus tareas sin participar activamente en el proceso de escritura. Tras observar que el nivel de vocabulario empleado superaba el esperado para su nivel de competencia lingüística, se identificó la necesidad de investigar el papel de la IA en la enseñanza del español, particularmente en el ámbito del vocabulario y la adecuación a los niveles establecidos por el Plan Curricular del Instituto Cervantes (PCIC).
En particular, este estudio se enfocará en la evaluación del vocabulario generado por los LLM en textos diseñados para la comprensión lectora en niveles A1/A2 y B1/B2. El estudio del léxico en estos niveles es esencial, ya que el dominio de un vocabulario adecuado es un componente central en el desarrollo de la competencia lingüística de los estudiantes de ELE (Moreno Villanueva, 2021, p. 14). La adecuación de los textos a los niveles de los estudiantes no solo garantiza una progresión efectiva en el aprendizaje, sino que también permite a los estudiantes enfrentarse a textos que reflejan de manera realista el uso del español en distintos contextos comunicativos (Bartol Hernández, 2010, p. 85). Asimismo, es importante la realización de un estudio de los textos de comprensión lectora, ya que se trata de una competencia básica (Núñez Delgado & Rodríguez Guerrero, 2017, p. 34). Como nos indican Muñoz-Basols y Fuertes Gutiérrez (2024, p. 351) las herramientas de IA nos pueden facilitar la evaluación del progreso en la adquisición del vocabulario.
Sin embargo, es necesario que los textos generados sean revisados cuidadosamente para asegurar que respetan los principios lingüísticos y pedagógicos adecuados para la enseñanza del español (Ribes-Lafoz & Navarro Colorado, 2023, pp. 1264-1265). En este sentido, el análisis del vocabulario en los textos generados por IA permitirá determinar si estos modelos pueden ser una herramienta útil en la creación de actividades didácticas que refuercen las competencias lingüísticas de los estudiantes.
Por tanto, el presente estudio no solo busca explorar la viabilidad del uso de LLM en la enseñanza de ELE, sino también aportar nuevas perspectivas sobre cómo la IA puede contribuir al estudio del vocabulario en contextos de aprendizaje de lenguas. La adecuada integración de estas tecnologías en el aula no solo puede optimizar el trabajo docente, sino también enriquecer la experiencia de los estudiantes, motivándolos a interactuar de manera más efectiva con el español como lengua extranjera.
La primera cuestión se enfoca en el vocabulario generado por ChatGPT y LlaMa en función de los niveles de competencia de los estudiantes. ¿Cómo se relaciona la calidad y complejidad del vocabulario proporcionado por ChatGPT y LlaMa con los niveles de competencia lingüística de los estudiantes de ELE? Esta pregunta implica examinar la calidad y complejidad del vocabulario proporcionado por la IA en relación con los niveles de aprendizaje de español como lengua extranjera. Se evaluará si las palabras y expresiones seleccionadas son adecuadas para facilitar la comprensión y adquisición de léxico, fomentando un aprendizaje progresivo y ajustado a las necesidades de cada nivel.
A continuación, nos cuestionamos si el vocabulario y las estructuras generadas por los modelos de lenguaje están alineados con los descriptores y directrices del Plan Curricular del Instituto Cervantes para los niveles A1-B2. Se analizará la correspondencia entre el léxico generado, los descriptores oficiales y los conocimientos de nuestro alumnado, garantizando que los términos sean adecuados para los niveles de competencia A1-B2 y respeten los criterios pedagógicos establecidos para la enseñanza del español como lengua extranjera.
Como última pregunta de investigación, nos planteamos ¿Cuál es el impacto de los modelos de lenguaje en el aprendizaje del español como lengua extranjera en términos de generación de materiales didácticos, adaptación a las necesidades del aula y motivación de los estudiantes? Para dar respuesta a esta cuestión se explorará la efectividad de los modelos para generar materiales didácticos útiles, adaptados y motivadores que faciliten el aprendizaje y la participación activa de los estudiantes, y se medirá su impacto en el aula de ELE.
En esta sección abordaremos varios aspectos clave. En primer lugar, se describirán los modelos de lenguaje utilizados en el estudio. A continuación, se ofrecerá una breve explicación de las nociones específicas del Plan Curricular del Instituto Cervantes.
Para este estudio, realizamos una comparación entre dos modelos de generación de texto: ChatGPT (versión GPT-3.5) desarrollado por OpenAI, y LLaMA (versión 3.1.8b) desarrollado por Meta AI. Ambos modelos, basados en la arquitectura Transformer, utilizan mecanismos de autoatención para procesar y generar lenguaje natural, simulando la producción textual humana.
La elección de ChatGPT se justificó no solo por su facilidad de uso, sino también por su amplio alcance: en abril de 2024, ChatGPT contaba con 180.5 millones de usuarios activos (ChatGPT: Usuarios y Estadísticas, 2024), lo que evidencia su relevancia y adopción global. Elegido por su accesibilidad y popularidad entre usuarios de diferentes ámbitos, incluidos docentes y estudiantes. Este modelo ha ganado reconocimiento por su capacidad para generar textos coherentes y realistas, sin necesidad de instalación o descarga, lo que facilita su implementación en contextos educativos (Ribes-Lafoz & Navarro Colorado, 2023, pp. 1264-1265).
Por otro lado, LLaMA es un modelo diseñado como una herramienta de investigación para optimizar el rendimiento de los grandes modelos de lenguaje. LLaMA se seleccionó por su eficiencia en la generación de texto con menos parámetros y su capacidad para analizar el lenguaje de manera precisa (Fernández, 2023).
A continuación, vamos a exponer un resumen de las nociones específicas de los niveles de A1 hasta B2 que encontramos en el Plan Curricular del Instituto Cervantes (2006). Estas nociones específicas son los componentes relacionados con el significado.
En el nivel A1, encontramos los siguientes apartados con ejemplos:
1. Individuo: dimensión física, esta dimensión se refiere a las descripciones físicas de las personas, su cuerpo y su estado de salud. En el nivel A1, los estudiantes aprenden vocabulario relacionado con las partes del cuerpo, como cabeza, pierna, brazo, así como expresiones simples para hablar del estado físico de las personas, como estar cansado o tener hambre. Esto permite a los estudiantes describir a otros o a sí mismos en términos básicos.
2. Individuo: dimensión perceptiva y anímica, en este ámbito, los estudiantes aprenden a hablar sobre sus emociones y percepciones. En el nivel A1, se introducen palabras básicas para describir estados de ánimo, como feliz, triste, enfadado o nervioso. También se cubren expresiones relacionadas con los cinco sentidos, como ver, oír, sentir, lo que permite a los estudiantes expresar sus experiencias sensoriales de manera sencilla.
3. Identidad personal: este apartado se centra en la capacidad de los estudiantes para hablar sobre sí mismos de manera básica. En el nivel A1, los estudiantes aprenden a dar información personal como su nombre, edad, nacionalidad, y ocupación. También se introducen los términos necesarios para hablar sobre aspectos de la vida personal como el estado civil (soltero, casado) y la dirección de residencia. El objetivo es que puedan presentarse y proporcionar detalles esenciales en interacciones cotidianas.
4. En cuanto a las relaciones personales, el vocabulario cubre los términos más comunes para referirse a miembros de la familia (padre, madre, hermano), amigos y conocidos. Los estudiantes aprenden a describir relaciones básicas y a hablar de su círculo social utilizando frases sencillas. Además, pueden describir la relación que tienen con personas en contextos formales e informales.
5. Alimentación: este apartado aborda todo lo relacionado con la comida y las bebidas. En el nivel A1, los estudiantes aprenden los nombres de alimentos básicos, como pan, agua, carne, fruta, así como verbos esenciales como comer y beber. También se introducen estructuras para pedir comida en un restaurante o describir una comida diaria. Esta área es fundamental para desenvolverse en contextos como ir a un restaurante o hacer la compra.
6. El ámbito educativo se enfoca en proporcionar el vocabulario básico para hablar sobre las instituciones académicas, las asignaturas y las actividades en el aula. En el nivel A1, los estudiantes aprenden palabras como profesor, clase, examen y deberes. Esto les permite hablar sobre su experiencia en el aula y su vida académica de manera sencilla, facilitando la descripción de actividades como estudiar, aprender y hacer un examen.
7. Trabajo: en este apartado, se introducen nociones relacionadas con las profesiones más comunes y las acciones vinculadas al trabajo. Los estudiantes aprenden a describir su ocupación con palabras como médico, profesor, taxista y estructuras básicas como trabajar en o ser. Además, pueden hablar sobre situaciones laborales, como tener trabajo o estar en paro proporcionando el vocabulario esencial para describir su situación laboral.
8. El vocabulario relacionado con el ocio cubre una amplia gama de actividades recreativas, desde deportes hasta entretenimiento cultural. En el nivel A1, los estudiantes aprenden a hablar de actividades como ver una película, leer un libro, escuchar música y viajar. Esto les permite describir cómo pasan su tiempo libre y hablar sobre planes y preferencias recreativas de manera básica.
9. Información y medios de comunicación: este apartado, se introduce el vocabulario necesario para hablar de los medios de comunicación, como televisión, radio, teléfono y correo electrónico. Los estudiantes también aprenden a describir acciones como ver la televisión, leer el periódico o escribir un mensaje electrónico. Esto les proporciona las herramientas lingüísticas para interactuar con medios de comunicación en contextos cotidianos.
10. El vocabulario relacionado con la vivienda incluye los tipos de residencias y las partes de una casa. En el nivel A1, los estudiantes aprenden a describir su hogar con palabras como casa, piso, habitación, cocina y baño. También se introduce vocabulario relacionado con la compra y el alquiler de viviendas, lo que les permite hablar sobre el tipo de lugar donde viven y las características de este.
11. En el ámbito de los servicios, los estudiantes aprenden términos relacionados con el correo, los bancos, y los servicios médicos. Palabras como carta, sello, banco, dinero, hospital y policía son esenciales en este nivel para que los estudiantes puedan desenvolverse en situaciones cotidianas como enviar una carta o visitar al médico.
12. Compras, tiendas y establecimientos. Este apartado se centra en las interacciones comerciales más básicas, como comprar en una tienda. Los estudiantes aprenden vocabulario relacionado con tiendas (mercado, supermercado, tienda) y productos comunes, como pantalones, camisa, precio, dinero. Esto les permite realizar compras sencillas y describir lo que necesitan o desean adquirir.
13. En el área de la salud, los estudiantes aprenden a describir su estado físico, como estar enfermo o tener fiebre. También adquieren vocabulario relacionado con el cuidado personal y la higiene, como lavarse las manos, bañarse y ducharse. Este vocabulario es crucial para describir situaciones relacionadas con la salud y el bienestar.
14. Viajes, alojamiento y transporte: en este ámbito, se introduce el vocabulario relacionado con los viajes, el transporte y el alojamiento. Palabras como aeropuerto, tren, autobús, hotel y billete son esenciales para que los estudiantes puedan describir y entender situaciones de viaje. También se cubren actividades comunes como comprar un billete o viajar en avión.
15. El vocabulario económico básico incluye términos como dinero, precio, tarjeta, cambiar dinero. En este nivel, los estudiantes aprenden a describir transacciones comerciales sencillas, como pagar en una tienda o cambiar dinero en un banco.
16. Ciencia y tecnología. Este apartado introduce términos básicos relacionados con la tecnología y la informática, como ordenador, Internet, programa y navegar por Internet. También se cubre el vocabulario necesario para describir acciones sencillas en el ámbito de la tecnología, como enviar un correo electrónico o usar un portátil.
17. Gobierno, política y sociedad. En este ámbito, se cubren nociones relacionadas con las instituciones políticas y el gobierno, como país, capital, presidente, rey, reina. Los estudiantes aprenden a describir su lugar de origen y a reconocer las estructuras políticas más básicas.
18. Actividades artísticas. Este apartado se centra en las actividades culturales, como el cine, la música y las exposiciones de arte. Los estudiantes aprenden palabras como película, concierto, museo, teatro y pueden describir sus preferencias artísticas o hablar de una actividad cultural que les interese.
19. Religión y filosofía. Aquí, el vocabulario se relaciona con las principales religiones, como cristiano, judío, musulmán, y los lugares de culto, como iglesia, mezquita y sinagoga. Esto permite a los estudiantes describir su religión o referirse a aspectos culturales religiosos básicos.
20. Geografía y naturaleza. El vocabulario geográfico cubre palabras como país, ciudad, montaña, río, playa, mapa. Los estudiantes aprenden a describir ubicaciones geográficas y características naturales básicas, lo que les permite hablar de su entorno y su contexto geográfico de manera sencilla.
En el nivel A2, en el apartado de nociones específicas encontramos:
1. Individuo: Dimensión física, se incluyen partes del cuerpo más detalladas como espalda, estómago, oído. También se describen características físicas sencillas como ser calvo y llevar gafas.
2. Individuo: Dimensión perceptiva y anímica, se utilizan adjetivos para describir la personalidad, tales como optimista, reservado, nervioso. En cuanto a los estados anímicos, se incluyen expresiones como estar preocupado y odiar algo.
3. Identidad personal: se abordan aspectos de la identidad personal más completos, como apellidarse y tener la nacionalidad. Además, se mencionan objetos personales como agenda, maletín.
4. Relaciones personales: se amplía el vocabulario relacionado con la familia, incluyendo términos como hijo único, exmarido. También se abordan las relaciones laborales con términos como socio, compañero de trabajo.
5. Alimentación: se presentan comidas más complejas, como merluza, gambas, pasta. También se incluyen bebidas comunes como zumo de naranja, lata o relacionadas como tener sed.
6. Educación: se mencionan asignaturas escolares como Matemáticas, Historia, Medicina. Además, se incluyen actividades académicas como repasar un ejercicio, memorizar, aprobar.
7. Trabajo: se amplía el vocabulario de profesiones con términos como dependiente, funcionario. También se incluyen actividades laborales comunes, como contestar el teléfono, preparar una factura.
8. Ocio: se mencionan actividades recreativas como ir de paseo, ir de compras, tener una cita. Además, se incluyen deportes como montar en bicicleta o jugar a las cartas.
9. Información y medios de comunicación: se incluyen medios de comunicación más amplios como navegar por Internet, hablar/llamar por teléfono. También se abordan formas de comunicación escrita, como escribir una carta, enviar un mensaje electrónico.
10. Vivienda: se mencionan tipos de viviendas más específicos como chalé, piso de estudiantes, propietario. También se describen condiciones de vivienda como piso amueblado, en buen estado.
11. Servicios: se incluyen servicios adicionales como Cruz Roja, Seguridad Social. Además, se mencionan servicios financieros, como cajero automático.
12. Compras, tiendas y establecimientos: se abordan tiendas especializadas como frutería, carnicería, panadería. También se mencionan productos comunes como ropa de hombre, ropa de mujer, bolsos. Y pagos como dejar propina, con IVA.
13. Salud e higiene: se incluyen enfermedades y dolencias como tener alergia, doler la espalda. También se abordan aspectos de la higiene personal, como cepillarse los dientes, peinarse.
14. Viajes, alojamiento y transporte: se presentan tipos de alojamiento como media pensión, pensión completa. Además, se mencionan tipos de transporte como ciclista, coger un taxi, coger el avión.
15. Economía e industria: se mencionan transacciones cotidianas como pagar en efectivo, publicidad. También se incluyen tipos de empresa, como fábrica, negocio, despacho.
16. Ciencia y tecnología: se incluyen tecnologías más avanzadas como informática, navegar por internet, virus. También se mencionan acciones relacionadas con matemáticas.
17. Gobierno, política y sociedad: se incluyen instituciones políticas como gobierno, ministro, ayuntamiento. Además, se mencionan términos relacionados con la comunidad, como vecino, ciudadano.
18. Actividades artísticas: se abordan aspectos del arte, incluyendo museo, exposición, monumento. También se incluyen géneros musicales como flamenco, rock, pop.
19. Religión y filosofía: se incluyen prácticas religiosas como ir a la iglesia, celebrar Navidad.
20. Geografía y naturaleza: se mencionan elementos naturales como árbol, flor, pino. También se incluyen términos relacionados con el clima, como lluvia, nieve, sol.
Para el nivel B1, el Plan Curricular del Instituto Cervantes nos indica lo siguiente:
1. Individuo: Dimensión física en el nivel B1, los estudiantes aprenden términos relacionados con partes del cuerpo como músculo, hueso, piel, corazón, pulmón, cuello, hombros, pecho, cintura, barriga, rodilla, tobillo, codo, muñeca, frente, mejilla, barbilla, ceja y pestaña.
2. Individuo: Dimensión perceptiva y anímica, se trabajan conceptos emocionales y actitudinales como el optimismo, pesimismo, tranquilidad, paciencia, sinceridad, sentido del humor, alegría, admiración, alivio, emoción, felicidad, orgullo, angustia, enfado, temor, tristeza. Estas emociones y actitudes permiten a los estudiantes expresarse con mayor profundidad en contextos cotidianos y personales.
3. Identidad personal: se introducen nociones relacionadas con la identidad y el estado civil, como cambiar de nombre, llamar por el nombre o apellido, tratar de tú o usted, vivir en las afueras o en el centro, recién nacido, anciano, varón, hembra, boda civil o religiosa, divorcio y separación.
4. Relaciones personales: los términos relacionados con las relaciones familiares y personales incluyen madre soltera, niño adoptado, convivir con la pareja, discutir con los padres, cónyuge, cuñado, suegro, yerno, nuera, familiar cercano o lejano, familia numerosa, educar a un hijo, tener novio o pareja, salir con alguien, ligar.
5. Alimentación: se abordan conceptos como alimentación sana y equilibrada, calorías, proteínas, alimentos sin conservantes, bajo en calorías, productos frescos o congelados, marisco, lentejas, guisantes, leche entera o descremada, chuleta de cerdo, aceite de oliva, freír, hervir y cocer.
6. En el ámbito educativo, los estudiantes aprenden vocabulario como colegio público o privado, guardería, curso elemental, educación primaria y secundaria, asignatura obligatoria, matrícula, beca, asignatura trimestral, curso de formación continua, hacer un intercambio, examen, hacer un control y corregir un examen.
7. Los términos relacionados con el mundo laboral incluyen director de RRHH, empleado de banca, sustituto, trabajar para una empresa, tener un empleo en la administración, bufete, taller, casco, botas, hacer un pedido, trabajar en equipo, firmar un contrato, negociar un contrato y despedir.
8. Se introducen actividades de ocio como ir de camping, hacer turismo, inscribirse en un club, tener tiempo libre, salir de copas, ser aficionado a, coleccionar sellos, fiesta de disfraces, parque temático, espectador, galería de arte, poner una película y hacer cola.
9. Información y medios de comunicación: este campo abarca términos como medios de comunicación, dar información, estar informado, buzón, destinatario, carta formal o personal, contestador automático, llamada, línea telefónica, hacer una llamada, periodismo, titular y suscribirse a un periódico.
10. Los términos relacionados con la vivienda incluyen casero, propietario, visitar un piso, pagar el alquiler, pagar el recibo de la luz, empresa de mudanzas, hacer una mudanza, bloque de pisos, vivienda de alquiler, portero, administrador y buena o mala distribución.
11. En el ámbito de los servicios, los estudiantes aprenden vocabulario como cartero, buzón de correos, giro postal, cuenta corriente, cheques de viaje, ingresar dinero, pedir un préstamo, clínica, urgencias, vigilante, policía municipal y seguridad ciudadana.
12. El vocabulario de compras incluye términos como salida de emergencia, descuento, garantía, rebajas, establecimiento, cliente, consumidor, ropa de verano, zapatos planos, coser, que la ropa quede bien o mal, carro de la compra y producto natural.
13. Salud e higiene: se introducen conceptos relacionados con la salud, como seguro médico, tener fiebre, estar sano, diagnóstico, ataque al corazón, enfermedad leve o grave, contagiarse, perder el apetito, quemadura, corte, tener cicatriz, adelgazar, estar mareado, tener náuseas y hacerse una revisión.
14. El vocabulario de viajes incluye términos como equipaje, cambiar un billete, hacer turismo, viaje de trabajo, registrar las maletas, hostal, tienda de campaña, albergue, habitación completa, consigna, autovía y autopista de peaje.
15. Economía e industria: en este campo, los términos incluyen cuenta bancaria, pedir un crédito, ingresar dinero, talonario de cheques, pagar a plazos, presupuesto, hacer una transferencia, cobrar un cheque, hipoteca y caja fuerte.
16. El vocabulario tecnológico abarca términos como ratón, programa, antivirus, consultar una página web, descargar un archivo, abrir una cuenta de correo, adjuntar un documento y virus informático.
17. Gobierno, política y sociedad, los estudiantes aprenden nociones relacionadas con la burocracia y el gobierno, como DNI, pasaporte, documento caducado, funcionario, burocracia y tener validez.
18. Se trabajan conceptos artísticos como galería de arte, función de teatro, representación teatral, espectáculo deportivo, estrenar y cancelar un espectáculo.
19. Los términos religiosos incluyen boda religiosa, misa y ceremonia.
20. En el ámbito de la geografía, se introducen términos como mapa, plano turístico, travesía y ruta.
Por otro lado, con respecto al nivel B2 encontramos lo siguiente:
1. Individuo: dimensión física, encontramos términos como cerebro, hígado, riñón, esqueleto, columna, costilla, nervio, articulación, arteria, tendón. También se incluyen términos sobre las funciones corporales más avanzadas, como respirar, llorar, tocar, besar, abrazar. En cuanto a la postura, se utilizan términos como incorporarse, alzarse, agacharse, cruzar los brazos/las piernas.
2. Individuo: dimensión perceptiva y anímica, se incorporan adjetivos más complejos como arrogante, ambicioso, introvertido, vago, y se exploran emociones más profundas como admiración, alivio, angustia, fascinación, resignación. También se amplía el vocabulario para describir sentimientos con matices, como dar asco/pánico/terror, sentirse animado/agobiado, estar furioso/histérico.
3. Identidad personal: se incluyen términos más detallados como ser virgen, hacer el amor, tener relaciones sexuales, así como aspectos formales de la identidad como Documento Nacional de Identidad (DNI), validez, fecha de expiración. También se consideran aspectos burocráticos como renovar o solicitar documentos.
4. Relaciones personales: se amplía el vocabulario relacionado con la familia y la sociedad, incluyendo términos como familiar cercano/lejano, madre de alquiler, niño probeta, familia adoptiva. En cuanto a las relaciones interpersonales, se incluyen conceptos como tener una relación de amor/trabajo, salir/romper con alguien, tener un romance o una aventura.
5. Alimentación: se introduce vocabulario relacionado con dietas y productos específicos, como producto orgánico, alimento bajo en calorías, rico en proteínas, legumbres, frutos secos. En la preparación de alimentos, se incluyen acciones más complejas como rebozar, rallar, exprimir, dorar la cebolla.
6. Educación: en este nivel se detallan más términos académicos como congreso, seminario, créditos, carrera, máster, doctorado. Se incluye vocabulario relacionado con los estudios universitarios y profesionales, como solicitar una beca, obtener créditos, licenciarse, doctorarse.
7. Trabajo: se amplía el vocabulario laboral con términos como contrato temporal, empleo cualificado, trabajo por cuenta propia/ajena, subir el sueldo, firmar un presupuesto. También se incluyen aspectos más avanzados de la carrera profesional como negociar un contrato, trabajar en equipo, coordinar un departamento.
8. Ocio: en este nivel se incorporan términos más detallados como resolver pasatiempos, organizar una exposición, asistir a una representación teatral, participar en un campeonato. Además, se añaden actividades de ocio más complejas como hacer una marcha, hacer alpinismo.
9. Información y medios de comunicación: vocabulario relacionado con los medios de comunicación más avanzados como editorial, redactor jefe, corresponsal, reportaje, suplemento cultural. También se incluyen términos sobre tecnología de la información como descargarse archivos, participar en una videoconferencia.
10. Vocabulario más específico sobre tipos de viviendas y sus características como vivienda de segunda mano, con buena/mala distribución, bien/mal orientada. También se incluyen términos sobre construcción y reforma, como cemento, ladrillo, reformar una vivienda.
11. Servicios: se incluyen términos más avanzados sobre servicios bancarios y financieros como hipoteca, crédito, talonario de cheques, pedir un préstamo. También se amplía el vocabulario relacionado con servicios de seguridad, como policía municipal, inspector de policía, servicio de vigilancia.
12. Compras, tiendas y establecimientos: se introducen conceptos más avanzados como comprar por catálogo o por Internet, condiciones de financiación, pagar a plazos. En cuanto a la ropa y complementos, se incluyen términos como ropa de temporada, estar pasado de moda, limpiar en seco.
13. Salud e higiene: se incluyen términos relacionados con enfermedades y condiciones médicas más complejas como diabetes, bronquitis, neumonía, depresión, enfermedad terminal. También se amplía el vocabulario sobre tratamientos médicos como hacer una transfusión, escayolar, tener una cicatriz.
14. Viajes, alojamiento y transporte: vocabulario relacionado con tipos de viajes más complejos como viaje oficial, viaje de negocios, turismo de aventura. También se añaden términos relacionados con el transporte como hacer escala, sala de embarque, transporte aéreo.
15. Economía e industria: términos más avanzados de economía como ingresos periódicos, inversor, acciones, abrir una cuenta corriente, solicitar un crédito. También se incluyen términos industriales relacionados con la gestión económica de empresas.
16. Ciencia y tecnología: se amplía el vocabulario científico y tecnológico, incluyendo términos como navegar en Internet, descargar archivos, antivirus, servidor, proveedor de acceso. También se incluyen términos relacionados con la ciencia como ecología, energía renovable.
17. Gobierno, política y sociedad: vocabulario sobre política y sociedad como gobierno, elecciones, ley, votar. Se añaden términos más formales sobre los derechos ciudadanos y la burocracia, como validar documentos, renovar el DNI, hacer trámites.
18. Actividades artísticas: vocabulario relacionado con las artes, incluyendo términos como montar una exposición, organizar un festival, participar en una obra de teatro. También se introducen términos sobre eventos culturales como estrenar, cancelar un espectáculo.
19. Religión y filosofía: se amplía el vocabulario sobre las creencias y religiones con términos como misa, confirmación, bodas de oro/plata, banquete nupcial.
20. Geografía y naturaleza: se añaden términos más avanzados para describir el entorno natural, como escalada de montaña, descenso de barrancos, ecología, energía renovable. También se incluye vocabulario relacionado con la planificación de viajes y el transporte, como recorrer el océano, ruta turística, cruzar fronteras.
Denominamos prompt al texto de entrada que utilizamos para realizar solicitudes a los modelos de lenguaje. Es esencial utilizarlos de manera efectiva a la hora de trabajar con los modelos de lenguaje, para ello hay que tener en cuenta una serie de información que proporcionarle al modelo: una instrucción concreta, un contexto con información complementaria, la pregunta y el tipo de respuesta que buscamos (Giray, 2023, p. 2630).
Teniendo en cuenta esas indicaciones, el prompt utilizado en este estudio sería el siguiente: “Eres un docente de español como lengua extranjera y vas a preparar un texto de comprensión lectora para estudiantes de nivel XX del Marco Curricular del Instituto Cervantes”.
A continuación, presentamos los textos generados por el modelo en respuesta a las consultas realizadas, correspondientes a los niveles de A1 a B2.
Textos de nivel A1. Generado por ChatGPT:
(1) La familia Pérez
La familia Pérez vive en una casa grande en el campo. Los Pérez son cinco: papá, mamá, Marta, Pedro y el perro Toby. Todos los días, papá y Pedro van al trabajo en el campo. Mamá se queda en casa y cuida de Marta, que es una niña pequeña. Toby es un perro muy cariñoso y siempre juega con los niños.
Los Pérez son una familia muy unida. Los domingos les gusta salir juntos a pasear por el campo y disfrutar del aire fresco. A veces, van al río y se bañan todos juntos. Les encanta pasar tiempo en familia y hacer actividades al aire libre.
Un día, los Pérez decidieron hacer una barbacoa en el jardín. Papá encendió el fuego, mamá preparó la comida y Marta y Pedro recogieron leña. Toby estaba muy emocionado y no paraba de mover la cola. Todos se sentaron alrededor de la mesa y disfrutaron de una deliciosa comida al aire libre.
Los Pérez son una familia feliz y siempre están juntos en los momentos importantes. Les gusta compartir momentos especiales y hacer cosas divertidas en familia. (OpenAI, 2024)
Generado por LlaMa:
(2) Hola, soy Lucía. Vivo en Madrid. Me gusta leer libros de aventuras. Mi favorito es “El Quijote” de Miguel de Cervantes. Es un libro muy divertido y emocionante. ¿Sabías que es el libro más antiguo de España? ¡Es verdad! Lo escribió en el siglo XVII. Me gusta leerlo en el parque o en la biblioteca. A veces, me imagino que soy Sancho Panza, el compañero de Don Quijote. ¡Es divertido! (MetaAI, 2024)
Podemos observar que los textos tienen una longitud distinta, siendo el generado los LlaMa menor, con unas 70 palabras y el texto generado por ChatGPT cuenta con unas 186 palabras. Si tomamos de ejemplo la comprensión lectora del Diploma de Español como Lengua Extranjera (DELE), en el nivel A1 tenemos textos de entre 20 y 175 palabras (Instituto Cervantes, 2019, pp. 8-9). Por lo que ambos textos podrían encontrarse dentro de las medidas del DELE, a pesar de que el texto de ChatGPT supere brevemente el número de palabras.
Textos de nivel A2. Generado por ChatGPT:
(3) El Parque Nacional
El Parque Nacional es un lugar hermoso y tranquilo donde la naturaleza es la protagonista. En este parque, los visitantes pueden disfrutar de largas caminatas por senderos rodeados de árboles, cascadas y animales silvestres. También se pueden observar aves exóticas y plantas únicas en su hábitat natural.
Los guardaparques se encargan de proteger y preservar la flora y fauna del parque, así como de mantener limpias las áreas de descanso y los senderos. Además, organizan actividades educativas para enseñar a los visitantes la importancia de cuidar el medio ambiente y respetar la vida silvestre.
Si decides visitar el Parque Nacional, recuerda llevar agua, protector solar y ropa cómoda para disfrutar al máximo de la experiencia. ¡No olvides tu cámara para capturar los momentos más especiales de tu visita! (OpenAI, 2024)
Generado por LlaMa:
(4) Hoy he ido a la playa con mis amigos. El sol brillaba en el cielo. Me puse el protector solar y la gorra para no quemarme. Me gustan las playas con arena blanca y el mar azul. Allí había muchas personas nadando y jugando en el agua.
Me senté en una sombrilla con mis amigos. Comimos sandwiches y bebimos agua. Después de comer, fuimos a nadar. Me gustó mucho el agua fría. Me sentí cansado, así que volví a la sombrilla a descansar. (MetaAI, 2024)
En estas muestras podemos apreciar que el texto generado por LlaMa vuelve a ser el de menor tamaño con unas 83 palabras, frente al generado por ChatGPT con 128 palabras. Si los comparamos con los textos de comprensión lectora del DELE A2, en este, podemos encontrar una variedad de textos de entre 50 y 80 palabras o textos entre 375 y 425 palabras (Instituto Cervantes, 2022, pp. 8-9). Por lo que podemos decir que las muestras de los modelos podrían encajar en los textos de las tareas, siempre que no se tomasen como textos únicos de la tarea, en especial el generado por LlaMa, ya que cuentan con un número menor de palabras.
Textos de nivel B1. Generado por ChatGPT:
(5) La Fiesta de la Vendimia
En el pueblo de Villafranca, cada año se celebra la Fiesta de la Vendimia en honor a la cosecha de uvas. Durante esta festividad, los habitantes del pueblo y visitantes de otras regiones se reúnen para participar en diversas actividades relacionadas con la vendimia.
La fiesta comienza con un desfile de carrozas decoradas con racimos de uvas y personas vestidas con trajes tradicionales. Luego, se lleva a cabo la tradicional pisada de uvas, donde los participantes aplastan las uvas con los pies para extraer el mosto.
Además, hay concursos de cata de vinos, donde los expertos y aficionados prueban diferentes variedades de vino producidas en la región. También se organizan espectáculos de música y baile folclórico para animar la celebración.
La Fiesta de la Vendimia es una oportunidad para disfrutar de la cultura local, degustar deliciosos platos típicos y conocer el proceso de elaboración del vino. ¡Una experiencia única que no te puedes perder! (OpenAI, 2024)
Generado por LlaMa:
(6) Hoy he decidido explorar la ciudad. Me levanté temprano y tomé un café en el bar de la esquina. Después de desayunar, fui al museo de arte para ver la exposición de pinturas del siglo XIX. Me gustó mucho la obra de Velázquez. Me sentí fascinado por la técnica y la creatividad de los artistas.
Luego, me dirigí al parque central para hacer un paseo. El sol brillaba en el cielo y la gente se reía y hablaba en las bancas. Me senté en una de ellas y observé a los niños jugando en el parque. Me recordó a mis propios días de niño.
Después de un rato, decidí ir al centro comercial para hacer algunas compras. Compré un regalo para mi hermana y un libro de historia que había leído horas atrás pero que quería re leer de nuevo. (MetaAI, 2024)
Con respecto a la muestra del nivel B1, podemos destacar que los textos generados por los modelos ChatGPT y LlaMa cuentan con una extensión de 154 y 140 palabras respectivamente. Teniendo de referencia los textos de las tareas de comprensión escrita del DELE B1 (Instituto Cervantes, 2014a, pp. 8-9), estos textos podrían ser utilizados en tareas en las que los alumnos deban leer múltiples textos, ya que se encuadran en la extensión de este tipo de tareas (tarea 3, 100-120 palabras por texto, tres textos en la tarea), sin embargo, se aleja de las tareas que cuentan con un único texto, ya que estas cuentan con un total de 400 y 450 palabras.
Textos de nivel B2. Generado por ChatGPT:
(7) El Arte Urbano: Expresión Creativa en la Ciudad
El arte urbano, también conocido como arte callejero o street art, es una forma de expresión artística que se desarrolla en espacios públicos como calles, paredes y edificios. A través de murales, grafitis, esténciles y otras técnicas, los artistas urbanos transmiten mensajes y emociones al público en general.
Este tipo de arte ha cobrado gran relevancia en las últimas décadas, convirtiéndose en una manifestación cultural y social que transforma el entorno urbano y despierta reflexiones en la sociedad. Muchos artistas urbanos utilizan sus obras para abordar temas como la injusticia social, la diversidad cultural, el medio ambiente y la libertad de expresión.
Además de embellecer las ciudades, el arte urbano invita a la reflexión y promueve el diálogo entre diferentes grupos sociales. Algunas ciudades han promovido el arte urbano como una forma de revitalizar espacios abandonados y fomentar el turismo cultural.
A través del arte urbano, los artistas encuentran una plataforma para expresar sus ideas y conectar con la comunidad de una manera única y directa. ¡Descubre la creatividad y la diversidad del arte urbano en tu ciudad! (OpenAI, 2024)
Generado por LlaMa:
(8) La ciudad de Madrid es la capital de España y es conocida por su rica historia, su arquitectura y su cultura. La ciudad tiene un clima mediterráneo, con veranos cálidos y inviernos suaves. La gente de Madrid es amable y acogedora, y se puede disfrutar de la ciudad en cualquier época del año.
Una de las atracciones turísticas más famosas de Madrid es el Museo del Prado, que alberga obras maestras de pintores como Goya, Velázquez y El Greco. Otro lugar emblemático es el Palacio Real, que ha sido la residencia de la familia real española durante siglos. La noche en Madrid es también muy animada, con bares y restaurantes en los que se puede disfrutar de la música en vivo y la gastronomía local.
Sin embargo, la ciudad también tiene sus problemas, como la contaminación y la congestión del tráfico. Los madrileños están trabajando para reducir el impacto ambiental de la ciudad y hacerla más sostenible. Algunos de los proyectos más interesantes incluyen la creación de espacios verdes en el centro de la ciudad y la implementación de un sistema de transporte público eficiente. (MetaAI, 2024)
Por último, en el nivel B2, si consultamos el número de palabras en las tareas del DELE B2, en tareas en las que se incluye más de un texto, se encuentra entre 130 y 150 palabras por texto, mientras que en las tareas donde hay un único texto, cuenta entre 400 y 450 palabras (Instituto Cervantes, 2014b, pp. 8-9). En las muestras obtenidas por los modelos, ChatGPT nos presenta un texto de 186 palabras y LlaMa un texto de 185 palabras. Ambos textos se encontrarían lejanos a los utilizados en las tareas del DELE de texto único.
Una vez que los modelos nos han proporcionado las distintas muestras textuales, nos disponemos a realizar el análisis de estos con respecto a las nociones específicas del Plan Curricular del Instituto Cervantes.
En el análisis de los textos del nivel A1, podemos observar diferencias entre los producidos por ChatGPT y LlaMa. En primer lugar, el texto generado por ChatGPT contiene un vocabulario simple y acorde con el nivel A1, lo que sugiere un buen ajuste inicial a los requisitos de este nivel. Sin embargo, es importante señalar la presencia de algunos términos y construcciones que superan las competencias esperadas para este nivel. Por ejemplo, el uso de la expresión pasear por el campo se podría clasificar dentro del nivel A2 de acuerdo con el Plan Curricular del Instituto Cervantes (PCIC). De igual manera, el verbo encantar también es propio de un nivel superior, ya que su uso es más complejo que el esperado en A1. Además, es relevante destacar la inclusión de tiempos verbales en pasado, lo cual no corresponde al utilizado en este nivel.
Por otro lado, el texto generado por LlaMa también presenta algunos desajustes en relación con el nivel A1. Aunque se observa una tendencia a utilizar vocabulario sencillo, encontramos el uso del verbo gustar, que según el PCIC se clasifica como propio del nivel A2. Asimismo, en el texto se identifican términos como antiguo, siglo y biblioteca, que no se ajustan adecuadamente al nivel A1, ya que son palabras que requieren un conocimiento léxico más avanzado. Estos términos sugieren un léxico más abstracto y relacionado con conceptos temporales e históricos que normalmente se introducen en niveles posteriores del aprendizaje de una lengua.
Por lo tanto, si bien ambos textos presentan elementos que se ajustan al nivel A1, tanto el generado por ChatGPT como el de LlaMa contienen vocabulario que excede las competencias esperadas para este nivel.
En cuanto a los textos correspondientes al nivel A2, observamos diferencias significativas entre los textos generados por ChatGPT y LlaMa. Por un lado, el texto producido por ChatGPT contiene, en su mayoría, términos que efectivamente se corresponden con el nivel A2, lo que cumple parcialmente con las expectativas para este nivel. No obstante, es importante destacar que también se identifican elementos de vocabulario que exceden las limitaciones de este nivel. Por ejemplo, términos como senderos, cascada, silvestre o aves exóticas se encuentran dentro de un léxico más complejo y podrían catalogarse como propios de niveles superiores debido a la especificidad y el detalle que requieren, tanto en comprensión como en producción.
Por otro lado, el texto generado por LlaMa presenta una estructura más sencilla y ajustada al nivel A2. Se observa un uso predominante de términos más accesibles y frecuentes en dicho nivel, tales como playa, cielo, gustar, nadar o estar cansado. Este tipo de vocabulario es más coherente con los objetivos de un nivel elemental, en el que se espera que los aprendices se familiaricen con palabras y expresiones comunes en contextos cotidianos y de fácil comprensión.
A partir de esta comparación, es posible señalar que, en lo que respecta a la fidelidad con el nivel A2, el texto generado por LlaMa se aproxima de manera más efectiva a las expectativas del nivel que se le ha solicitado. La simplicidad de los términos utilizados en LlaMa refleja una adecuación más precisa a las competencias lingüísticas que se espera que los aprendices adquieran en este estadio del aprendizaje de una lengua extranjera. Por lo tanto, si bien el texto de ChatGPT incluye vocabulario relevante, su nivel de complejidad podría generar dificultades para estudiantes en el nivel A2, lo que sugiere que la generación de textos por parte de este modelo puede requerir ajustes para cumplir de manera más exacta con los objetivos de este nivel.
En el análisis del nivel B1, se destacan diversos aspectos relevantes en los textos generados por ChatGPT y LlaMa. En primer lugar, el texto elaborado por ChatGPT muestra una notable correspondencia con las competencias lingüísticas y gramaticales esperadas para el nivel B1. La mayor parte del vocabulario empleado se ajusta adecuadamente a las exigencias de este nivel, lo que refleja una alineación con los parámetros del PCIC. No obstante, se han identificado algunos términos que podrían ser considerados más avanzados y propios del nivel B2, tales como vendimia, cata de vinos, y el verbo degustar. Estas palabras están asociadas con un vocabulario más especializado y contextos culturales concretos, como el de la gastronomía y el vino, lo que las hace más apropiadas para un nivel superior debido a su complejidad y especificidad.
Por su parte, el texto generado por LlaMa también incorpora varios elementos léxicos y expresiones que se ajustan al nivel B1, como las frases me recordó y me sentí fascinado, que son adecuadas para describir emociones y sensaciones de manera más precisa, acorde con la capacidad expresiva que se espera en este nivel intermedio. Sin embargo, es importante subrayar que el texto de LlaMa incluye vocabulario propio de niveles más básicos, como el nivel A1, con ejemplos como ir al parque. Este tipo de léxico es demasiado elemental y no refleja el grado de complejidad esperado en un texto de nivel B1. Además, se observan términos más cercanos al nivel B2, como exposición de pinturas y expresiones como técnica y creatividad de los artistas, que requieren un conocimiento más abstracto y técnico relacionado con el arte y la cultura, lo que supera la competencia lingüística del nivel B1.
En conclusión, al comparar los textos generados por ChatGPT y LlaMa para el nivel B1, se puede afirmar que el texto de ChatGPT se ajusta más consistentemente a los criterios establecidos por el PCIC, subrayadas en el apartado anterior, podemos observar términos que se encontrarían en el nivel B1 relacionadas con alimentación y actividades artísticas. Aunque ambos textos presentan elementos válidos para el nivel B1, el de ChatGPT muestra una mayor coherencia y uniformidad en el uso del vocabulario, mientras que el texto de LlaMa presenta una fluctuación más notable, al incluir términos que oscilan entre niveles inferiores y superiores a B1, lo que afecta su adecuación a los estándares requeridos para este nivel lingüístico. Al igual que en el texto de ChatGPT, se puede observar los términos de B1 subrayados en el texto generado por LlaMa.
Con respecto al nivel B2, el texto generado por ChatGPT se encuentra más orientado a nivel B2, con términos como arte callejero o un listado de técnicas artísticas como murales, grafitis o esténciles. Con respecto al texto de LlaMa, encontramos también léxico del nivel B2 como la residencia de la familia real durante siglos, sostenible y eficiente.
En ambos textos, encontramos asimismo términos de nivel B1, pero con predominio del nivel B2, por lo que podemos decir que ambos modelos presentan una adecuación con el nivel que se le ha solicitado.
Para analizar la complejidad y la variedad léxica, se ha utilizado la herramienta Textflow, desarrollado por el grupo de Sistemas Inteligentes de Acceso a la Información (s. f). A continuación, presentamos una tabla con los resultados generados:
Como podemos observar en la Tabla 1, con respecto a la complejidad de frases, el modelo LlaMa presenta un número más elevado en comparación con el texto del mismo nivel generado por ChatGPT. No obstante, en el resto de métricas, el modelo ChatGPT presenta una complejidad superior, como en el uso de signos de puntuación y de palabras.
Nivel |
Modelo |
Complejidad de la frase |
Complejidad signos de puntuación |
Complejidad de palabras |
Complejidad de palabras extrañas |
Complejidad de sílabas |
Diversidad léxica simple |
A1 |
LLaMA |
10 |
19 |
70 |
15 |
129 |
0.09375 |
A1 |
GPT-3.5 |
15 |
24 |
192 |
34 |
348 |
0.033497536945812800 |
A2 |
LLaMA |
10 |
12 |
85 |
25 |
145 |
0.07356321839 |
A2 |
GPT-3.5 |
7 |
14 |
136 |
46 |
285 |
0.0430622009 |
B1 |
LLaMA |
11 |
14 |
143 |
33 |
248 |
0.04663923182 |
B1 |
GPT-3.5 |
8 |
16 |
165 |
46 |
338 |
0.03744939271 |
B2 |
LLaMA |
9 |
18 |
188 |
43 |
368 |
0.03130755064 |
B2 |
GPT-3.5 |
8 |
21 |
191 |
52 |
418 |
0.03091060985 |
Tabla 1: Resultados Textflow de complejidad y variedad léxica
Con respecto a la variedad léxica, podemos ver que es similar en ambos modelos, con una variedad más elevada en los textos generados por LlaMa. Sin embargo, en los niveles A1 y A2 la diferencia entre ambos modelos es más pronunciada.
Como conclusiones, podemos determinar varios aspectos.
En primer lugar, hay que señalar que ambos modelos no solo nos han proporcionado el texto solicitado, sino que nos han dado una serie de preguntas para evaluar la comprensión lectora de nuestros estudiantes, dichas preguntas nos sirven de objeto de análisis en estudios posteriores.
En segundo lugar, hemos de remarcar la necesidad de realizar una entrada adecuada al modelo, para que este se ajuste a la respuesta que necesitamos. Como podemos comprobar los textos generados por los modelos son textos narrativos, sin embargo, sería interesante añadir la modalidad textual en la entrada siguiendo el PCIC, como por ejemplo en nivel A1 un folleto con información turística. No obstante, con una entrada adecuada estos materiales generados pueden adaptarse a los distintos niveles y, asimismo, motivar a los alumnos, a la lectura, ya que se puede solicitar textos de interés para ellos.
En tercer lugar, hay que destacar que el modelo ChatGPT muestra un vocabulario más adecuado al nivel solicitado en los niveles intermedios B1 y B2, mientras que LlaMa no se ajusta a los estándares de estos niveles, dándonos un vocabulario de nivel inferior y superior. En los niveles básicos A1 y A2, ambos niveles nos devuelven un texto con vocabulario superior al solicitado, por lo que requieren de un ajuste.
En conclusión, los modelos de lenguaje pueden servirnos de apoyo a los docentes a la hora de elaborar material, no obstante, hay que realizar una revisión al mismo, puesto que, como hemos comprobado, no siempre se ajusta a los estándares del Plan Curricular del Instituto Cervantes y sería necesario una revisión manual de los mismos.
Bartol Hernández, J. A. (2010). Disponibilidad léxica y selección de vocabulario. En R. M.ª Castañer & V. Laguéns (eds.), De moneda nunca usada: estudios dedicados a José M.ª Enguita Utrilla (pp. 85-107). Instituto Fernando El Católico-CSIC.
ChatGPT: usuarios y estadísticas (2024). (2024, 17 mayo). https://n9.cl/sdwf7
Fernández, Y. (2023, 21 abril). Qué es LLaMA, cómo funciona y qué sabemos de la inteligencia artificial de Meta. Xataka. https://n9.cl/u2bnb
Fredholm, M. (2024). ChatGPT: Aplicación y percepción de su uso en el aula de español como lengua moderna: Un estudio sobre la producción escrita en la escuela básica en Suecia [Proyecto Fin de Carrera. Universidad de Dalarna. Escuela de Formación del profesorado]. DiVA. Dalarna University’s publications database. https://n9.cl/2z8jn
Giray, L. (2023). Prompt Engineering with ChatGPT: A Guide for Academic Writers. Annals Of Biomedical Engineering, 51(12), 2629-2633. https://doi.org/10.1007/s10439-023-03272-4
Instituto Cervantes (2006) Plan curricular del Instituto Cervantes. Instituto Cervantes. https://n9.cl/6sl6a
Instituto Cervantes (2014a). Guía del examen DELE B1. Instituto Cervantes. https://n9.cl/psafgs
Instituto Cervantes (2014b). Guía del examen DELE B2. Instituto Cervantes. https://n9.cl/nkc3n
Instituto Cervantes (2019). Guía del examen DELE A1. Instituto Cervantes. https://n9.cl/wgp3t
Instituto Cervantes (2022). Guía del examen DELE A2. Instituto Cervantes. https://n9.cl/7282m6
Jiménez Linares, L., López-Gómez, J. L., Martín-Baos, J. Á., Romero, F. P. & Serrano-Guerrero J. (2023). ChatGPT: reflexiones sobre la irrupción de la inteligencia artificial generativa en la docencia universitaria. En J. A. Cruz Lemus, N. Medina Medina & M.ª J. Rodríguez Fórtiz (eds.), Actas de las XXIX Jornadas sobre la Enseñanza Universitaria de la Informática (pp. 113-120). Asociación de Enseñantes Universitarios de la Informática. https://n9.cl/kex4sy
Meta AI (2024). LLaMA (versión 3.8b) [Modelo de lenguaje de gran tamaño]. https://llama.meta.com/
Moreno Villanueva, J. A. (2021). Léxico disponible y evaluación del vocabulario en estudiantes sinohablantes de ELE. RLA. Revista de Lingüística Teórica y Aplicada, 59(2), 13-42. https://doi.org/10.29393/rla59-9ldjm10009
Muñoz-Basols, J. & Fuertes Gutiérrez, M. (2024). Oportunidades de la Inteligencia Artificial (IA) en la enseñanza y el aprendizaje de lenguas. En J. Muñoz-Basols, M. Fuertes Gutiérrez & L. Cerezo (eds.), La enseñanza del español mediada por tecnología: de la justicia social a la Inteligencia Artificial (IA) (pp. 343-365). Routledge. https://doi.org/10.4324/9781003146391
Núñez Delgado, M.ª P. & Rodríguez Guerrero, B. (2017). La comprensión lectora en ELE. Análisis de manuales de B1 con base en su tipología textual. Revista Internacional de Lenguas Extranjeras, 1(6), 31-54. https://doi.org/10.17345/rile6.31-54
OpenAI. (2024). ChatGPT (versión GPT-3.5) [Modelo de lenguaje de gran tamaño]. https://chat.openai.com/chat
Ribes Lafoz, M.ª A. & Navarro Colorado, B. (2023). Aprovechamiento de ChatGPT en la enseñanza de lengua extranjera en educación superior. En D. Ortega-Sánchez & A. López-Padrón (eds.), Educación y Sociedad: Claves Interdisciplinares (pp. 1264-1271). Octaedro. https://n9.cl/r9msog
Sistemas Inteligentes de Acceso a la Información (SINAI). (s. f.). GitHub - sinai-uja/textflow. GitHub. https://n9.cl/rcfudb