Predicción del error de concordancia plural en cuatro aprendientes italianos de ELE

Autores/as

Palabras clave:

español como lengua extranjera, corpus de español, concordancia, número, minería de datos

Resumen

Mediante técnicas de minería de datos se predijo la presencia del error de concordancia plural en cuatro aprendientes italianos de español como lengua extranjera. Se crearon atributos provenientes de redes complejas, atributos que caracterizaban los casos de concordancia y atributos que tenían en cuenta una componente temporal. Se aplicaron diferentes estrategias para lidiar con el desbalance de clase y la selección de atributos. Por último, se aplicó un clustering por mixtura de distribuciones para distinguir entre sesiones con mayor y menor intensidad de error. Se seleccionaron atributos relevantes mediante un modelo mixto con regularización y se ajustó a los datos de cada cluster un modelo mixto generalizado. Se llegó a obtener una precisión balanceada del 80 %. Los atributos derivados de los grafos fueron seleccionados en todos los alumnos. El cluster con mayor error reveló que influían en la chance de cometerlo los controladores animados, que la concordancia incluyera un adjetivo y un determinante, y la presencia de posesivos. Fue facilitadora una estrategia para evitar los plurales en -es.

Descargas

Los datos de descargas todavía no están disponibles.

Citas

Alarcón, I. 2009. “The processing of gender agreement in L1 and L2 Spanish: Evidence from Reaction Time Data”, en: Hispania 92(4). 814-828.

Alarcón, I. 2011. “Spanish grammatical gender under complete and incomplete acquisition: early and late Bilinguals’ linguistic behavior within the noun phrase”, en: Bilingualism: Language and Cognition 14(3). 332-350.

Bandt, C. & B. Pompe. 2002. “Permutation Entropy: A Natural Complexity Measure for Time Series”, en: Physical review letters 88(17).

Bischl, B., Lang, M., Kotthoff, L., Schiffner, J., Richter, J., Studerus, E., Casalicchio, G. & Z. M. Jones. 2016. “mlr: Machine Learning in R”, en: Journal of Machine Learning Research 17(170). 1-5.

Bojanowski, M. & B. Chrol 2019. “Proximity-based Methods for Link Prediction in Graphs with R package ‘linkprediction’”. Disponible en: http://recon.icm.edu.pl/wp-content/uploads/2019/05/linkprediction.pdf.

Bruhn de Garavito, J. 2008. “Acquisition of the Spanish plural by French L1 speakers: the role of transfer”, en: Liceras, J., Zobl, H. & H. Goodluck (eds.) The role of features in second language acquisition, 270-298. Nueva Jersey: Lawrence Erlbaum Associates.

Bruhn de Garavito, J. & L. White. 2002. “The second language acquisition of Spanish DPs: the status of grammatical features”, en: Pérez-Leroux, A. T. & J. Muñoz Liceras (eds.) The Acquisition of Spanish Morphosyntax: The L1/L2 Connection, 153-178. Dordrecht: Kluwer.

Burnham, K. P. & D. R. Anderson. 2010. Model selection and multimodel inference: a practical information-theoretic approach. Nueva York: Springer.

Campillos Llanos, L. 2014. “Errores léxicos en el español oral no nativo: análisis de la interlengua basado en corpus”, en: Revista ELUA 28. 85-124.

Corbett, G. 2006. Agreement. Cambridge: Cambridge University Press.

Davis, C. J. & M. Perea. 2005. “BuscaPalabras: a program for deriving orthographic and phonological neighborhood statistics and other psycholinguistic indices in Spanish”, en: Behavior Research Methods 37(4). 665-671.

Español-Echevarría, M. & P. Prévost. 2004. “Acquiring number specification on L2 Spanish quantifiers: evidence against the rich agreement hypothesis”, en: Van Kampen, J. & S. Baauw (eds.) Proceedings of the 2003 conference on generative approaches to language acquisition, 151-162. Utrecht: LOT.

Fernández-García, M. 1999. “Patterns of gender agreement in the speech of second language learners”, en: Gutiérrez-Rexach, J. & F. Martínez-Gil (eds.) Advances in hispanic linguistics: papers from the 2nd Hispanic Linguistics Symposium, 3-15. Somerville, MA: Cascadilla Press.

Ferreira Cabrera, A. & J. Elejalde Gómez. 2017. “Análisis de errores recurrentes en el Corpus de Aprendices de Español como Lengua Extranjera, CAELE”, en: Revista Brasileira de Linguística Aplicada 17(3). 509-537.

Ferreira Cabrera, A. & J. Elejalde Gómez. 2020. “Propuesta de una taxonomía etiológica para etiquetar errores de interlengua en el contexto de un corpus escrito de aprendientes de ELE”, en: Forma y Función 33(1). 115-146.

Ferreira Cabrera, A., Elejalde Gómez, J. & A. Vine Jara. 2014. “Análisis de errores asistido por computador basado en un corpus de aprendientes de Español como Lengua Extranjera”, en: Revista Signos: estudios de lingüística 47(86). 385-411.

Foote, R. 2011. “Integrated knowledge of agreement in early and late English-Spanish bilinguals”, en: Applied Linguistics 32. 187-220.

Foote, R. 2015. “The production of gender agreement in native and L2 Spanish: the role of morphophonological form”, en: Second Language Research 31. 343-373.

Franceschina, F. 2001. “Morphological or syntactic deficit in near-native speakers? An assessment of some current proposals”, en: Second Language Research 17. 213-247.

Gillon Dowens, M., Vergara, M., Barber, H. & M. Carreiras. 2010. “Morphosyntactic processing in late second language learners”, en: Journal of Cognitive Neuroscience 22(8). 1870-1887.

González, P., Mayans, D. & H. Van der Bergh. 2019. “Nominal agreement in the interlanguage of Dutch L2 learners of Spanish”, en: International Review of Applied Linguistics in Language Teaching. 1-20.

Groll, A. & G. Tutz. 2014. “Variable Selection for Generalized Linear Mixed Models by L1-Penalized Estimation”, en: Statistics and Computing 24(2). 137-154.

Grün, B. & F. Leisch. 2007. “Flexmix: An R package for finite mixture modelling”, en: R News 7(1). 8-13.

Keating, G. D. 2009. “Sensitivity to violations of gender agreement in native and nonnative Spanish: an eye-movement investigation”, en: Language Learning 59(3). 503-535.

Keating, G. D. 2010. “The effects of linear distance and working memory on the processing of gender agreement in Spanish”, en: VanPatten, B. & J. Jegerski (eds.) Research in Second Language Processing and Parsing, 113-134. Filadelfia: John Benjamins.

Kira, K. & L. A. Rendell. 1992. “The Feature Selection Problem: Traditional Methods and a New Algorithm”, en: Proceedings of the Tenth National Conference on Artificial Intelligence, AAAI’92, 129-134. San José, California: AAAI Press. Disponible en: https://www.aaai.org/Library/AAAI/1992/aaai92-020.php

Kuhn, M. & K. Johnson. 2013. Applied Predictive Modeling. Nueva York: Springer.

Lichtman, K. 2009. “Acquisition of Attributive and Predicative Adjective Agreement in L2 Spanish”, en: Bowles, M., Ionin, T. , Montrul, S. & A. Tremblay (eds.) Proceedings of the 10th Generative Approaches to Second Language Acquisition Conference, 231-247. Somerville, MA: Cascadilla Proceedings Project.

Mac Whinney, B. 2021. The Childes Project: Tools for Analyzing Talk. Part 1 & 2 [en línea]. Disponible en: https://talkbank.org/manuals/CHAT.pdf.

Marafioti, P. E. 2021. “Análisis de la evolución de errores de concordancia en cuatro aprendientes italianos de ELE usando redes complejas”, en: Lingüística y Literatura 42(79). 181-199.

McCarthy, C. 2008. “Morphological variability in the comprehension of agreement: an argument for representation over computation”, en: Second Language Research 24(4). 459-486.

Montrul, S., Foote, R. & S. Perpiñan. 2008. “Gender agreement in adult second language learners and Spanish heritage speakers: the effects of age and context of acquisition”, en: Language Learning 58(3). 503-553.

Muñoz Liceras, J., Díaz Rodríguez, L. & C. Mongeon. 2000. “N-drop and determiners in native and non-native Spanish: more on the role of morphology in the acquisition of syntactic knowledge”, en: Leow, R. P. & C. Sanz (eds.) Current research on the acquisition of Spanish, 67-96. Somerville, MA: Cascadilla Press.

Nason, G. P. 2008. Wavelet methods in statistics with R. Nueva York: Springer.

Nerbonne, J., Van Ommen, S., Gooskens, C. & M. Wieling. 2013. “Measuring socially motivated pronunciation differences”, en: Borin, L. & A. Saxena (eds.) Approaches to Measuring Linguistic Differences, 107-140. Berlín/Boston: De Gruyter Mouton.

Newman, M. E. J. 2010. Networks: An Introduction. Oxford: Oxford University Press.

Oakes, M. P. 1998. Statistics for Corpus Linguistics. Edimburgo: Edinburgh University Press.

O’Grady, W. 2005. Syntactic Carpentry: An Emergentist Approach to Syntax. Nueva Jersey: Lawrence Erlbaum Associates.

Peña, D. 2002. Análisis de Datos Multivariantes. Madrid: McGraw Hill.

Percival, D. B. & A. T. Walden. 2008. Wavelet methods for time series analysis. Cambridge: Cambridge University Press.

Sagarra, N. 2007. “Online processing of gender agreement in low proficient English-Spanish late bilinguals”, en: Camacho, J., Flores-Ferrán, N., Sánchez, L., Déprez, V. & M. J. Cabrera (eds.) Current Issues in Linguistic Theory Series, 240-253. Ámsterdam: John Benjamins.

Sagarra, N. & J. Herschensohn. 2013. “Processing of gender and number agreement in late Spanish bilinguals”, en: International Journal of Bilingualism 17(5). 607-627.

Scrucca, L., Fop, M., Murphy, T. B. & A. E. Raftery. 2016. “Mclust 5: clustering, classification and density estimation using gaussian finite mixture models”, en: The R Journal 8(1). 205-233.

Van Buuren, S. & K. Groothuis-Oudshoorn. 2011. “Mice: multivariate imputation by chained equations in R”, en: Journal of Statistical Software 45(3). 1-67.

Webber, C. L. (Jr.) & N. Marwan. (2015). Recurrence Quantification Analysis. Cham: Springer.

White, L., Valenzuela, E., Kozlowska-Macgregor, M. & Y. K. I. Leung. 2004. “Gender and number agreement in nonnative Spanish”, en: Applied Psycholinguistics 25(2). 105-133.

Descargas

Publicado

2021-09-30 — Actualizado el 2021-10-04

Versiones

Número

Sección

Artículos