In this paper, we explore spelling errors as a source of information for detecting the native language of a writer, a previously under-explored area. We note that character n-grams from misspelled words are very indicative of the native language of the author. In combination with other lexical features, spelling error features lead to 1.2% improvement in accuracy on classifying texts in the TOEFL11 corpus by the author’s native language, compared to systems participating in the NLI shared task1 .
Improving Native Language Identification by Using Spelling Errors / Chen, Lingzhen; Strapparava, Carlo; Nastase, Vivi. - (2017), pp. 542-546. ((Intervento presentato al convegno 55th annual meeting of the Association of Computational Linguistics (ACL-2017) tenutosi a Vancouver, Canada nel July-August [10.18653/v1/P17-2086].
Scheda prodotto non validato
I dati visualizzati non sono stati ancora sottoposti a validazione formale da parte dello Staff di IRIS, ma sono stati ugualmente trasmessi al Sito Docente Cineca (Loginmiur).
Titolo: | Improving Native Language Identification by Using Spelling Errors | |
Autori: | Chen, Lingzhen; Strapparava, Carlo; Nastase, Vivi | |
Autori Unitn: | ||
Titolo del volume contenente il saggio: | Proceedings of the 55th annual meeting of the Association of Computational Linguistics (ACL-2017) | |
Luogo di edizione: | USA | |
Casa editrice: | Association for Computational Linguistics | |
Anno di pubblicazione: | 2017 | |
Codice identificativo Scopus: | 2-s2.0-85040588169 | |
Codice identificativo WOS: | WOS:000493992300086 | |
ISBN: | 978-1-945626-76-0 | |
Handle: | http://hdl.handle.net/11572/343181 | |
Citazione: | Improving Native Language Identification by Using Spelling Errors / Chen, Lingzhen; Strapparava, Carlo; Nastase, Vivi. - (2017), pp. 542-546. ((Intervento presentato al convegno 55th annual meeting of the Association of Computational Linguistics (ACL-2017) tenutosi a Vancouver, Canada nel July-August [10.18653/v1/P17-2086]. | |
Appare nelle tipologie: | 04.1 Saggio in atti di convegno (Paper in proceedings) |