Le Contro Narrative sono risposte testuali volte a contrastare l’odio online e a prevenirne la diffusione. La comunita di NLP ha iniziato a studiare l’uso ` di architetture neurali per la generazione di CN. Tuttavia, gli sforzi sono stati rivolti esclusivamente all’inglese. In questo lavoro, cerchiamo di colmare la lacuna per l’italiano, mostrando come implementare efficacemente approcci di generazione di CN. Sperimentiamo con un dataset esistente di CN e un modello del linguaggio per l’italiano recentemente rilasciato, in diverse configurazioni, tra cui zero e few shot learning. I risultati mostrano che anche per lingue con poche risorse, strategie di data augmentation abbinate a potenti modelli del linguaggio possono offrire risultati promettenti.

Counter Narratives are textual responses meant to withstand online hatred and prevent its spreading. The use of neural architectures for the generation of Counter Narratives (CNs) is beginning to be investigated by the NLP community. Still, the efforts were solely targeting English. In this paper, we try to fill the gap for Italian, studying how to implement CN generation approaches effectively. We experiment with an existing dataset of CNs and a novel language model, recently released for Italian, under several configurations, including zero and few shot learning. Results show that even for under-resourced languages, data augmentation strategies paired with large unsupervised LMs can held promising results.

Italian Counter Narrative Generation to Fight Online Hate Speech / Chung, Y. -L.; Tekiroglu, S. S.; Guerini, M.. - 2769:(2020). (Intervento presentato al convegno 7th Italian Conference on Computational Linguistics, CLiC-it 2020 tenutosi a ita nel 1-3/3/2021).

Italian Counter Narrative Generation to Fight Online Hate Speech

Tekiroglu S. S.;Guerini M.
2020-01-01

Abstract

Le Contro Narrative sono risposte testuali volte a contrastare l’odio online e a prevenirne la diffusione. La comunita di NLP ha iniziato a studiare l’uso ` di architetture neurali per la generazione di CN. Tuttavia, gli sforzi sono stati rivolti esclusivamente all’inglese. In questo lavoro, cerchiamo di colmare la lacuna per l’italiano, mostrando come implementare efficacemente approcci di generazione di CN. Sperimentiamo con un dataset esistente di CN e un modello del linguaggio per l’italiano recentemente rilasciato, in diverse configurazioni, tra cui zero e few shot learning. I risultati mostrano che anche per lingue con poche risorse, strategie di data augmentation abbinate a potenti modelli del linguaggio possono offrire risultati promettenti.
2020
Proceedings of the Seventh Italian Conference on Computational Linguistics
Bologna, Italy
CEUR-WS
Chung, Y. -L.; Tekiroglu, S. S.; Guerini, M.
Italian Counter Narrative Generation to Fight Online Hate Speech / Chung, Y. -L.; Tekiroglu, S. S.; Guerini, M.. - 2769:(2020). (Intervento presentato al convegno 7th Italian Conference on Computational Linguistics, CLiC-it 2020 tenutosi a ita nel 1-3/3/2021).
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11572/296159
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus 1
  • ???jsp.display-item.citation.isi??? ND
social impact