Imparare a quantificare guardando

Pezzelle, Sandro; Sorodoc, Ionut-teodor; Herbelot, Aurelie; Bernardi, Raffaella

In questo lavoro studiamo le domande del tipo “Quanti cani sono neri?”, la cui risposta è un quantificatore (es. “alcuni”/”tutti”/”nessuno”). Mostriamo che al fine di imparare a quantificare, un modello multimodale deve ottenere una rappresentazione profonda della domanda linguistica, dell’immagine e della loro interazione. Proponiamo un modello che estrae una rappresentazione approssimativa dell’insieme degli oggetti e della proprietà sui quali verte la domanda.

In this paper, we focus on linguistic questions over images which may be answered with a quantifier (e.g.How many dogs are black? Some/most/all of them, etc.). We show that in order to learn to quantify, a multimodal model has to obtain a genuine understanding of linguisticand visual inputs and of their interaction. We propose a model that extracts a fuzzy representation of the set of the queried objects (e.g.dogs) and of the queried property in relation to that set (e.g. blackwith respect todogs), outputting the appropriate quantifier for that relation.

Imparare a quantificare guardando / Pezzelle, S., Sorodoc, I., Herbelot, A., Bernardi, R.. - 1749:(2016), pp. 237-242. (CLiC-it 2016 & EVALITA 2016 Napoli, Italia 5th-7th December 2016).

Imparare a quantificare guardando

Pezzelle, Sandro;Sorodoc, Ionut-teodor;Herbelot, Aurelie;Bernardi, Raffaella

2016-01-01

Abstract

In questo lavoro studiamo le domande del tipo “Quanti cani sono neri?”, la cui risposta è un quantificatore (es. “alcuni”/”tutti”/”nessuno”). Mostriamo che al fine di imparare a quantificare, un modello multimodale deve ottenere una rappresentazione profonda della domanda linguistica, dell’immagine e della loro interazione. Proponiamo un modello che estrae una rappresentazione approssimativa dell’insieme degli oggetti e della proprietà sui quali verte la domanda.

Scheda breve

Scheda completa

Scheda completa (DC)

	Anno di pubblicazione (Date of publication)
	
				2016
			
	Titolo del volume (Proceedings title)
	
				Proceedings of Third Italian Conference on Computational Linguistics (CLiC-it 2016) and Fifth Evaluation Campaign of Natural Language Processing and Speech Tools for Italian. Final Workshop (EVALITA 2016)
			
	Luogo di edizione (Place of publication)
	
				Aachen
			
	Casa editrice (Publisher)
	
				CEUR Workshop Proceeding
			
	Codice Scopus (Scopus Identifier)
	
				2-s2.0-85009268621
			
	Tutti gli autori
	
						Pezzelle, Sandro; Sorodoc, Ionut-teodor; Herbelot, Aurelie; Bernardi, Raffaella
					
	Citazione
	
				Imparare a quantificare guardando / Pezzelle, S., Sorodoc, I., Herbelot, A., Bernardi, R.. - 1749:(2016), pp. 237-242. (CLiC-it 2016 & EVALITA 2016 Napoli, Italia 5th-7th December 2016).
			
	Appare nelle tipologie:
	
				04.1 Saggio in atti di convegno (Paper in Proceedings)

File in questo prodotto:

File	Dimensione	Formato
CLIC-IT2016_imparare.pdf accesso aperto Tipologia: Versione editoriale (Publisher’s layout) Licenza: Tutti i diritti riservati (All rights reserved) Dimensione 134.77 kB Formato Adobe PDF Visualizza/Apri	134.77 kB	Adobe PDF	Visualizza/Apri