In questo lavoro studiamo le domande del tipo “Quanti cani sono neri?”, la cui risposta è un quantificatore (es. “alcuni”/”tutti”/”nessuno”). Mostriamo che al fine di imparare a quantificare, un modello multimodale deve ottenere una rappresentazione profonda della domanda linguistica, dell’immagine e della loro interazione. Proponiamo un modello che estrae una rappresentazione approssimativa dell’insieme degli oggetti e della proprietà sui quali verte la domanda.
In this paper, we focus on linguistic questions over images which may be answered with a quantifier (e.g.How many dogs are black? Some/most/all of them, etc.). We show that in order to learn to quantify, a multimodal model has to obtain a genuine understanding of linguisticand visual inputs and of their interaction. We propose a model that extracts a fuzzy representation of the set of the queried objects (e.g.dogs) and of the queried property in relation to that set (e.g. blackwith respect todogs), outputting the appropriate quantifier for that relation.
Imparare a quantificare guardando / Pezzelle, Sandro; Sorodoc, Ionut-teodor; Herbelot, Aurelie; Bernardi, Raffaella. - 1749:(2016), pp. 237-242. (Intervento presentato al convegno CLiC-it 2016 & EVALITA 2016 tenutosi a Napoli, Italia nel 5th-7th December 2016).
Imparare a quantificare guardando
Pezzelle, Sandro;Sorodoc, Ionut-teodor;Herbelot, Aurelie;Bernardi, Raffaella
2016-01-01
Abstract
In questo lavoro studiamo le domande del tipo “Quanti cani sono neri?”, la cui risposta è un quantificatore (es. “alcuni”/”tutti”/”nessuno”). Mostriamo che al fine di imparare a quantificare, un modello multimodale deve ottenere una rappresentazione profonda della domanda linguistica, dell’immagine e della loro interazione. Proponiamo un modello che estrae una rappresentazione approssimativa dell’insieme degli oggetti e della proprietà sui quali verte la domanda.File | Dimensione | Formato | |
---|---|---|---|
CLIC-IT2016_imparare.pdf
accesso aperto
Tipologia:
Versione editoriale (Publisher’s layout)
Licenza:
Tutti i diritti riservati (All rights reserved)
Dimensione
134.77 kB
Formato
Adobe PDF
|
134.77 kB | Adobe PDF | Visualizza/Apri |
I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione