Garbage In, Reasoning Out? Why Benchmark Scores are Unreliable and What to Do About It / Mousavi, Seyed Mahed; Cecchinato, Edoardo; Horníková, Lucia; Riccardi, Giuseppe. - (2026), pp. 1747-1759. ( EACL2026 MOROCCO march 2026) [10.18653/v1/2026.findings-eacl.89].

Garbage In, Reasoning Out? Why Benchmark Scores are Unreliable and What to Do About It

Mousavi, Seyed Mahed
Primo
;
Riccardi, Giuseppe
2026-01-01

2026
Findings of the Association for Computational Linguistics: EACL 2026
Morocco
Association for Computational Linguistics
Mousavi, Seyed Mahed; Cecchinato, Edoardo; Horníková, Lucia; Riccardi, Giuseppe
Garbage In, Reasoning Out? Why Benchmark Scores are Unreliable and What to Do About It / Mousavi, Seyed Mahed; Cecchinato, Edoardo; Horníková, Lucia; Riccardi, Giuseppe. - (2026), pp. 1747-1759. ( EACL2026 MOROCCO march 2026) [10.18653/v1/2026.findings-eacl.89].
File in questo prodotto:
Non ci sono file associati a questo prodotto.

I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione

Utilizza questo identificativo per citare o creare un link a questo documento: https://hdl.handle.net/11572/485291
 Attenzione

Attenzione! I dati visualizzati non sono stati sottoposti a validazione da parte dell'ateneo

Citazioni
  • ???jsp.display-item.citation.pmc??? ND
  • Scopus ND
  • ???jsp.display-item.citation.isi??? ND
  • OpenAlex ND
social impact