"MoNaCo : la nouvelle évaluation d'Ai2 qui teste l'efficacité des modèles à synthétiser des informations de multiples sources"
Share
Ai2 a lancé MoNaCo, une nouvelle évaluation qui teste l'efficacité des modèles à assembler des preuves provenant de dizaines de sources différentes. Elle comprend 1 315 questions en plusieurs étapes, la récupération, le filtrage et l'agrégation à travers les textes et les tableaux, et plus de 40 documents distincts par requête.