I modelli di frontiera migliorano più in fretta dei benchmark che li misurano

Aprile 30, 2026 - 19:30
 0
I modelli di frontiera migliorano più in fretta dei benchmark che li misurano

Benchmark pensati per durare anni vengono saturati nell'arco di mesi. Quattro top model dentro 25 punti Elo, gap USA-Cina al 2,7%. In parallelo, tassi di errore fino al 42% e capacità frastagliate rimettono in discussione cosa significa oggi valutare un'AI

L'articolo I modelli di frontiera migliorano più in fretta dei benchmark che li misurano proviene da AI4Business.

Qual è la tua reazione?

Mi piace Mi piace 0
Antipatico Antipatico 0
Lo amo Lo amo 0
Comico Comico 0
Furioso Furioso 0
Triste Triste 0
Wow Wow 0
Redazione Redazione Eventi e News