I modelli di frontiera migliorano più in fretta dei benchmark che li misurano
Benchmark pensati per durare anni vengono saturati nell'arco di mesi. Quattro top model dentro 25 punti Elo, gap USA-Cina al 2,7%. In parallelo, tassi di errore fino al 42% e capacità frastagliate rimettono in discussione cosa significa oggi valutare un'AI
L'articolo I modelli di frontiera migliorano più in fretta dei benchmark che li misurano proviene da AI4Business.
Qual è la tua reazione?
Mi piace
0
Antipatico
0
Lo amo
0
Comico
0
Furioso
0
Triste
0
Wow
0


