DeepSeek aggiorna il modello R1 e distilla una versione “light” basata su Qwen3-8B

Maggio 30, 2025 - 19:00
 0
DeepSeek aggiorna il modello R1 e distilla una versione “light” basata su Qwen3-8B

La startup cinese ha introdotto R1-0528, una versione potenziata che riduce le allucinazioni e migliora la capacità di gestire compiti complessi. Parallelamente, ha lanciato un modello distillato basato su Qwen3-8B, in grado di competere con i migliori modelli americani su benchmark matematici, funzionando però con una sola GPU. Ecco tutti i dettagli

L'articolo DeepSeek aggiorna il modello R1 e distilla una versione “light” basata su Qwen3-8B proviene da AI4Business.

Qual è la tua reazione?

Mi piace Mi piace 0
Antipatico Antipatico 0
Lo amo Lo amo 0
Comico Comico 0
Furioso Furioso 0
Triste Triste 0
Wow Wow 0
Redazione Redazione Eventi e News