DeepSeek-R1, tutto sul modello cinese che sfida OpenAI

Maggio 30, 2025 - 19:00
 0
DeepSeek-R1, tutto sul modello cinese che sfida OpenAI

R1 è un modello di ragionamento capace di competere nei benchmark con OpenAI-o1. Utilizza un'architettura Mixture of Experts (MoE) che riduce significativamente i costi computazionali, attivando solo 37 mld di parametri per ogni passaggio e apprendimento per rinforzo (RL). Utilizza solo 2.000 GPU, rispetto alle 100mila dei modelli tradizionali. Novità 2025: DeepSeek v3-0324, 671 mld di parametri; R1-0528, versione potenziata che riduce le allucinazioni e migliora la capacità di gestire compiti complessi; infine, un modello distillato basato su Qwen3-8B

L'articolo DeepSeek-R1, tutto sul modello cinese che sfida OpenAI proviene da AI4Business.

Qual è la tua reazione?

Mi piace Mi piace 0
Antipatico Antipatico 0
Lo amo Lo amo 0
Comico Comico 0
Furioso Furioso 0
Triste Triste 0
Wow Wow 0
Redazione Redazione Eventi e News