Come OpenAI e Apollo Research stanno combattendo lo “scheming” nei modelli avanzati

Il fenomeno si verifica quando un’AI finge di essere allineata mentre persegue obiettivi nascosti. OpenAI lo sta studiando, sviluppando test e nuove tecniche per ridurne l’incidenza. I risultati mostrano una riduzione di comportamenti ingannevoli di circa 30 volte, ma restano rischi legati alla consapevolezza situazionale e alla trasparenza dei processi decisionali
L'articolo Come OpenAI e Apollo Research stanno combattendo lo “scheming” nei modelli avanzati proviene da AI4Business.
Qual è la tua reazione?






