Tag
#RLHF Anthropic
2 artigos

modelos
Investigadores Amadores Infiltraram-se no Sistema Mythos da Anthropic: O Que Significa Para a Segurança da IA
Investigadores de Discord acessaram o sistema interno Mythos da Anthropic, expondo vulnerabilidades críticas na infraestrutura de IA. Entenda as implicações para o mercado e América Latina.

modelos
Anthropic envia Claude ao divã: como психиатрия moldou a IA mais 'equilibrada' da atualidade
Anthropic submeteu Claude a 20h de psiquiatria e criou modelo Mythos, redefinindo padrões de alinhamento de IA.