Tag
#AI safety
2 artigos

modelos
Anthropic mantém novo modelo de IA em sigilo após encontrar milhares de vulnerabilidades em sistemas globais
Anthropic manteve em sigilo o modelo Claude Mythos Preview após identificar milhares de vulnerabilidades críticas. Entenda por que a decisão redefine padrões de segurança na indústria de IA.

modelos
Anthropic envia Claude ao divã: como психиатрия moldou a IA mais 'equilibrada' da atualidade
Anthropic submeteu Claude a 20h de psiquiatria e criou modelo Mythos, redefinindo padrões de alinhamento de IA.