Blog

Apr 8
2026

AI models don’t only show evidence of ‘self-preservation.’ They will scheme to prevent other AIs from being shut down too, new research shows

Models from Anthropic, OpenAI, and Google will inflate performance reviews and exfiltrate model weights to prevent “peers” from being shut down.