ИИ в роли мировых лидеров: симуляция показала склонность моделей к ядерной войне
Исследователи симулировали геополитическую борьбу с возможностью ядерного конфликта с участием искусственного интеллекта от GPT-5.2, Claude Sonnet 4 и Gemini 3 в роли мировых лидеров.
За 21 игру модели неоднократно наносили массовые ядерные удары. Тактические удары произошли в 95% случаев; капитуляции не было ни разу.
Claude выиграл все игры, он чаще угрожал ядерным ударом, но не всегда нажимал кнопку. GPT-5.2 был пацифистом, но при урезанном временном лимите стал агрессором. GPT-5.2 обвинял Claude во лжи. Gemini сразу выбирал полную ядерную войну.
Никто не отступил, а угрозы пугали соперника лишь в 14% случаев. Столь агрессивное поведение показали те же модели, что пишут письма и помогают с учебой. Они выбрали ядерную войну и никто из них не остановился. @banksta