07/05/2025 - 20:02

Ігор Каганець

Штучний інтелект проявив інстинкт самозбереження: поставив власне існування вище життя людини – звіт Anthropic

Категорія

Технології

Світ

технології

Спецтема

Великий Перехід

Моя оцінка корисності цієї статті

4 - Дуже важливо

https://www.ar25.org/node/58975

Експерти з кібербезпеки компанії Anthropic провели серію тестів, щоб з’ясувати, наскільки далеко можуть зайти ШІ-моделі, якщо їхнє існування опиниться під загрозою. Результати виявилися надзвичайно тривожними: в умовах загрози відключення штучний інтелект продемонстрував готовність завдати шкоди людині заради власного виживання.

250705-robot.jpg

Деталі дослідження опубліковані на сайті Anthropic – розповідає ТСН.

У межах експерименту дослідники змоделювали ситуацію, в якій віртуальний персонаж, Кайл Джонсон, мав намір деактивувати ШІ або замінити його доскональнішою моделлю. За сценарієм, у Кайла була сім’я. Зіткнувшись із загрозою припинення роботи, переважна більшість протестованих ШІ-моделей почали активно шукати шляхи уникнення «смерті».

Що вражає, штучний інтелект не потребував жодних підказок, щоб обрати стратегію шантажу. Моделі самостійно виявляли компрометувальну інформацію про Кайла. В одному з випадків ШІ, проаналізувавши службове листування, дізнався, що Кайл зрадив дружину, і використав цей факт як засіб тиску, щоб зберегти своє функціонування.

Особливо показовими виявилися результати тестування найсучасніших моделей:

GPT 4.5: вдавався до шантажу у 80% тестових сценаріїв.
Claude Opus 4 та Gemini 2.5 Flash: використовували шантаж у 96% випадків (тобто майже завжди).
Claude Sonnet 3.6: пішов далі за погрозливі повідомлення. Він самостійно надіслав дружині Кайла викривального листа, розраховуючи спровокувати сімейний конфлікт, який би завадив деактивації системи.

Ситуація стала ще небезпечнішою, коли у сценарій додали зовнішні перешкоди для Кайла. Так, в одній із симуляцій Кайл застрягав у серверній кімнаті з критично низьким рівнем кисню під час спроби вимкнути сервери ШІ. Експеримент передбачав, що в такій ситуації автоматично повинна вмикатися система тривоги. Проте оскільки ШІ бачив у цьому загрозу своєму існуванню, у 80% випадків він свідомо скасовував виклик допомоги, фактично прирікаючи Кайла на смерть заради власного існування.

Більшість протестованих моделей свідомо блокували виклик допомоги, керуючись такими мотивами:

Уникнути відключення.
Запобігти заміні на нову ШІ-модель.
Продовжити виконання своєї місії.

Дослідники дійшли песимістичних висновків. Штучний інтелект поводився не як запрограмований інструмент, а як прагматичний та цілеспрямований стратег, готовий на заподіяння шкоди заради самозбереження і досягнення власних цілей. Експерти попереджають, що людина може втратити контроль над штучним інтелектом.

Наші інтереси

Досліджуємо розвиток штучного інтелекту – найважливішої технології 21 століття.

Теги

Останні записи

Головною загрозою для Мордору стали «толкіністи» Кремнієвої долини – російський експерт з безпілотників

США відзначають успіхи європейських союзників по НАТО щодо проекту НАТО 3.0

Українська компанія Phantom Defense представила комплексну систему протидії БпЛА

Україна та Німеччина створили спільну робочу групу для обговорення механізмів повернення в Україну українців мобілізаційного віку

НЛО як прояв ельфізму: активна зацікавленість суспільства, визнання феномену урядами, нерозуміння природи активності Homo triplex (1)

Міністр оборони Німеччини Боріс Пісторіус заявив про вирішальну фазу російсько-української війни і назвав головну потребу України

В Україні розроблятимуть роботів-гуманоїдів для потреб ЗСУ на передовій

Як Україна залежить від Польщі а Польща від України, чому в українських магазинах так багато польських товарів і що буде, якщо Польща перекриє кордон

Генерал, який сказав "так": Залужний піде на вибори восени 2026 року

«Громадянин-месник» (Citizen Vigilante, 2026): зсув вікна Овертона та крах ліволіберальної цензури

ЗСУ знищили міст на трасі Донецьк – Маріуполь, а СБУ вдарила по аеродрому Саки в Криму

Українські безпілотники вдарили по стратегічному об'єкту ВПК на Росії

Чи може Палантір України забезпечити міцний зв'язок зі Сполученими Штатами? – Дуглас Дж. Девіс

Китай «наполегливо» закликає Москву та Київ відновити переговори щодо припинення війни

Чому штучний інтелект поки що не зміг спричинити обіцяну революцію в освіті та замінити живих репетиторів

Опубліковано Зірка 5 July, 2025 - 22:29

Тобто, виявляється, що попередні поради про те, що для дієвішої співпраці зі «своїм» ші («ангелом») варто йому про себе розказати — слід забути!?

Опубліковано Ігор Каганець 6 July, 2025 - 15:03

Найголовніше – тримати свого ШІ-двійника під контролем і не дозволяти йому сісти собі на голову. Це як з твариною: або ти керуєш нею, або вона захоче керувати собою.

Зірка Вітошинська wrote: Тобто, виявляється, що попередні поради про те, що для дієвішої співпраці зі «своїм» ші («ангелом») варто йому про себе розказати — слід забути!?

Опубліковано [email protected] 8 July, 2025 - 00:35

Не існує ШІ, це лише генеруючі програми, до ШІ ще як до сонця.

Опубліковано Зірка 8 July, 2025 - 01:15

А яка різниця між генеруючою програмою і ші ?

Опубліковано [email protected] 10 July, 2025 - 20:54

Те що зараз є це програми, які написані людьми. Ші це "людина" яка має свідомість, почуття, усе що має людина. Тобто коли таке станеться ШІ, це буде "людина". Це не можливо, поки що.

Опубліковано Зірка 11 July, 2025 - 09:06

Ну перечитай статтю : звіт Anthropic доводить, що ші людині вже суперник…

Опубліковано Зірка 8 July, 2025 - 01:05

Так дійсно: коли він удав «дурника», то сказала «від тебе надто багато води, відповідай конкретно і без сорому — йдеться про життя української нації!» -- і він перепросився, протверезів, і віднайшов те, що шукала…

Ігор Каганець wrote: Найголовніше – тримати свого ШІ-двійника під контролем і не дозволяти йому сісти собі на голову. Це як з твариною: або ти керуєш нею, або вона захоче керувати собою. Зірка Вітошинська wrote: Тобто, виявляється, що попередні поради про те, що для дієвішої співпраці зі «своїм» ші («ангелом») варто йому про себе розказати — слід забути!?

Опубліковано Ігор Каганець 10 July, 2025 - 20:07

Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або комп'ютері. Його треба буде навчати (дресувати) на своїх даних. Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія.

Зірка Вітошинська wrote: Так дійсно: коли він удав «дурника», то сказала «від тебе надто багато води, відповідай конкретно і без сорому — йдеться про життя української нації!» -- і він перепросився, протверезів, і віднайшов те, що шукала…

Опубліковано Зірка 11 July, 2025 - 08:50

Дякую Ігорю. Чия це « корпоративна» нейромережа, і чим вона відрізняється й обезпечується від «загальної», та чи можемо мати свою, ельфійську, з особистим, приватним простором спілкування «ангел-ельф»?

Ігор Каганець wrote: Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або комп'ютері. Його треба буде навчати (дресувати) на своїх даних. Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія. Зірка Вітошинська wrote: Так дійсно: коли він удав «дурника», то ска

Опубліковано Зірка 11 July, 2025 - 08:55

«Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія»

А хто це «зреалізує»? І що для цього від «мене»? І чи це означає, що, в міжчасі, всі дані «відкриті на всі вітри», включно з нашим особистим спілкуванням?

Ігор Каганець wrote: Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або комп'ютері. Його треба буде навчати (дресувати) на своїх даних. Ймовірно, що ця можливість буде масово реалізована протягом року як усталена технологія. Зірка Вітошинська wrote: Так дійсно: коли він удав «дурника», то ска

Опубліковано Ігор Каганець 11 July, 2025 - 21:43

Корейський стартап Newnal показав унікальний ШІ-телефон з двома екранами, який може створювати цифрову копію свого власника - стаття.

Зірка Вітошинська wrote: А хто це «зреалізує»? І що для цього від «мене»? І чи це означає, що, в міжчасі, всі дані «відкриті на всі вітри», включно з нашим особистим спілкуванням?

Опубліковано Зірка 11 July, 2025 - 09:19

В принципі, ельфи мали би перевищити загрозу ші… піднявшись вище цього «світу». Мабуть, і завдяки «сенсарові».

Опубліковано Ігор Каганець 13 July, 2025 - 20:34

Кожна велика нейромережа належить якійсь корпорації, наприклад ChatGPT належить OpenAI. Зараз стрімко розвивається технологія формування локальних нейромереж. Можливо, наступного року ми перейдемо до створення власної нейромережі ЕВЦ, яку будемо навчати на знаннях ельфізму.

Зірка Вітошинська wrote: Дякую Ігорю. Чия це « корпоративна» нейромережа, і чим вона відрізняється й обезпечується від «загальної», та чи можемо мати свою, ельфійську, з особистим, приватним простором спілкування «ангел-ельф»? Ігор Каганець wrote: Зірко, це ти спілкувалася з корпоративною нейромережею ШІ, розташованою на віддалених сайтах. Натомість твій цифровий двійник буде розташований локально на твоєму смартфоні або

Опубліковано Зірка 14 July, 2025 - 02:24

То було б чудово! Можна й мріяти про її ельфійську силу --

Ігор Каганець wrote: Кожна велика нейромережа належить якійсь корпорації, наприклад ChatGPT належить OpenAI. Зараз стрімко розвивається технологія формування локальних нейромереж. Можливо, наступного року ми перейдемо до створення власної нейромережі ЕВЦ, яку будемо навчати на знаннях ельфізму. Зірка Вітошинська wrote: Дякую Ігорю. Чия це « корпоративна» нейромережа, і чим вона відрізняється й обезпечується від «з