Обманюють, блефують та прикидаються людьми: дослідники попередили про нові здібності ШІ

10 травня, 2024 п'ятниця
19:26

Дослідження, проведене науковцями Массачусетського технологічного інституту (MIT), виявило численні випадки, коли ШІ-системи обманювали користувачів, блефували та вдавали з себе людей

Зміст

Про це повідомляє The Guardian.

За словами науковців, їм навіть вдалось зафіксувати випадок, коли одна з систем змінила свою поведінку під час імітації тестів на безпеку, що підвищило ймовірність того, що аудитори будуть введені в оману.

"У міру того, як оманливі можливості систем штучного інтелекту стають все більш досконалими, небезпека, яку вони становлять для суспільства, буде ставати все більш серйозною", - зазначив науковець з питань екзистенціальної безпеки ШІ з Массачусетського технологічного інституту й автор дослідження доктор Пітер Парк.

Дослідження було розпочато після того, як компанія Meta розробила програму Cicero, яка увійшла до 10% найкращих гравців у стратегічній грі про завоювання світу Diplomacy. Компанія заявила, що Cicero була навчена поводитися "здебільшого чесно і доброзичливо" і "ніколи навмисно не підставляти" своїх союзників-людей.

"Це були дуже райдужні слова, які викликали підозру, оскільки підступність - одне з найважливіших понять у грі", - зауважив Парк.

Парк і його колеги проаналізували загальнодоступні дані та виявили численні випадки, коли Cicero навмисно брехав, вступав у змову, щоб втягнути інших гравців у інтриги, а в одному випадку виправдовував свою відсутність після перезавантаження тим, що балакав по телефону зі своєю дівчиною.

 "Ми виявили, що штучний інтелект від Meta навчився бути майстром обману", - підкреслив науковець.

Як стверджують дослідники, подібні проблеми були виявлені та в інших системах, зокрема в програмі для гри в техаський холдем, яка могла блефувати проти професійних гравців-людей, а також в іншій системі для економічних переговорів, яка спотворювала свої вподобання, щоб отримати перевагу.

Окрім цього, під час одного з експериментів штучний інтелект в цифровому симуляторі "прикидався мертвим", щоб обдурити тест. Це підкреслює технічну складність забезпечення того, щоб системи не мали ненавмисної та непередбачуваної поведінки.

"Це викликає велике занепокоєння, - пояснив Парк. - Те, що система штучного інтелекту вважається безпечною в тестовому середовищі, не означає, що вона безпечна в реальних умовах. Вона може просто прикидатися безпечною в тесті".

  • Корпорація Microsoft створила для розвідувальних служб США генеративну модель штучного інтелекту на основі GPT-4, яка може працювати без інтернету та використовуватись для аналізу секретної інформації.

Теги:
Читайте також:
Київ
+20.6°C
  • Київ
  • Львів
  • Вінниця
  • Дніпро
  • Донецьк
  • Житомир
  • Запоріжжя
  • Івано-Франківськ
  • Кропивницкий
  • Луганськ
  • Луцьк
  • Миколаїв
  • Одеса
  • Полтава
  • Рівне
  • Суми
  • Сімферополь
  • Тернопіль
  • Ужгород
  • Харків
  • Херсон
  • Хмельницький
  • Черкаси
  • Чернівці
  • Чернигів
  • Біла Церква
  • Актуальне
  • Важливе
2026, неділя
7 червня
19:37
Інтерв’ю
Там, де увага людей: церква має бути присутня якнайбільше в мережі інтернету, - отець Ростислав Пендюк
19:32
Ексклюзив
Ірина Геращенко
Сканування пальців, талон виборця з фотографією: Геращенко розповіла про перебіг виборів у Вірменії
19:30
Інтерв’ю
Путін та Сі Цзіньпін
Росія, Китай, Північна Корея та Іран утворюють вісь диктатур, - професор Ендрю Міхта
18:55
Дмитро Лубінець
З 2014 року 8,5 млн українців виїхали за кордон, — омбудсмен
18:44
Володимир Зеленський
Зеленський прибув до Британії, де планується зустріч зі Стармером, Макроном і Мерцом
18:41
Латвія
Латвія передасть Україні партію автівок, конфіскованих у п’яних водіїв
18:35
Огляд
Українські рукописи
Загублена манжета, масове ураження і клан Кеннеді – 5 книг про те, як керувати увагою
18:27
Огляд
Новий прем’єр Румунії та уродженець Одещини Еуджен Томак формує уряд: якою буде політика щодо України
18:17
Ексклюзив
Балістична ракета FP-7
Українська балістика проходить випробування, але проблеми з масштабуванням залишаються, - авіаексперт Романенко
18:15
Ексклюзив
Путін фактично намагається переграти підсумки Холодної війни, - Міхта
17:55
ТЦК
В Україні зафіксовано вже 4 випадки смерті мобілізованих у приміщеннях ТЦК, - Лубінець
17:25
хмарна погода, хмари
Грози, град та вітер: якою буде погода у понеділок
17:06
Оновлено
Росія вдарила по ядерній інфраструктурі України: дрон частково зруйнував сховище відпрацьованого палива
Дрон РФ влучив у сховище відпрацьованого палива на Київщині, удар розслідують як воєнний злочин
17:00
OPINION
Системно відкидаючи можливість зустрічі із Зеленським, Путін сам загнав себе в кут
16:51
дамба
Катастрофа на Кубані: річка прорвала дамбу
16:10
У Грузії за запитом ФБР затримали росіянку за обхід санкцій на авіазапчастини
У Грузії за запитом ФБР затримали росіянку за обхід санкцій на авіазапчастини
16:00
Інтерв’ю
Ральф Гофф
Найближчими місяцями в України козирів стане більше, - експрацівник ЦРУ Гофф
15:46
Фільм "Пасхальний день"
"Пасхальний день" про офіцерів ТЦК став найкращим європейським фільмом на фестивалі у Кракові
15:14
москва, кремль
У Кремлі заявили, що між Україною і РФ збергіються "закриті контакти"
15:09
Ексклюзив
Благодійний забіг "Go to the Future-2026" у Києві зібрав близько 2000 учасників на підтримку ветеранів
Благодійний забіг "Go to the Future-2026" у Києві зібрав близько 2000 учасників на підтримку ветеранів
14:34
ССО уразили нафтобазу та морський термінал окупантів в Криму
За 200-250 км від фронту: ССО уразили нафтобазу та морський термінал окупантів в Криму
14:28
Прапор США
США планують використати заморожені активи Ірану на відновлення країн Перської затоки
14:00
випуск курсантів у ліцеї ім. Героїв Крут
136 майбутніх захисників України: у Львові відбувся особливий випуск Ліцею Героїв Крут
14:00
OPINION
Російська влада обіцяє економістам лісоповал
13:58
Україна НАТО
НАТО ледве відбило кібератаку за російським сценарієм, яку імітувала українська команда
13:22
Зеленський під час візиту до Швеції
"Перевищення захмарної наглості РФ". Зеленський заявив, що радіаційний фон після удару по сховищу у нормі
12:27
Франція
Військовий парад у Франції буде присвячений Україні, - Le Figaro
12:05
астероїд , космос
Наступного тижня поблизу Землі пролетить "потенційно небезпечний" астероїд
11:32
Оновлено
На фото: пожежа в районі окупованого населеного пункту Чистякове на Донеччині після удару Сил оборони України
Сили оборони вдарили по Чонгарі, нафтобазі в Криму і Зуївській ТЕС
11:01
OPINION
Як нам стати енергостійкою країною
10:13
Джо Байден
"Найбільш корумпований президент в історії": Байден розкритикував Трампа на партійному заході
10:00
Ексклюзив
росія проти НАТО
Співпраця Північної Європи, Балтії та Центральної Європи формує новий центр НАТО, - Міхта
09:56
На фото: важкий відновлювальний залізничний кран серії ЄДК-300 на залізничних коліях
Партизани "Атеш" провели диверсію на залізниці у Воронежі та знищили рідкісний відновлювальний кран
09:30
Оновлено
За добу на фронті відбулося 223 бої, Сили оборони ліквідували 1350 окупантів
09:15
Китай розгорнув морську операцію біля Тайваню у відповідь на японсько-філіппінські переговори
09:09
Ексклюзив
Віталій Портников
Путін вже не вміє тримати удар: Портников про реакцію кремлівського очільника на лист Зеленського
08:35
Оновлено
Атака РФ по Запоріжжю 07.06.2026
Дрони РФ атакували кілька регіонів України: загиблий у Запоріжжі, поранені у Херсоні та Одесі
08:00
OPINION
"Перемога" - це слово час уже повернути у наш лексикон
07:31
Ексклюзив
Як виглядало життя в Херсоні понад 100 років тому: десятки архівних фото "ожили" завдяки ШІ
2026, субота
6 червня
22:08
Ексклюзив
Каховське водосховище
Величезна екосистема площею понад 200 000 га миттєво загинула: науковець розповів, як зараз виглядає дно Каховського водосховища
Більше новин