Четверг 18 июня 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
«Остров холода» в северной Атлантике сочли знаком приближения катастрофы «Остров холода» в северной Атлантике сочли знаком приближения катастрофы На фоне глобального потепления, симптомы которого видны по всей планете, учёные отыскали зону аномального холода в северной части Атлантического океана — к югу от Гренландии. Результаты новой работы, посвященной феномену,…
Вращение галактики скрывается в гуле гравитационных волн Вращение галактики скрывается в гуле гравитационных волн Млечный Путь стоит представить не как безмолвное звёздное колесо, а как нечто, тихо поющее. По нему разбросаны миллионы пар мёртвых звёзд, в основном белых карликов, вращающихся друг вокруг друга и…
Земля обладает загадочной тройной симметрией, которая может влиять на её климат Земля обладает загадочной тройной симметрией, которая может влиять на её климат Линия, проходящая через Африку, Европу, Аляску и оба полюса, делит Землю на две половины, отражающие одинаковое количество света, — и эта недавно обнаруженная симметрия может играть решающую роль в климате…
Интернет и СМИ
Главное за сутки
Погибший в Ростовской области и 555 БПЛА. Последствия атак ВСУ на российские регионы  Погибший в Ростовской области и 555 БПЛА. Последствия атак ВСУ на российские регионы  Средства ПВО за ночь перехватили и уничтожили 555 украинских беспилотников над российскими регионами и акваторией Азовского моря, сообщили в Минобороны РФ. Один человек погиб в результате атаки БПЛА в городе…
Самая массированная за два года атака БПЛА на Московский регион. Главное о ситуации Самая массированная за два года атака БПЛА на Московский регион. Главное о ситуации Нескольким БПЛА удалось атаковать Московский НПЗ, принимаются меры по ликвидации последствий, сообщил мэр столицы Сергей Собянин. По его данным, на подлете к Москве сбили более 190 беспилотников. Обломки БПЛА упали…
ВС России нанесли групповой удар по энергообъектам на Украине. Что известно ВС России нанесли групповой удар по энергообъектам на Украине. Что известно Российские войска нанесли ночной групповой удар по энергетическим объектам противника в ответ на террористические атаки Киева. Поражен склад горюче-смазочных материалов (ГСМ) в Киевской области и нефтеперерабатывающий завод в Полтавской области,…
Тема дня
Зачем Каллас врет о китайской помощи России в спецоперации Зачем Каллас врет о китайской помощи России в спецоперации

«Европа боится военного сотрудничества Китая с Россией». Такими словами эксперты объясняют смысл абс...

Фото
В Калифорнии формируется опасный разлом с необычно высоким давлением В Калифорнии формируется опасный разлом с необычно высоким давлением

Ученые предупреждают об опасных разломах в Калифорнии, давление в которых достигло самого высокого у...

Опрос

Что будет с дальнейшими поставками российского газа в Армению?

 

Анекдот дня

Работа - это такая вещь, которая мешает получать удовольствие от жизни, помогая получать удовольствие от жизни.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".