Понедельник 18 августа 2025 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
На основе данных коллайдера получен ключ к тайнам бозона Хиггса На основе данных коллайдера получен ключ к тайнам бозона Хиггса Специалистами коллаборации ATLAS, работающими на Большом адронном коллайдере, представлены новые результаты исследований, способные приблизить науку к разгадке тайн бозона Хиггса. На Европейской конференции по физике высоких энергий во французском Марселе…
Исследование выявило важные особенности людей, доживших до 100 лет Исследование выявило важные особенности людей, доживших до 100 лет Шведскими учеными проведено масштабное исследование, позволившее выявить общие биологические особенности у людей, что доживают до ста лет и более. Некоторые показатели в анализах крови становятся маркером будущего долголетия. Важно, что…
Найден способ защиты мышц космонавтов и лежачих пациентов от атрофии Найден способ защиты мышц космонавтов и лежачих пациентов от атрофии Российскими учеными из Института медико-биологических проблем РАН достигнут большой успех в борьбе с мышечной атрофией. Как сообщают «Известия», разработан метод, способный помочь космонавтам, пожилым и людям с ограниченной подвижностью. Исследование…
Интернет и СМИ
Главное за сутки
МО: за ночь силы ПВО уничтожили 46 украинских БПЛА над регионами России МО: за ночь силы ПВО уничтожили 46 украинских БПЛА над регионами России Российские силы противовоздушной обороны за ночь сбили 46 беспилотных летательных аппаратов ВСУ над регионами РФ. Об этом сообщили в Минобороны России. Как уточнили в ведомстве, в течение прошедшей ночи, с…
Петрин: в Воронеже из-за падения обломков БПЛА повреждены жилой дом и 10 автомобилей Петрин: в Воронеже из-за падения обломков БПЛА повреждены жилой дом и 10 автомобилей Падение обломков БПЛА привело к повреждению остекления одной квартиры, технического этажа в одном из домов и 10 автомобилей. Об этом сообщил в Telegram-канале глава Воронежа Сергей Петрин. "По поручению губернатора…
МИД Франции: Париж выступает против демилитаризации Украины МИД Франции: Париж выступает против демилитаризации Украины Франция выступает против демилитаризации Украины, укрепление ее армии должно быть одной из гарантий безопасности. Об этом в интервью газете La Tribune Dimanche заявил министр-делегат по делам Европы при МИД Франции…
Тема дня
Саммит на Аляске вызвал политическую лихорадку в Европе Саммит на Аляске вызвал политическую лихорадку в Европе

Прошедший на Аляске саммит Россия – США продемонстрировал взаимное уважение двух сверхдержав и вызва...

Фото
«Горячий камень» под Аппалачами за миллион лет продвинулся на 20 километров «Горячий камень» под Аппалачами за миллион лет продвинулся на 20 километров

Геологи утверждают, что область аномально горячих пород на глубине 200 километров под северными Аппа...

Опрос

Чем закончатся 10 дней, которые дал Трамп для достижения перемирия в украинском конфликте?

 

Анекдот дня

Если тебе когда-нибудь придет в голову мысль, что в твоем возрасте не подобает чего-либо делать, просто напомни себе, что ты никогда уже не будешь таким молодым, как сегодня.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".