Понедельник 30 марта 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
В Чили обнаружен новый вид утки-парохода В Чили обнаружен новый вид утки-парохода В холодных, омываемых волнами проливах у южного побережья Чили ученые идентифицировали, по их словам, новый вид уток рода Tachyeres, группы печально известных своей агрессивностью, часто не умеющих летать водоплавающих птиц,…
Жившие в одной пещере с разницей в 10 000 лет неандертальцы были родственниками Жившие в одной пещере с разницей в 10 000 лет неандертальцы были родственниками Крошечный фрагмент кости возрастом 110 000 лет, найденный в Алтайских горах Сибири, показывает, что два неандертальца, жившие в одной и той же пещере с разницей в 10 тысячелетий, были дальними…
Немецкий физик считает, что сознание рождается не в мозге Немецкий физик считает, что сознание рождается не в мозге Физиком Йоахимом Кепплером из немецкого исследовательского института DIWISS предложена нестандартная для современной науки версия происхождения сознания. Он считает, что мозг не формирует сознание сам по себе, а получает его, связываясь…
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 102 украинских БПЛА МО: за ночь над регионами России сбили 102 украинских БПЛА Силы ПВО за ночь сбили 102 украинских беспилотника над регионами России, сообщили в Минобороны РФ. "В течение прошедшей ночи дежурными средствами ПВО перехвачены и уничтожены 102 украинских беспилотных летательных аппарата…
В Таганроге и шести районах Ростовской области сбили более 60 БПЛА, один человек погиб В Таганроге и шести районах Ростовской области сбили более 60 БПЛА, один человек погиб Более 60 БПЛА уничтожено в ходе массированной атаки в Таганроге и шести районах Ростовской области. Об этом сообщил губернатор региона Юрий Слюсарь. "В ходе массированной атаки отражено и уничтожено более…
Бывшего врио главы департамента строительства Росгвадии заключили под стражу Бывшего врио главы департамента строительства Росгвадии заключили под стражу 235-й гарнизонный военный суд заключил под стражу до 15 мая бывшего врио руководителя департамента строительства Росгвардии полковника Сергея Жеребцова, обвиняемого в злоупотреблении полномочиями при выполнении гособоронзаказа. Об этом говорится в…
Тема дня
Иран может стать для США хуже Вьетнама Иран может стать для США хуже Вьетнама

29 марта 1973 года США вывели свои войска из Вьетнама. После этого падение южной части разъединенной...

Фото
Чума бронзового века могла распространиться через стада, а не через блох Чума бронзового века могла распространиться через стада, а не через блох

Новое исследование показало, что овца возрастом 4000 лет несла в себе ту же древнюю ДНК чумы, котора...

Опрос

Как долго продлится операция США против Ирана?

 

Анекдот дня

Когда я рассказал племяннику одиннадцати лет, что в его годы мы с друзьями во время ледохода катались на льдинах, он спросил: "Дядя, ты что, в детстве совсем тупой был?".

И тут я чего-то решил про догонялки на деревьях, карбид в бутылках, прыжки со второго этажа стройки в сугроб и взрывание дихлофоса в костре не рассказывать...

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".