Понедельник 27 апреля 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Ученые выяснили, кто создал 9000-летние наскальные рисунки в Кении Ученые выяснили, кто создал 9000-летние наскальные рисунки в Кении Крупный прорыв в африканской археологии позволил раскрыть личность создателя одного из самых загадочных мест с наскальными рисунками в Восточной Африке. В скальном убежище Какапел на западе Кении исследователи реконструировали визуальную…
Неизвестный «призрачный» азиатский народ передал гены коренным американцам Неизвестный «призрачный» азиатский народ передал гены коренным американцам Новый масштабный анализ ДНК коренных американцев показал, что миграция людей в Южную Америку происходила тремя различными волнами на протяжении тысяч лет. Исследование также выявило, что гены, связанные с фертильностью, метаболизмом…
Восстановлен некогда утраченный текст христианской рукописи Восстановлен некогда утраченный текст христианской рукописи Цифровые методики анализа древних манускриптов позволили международной команде ученых восстановить 42 утраченные страницы Кодекса H — греческой рукописи VI века с Посланиями святого апостола Павла. Рукопись является важным источником для…
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 203 украинских БЛПА МО: за ночь над регионами России сбили 203 украинских БЛПА Силы ПВО за ночь сбили 203 украинских беспилотника над российскими регионами и Черным морем, сообщили в Минобороны РФ. В Севастополе из-за действий ВСУ один человек погиб, четверо пострадали. Трубопровод с…
40 лет назад произошла авария на Чернобыльской атомной электростанции 40 лет назад произошла авария на Чернобыльской атомной электростанции 40 лет назад, 26 апреля 1986 года, произошла авария на Чернобыльской атомной электростанции (ЧАЭС). Ее последствия продемонстрировали миру, что вырвавшийся из-под контроля мирный атом может быть не менее страшен, чем…
Что известно о стрельбе на приеме с Трампом Что известно о стрельбе на приеме с Трампом Стрельба произошла 25 апреля вечером на приеме Ассоциации корреспондентов при Белом доме в отеле Washington Hilton, в котором принимал участие президент США Дональд Трамп. Никто из представителей американской администрации, в…
Тема дня
США из мести могут превратить Испанию в неполноценного члена НАТО США из мести могут превратить Испанию в неполноценного члена НАТО

В Пентагоне решают, как наказать Испанию за отказ поддержать войну США против Ирана. Среди возможных...

Фото
Обнаружены миллионы генетических переключателей, повлиявших на эволюцию растений Обнаружены миллионы генетических переключателей, повлиявших на эволюцию растений

Исследователи идентифицировали более 2,3 миллиона древних ДНК-переключателей, сохранившихся у сотен ...

Опрос

Через месяц после начала войны в Иране на чьей стороне преимущество?

 

Анекдот дня

Кто виноват?

Что делать?

А зачем?

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".