Суббота 31 января 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
JSR: Назван доступный способ улучшить сексуальные отношения JSR: Назван доступный способ улучшить сексуальные отношения Люди, ощущающие себя влиятельными в романтических отношениях, чаще говорят и о более насыщенной и удовлетворяющей сексуальной жизни. Это резюме международной команды психологов, опубликованное в журнале JSR. Специалисты добавляют: позитивный эффект…
Обнаружен критический момент, когда Эль-Ниньо начало разрушать лед в Арктике Обнаружен критический момент, когда Эль-Ниньо начало разрушать лед в Арктике Ученые обнаружили переломный момент, произошедший в 2000 году, когда влияние Эль-Ниньо на сокращение морского льда в Сибири усилилось. Исследователям уже много лет известно о наличии обратной связи между явлением Эль-Ниньо…
AHA: Озвучен неожиданный фактор летального исхода после инсульта AHA: Озвучен неожиданный фактор летального исхода после инсульта Ученые из американского Медицинского центра Вейла Корнелла рассказали о сильном факторе риска летальности после инсульта. Это прием нескольких лекарств против образования тромбов либо препаратов сильнее аспирина. Результаты соответствующего исследования опубликованы …
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 26 украинских БПЛА МО: за ночь над регионами России сбили 26 украинских БПЛА Силы ПВО за ночь сбили 26 украинских БПЛА над регионами России. Об этом сообщили в Минобороны РФ. "Минувшей ночью дежурные средства ПВО перехватили и уничтожили 26 украинских беспилотных летательных аппаратов…
Аналитики НАТО посоветовали Европе начать отработку наступательных информопераций Аналитики НАТО посоветовали Европе начать отработку наступательных информопераций Аналитики Североатлантического альянса рекомендовали странам Северной Европы и Балтии начать отработку скоординированных наступательных действий в информационном пространстве на случай вероятного конфликта. Такая рекомендация содержится в докладе Центра передового опыта НАТО…
В Конго более 200 человек погибли при обрушении шахты В Конго более 200 человек погибли при обрушении шахты По меньшей мере 227 человек погибли при обрушении шахты на востоке Демократической Республики Конго (ДРК), которая находится в районе, контролируемом повстанцами из группировки "Движение 23 марта" (М23). Об этом сообщило…
Тема дня
США приревновали Британию к Китаю США приревновали Британию к Китаю

Не иначе как «пекинской капитуляцией» называет британская пресса визит своего премьера Кира Стармера...

Фото
На Марсе нашли древний пляж, говорящий о вероятности его обитаемости в прошлом На Марсе нашли древний пляж, говорящий о вероятности его обитаемости в прошлом

В марсианском кратере Езеро найдены песчаники с округлыми зёрнами, характерной косой слоистостью и «...

Опрос

Присвоит ли в итоге Евросоюз замороженные российские активы?

Да - 8.7%
Нет - 6.1%
Затрудняюсь ответить - 3.1%

Всего голосов:: 965

 

Анекдот дня

Мне кажется, что Чебурашку и Буратино в новых российских фильмах рисовали дизайнеры АвтоВАЗа.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".