Воскресенье 23 ноября 2025 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Названо доступное средство укрепления сосудов и защиты от ССЗ Названо доступное средство укрепления сосудов и защиты от ССЗ Сердечно-сосудистые заболевания продолжают удерживать печальное первенство по уровню смертности в мире. Поиск новых эффективных препаратов от инсульта и инфаркта продолжается и порой даёт неожиданные результаты. Так, в новом систематическом обзоре,…
Принципиально новая теория раскрывает 3500-летнюю тайну Северной Америки Принципиально новая теория раскрывает 3500-летнюю тайну Северной Америки Новаторская интерпретация Поверти-Пойнт, одного из самых знаковых археологических памятников Северной Америки, бросает вызов устоявшимся представлениям о людях, построивших эти гигантские земляные памятники 3500 лет назад. Новое исследование Университета Вашингтона в…
В образцах лунного грунта с обратной стороны найдено соединение железа В образцах лунного грунта с обратной стороны найдено соединение железа Обратная сторона Луны до сих пор слабо исследована. Недавно китайским исследователям удалось отыскать в образцах грунта, что был доставлен станцией "Чанъэ-6", любопытное вещество. Открытие стало подтверждением более ранних данных зонда…
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 75 украинских БПЛА МО: за ночь над регионами России сбили 75 украинских БПЛА Силы ПВО за ночь сбили 75 украинских БПЛА над регионами России и Черным морем, сообщили в Минобороны РФ. "В течение прошедшей ночи дежурными средствами ПВО перехвачены и уничтожены 75 украинских…
В России в 2025 году зафиксировали новый максимум террористических преступлений В России в 2025 году зафиксировали новый максимум террористических преступлений Количество зарегистрированных в России преступлений террористического характера за девять месяцев 2025 года составило 4 467, зафиксирован новый максимум за последние годы. Это следует из материалов МВД России, которые проанализировал ТАСС.…
Институт Пушкина выбрал слово 2025 года, им стала «Победа» Институт Пушкина выбрал слово 2025 года, им стала «Победа» Слово "Победа" стало самым популярным словом 2025 года. Второе и третье место заняли "Max" и "нейросеть" соответственно, сообщили ТАСС в пресс-службе Государственного института русского языка им. А. С. Пушкина. 22…
Тема дня
Россия указала Украине место на будущих мирных переговорах Россия указала Украине место на будущих мирных переговорах

В процессе урегулирования конфликта на Украине новые вводные: Вашингтон давит на Киев с целью застав...

Фото
Инвазивные полинезийские крысы сыграли важную роль в вырубке лесов острова Пасхи Инвазивные полинезийские крысы сыграли важную роль в вырубке лесов острова Пасхи

Экологическая трансформация острова Пасхи (Рапа-Нуи) стала одним из самых хрестоматийных, но в то же...

Опрос

Как вы оцениваете заявления США о возможной передаче Украине ракет Tomahawk?

 

Анекдот дня

- Ты сильный, ты справишься.

- Я умный. Я даже не возьмусь.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".