Суббота 14 марта 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Найдено средство, помогающее бросить курить эффективнее никотинового пластыря Найдено средство, помогающее бросить курить эффективнее никотинового пластыря Группой специалистов из Университета Джонса Хопкинса проведены пилотные клинические испытания по тестированию эффективности псилоцибина. Выяснилось, что даже однократный приём высокой дозы препарата в комплексе с психотерапией помогает избавиться от тяги…
Lancet: Впервые найдено лекарство от остановки дыхания во сне Lancet: Впервые найдено лекарство от остановки дыхания во сне Команда европейских ученых обнаружила, что препарат сультиам облегчает симптомы обструктивного апноэ — нарушения дыхания во время сна. Клиническое исследование продемонстрировало, что препарат заметно понижает количество ночных остановок дыхания, улучшая насыщение…
Ученые выяснили, как змеи могут «стоять», не имея конечностей Ученые выяснили, как змеи могут «стоять», не имея конечностей Ученые разгадали биологическую загадку: как змеям — особенно древесным змеям — удается удерживать в вертикальном положении такие большие части тела без конечностей. Эта работа может способствовать развитию робототехники, в частности,…
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 176 украинских БПЛА МО: за ночь над регионами России сбили 176 украинских БПЛА Силы ПВО за ночь сбили 176 украинских БПЛА над российскими регионами, сообщили в Минобороны РФ. Губернатор Севастополя Михаил Развожаев сообщил, что атака на город в ночь на 13 марта была…
Хинштейн: за сутки ВСУ обстреляли из артиллерии районы Курской области 96 раз  Хинштейн: за сутки ВСУ обстреляли из артиллерии районы Курской области 96 раз  Вооруженные силы Украины атаковали с помощью 62 беспилотников различного типа территорию Курской области за прошедшие сутки, 96 раз применили артиллерию по отселенным районам. Об этом сообщил губернатор региона Александр Хинштейн.…
Хинштейн: аналогов операции «Поток» по освобождению Суджи нет Хинштейн: аналогов операции «Поток» по освобождению Суджи нет Губернатор Курской области Александр Хинштейн поздравил жителей с годовщиной освобождения приграничного города Суджа, который был оккупирован ВСУ в августе 2024 года. Он отметил, что аналогов операции "Поток", участники которой преодолели…
Тема дня
Новый верховный лидер Ирана подтвердил еще одну теорию заговора Новый верховный лидер Ирана подтвердил еще одну теорию заговора

Новый верховный лидер Ирана Моджтаба Хаменеи выпустил первое обращение к народу и агрессорам. Однако...

Фото
Исследование показало, почему многозадачность невозможна Исследование показало, почему многозадачность невозможна

Многие считают, что отлично справляются с многозадачностью, поскольку одновременно отвечают на сообщ...

Опрос

Как долго продлится операция США против Ирана?

 

Анекдот дня

Когда вам покажется, что вы не справитесь, вспомните, что вы из поколения, которое писало сочинения на три страницы. Из головы! Ручкой на большой перемене!

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".