Суббота 23 ноября 2024 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 

 

 

Ваган Григорян Опубликовано в Наука   Теги Новости
Главное за сутки
МО: средства ПВО за ночь уничтожили один украинский БПЛА МО: средства ПВО за ночь уничтожили один украинский БПЛА Средства ПВО за ночь уничтожили один украинский беспилотный летательный аппарат над Крымом. Об этом сообщили в Минобороны России. "В течение прошедшей ночи пресечена попытка киевского режима совершить террористическую атаку с…
Потери ВСУ, заочный арест наемника и помощь пострадавшим: что известно о ситуации в Курской области Потери ВСУ, заочный арест наемника и помощь пострадавшим: что известно о ситуации в Курской области Потери Вооруженных сил Украины (ВСУ) за сутки на курском направлении составили 150 человек, сообщили в Минобороны России. Всего за время боевых действий противник потерял более 34 690 военнослужащих. Суд заочно…
«Орешник» на вооружении и новые разработки: что сказал Путин военным и оборонщикам «Орешник» на вооружении и новые разработки: что сказал Путин военным и оборонщикам Гиперзвуковые ракетные системы "Орешник", успешное боевое испытание которых состоялось накануне, официально приняты на вооружение ВС РФ. Об этом заявил президент России Владимир Путин на совещании с руководством Минобороны, ОПК и…
Интернет и СМИ
Читайте также
JCSM: озвучен простой способ снижения кровяного давления JCSM: озвучен простой способ снижения кровяного давления Ученым из британских Бристольского и Эксетерского университетов удалось установить, что для снижения давления поможет выполнение легких десятиминутных упражнений каждый час, что вы проводите в сидячем положении. Результатами исследования авторы поделились…
О проблемах с лёгкими или сердцем способен рассказать простой тест на пальцах О проблемах с лёгкими или сердцем способен рассказать простой тест на пальцах В журнале Pulse Healthcare британский специалист Ахмед раскрыл простой способ самостоятельной диагностики возможных заболеваний сердечно-сосудистой и дыхательной систем. Метод заключается в несложной проверке состояния ногтей и их формы. Врач предлагает…
Древнейший известный алфавит обнаружен в древнем сирийском городе Древнейший известный алфавит обнаружен в древнем сирийском городе То, что, по-видимому, является доказательством существования древнейшей алфавитной письменности в истории человечества, высечено на глиняных цилиндрах длиной с палец, найденных в гробнице в Сирии группой исследователей из Университета Джонса Хопкинса.…
Тема дня
Трамп несет постсоветскому пространству войну и мир Трамп несет постсоветскому пространству войну и мир

Конечно, Трамп не отдаст России Украину на блюде. Любой товар (даже киевский чемодан без ручки) для ...

Фото
Датские учёные обнаружили противовоспалительный эффект страшных аттракционов Датские учёные обнаружили противовоспалительный эффект страшных аттракционов

Датские учёные раскрыли неожиданное влияние развлекательного страха на организм человека. В журнале ...

Опрос

Трамп на посту президента пообещал работать над прекращением всех войн в мире. Получится у Трампа остановить войны?

 

Анекдот дня

Когда-нибудь - это где-то между чуть попозже и никогда.

Еще »
Комментарии для сайта Cackle
Мы на одноклассниках
 

 

МЫ ВКОНТАКТЕ

Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,

информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов

planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления

информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",

находящихся на территории Российской Федерации)".