Пятница 20 сентября 2024 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46
Угроза безопасности: AI Scientist самостоятельно изменила свой код Фото из открытых источников

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 

 

 

Ваган Григорян Опубликовано в Наука   Теги Новости
Главное за сутки
МО: за ночь над Курской и Белгородской областями уничтожили три украинских беспилотника МО: за ночь над Курской и Белгородской областями уничтожили три украинских беспилотника Российские средства противовоздушной обороны (ПВО) уничтожили за ночь три беспилотника над Курской и Белгородской областями. Об этом сообщили в Минобороны России. "В течение прошедшей ночи пресечены попытки киевского режима совершить…
Уничтожение украинских переправ и пленные ВСУ: что известно о ситуации в Курской области Уничтожение украинских переправ и пленные ВСУ: что известно о ситуации в Курской области Российские военные продолжили ведение наступательных действий в Курской области и отразили четыре контратаки Вооруженных сил Украины (ВСУ) за сутки, сообщили в Минобороны РФ. По данным ведомства, восемь украинских военнослужащих взяли…
НАТО создает форпост на границе с Мурманской областью и Карелией НАТО создает форпост на границе с Мурманской областью и Карелией Военную базу в финской Лапландии отдадут под контроль Швеции. Как отмечает издание Svenska Dagbladet, туда направят от 20 до 50 шведских офицеров. О том, как Североатлантический альянс использует Хельсинки для…
Интернет и СМИ
Читайте также
Математики открыли совершенно новый класс фигур Математики открыли совершенно новый класс фигур Как бы мы ни были умны как вид, Мать-природа почти всегда, кажется, нас побеждает. Это верно для таких вещей, как хирургия мозга и робототехника; это верно для гонки по предотвращению…
На Мадагаскаре археологи обнаружили сооружение, которое озадачило их На Мадагаскаре археологи обнаружили сооружение, которое озадачило их В отдаленном массиве Исало на юге Мадагаскара обнаружена необычная архитектурная конструкция, высеченная в скале. Эта находка привлекла внимание международной группы исследователей своей уникальностью, поскольку подобных сооружений не было обнаружено ни…
Пирамида Хеопса открывает тайны, дающие шанс на разработку светового компьютера Пирамида Хеопса открывает тайны, дающие шанс на разработку светового компьютера Физиками из Германии и России недавно были изучены необычные свойства пирамиды Хеопса. Специалисты сделали вывод, что сооружение способно концентрировать во внутренних камерах электромагнитную энергию и перенаправлять ее «прицельно» в пространство…
Тема дня
Русское оружие – гарант национального суверенитета России Русское оружие – гарант национального суверенитета России

19 сентября – День оружейника, профессиональный праздник всех работников военно-промышленного компле...

Фото
За последние 500 миллионов лет Земля стала даже горячее, чем считалось За последние 500 миллионов лет Земля стала даже горячее, чем считалось

Согласно самому тщательному исследованию, проведенному на сегодняшний день, средняя температура пове...

Опрос

Сколько нужно времени, чтобы полностью выбить ВСУ из Курской области?

 

Анекдот дня

Не рой русскому яму. Для русского яма - окоп.

Еще »
Комментарии для сайта Cackle
Мы на одноклассниках
 

 

МЫ ВКОНТАКТЕ

Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,

информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов

planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления

информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",

находящихся на территории Российской Федерации)".