Четверг 02 июля 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Младенцы рождаются с нейронными основами для математики Младенцы рождаются с нейронными основами для математики Младенцы рождаются с врожденным чувством чисел, и теперь впервые были выявлены мозговые механизмы, лежащие в основе этой способности. В течение нескольких дней или даже часов после рождения группа младенцев смогла…
Древняя окаменелость рыбы сохранила свой мозг на протяжении 300 млн лет Древняя окаменелость рыбы сохранила свой мозг на протяжении 300 млн лет Большинство ископаемых останков содержат лишь кости и ничего больше. Лишь немногие сохраняют нечто гораздо более хрупкое. Более 300 миллионов лет назад крошечная рыбка размером с пескаря опустилась в ил доисторического…
PLOS One: Отпустить проблему поможет написание истории о неудачных отношениях PLOS One: Отпустить проблему поможет написание истории о неудачных отношениях Психологам давно известно, что проговаривание проблемы может делать ее намного менее катастрофичной. Польские специалисты решили проверить, что изменится, если трансформировать проговаривание в нарратив — полновесный рассказ с сюжетом и персонажами.…
Интернет и СМИ
Главное за сутки
Погибший в Нижегородской области и 327 сбитых БПЛА. Последствия атак ВСУ на российские регионы Погибший в Нижегородской области и 327 сбитых БПЛА. Последствия атак ВСУ на российские регионы Российские средства ПВО за минувшую ночь перехватили и уничтожили 327 украинских беспилотников, сообщили в Минобороны РФ. Мирный житель погиб в результате атаки ВСУ при помощи беспилотников на Нижегородскую область, заявил…
Ответный массированный удар ВС России по Украине. Главное Ответный массированный удар ВС России по Украине. Главное Вооруженные силы России в ответ на украинские террористические атаки нанесли массированный удар, поражены предприятия военной промышленности, ТЭК и инфраструктура военных аэродромов. Об этом сообщили в Минобороны РФ. ТАСС собрал основное…
Шуваев: за сутки в Белгородской области при атаках ВСУ погибли два человека Шуваев: за сутки в Белгородской области при атаках ВСУ погибли два человека ВСУ атаковали территорию Белгородской области 62 раза за прошедшие сутки. В результате атак в Валуйском и Вейделевском округах погибли два мирных жителя, еще девять получили ранения в Борисовском, Валуйском, Вейделевском,…
Тема дня
Поляки быстро и эффектно заменили Украину на Турцию Поляки быстро и эффектно заменили Украину на Турцию

Президент Польши Кароль Навроцкий проявил изрядную прыть: не только вызвал к себе народную любовь че...

Фото
Древний раскол континента способствовал образованию ледяного щита Антарктиды Древний раскол континента способствовал образованию ледяного щита Антарктиды

Когда Антарктида отделилась от Африки во время распада суперконтинента Гондвана 160 миллионов лет на...

Опрос

Что будет с дальнейшими поставками российского газа в Армению?

Прекратятся полностью - 52.1%
Продолжатся, но уже без скидок, по мировым рыночным ценам - 16.5%
Все останется без изменений - 14.7%

Всего голосов:: 1726

 

Анекдот дня

Всегда смущало наличие в ПДД гужевой повозки. Сейчас вообще вопросов не возникает.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".