Суббота 06 июня 2026 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
CNS: Иглоукалывание способно ускорить восстановление после инсульта CNS: Иглоукалывание способно ускорить восстановление после инсульта Иглоукалыванием можно помочь восстановить подвижность после инсульта через изменения в структуре головного мозга. К этому выводу пришли специалисты Шанхайского университета традиционной китайской медицины в ходе исследования, итоги которого опубликованы в …
В Пиренеях обнаружен пещерный лагерь, возраст которого составляет 5500 лет В Пиренеях обнаружен пещерный лагерь, возраст которого составляет 5500 лет Высоко в восточных Пиренеях, на поразительной высоте 2235 метров над уровнем моря, в отдаленной пещере, известной как Кова 338, были обнаружены свидетельства интенсивного, организованного и повторяющегося заселения человеком этого места…
Люди верхнего палеолита освещали себе в пещере путь небольшими сосновыми ветками Люди верхнего палеолита освещали себе в пещере путь небольшими сосновыми ветками Междисциплинарная группа исследователей обнаружила, что большие факелы были непрактичны и что люди верхнего палеолита использовали тонкие веточки, чтобы спускаться в глубины итальянской пещеры. Группа исследователей сумела разгадать одну из самых…
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 376 украинских БПЛА МО: за ночь над регионами России сбили 376 украинских БПЛА Российские средства ПВО за ночь перехватили и уничтожили над регионами РФ, а также над Азовским, Черным морями и Абхазией 376 украинских БПЛА. Об этом сообщили в Минобороны России. "В течение…
Королев: в Тверской области при атаке ВСУ погиб человек Королев: в Тверской области при атаке ВСУ погиб человек Мужчина погиб в результате падения обломков вражеского БПЛА на движущийся автомобиль в Тверской области. Об этом сообщил глава региона Виталий Королев. "Над территорией нашего региона за прошедшую ночь уничтожено 5…
«Не вижу смысла. Нужны договоренности». Путин о письме и предложении Зеленского встретиться «Не вижу смысла. Нужны договоренности». Путин о письме и предложении Зеленского встретиться Президент России Владимир Путин ответил на открытое письмо Владимира Зеленского. Российский лидер отметил "элементы хамства" в тексте, указал на бессмысленность встречи без предварительных договоренностей и призвал российских военных "работать". Подробнее…
Тема дня
«Работайте, братья!». Президент Путин озвучил принцип России «Работайте, братья!». Президент Путин озвучил принцип России

Владимир Путин на пленарном заседании ПМЭФ заявил, что мир переживает крупнейшую структурную трансфо...

Фото
Гигантские рогатые родственники коров бродили по лесам Европы 4 млн лет назад Гигантские рогатые родственники коров бродили по лесам Европы 4 млн лет назад

Миллионы лет назад в лесах современной Каталонии, Испания, обитал крупный родственник современного к...

Опрос

Что будет с дальнейшими поставками российского газа в Армению?

 

Анекдот дня

Не так страшно, что искусственный интеллект умнеет, как то, что естественный интеллект глупеет.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".