Вторник 16 сентября 2025 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Островные муравьи демонстрируют признаки невидимого «апокалипсиса насекомых» Островные муравьи демонстрируют признаки невидимого «апокалипсиса насекомых» Новое исследование показало, что новый подход к анализу музейных образцов выявил значительное сокращение численности местных видов муравьев Фиджи с момента прибытия людей на острова. Исследование опубликовано в журнале Science. По…
Ученые обнаружили на Луне свежие валуны Ученые обнаружили на Луне свежие валуны Изучив тысячи спутниковых снимков, исследователи геолоцировали 245 свежих следов валунов, выявив признаки сейсмической активности или ударных событий за последние полмиллиона лет. Когда валун катится по склону скалы на Луне, он…
Редкая сабля аварской эпохи обнаружена в Венгрии Редкая сабля аварской эпохи обнаружена в Венгрии Венгерские археологи совершили знаменательное открытие: недалеко от города Секешфехервар была обнаружена редкая сабля аварского периода. Эта находка, которая, по словам экспертов, проливает новый свет на значение региона в эпоху раннего…
Интернет и СМИ
Главное за сутки
МО: за ночь над территорией России сбили шесть беспилотников МО: за ночь над территорией России сбили шесть беспилотников Российские средства противовоздушной обороны уничтожили и перехватили шесть украинских БПЛА над Белгородской областью за ночь. Об этом сообщили в Минобороны России. "В течение прошедшей ночи дежурными средствами ПВО перехвачены и…
В Ангарске при взрыве газа в доме погиб человек, повреждены 10 квартир В Ангарске при взрыве газа в доме погиб человек, повреждены 10 квартир Десять квартир повреждено в многоэтажном доме Ангарска, где произошел взрыв бытового газа. Об этом в своем Telegram-канале сообщает губернатор Иркутской области Игорь Кобзев. "Всего в доме 100 квартир, прописано 250…
В российских регионах определились победители губернаторских выборов В российских регионах определились победители губернаторских выборов Действующий глава Татарстана, а также его коллеги в Ленинградской области (также действующий глава), Курской (врио губернатора) и Оренбургской (врио губернатора) показывают наилучший результат по количеству набранных голосов избирателей после подсчета…
Тема дня
За перекрытие белорусской границы объясняться Польше придется перед Китаем За перекрытие белорусской границы объясняться Польше придется перед Китаем

Польша официально и на неопределенный срок перекрыла один из главных торговых путей планеты – магист...

Фото
Clinical Nutrition: Озвучен лучший рацион для замедления старения мозга Clinical Nutrition: Озвучен лучший рацион для замедления старения мозга

Международная группа ученых, представляющих университеты Бен-Гуриона, Гарварда и Лейпцига, в ходе но...

Опрос

Когда закончится СВО?

 

Анекдот дня

Канцлер Германии Мерц вознамерился экономически истощить Россию, а для начала решил потренироваться на Германии.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".