Среда 10 декабря 2025 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Nature: При недосыпе мозг запускает днём «ночные» волны Nature: При недосыпе мозг запускает днём «ночные» волны Специалисты Массачусетского технологического института выяснили, что в условиях недосыпа мозг запускает механизмы ночной очистки во время бодрствования. Как передаёт портал Nature, у невыспавшихся людей эксперты регистрировали в моменты краткой потери…
Неожиданно: частое употребление кофе ведет к восстановлению во время сна Неожиданно: частое употребление кофе ведет к восстановлению во время сна В авторитетном издании Journal of Psychopharmacology опубликованы результаты недавнего исследования, авторами которого стала группа учёных из Университета Цюриха. Оно показало сложные взаимосвязи между употреблением кофе и качеством сна. Выяснилось, что…
В споре между Эйнштейном и Бором появились новые аргументы В споре между Эйнштейном и Бором появились новые аргументы Около столетия прошло с момента острых дискуссий между Альбертом Эйнштейном и Нильсом Бором, в которых автор теории относительности пытался поставить под сомнение основы квантовой теории. Но сегодня становится ясно: сама…
Интернет и СМИ
Главное за сутки
МО: за ночь над Россией сбили 20 украинских БПЛА МО: за ночь над Россией сбили 20 украинских БПЛА Силы противовоздушной обороны уничтожили за ночь над российскими регионами 20 украинских беспилотников, из них один - над Московским регионом. Об этом сообщили в Минобороны РФ. Как уточнили в ведомстве, в…
Попытки ограбить Россию и «науськивание» Украины Западом. Заявления Сергея Лаврова Попытки ограбить Россию и «науськивание» Украины Западом. Заявления Сергея Лаврова Европейские страны искусственно сдерживают мирный процесс по ситуации вокруг Украины, науськивая Владимира Зеленского на продолжение боевых действий. Но Запад не един в своих подходах к урегулированию, заявил глава МИД России…
Зеленский признал, что Украина не сможет получить Крым Зеленский признал, что Украина не сможет получить Крым Владимир Зеленский сообщил, что на встрече с президентом России Владимиром Путиным в 2019 году во Франции сказал ему о желании вернуть Крым, но признал, что у Украины нет для этого…
Тема дня
Что означает заявление Зеленского о готовности провести выборы президента Украины Что означает заявление Зеленского о готовности провести выборы президента Украины

Владимир Зеленский согласен провести президентские выборы на Украине. Это решение было принято под д...

Фото
РОS: Соцсети заметно снижают концентрацию внимания подростков РОS: Соцсети заметно снижают концентрацию внимания подростков

Группа ученых из Каролинского института в итоге нового исследования показала, что активное использов...

Опрос

Что вы ждете от обсуждаемого сейчас плана Трампа по урегулированию украинского конфликта?

 

Анекдот дня

- Тебе, наверное, больше сорока?

- С чего ты взял?

- Пишешь без ошибок. Чувствуется Советская школа.

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

Интересные материалы
МЫ ВКОНТАКТЕ

Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций

(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном

цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с

точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии

предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей

сети "Интернет", находящихся на территории Российской Федерации)".