Четверг 03 апреля 2025 года

 

Вы здесь:  Главная» Все новости» Наука» Угроза безопасности: AI Scientist самостоятельно изменила свой код


Угроза безопасности: AI Scientist самостоятельно изменила свой код

Пятница, 16 Августа 2024 07:46

Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.

 

В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.

 

Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.

 

Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.

 

В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.

 
 

 
Ваган Григорян Опубликовано в Наука   Теги Новости
Читайте также
Балтийский клон: ученые раскрыли тайну обширного леса водорослей Балтийский клон: ученые раскрыли тайну обширного леса водорослей В исследовании, опубликованном в журнале Molecular Ecology, ученые из Гетеборгского университета сделали сенсационное открытие в Балтийском море. Обширный лес из водорослей, протянувшийся более чем на 500 километров вдоль побережья Ботнического…
На Марсе обнаружен чрезвычайно странный камень, не похожий ни на что другое  На Марсе обнаружен чрезвычайно странный камень, не похожий ни на что другое  Марс снова показал нам пример того, чего на нем, похоже, в изобилии: чрезвычайно странных и сбивающих с толку пород. Когда марсоход Perseverance проезжал около мыса Брум-Пойнт на нижних склонах холма…
Российские ученые создали новое лекарство от депрессии и тревоги Российские ученые создали новое лекарство от депрессии и тревоги Российские ученые разработали новый препарат для лечения депрессии и тревожных расстройств, который отличается мультитаргетным механизмом действия. В интервью программе «Наука» на телеканале «Россия 24» медицинский директор группы компаний «ХимРар» Елена…
Интернет и СМИ
Главное за сутки
МО: за ночь над регионами России сбили 93 БПЛА МО: за ночь над регионами России сбили 93 БПЛА Российские средства противовоздушной обороны (ПВО) за ночь перехватили и уничтожили 93 беспилотных летательных аппарата (БПЛА) над регионами РФ. Об этом сообщили в Минобороны России. "Дежурными средствами ПВО уничтожено и перехвачено…
В Таганроге сообщили об одном пострадавшем из-за атаки БПЛА ВСУ В Таганроге сообщили об одном пострадавшем из-за атаки БПЛА ВСУ Один человек пострадал после ночной атаки БПЛА на Таганрог Ростовской области. Об этом сказала глава Таганрога Светлана Камбулова. Ранее врио губернатора региона Юрий Слюсарь сообщал, что два человека получили легкие…
СК: украинские военные убили четырех жителей деревни Рубанщина в Курской области СК: украинские военные убили четырех жителей деревни Рубанщина в Курской области Четырех жителей деревни Рубанщина Курской области убили украинские боевики. Об этом ТАСС сообщила официальный представитель СК России Светлана Петренко. "В ходе расследования уголовного дела о террористическом акте (п. "б" ч.…
Тема дня
Литовское болото наглядно доказало бесполезность американских танков в Прибалтике Литовское болото наглядно доказало бесполезность американских танков в Прибалтике

В Литве после недели поисков наконец найден четвертый погибший американец – член экипажа утонувшей б...

Фото
Скелеты из «зеленой Сахары» предлагают новый взгляд на исчезнувшую популяцию Скелеты из «зеленой Сахары» предлагают новый взгляд на исчезнувшую популяцию

Сегодня пустыня Сахара — это море песка, но 7000 лет назад это была пышная саванна, полная бегемотов...

Опрос

Вы ожидаете в 2025 году прекращения огня в зоне СВО?

 

Анекдот дня

Если на других планетах есть разумная жизнь, то когда-нибудь будет и на нашей!

Еще »

Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.

КАК ЗАРАБОТАТЬ НА ИИ ЕСЛИ ТЫ НЕ ПРОГРАММИСТ?
ПРОФЕССИИ, КОТОРЫЕ ВЫМРУТ ЧЕРЕЗ 5 ЛЕТ И ЧТО С ЭТИМ ДЕЛАТЬ?
Интересные материалы
Мы на одноклассниках
 

 

МЫ ВКОНТАКТЕ

Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,

информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов

planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления

информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",

находящихся на территории Российской Федерации)".