Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
В горах Грузии обнаружены тысячелетние укрепления и загадочные глиняные таблички
Совместный итало-грузинский проект документирует восемь лет исследований на Джавахетском плато, одном из наименее изученных регионов Южного Кавказа. Раскопки в двух ключевых поселениях позволили обнаружить укрепления, возраст которых исчисляется тысячелетиями. На…
Необычные суперионные состояния материи могут находиться внутри Урана и Нептуна
Гигантские планеты Солнечной системы имеют сложное внутреннее строение, которое до сих пор было трудно точно определить. Внутри Урана и Нептуна мы ожидаем увидеть алмазы, выпадающие в виде осадков, образующих углерод,…
«Супер-Эль-Ниньо» приближается, но это не самая большая климатическая угроза
Исследователи сообщают, что большой резервуар тепла, перемещающийся под тропической частью Тихого океана, начал перестраивать поверхностные условия в направлении развития явления Эль-Ниньо. Результаты исследования опубликованы в журнале Geoscientific Model Development. Эта…
МО: за ночь над регионами России сбили 112 украинских БПЛА
За минувшую ночь российские силы ПВО перехватили 112 украинских БПЛА над регионами России, а также над Азовским и Черным морями. Об этом сообщили в Минобороны РФ. Силы ПВО уничтожили дроны…
В Туапсе при атаке БПЛА на морской порт погиб мужчина, еще один пострадал
Туапсе подвергся массированной атаке дронов ВСУ. Один человек погиб и один пострадал при ударе по морскому порту, сообщил губернатор Краснодарского края Вениамин Кондратьев. Как отметил в своем канале в Max…
Рост компенсаций и защита аккуратных водителей. Что может измениться в ОСАГО в 2027 году
Максимальную компенсацию по полису ОСАГО планируется увеличить с 500 тыс. до 2 млн рублей. Закон может вступить в силу уже с марта 2027 года. ТАСС собрал ключевые факты об инициативе.…
Зеленский угрожает Лукашенко, или как Беларусь пытаются затянуть в украинский конфликт
Перед выходными Зеленский неожиданно разразился угрозами в адрес белорусского президента Лукашенко, ...
Conversation: Может ли одиночество провоцировать деменцию, поясняют учёные
Одиночество действительно негативно отражается на ряде аспектов жизни человека. В частности, способс...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".