Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
Физик вывел формулу для определения количества складываний блинчика
Если аккуратно сложить диск из гибкого и, возможно, вкусного материала, что заставит его остаться сложенным? И сколько раз его можно сложить, прежде чем он начнет сопротивляться и перевернется обратно? Физик…
Астрономы обнаружили огромный астероид, вращающийся с невероятной скоростью
Обсерватория имени Веры К. Рубин в Чили обнаружила самый быстро вращающийся крупный астероид из когда-либо наблюдавшихся. Несмотря на диаметр более полукилометра, этот астероид вращается примерно раз в 1,9 минуты —…
Под Большим Солёным озером может находиться огромное водохранилище пресной воды
На первый взгляд, Большое Соленое озеро выглядит как место, где пресной воде просто не место. Его поверхность покрыта толстым слоем соли, а сокращение береговой линии становится все большей проблемой для…
МО: за ночь над регионами России сбили 25 украинских БПЛА
Российские средства ПВО перехватили и уничтожили за ночь над регионами РФ 25 украинских БПЛА. Об этом сообщили в Минобороны России. "В течение прошедшей ночи дежурными средствами ПВО перехвачены и уничтожены…
Хинштейн: ВСУ за сутки 55 раз обстреляли из артиллерии Курскую область
Вооруженные силы Украины 55 раз атаковали из артиллерии отселенные районы Курской области, 80 беспилотников сбиты в регионе за прошедшие сутки. Погибших и пострадавших нет, сообщил в канале в Мах губернатор…
Трамп: США уничтожат электростанции Ирана, если Ормузский пролив не будет открыт
Американский президент Дональд Трамп заявил, что США уничтожат несколько электростанций Ирана, если Ормузский пролив не будет полностью открыт для судоходства через 48 часов. "Если Иран не откроет полностью и без…
Иранский конфликт стал уже общеевропейской проблемой
Иран нанес удар двумя баллистическими ракетами в направлении британо-американской базы на острове Ди...
Отлично сохранившееся пушечное ядро возрастом 190 лет обнаружено в США
В ходе раскопок возле исторической церкви Аламо в Сан-Антонио, штат Техас, археологи обнаружили заме...
Когда вам покажется, что вы не справитесь, вспомните, что вы из поколения, которое писало сочинения на три страницы. Из головы! Ручкой на большой перемене!
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".