Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
5300-летнее сверло сдвигает историю развития технологий Египта на 2000 лет назад
Международная группа исследователей установила, что небольшой и давно забытый инструмент из медного сплава, найденный столетие назад в некрополе Верхнего Египта, является старейшим из известных металлических вращающихся сверл в стране Нила.…
Ученые считают, что в 2023 году на Землю упала умирающая черная дыра
Согласно нашим лучшим теоретическим представлениям, чёрные дыры могут перестать существовать. Они испускают излучение Хокинга и, таким образом, медленно испаряются. Чем больше чёрная дыра, тем медленнее она испаряется; но даже самой…
Ученые обнаружили кристаллы времени, нарушающие третий закон движения Ньютона
Группа физиков из Нью-Йоркского университета экспериментально наблюдала новую и радикальную форму кристалла времени — экзотическое состояние материи, компоненты которого, макроскопические частицы, видимые невооруженным глазом, левитируют на звуковой подушке и взаимодействуют…
МО: за ночь над регионами России сбили 108 украинских беспилотников
Силы ПВО за ночь сбили 108 украинских беспилотников над российскими регионами, сообщили в Минобороны РФ. В Волгоградской области в результате атаки БПЛА поврежден многоэтажный дом. Также из-за падения беспилотников возникло…
Безопасность России и наследие Анкориджа. Заявления главы МИД РФ Сергея Лаврова
Министр иностранных дел России Сергей Лавров в интервью для интернет-проекта "Эмпатия Манучи" обвинил Европу и Киев в "изнасиловании" американской инициативы по урегулированию на Украине. Он также отметил, что Россия всегда…
В Канаде при стрельбе в школе погибли 10 человек
По меньшей мере 10 человек, включая нападавшего, погибли в результате стрельбы в школе в городе Тамблер-Ридж (провинция Британская Колумбия). ТАСС собрал основное о происшествии. Шесть жертв нашли в здании учебного…
Четыре важных условия устойчивого мира на Украине
Ни сегодня, ни завтра, ни через несколько месяцев никакого устойчивого мирного соглашения подписано ...
DPA GmbH: Препарат для лечения суставов эффективен от инфаркта и инсульта
Лекарство, которое широко применяют для терапии подагры, может служить и уменьшению риска сердечно-с...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".