Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
Ученые нанесли на карту 16 рек на Марсе, текущих вопреки геологическим законам
На Марсе отсутствуют тектонические процессы, которые приводят в движение речные системы Земли, однако когда-то там существовали огромные водные потоки. Уже давно известно, что Марс когда-то был влажным миром. Но всегда…
В Стэнфорде нашли лекарство, способное восстанавливать разрушенный коленный хрящ
Остеоартроз чаще всего развивается на фоне возрастного износа суставного хряща. Но иногда его диагностируют и в молодом возрасте, в частности, из-за больших нагрузок и травм у спортсменов. Но медицина сегодня…
Фрагменты скелета показывают, что ранние виды рода Homo не были похожи на людей
Почти 60 лет Homo habilis занимает почетное место как самый ранний представитель нашего рода Homo. Череп так называемого «человека умелый» имел более плоское лицо и больший мозг, чем у более…
Погибший и пострадавшие в Ростовской области. Последствия атаки украинских БПЛА
Силы ПВО в течение ночи сбили 48 украинских беспилотников над российскими регионами, сообщили в Минобороны РФ. Спасатели при разборе завалов в одной из квартир в Ростове-на-Дону после атаки БПЛА обнаружили…
В Белгородской области при атаке БПЛА погибла женщина
Вооруженные силы Украины атаковали беспилотником автомобиль в селе Зозули Белгородской области, погибла мирная жительница, водитель получил ранения. Об этом сообщили оперштаба региона. "В Борисовском округе в селе Зозули дрон атаковал…
В Санкт-Петербурге предотвратили теракт против сотрудника предприятия ОПК
Сотрудники ФСБ предотвратили теракт в Санкт-Петербурге, задержана завербованная Службой безопасности Украины россиянка, прошедшая обучение диверсионной деятельности. Об этом ТАСС сообщили в Центре общественных связей (ЦОС) ФСБ России. "Федеральной службой безопасности…
Латинская Америка под прицелом Трампа: доктрина Донро в действии
В январе 2025 г. издание New York Post опубликовало статью под провокационным названием «Доктрина До...
Моделирование показывает, что без Марса ритм ледниковой Земли изменился бы
Согласно исследованиям, этот сценарий коренным образом изменит историю климата нашей планеты. Компью...
- Тебе, наверное, больше сорока?
- С чего ты взял?
- Пишешь без ошибок. Чувствуется Советская школа.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".