Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
Черные дыры «качаются», выбрасывая вещество в виде ветров или струй
Сверхмассивные чёрные дыры (СМЧД), расположенные в центре многих галактик (от карликовых до массивных), представляют собой настоящую силу природы. Со временем пыль и газ из их окружения падают на них, образуя…
«Часы старения» выявлены в сперматозоидах
Группа специалистов из Университета здравоохранения штата Юта выяснила, что РНК в сперматозоидах с возрастом постепенно меняется, создавая своего рода «часы старения», способные оказывать влияние на здоровье потомства. Результаты работы опубликовали …
В Иордании найдено захоронение жертв Юстиниановой чумы, переписывающее историю
Фраза «на нас обрушилась чума» наверняка часто звучала в древней Иордании, где таинственная болезнь унесла бесчисленные жизни и в конечном итоге сформировала не только общество, но и целую эпоху цивилизации.…
МО: за ночь над регионами России сбили 31 украинский беспилотник
Над регионами России за ночь уничтожили и перехватили 31 украинский беспилотник. Об этом сообщили в Минобороны РФ. "С 23:00 21 января до 07:00 мск 22 января дежурные средства ПВО перехватили…
Москалькова: в Курской области после вторжения ВСУ в массовых захоронениях нашли 524 тела
Тела 524 погибших в Курской области были найдены в местах массовых захоронений после вооруженного вторжения в регион ВСУ. Об этом сообщила уполномоченный по правам человека в РФ Татьяна Москалькова. "С…
Поддержка семей и бесперебойное обеспечение льготными лекарствами. Заявления Путина на совещании с правительством
Защитники Отечества должны быть уверены, что все вопросы социального характера как для них, так и для их близких, будут решаться эффективно, заявил глава государства Владимир Путин на совещании с правительством.…
Как канадские партизаны будут сражаться против США
В Канаде стали появляться первые прикидки планов обороны на случай военного вторжения со стороны США...
Падающий космический мусор можно отследить по звуковым ударам
В апреле 2024 года серия огненных шаров пронеслась по небу Южной Калифорнии — это были горящие облом...
Мне кажется, что Чебурашку и Буратино в новых российских фильмах рисовали дизайнеры АвтоВАЗа.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".