Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
Древний раскол континента способствовал образованию ледяного щита Антарктиды
Когда Антарктида отделилась от Африки во время распада суперконтинента Гондвана 160 миллионов лет назад, этот разрыв не только разделил континенты. Согласно исследованию, опубликованному в журнале Science, он, возможно, также спровоцировал…
Комета из-за пределов Солнечной системы обладает уникальным химическим составом
Все признаки уже указывали на то, что межзвездная комета 3I/ATLAS не похожа ни на что из того, что мы когда-либо видели. Когда в прошлом году этот объект пронесся по внутренней…
Радар обнаружил в Узбекистане скрытый 2000-летний греческий военный лагерь
Хотя образ Александра Великого широко распространен в народе, он был талантливым военным стратегом, который, несмотря на превосходство противника, одерживал победы над персидскими армиями, превосходящими по численности его собственную. Казалось, Александр…
МО: за ночь над Россией сбили 71 украинский БПЛА
Российские средства ПВО за ночь перехватили и уничтожили над регионами РФ и Черным морем 71 украинский БПЛА. Об этом сообщили в Минобороны России. "В течение ночи в период с 20:00…
Аксенов: в Крыму из-за атаки ВСУ погиб человек, еще двое были ранены
После удара Вооруженных сил Украины по территории Крыма погиб человек. Еще двое пострадали. Об этом сообщил глава республики Сергей Аксенов. "На севере Крыма в результате очередной атаки врага погиб один…
Президенты России и США провели очередной телефонный разговор
Президент России Владимир Путин поговорил по телефону со своим американским коллегой Дональдом Трампом, сообщил помощник российского лидера Юрий Ушаков. По его словам, президент РФ указал Трампу на ложные посылки Киева…
Украина и Польша обречены на конфронтацию
Русофобия – слишком зыбкий базис для крепких отношений Польши и Украины. «Враг моего врага – еще не ...
Грибы с более широким спектром питания лучше уничтожают вредителей растений
В природе умение хорошо делать что-то одно обычно означает неумение делать что-то другое. Ученые наз...
Всегда смущало наличие в ПДД гужевой повозки. Сейчас вообще вопросов не возникает.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".