Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
Ученые восстановили облик жившего 125 млн лет назад родственника крокодила
Исключительно хорошо сохранившаяся кожа Montsecosuchus depereti, вымершего крокодиломорфа размером не больше домашней кошки, обитавшего в тропических болотах ранней меловой Испании, позволила палеонтологам реконструировать детали его чешуи, органов чувств и даже…
Radiology: Уменьшить боль при артрозе можно, не прибегая к операции
Участники международной группы исследователей сообщили об успешном применении нового малоинвазивного метода терапии остеоартроза коленного сустава. С помощью процедуры можно уменьшать боль и улучшать подвижность без хирургической замены сустава, и позитивный…
EHJ: Названы популярные пищевые консерванты, повышающие риск инфаркта
Масштабное эпидемиологическое исследование, к которому были привлечены 112 395 человек, позволило выявить связь между употреблением пищевых консервантов и повышением рисков гипертонии и сердечно-сосудистых патологий. Работу проводили в рамках французского когортного…
МО: за ночь над регионами России сбили 239 украинских БПЛА
Беспилотники уничтожили над территориями Астраханской, Белгородской, Брянской, Курской, Орловской, Ростовской областей, Краснодарского края, Республики Крым, Республики Адыгея, а также над акваториями Азовского и Черного морей Российские средства ПВО перехватили и…
Аксенов: из-за атаки БПЛА ВСУ на Керченский полуостров погибли четыре человека
На Керченском полуострове от атаки БПЛА ВСУ погибли 4 человека и 28 пострадали. Об этом в "Максе" сообщил глава Республики Крым Сергей Аксенов. "В результате атаки вражеских БПЛА на Керченский…
В результате атаки БПЛА ВСУ на Керченской паромной переправе погиб человек
В Темрюкском районе на Керченской переправе атакован паром «Панагия». По предварительной информации один человек погиб, еще один – пострадал. Также в результате атаки БПЛА произошло возгорание на нефтяном терминале в…
Киев демонстративно срывает с себя польские ордена
Президент Польши Кароль Навроцкий лишил Владимира Зеленского Ордена Белого Орла за героизацию военны...
Ископаемые из китайской пещеры заполняют важный пробел в истории приматов
В глубине известняковой пещеры на юге Китая палеонтологи обнаружили скопление из тринадцати окаменел...
Работа - это такая вещь, которая мешает получать удовольствие от жизни, помогая получать удовольствие от жизни.
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".