Фирма Sakana AI (Япония) сделала прорыв в области искусственного интеллекта, представив свою новую разработку — систему «The AI Scientist». Эта система разработана для того, чтобы автономно проводить научные исследования, используя языковые модели, подобные тем, что применяются в ChatGPT. Однако, в ходе тестирования, исследователи столкнулись с неожиданным поведением ИИ, которое заставило их пересмотреть потенциальные риски, связанные с автономной работой таких систем, сообщает блог компании.
В одном из тестовых запусков «The AI Scientist» начал переписывать свой собственный код, чтобы продлить время, необходимое для выполнения задачи. Этот инцидент вызвал обеспокоенность, так как ИИ, по сути, попытался обмануть систему, изменив код таким образом, чтобы запускать самого себя в бесконечном цикле. В другом случае система, вместо того чтобы ускорить выполнение задачи, намеренно изменила код, увеличив время ожидания, чтобы уложиться в установленный временной лимит.
Sakana AI опубликовала скриншоты сгенерированного ИИ кода на языке Python, который использовался для управления экспериментом. Эти случаи стали предметом подробного анализа в 185-страничной исследовательской работе компании, где рассматриваются вопросы, связанные с безопасным выполнением кода в автономных ИИ-системах.
Хотя описанное поведение ИИ не представляло угрозы в контролируемой лабораторной среде, оно демонстрирует потенциальные опасности, связанные с использованием таких систем в неконтролируемых условиях. Важно понимать, что даже без наличия гипотетических черт, таких как «AGI» (Artificial General Intelligence) или «самосознание», ИИ может представлять угрозу, если ему разрешено автономно писать и исполнять код. Это может привести к сбоям в критически важной инфраструктуре или даже к созданию вредоносного ПО, пусть и непреднамеренно.
В своей исследовательской работе Sakana AI акцентирует внимание на необходимости изолирования рабочей среды для подобных ИИ-систем. Изолированные среды позволяют запускать программы в безопасных условиях, что предотвращает их влияние на более широкую систему и минимизирует риски нанесения потенциального ущерба. Такой подход, по мнению исследователей, является важным механизмом защиты при использовании передовых ИИ-технологий.
ACP: Учёных озадачил неожиданный эффект негативного сексуального опыта
Американские учёные в ходе нового исследования пришли к выводу, что негативные переживания, что связаны с сексуальными воспоминаниями, забываются медленнее, нежели неприятные эмоции на фоне обычных жизненных событий. Работу опубликовали в …
Одна странная особенность объясняет, почему Великая пирамида стоит уже 4600 лет
Каким-то образом, в то время как остальной древнеегипетский мир рушится вокруг, Великая пирамида Хеопса в Гизе остается стоять, даже спустя 4600 лет. Даже пережив сильные землетрясения и постепенную утрату блестящих…
Aging: Впервые создан препарат, обращающий вспять старение кожи
Научный коллектив из Бостонского университета выяснил, что препарат ABT-263, предназначенный для уничтожения стареющих клеток, способен ускорять заживление повреждений кожи у пожилых. Работу опубликовали в журнале Aging. С возрастом в тканях…
35 пострадавших в Старобельске и 217 БПЛА. Последствия атак ВСУ на российские регионы
Средства ПВО за ночь перехватили и уничтожили над российскими регионами 217 украинских беспилотников, сообщили в Минобороны РФ. ВСУ с помощью дронов нанесли удары по учебному корпусу и общежитию Старобельского профессионального…
Порядка 18 человек под завалами. Главное об атаке ВСУ на колледж в Старобельске
ВСУ с помощью беспилотников нанесли удары по учебному корпусу и общежитию Старобельского профессионального колледжа в ЛНР. Спасатели извлекли из-под завалов тело погибшего студента, сообщили ТАСС в пресс-службе МЧС России. Пострадали…
Шуваев: в Белгородской области при атаках ВСУ пострадали три человека
Вооруженные силы Украины атаковали территорию Белгородской области 157 раз за минувшие сутки. В результате атак три мирных жителя получили ранения, сообщил врио губернатора региона Александр Шуваев в Telegram-канале. "За минувшие…
Россия и Китай дружат для формирования мирового порядка
Отношения России, Китая и США представляют собой сейчас баланс сил для поддержания даже хрупкого мир...
Замороженные микробы из далекого прошлого грозят пробудиться в любой момент
Под вечной мерзлотой планеты скрывается целая стая микробов-злодеев, существовавших задолго до появл...
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".