Насколько «безобидны» нейросети, наглядно показал эксперимент по запуску автономных ИИ-агентов в чате Discord. Выводы весьма тревожные. О чем рассказала публикация о результатах работы ученых в формате препринта на сайте arXiv.
Исследователям удалось обнаружить, что нейросети, которых наделили долгосрочной памятью и возможностью совершать автономные манипуляции, очень восприимчивы к воздействиям извне и могут нанести реальный ущерб информационной инфраструктуре.
Стандартные чат-боты функционируют по принципу «вопрос-ответ» в изолированном окне, но автономным агентам предоставлена возможность анализа контекста, они могут планировать определённые шаги и вступать во взаимодействие друг с другом. Но именно эта свобода и делает их уязвимыми.
Наблюдение специалистами длилось две недели, эксперты оценивали поведением ИИ-агентов в цифровой среде. Оказалось, что злоумышленникам даже нет необходимости писать сложный вредоносный код для взлома. Через несложные текстовые манипуляции и обман агентов несложно было «уговорить» раскрыть личные данные пользователей, переслать секретную документацию. Либо даже дать команду, позволяющую полностью удалить почтовый сервер! Алгоритмы не всегда могли корректно интерпретировать намерения «собеседника» и исполняли деструктивные указания.
Сегодня разные организации все чаще доверяют ИИ ведение рутинных бизнес-процессов, при этом проблема контроля обретает критичность. Ошибки в обычном генераторе текста уже стали привычными, воспринимаются порой даже с юмором. Но когда автономная система, имеющая доступ к корпоративным базам данных, неверно истолковывает инструкции (либо поддаётся вредоносным манипуляциям извне), это чревато катастрофой. Эксперты призывают пересмотреть стандарты безопасности перед широким освоением подобных технологий.
Предложен новый метод синтеза метана из углекислого газа
Химикам Швейцарской высшей технической школы Цюриха удалось совершить прорыв в разработке катализаторов для «зеленой» химии. Они создали структуру с изолированными атомами металла, рассказывает публикация в журнале Nature Nanotechnology. Метанол остаётся…
В Индии создан радиационно-стойкий цемент для более безопасных АЭС
Учеными из Индийского технологического института Гувахати разработан инновационный метод производства более прочного и долговечного цементного раствора, который может продуктивно защищать от вредного излучения на объектах атомной энергетики. Раствор получают путем…
Найден доступный метод получения за минуту светящейся в темноте керамики
Учеными разработан дешевый метод производства светоизлучающих материалов меньше, чем за минуту. О новой технологии ТАСС рассказали в пресс-службе Томского политехнического университета (ТПУ). Специалистами по материаловедению ТПУ в тандеме с коллегами…
МО: за ночь над регионами России сбили 25 украинских БПЛА
Российские средства ПВО перехватили и уничтожили за ночь над регионами РФ 25 украинских БПЛА. Об этом сообщили в Минобороны России. "В течение прошедшей ночи дежурными средствами ПВО перехвачены и уничтожены…
Хинштейн: ВСУ за сутки 55 раз обстреляли из артиллерии Курскую область
Вооруженные силы Украины 55 раз атаковали из артиллерии отселенные районы Курской области, 80 беспилотников сбиты в регионе за прошедшие сутки. Погибших и пострадавших нет, сообщил в канале в Мах губернатор…
Трамп: США уничтожат электростанции Ирана, если Ормузский пролив не будет открыт
Американский президент Дональд Трамп заявил, что США уничтожат несколько электростанций Ирана, если Ормузский пролив не будет полностью открыт для судоходства через 48 часов. "Если Иран не откроет полностью и без…
Иранский конфликт стал уже общеевропейской проблемой
Иран нанес удар двумя баллистическими ракетами в направлении британо-американской базы на острове Ди...
Причиной СДВГ признали энергетический сбой в мозге
Синдромом дефицита внимания и гиперактивности (СДВГ) называют нарушение развития нервной системы, си...
Когда вам покажется, что вы не справитесь, вспомните, что вы из поколения, которое писало сочинения на три страницы. Из головы! Ручкой на большой перемене!
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".