Международный исследовательский коллектив провёл тестирование ведущих языковых модели при помощи теста Струпа, который остаётся классическим психологическим инструментом для измерения концентрации. Результаты удивили: чем длиннее была задача, тем хуже ИИ с ней справлялся. Работу опубликовали в журнале PNAS Nexus.
Как обычно делается тест Струпа? Испытуемому демонстрируют слова-цвета, которые написаны цветными чернилами. Задача в том, чтобы называть цвет чернил, не произнося собственно слово. Так, если слово «зелёный» написано красным, требуется отвечать «красный». Люди как правило справляются с этим успешно, даже когда списки слов длинные.
Этот тест в эксперименте провели с GPT-4o, Claude 3.5 Sonnet, GPT-5, Claude Opus 4.1 и Gemini 2.5. Когда ИИ нужно было справляться с короткими списками в 5 слов, все системы делали эту работу хорошо. Но как только списки слов росли, точность резко падала. Так, GPT-4o при 5 словах удавалось верно идентифицировать 91% ответов, при 10 задачах КПД снижался до 57%, при 40 — падал до 15%. Claude 3.5 держался до 20 слов, а потом резко рухнул до 24%.
Авторы считают, что модели утрачивают связь с инструкцией и возвращаются к тому, что умеют лучше всего — читают слова. Это принципиальное отличие от людей: мы способны поддерживать устойчивое произвольное внимание.
Россиян атакуют мошеннические сайты с опросами и обещаниями кешбэка
В преддверии Дня России активность интернет-мошенников заметно выросла. Специалисты компании F6 выявили как минимум восемь фишинговых сайтов, которые злоумышленники запустили в период с 30 мая по 8 июня. Названия доменов…
В Европе планируют наладить выпуск аккумуляторов из старых батарей
Снизить вред для экологии позволит переработка отслуживших аккумуляторов. Подобный метод даст возможность сократить выбросы углекислого газа на 80% в сравнении с привычной добычей сырья. Ключевым компонентом анодов литий‑ионных аккумуляторов является…
Найдена возможность превращать отходы древесины в ванилин и биопластик
Группа сотрудников Университета Аликанте и Политехнического университета Валенсии (Испания) представила технологию трансформации лигнина в ванилин и биоразлагаемые материалы. Итоги исследования опубликованы в Nature Communications. Методика даёт возможность стабильно перерабатывать растительные…
Погибшие в Туле и 123 БПЛА. Последствия атаки ВСУ на российские регионы
Средства ПВО перехватили и уничтожили за ночь над российскими регионами, акваториями Черного и Азовского морей 123 украинских беспилотника, сообщили в Минобороны РФ. Украинские беспилотники атаковали жилой сектор Тулы. По предварительным…
Массированный удар ВС России по объектам ОПК Украины. Главное
Российские войска ударили по украинским объектам оборонно-промышленного комплекса (ОПК), военным аэродромам и территориальным центрам комплектования в Киеве, Харькове и Днепропетровске. Об этом сообщили в Минобороны РФ. ТАСС собрал основное об…
Сделка между США и Ираном: ключевые заявления сторон и международная реакция
США и Иран достигли договоренности об урегулировании конфликта. 19 июня в Женеве запланировано подписание соглашения. С 15 июня объявляется окончание морской блокады Ирана со стороны США, а также немедленное и…
Войска НАТО начали окружать Россию с севера
В финском городе Рованиеми создан сухопутный штаб НАТО. На 13 июня запланирована официальная церемон...
Влажная почва провоцирует и усиливает экстремальные волны жары по всему миру
Жара, как правило, обрушивается на одни и те же знакомые места. Засушливые внутренние районы Северно...
А вот если ты уверен, что завтра будет хуже, чем сегодня, это ведь тоже своего рода уверенность в завтрашнем дне?
Этот сайт использует файлы «cookie» с целью повышения удобства его использования. Во время посещения сайта вы соглашаетесь с тем, что мы обрабатываем ваши персональные данные с использованием сервиса «Яндекс. Метрика». Продолжая использовать сайт, вы соглашаетесь с Политикой конфиденциальности.
Зарегистрировано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций
(Роскомнадзор). Реестровая запись от 07.06.2022 серия ЭЛ № ФС 77 – 83392. При использовании, полном или частичном
цитировании материалов planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с
точкой зрения редакции. На информационном ресурсе применяются рекомендательные технологии (информационные технологии
предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей
сети "Интернет", находящихся на территории Российской Федерации)".