Российские исследователи создали новый алгоритм искусственного интеллекта, который способен с высокой точностью определять эмоциональное состояние человека по его речи. Согласно информации, опубликованной пресс-службой Сбера, новая модель заметно превосходит большинство существующих аналогов, особенно при анализе сложных речевых конструкций и эмоционально насыщенного контента.
Разработчики открыли исходный код модели, что дает возможность другим специалистам тестировать её на различных языках и датасетах, а также адаптировать для практического применения. В частности, модель может быть обучена на русскоязычных эмоциональных корпусах и использована в голосовых помощниках или в системах обслуживания клиентов, где важно точно определять настроение пользователя.
Алгоритм, получивший название CA-SER, разработан совместными усилиями специалистов лаборатории искусственного интеллекта Сбербанка, Института AIRI и Московского физико-технического института. В его основе лежит метод самообучения (SSL), объединяющий несколько подходов, применяемых в обработке речи и анализе эмоций.
Принцип работы алгоритма заключается в поэтапном анализе речевых сигналов. В первую очередь система выделяет ключевые характеристики произношения, а затем добавляет сведения о громкости, тональности и других звуковых особенностях, учитывая, какие частоты воспринимаются человеческим слухом наиболее эффективно. Далее, специальный механизм объединяет эти данные, что позволяет максимально точно интерпретировать эмоциональный окрас речи.
Для проверки эффективности новой технологии команда исследователей протестировала её, а также девять других алгоритмов, используя данные из базы IEMOCAP. Этот набор содержит аудиофайлы, видеозаписи и расшифрованные тексты, отражающие широкий спектр человеческих эмоций.
Испытания подтвердили, что CA-SER значительно обходит большинство аналогичных решений и демонстрирует результаты, сопоставимые с нейросетью HuBERT. Ученые полагают, что внедрение их алгоритма позволит существенно повысить качество работы голосовых интерфейсов и цифровых сервисов, ориентированных на взаимодействие с пользователями.
Эммануэль Макрон обиделся на художника, который живет за тысячи километров от Парижа – в Гваделупе, ...
Химики из Самарского политехнического университета (СамГТУ) представили новый метод синтеза биоразла...
Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,
информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов
planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.
На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления
информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",
находящихся на территории Российской Федерации)".