Когда компьютеры говорят, как они должны звучать?
Это был первый вопрос, с которым команда лингвистов, инженеров и маркетологов из ИБМ столкнулась, когда начали разработку функции, которая превратит текст в речь.
Задача создания компьютерной “личности” - сейчас одна из наиболее важных для растущего числа разработчиков, поскольку люди, у которых заняты руки, используют портативную технику, все чаще применяя именно голосовое взаимодействие.
Не только компьютеры и смартфоны, но и другая техника слушает, понимает и отвечает. Голоса были добавлены различным повседневным объектам использования, таким как автомобили и игрушки, а также бытовой технике.
Пока что невозможно создать компьютеризированный голос, который бы ничем не отличался от человеческого ни для чего-либо более чем короткие фразы, которые могут быть использованы для прогноза погоды или определять направление движения.
Помимо правильного произношения, есть еще большая проблема - это правильное применение человеческих качеств, таких как интонации и эмоции в речи.
Сегодня, не смотря на прогресс, невозможно полностью передать разнообразные эмоции человеческой речи с помощью искусственного интеллекта.
Корни современной речевой технологии синтеза лежат в ранней работе шотландского программиста Алана Блэка, который теперь работает преподавателем в Институте лингвистических технологий в Университете Карнеги-Меллон.
Мистер Блэк признает, что, хотя и был достигнут значительный прогресс, система синтеза речи пока не достигает подобного человеку совершенства. «Проблема в том, что мы не можем просто сказать машине, «скажи это с чувством»» объяснил он.
Исследователи из IBM прослушали голоса 25 актеров в поисках конкретного человека для создания компьютерного голоса. Больше всего им понравилось, когда они «играли» с различными способами изменения голосов, даже в одной точке частотного сдвига, он звучал как голос ребенка.
Исследователи искали машинный голос, который был бы плавным, стабильным и самое главное “приятным”. В конце концов, они, действовали больше как художники, чем инженеры. Голос, которого они достигли, является явно компьютерным, но он кажется оптимистичным и даже немного живым.
“Хороший интерфейс компьютерной машины - художественное произведение и должен рассматриваться как таковой”, сказал старший менеджер IBM.
Трамп провел новый бескровный блицкриг в Латинской Америке – и одержал новую победу. После мгновенно...
В новом исследовании, опубликованном в журнале PLoS ONE, палеонтологи проанализировали окаменелые ос...
Свидетельство о регистрации СМИ Эл № ФС77-83392 от 07.06.2022, выдано Федеральной службой по надзору в сфере связи,
информационных технологий и массовых коммуникаций. При использовании, полном или частичном цитировании материалов
planet-today.ru активная гиперссылка обязательна. Мнения и взгляды авторов не всегда совпадают с точкой зрения редакции.
На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления
информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет",
находящихся на территории Российской Федерации)".