ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке

ИИ от Google поможет сделать их голосовой ассистент лучшим на рынке

На сегодняшний день голосовые ассистенты довольно неплохо распознают речь. Но есть одна проблема: как правило, помощники работают хорошо до тех пор, пока они слышат более или менее «правильную» речь. Стоит с ними заговорить с акцентом или же просто невнятно, и от «ума» ассистента не останется и следа. Однако же исследователи лаборатории Google AI, работающие совместно с учеными из Института по изучению бокового амиотрофического склероза (болезни, от которой страдал известный физик Стивен Хокиг), разработали ИИ-систему, которая может распознавать произношение людей с нарушениями речи или акцентом.

Исследователи из Google говорят, что их подход поможет улучшить автоматическое распознавание речи, да и в целом их технологию можно без труда интегрировать в практически любую существующую систему по распознаванию голоса. Люди с боковым амиотрофическим склерозом часто имеют невнятную речь, но существующие системы ИИ обычно обучаются на голосовых данных от тех, кто говорит без каких-либо затруднений. Новый подход позволит значительно улучшить работу подобных алгоритмов. При этом голосовые ассистенты смогут куда лучше распознавать в принципе любую невнятную речь.

Сама система носит название Project Euphonia и для того, чтобы ее обучить, эксперты использовали более 36 часов голосовых аудиозаписей, полученных от 67 человек, страдающих боковым амиотрофическим склерозом. В результате после обучения, Project Euphonia сумел гораздо эффективнее распознавать речь. Если говорить о невнятной речи, то процент узнавания вырос на 62%, а вот в случае с акцентом данные куда скромнее — алгоритм справился «всего» на 35% лучше стандартных программ для распознавания голоса.

Стоит заметить, что все тестирование проходило на английском языке, но алгоритм, по словам создателей, легко можно интегрировать и в другие голосовые пакеты. К тому же, сейчас Project Euphonia находится лишь на начальном этапе разработки и нельзя исключать улучшения показателей в будущем. О новейших разработках в этой сфере мы обязательно сообщим вам в нашем новостном Телеграм-канале. Так что рекомендуем подписаться.

Источник

Следующая новость
Предыдущая новость

Официальный сайт казино Rox Обновление для смартфонов Samsung нарушило работу их фронтальной камеры Объявлены самые быстрые смартфоны в мире Microsoft разрабатывают беспроводные наушники-вкладыши «Почта России» начнёт распознавать клиентов по лицу до конца года"

Последние новости