Рубрикатор |
Все новости | Новости отрасли |
Офлайновая система распознает голос с точностью в 97%
30 октября 2018 |
Американские ученые из университета Ватерлоо и компании DarwinAI заявили, что смогли создать нейронную сеть для распознавания речи, которая не только работает с очень высокой точностью, но вполне надежно может работать на самых простых смартфонах. Информация об этой разработке была опубликована в онлайн-журнале Arxiv.org.
Об этом сообщает Evercare.ru со ссылкой на онлайн-журнал Arxiv.org.При разработке новой стратегии создания нейронной сети ученые использовали работы специалистов Amazon, отвечающих за создание Alexa, Qualcomm и ирландской компании Voysys.
Разработчики смогли создать несколько моделей высокоэффективных нейронных сетей глубокого обучения, получивших название EdgeSpeechNets, для распознавания речи с ограниченным словарным запасом. Для оценки работоспособности и производительности этих нейронных сетей ученые использовали набор данных Google Speech Commands, содержащий 65 000 односекундных образцов 30 коротких слов и образцов фоновых шумов.
Первая модель - EdgeSpeechNet-A - смогла добиться точности распознавания на 1% выше, чем у эталонной модели распознавания речи (res15), потребляя при этом существенно меньше мощности. Более того, она смогла добиться тестовой точности в 97%, превзойдя таким образом ранее опубликованные достижения.
Другая модель - EdgeSpeechNet-D - была запущена на телефоне Motorola Moto E с процессором Cortex-A53 1.4GHz и работала с задержкой в 34 миллисекунды и потреблением памяти менее 1 Мб. Т.е. с десятикратным снижением задержки и на 16,5% меньшим объемом памяти, по сравнению с упомянутой выше эталонной нейронной сетью.
Еще одна модель, самая маленькая из всех - EdgeSpeechNet-С - показала также более высокую точность, чем эталонная сеть, используя при этом в 7.8 раз меньше параметров и в 10.7 раз меньше операций умножения-сложения.
В итоге, по словам разработчиков, EdgeSpeechNets работает с большей точностью при значительно меньшем размере и существенно меньших затратах вычислительной мощности, чем современные глубокие нейронные сети.
Источник: EverCare.ru
Читайте также:
Yandex SpeechKit научился синтезировать и распознавать речь на узбекском языке
«Ассистент уролога» поможет доктору поставить более точный диагноз почечных заболеваний
Российские ученые разработали нейросеть, способную распознавать марки автомобилей
В «Сколково» представили инновационные системы сортировки отходов
КРОК представил отечественную систему дистанционного контроля промышленной безопасности
Оставить свой комментарий:
Комментарии по материалу
Данный материал еще не комментировался.