РАЗДЕЛЫ
Архив
|
ЦРТ разработал первую русскоязычную технологию Audio Data Mining"Центр Речевых Технологий ≡ Софт | пресс-релизы | 11.02.2008 19:16 Компания «Центр Речевых Технологий» завершила работу над уникальной технологией поиска «ключевых» слов в фонограммах речи для русского языка – Voice Digger. Это первая в России коммерческая разработка в области audio data mining - одного из самых перспективных направлений цифрового компьютерного рынка в мире. Voice Digger позволяет осуществлять автоматическое определение «ключевых» слов и словосочетаний в потоке слитной речи без предварительного прослушивания и, таким образом, становится незаменимым помощником в работе с аудио архивами и мониторинге аудиоинформации. Новая технология способна минимизировать усилия, требующиеся в процессе обработки звуковой информации, и значительно экономить ресурсы. Voice Digger основан на непрерывном распознавании речи, реализуемом на акустических скрытых Марковских моделях (HMM). Ключевые слова задаются в виде обычного набранного текста, по которому система строит НММ модель каждого слова. Кроме того в системе задается так называемая фоновая модель - модель общей речи. При построении моделей ключевых слов используется транскриптор русского языка и акустические модели фонов для русского языка. На выходе VoiceDigger предоставляет ссылку на звуковой документ и местоположение искомого слова или словосочетания. Метод является достаточно быстрым и не зависит от словаря. Уровень ошибки составляет всего 8%. По мнению специалистов, новая технология будет пользоваться спросом в крупных системах обработки, хранения и анализа данных. Модули, созданные на базе Voice Digger, позволят оперативно обработать не только текстовые, но и мультимедиа-данные и получить на выходе систематизированные выборки по интересующей пользователя тематике. Известный поисковый портал Google уже объявил о начале собственных разработок в этой области. Правда, в своих изысканиях он ориентируется прежде всего на англоязычную аудиторию. Voice Digger стал первым в мире коммерческим продуктом подобного класса для русского языка. «В связи с все более активным использованием естественного интерфейса и, в частности голоса, для общения с техникой возросло и значение аудиозаписи как единицы-носителя информации. Появилась потребность в системах, способных быстро и эффективно обслуживать аудио архивы и находить нужную информацию в большом объеме записи. Voice Digger - первая на российском рынке технология способная существенно облегчить работу в этом направлении» - отметил генеральный директор Центра Речевых Технологий Михаил Хитров. комментарии(0) | разделы: пресс-релизы | Софт Другие пресс-релизы |
Последние комментарии
Гость про Суд велел "Твиттеру" сдать сторонников WikiLeaks (12)
Гость про Книгоиздатели начали судиться с торрентами (2)
l_e_x_a про "ВКонтакте" принудительно протестирует пользователей (35)
andrey_kadetov про Google назвал Facebook "ловушкой без выхода" (6)
volv про День папуасского робошахтёра (14)
l_e_x_a про Русские кликботы признаны самыми активными (11)
все комментарии looli спрашивает: Земля вампиров смотреть онлайн в HD качестве looli спрашивает: Зеленый Фонарь смотреть онлайн в HD качестве looli спрашивает: Защитник смотреть онлайн в HD качестве looli спрашивает: Запретная зона смотреть онлайн в HD качестве looli спрашивает: Закон доблести смотреть онлайн в HD качестве looli спрашивает: Вышибала смотреть онлайн в HD качестве looli спрашивает: Встречный ветер смотреть онлайн в HD качестве looli спрашивает: Все любят китов смотреть онлайн в HD качестве |
Copyright © 2001-2020 «Вебпланета». При перепечатке ссылка на «Вебпланету» обязательна.