ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У  АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ  МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ

М. М. Биков; В. В. Ковтун

ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ

Автор(и)

М. М. Биков Вінницький національний технічний університет
В. В. Ковтун Вінницький національний технічний університет

Ключові слова:

автоматизована система розпізнавання мовців критичного застосування, розпізнавання образів, кепстральний аналіз, суміш гаусових розподілів, мовний сигнал

Анотація

Досліджено залежність якісних показників роботи автоматизованої системи розпізнавання мовців критичного застосування від використання множини мікрофонів для розпізнавання інформації. Для прийняття рішення щодо особи мовця використано суміші гаусових розподілів. Запропоновано правила формулювання остаточного рішення щодо особи мовця, які узагальнюють результати розпізнавання за інформацією від кожного мікрофону окремо.

Біографії авторів

М. М. Биков, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних систем управління

В. В. Ковтун, Вінницький національний технічний університет

канд. техн. наук, доцент, професор кафедри комп’ютерних систем управління

Посилання

1. Биков М. М. Надійний метод виділення складових сегментів у мовному сигналі / М. М. Биков, В. В. Ковтун, Н. Г. Савінова [Електронний ресурс] // Наукові праці Вінницького національного технічного університету. — 2007. — № 1. — С. 1—6. — Режим доступу : https://praci.vntu.edu.ua/index.php/praci .
2. A short tutorial on Gaussian Mixture Models [Electronic resource] // 14th Conference on Computer and Robot Vision. Edmonton, Alberta. — May 17-19, 2017. — Access mode :
http://www.computerrobotvision.org/2010/tutorial_day/GMM_said_crv10_tutorial.pdf .
3. Reynolds D. A. Speaker verification using adapted Gaussian mixture models / D. A. Reynolds, T. F. Quatieri, R. B. Dunn // Digital Signal Processing. — 2000. — Vol. 10. — P. 19—41.
4. Kittler J. Combining classifiers / J. Kittler, M. Hatef, P.W. Duin // Proc. 7th German Workshop on Color Image Processing (ICPR'96), Erlangen, Germany, 1996. — Vol. 2. — P. 897—901.
5. NOIZEUS: Noisy speech corpus — Univ. Texas-Dallas [Electronic resource]. — Access mode :
http://ecs.utdallas.edu/loizou/speech/noizeus/ .
6. Рабинер Л. Р. Цифровая обработка речевых сигналов / Л. Р. Рабинер, Р. В. Шафер. — М. : Радио и связь, 1981. — 593 c.
7. Perceptual Linear Predictive (PLP) Analysis of Speech [Electronic resource]. — Access mode :
http://seed.ucsd.edu/mediawiki/images/5/5c/PLP.pdf .
8. RASTA Processing of Speech [Electronic resource] // LABrosa. — Access mode :
https://labrosa.ee.columbia.edu/~dpwe/papers/HermM94-rasta.pdf .
9. Reynolds D. A. Robust text-independent speaker identification using Gaussian mixture speaker models / D. A. Reynolds, R. C. Rose // IEEE Trans. Speech Audio Process. — 1995. — Vol. 3. — P. 72—83.

##submission.downloads##

PDF
Завантажень: 91

Переглядів анотації: 195

Опубліковано

2017-06-23

Як цитувати

[1]

М. М. Биков і В. В. Ковтун, «ВИКОРИСТАННЯ МНОЖИНИ МІКРОФОНІВ У АВТОМАТИЗОВАНІЙ СИСТЕМІ РОЗПІЗНАВАННЯ МОВЦЯ КРИТИЧНОГО ЗАСТОСУВАННЯ», Вісник ВПІ, вип. 3, с. 84–91, Черв. 2017.

Завантажити посилання

Номер

№ 3 (2017)

Розділ

Інформаційні технології та комп'ютерна техніка

Метрики

Завантаження

Дані завантаження ще не доступні.

Ліцензія

Автори, які публікуються у цьому журналі, згодні з такими умовами:

Автори зберігають авторське право і надають журналу право першої публікації.
Автори можуть укладати окремі, додаткові договірні угоди з неексклюзивного поширення опублікованої журналом версії статті (наприклад, розмістити її в інститутському репозиторії або опублікувати її в книзі), з визнанням її первісної публікації в цьому журналі.
Авторам дозволяється і рекомендується розміщувати їхню роботу в Інтернеті (наприклад, в інституційних сховищах або на їхньому сайті) до і під час процесу подачі, оскільки це сприяє продуктивним обмінам, а також швидшому і ширшому цитуванню опублікованих робіт (див. вплив відкритого доступу).