"ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ" N 7, 2009

оглавление              текст:   html,   pdf   

Независимая система распознавания речи с использованием нейронных сетей


Н. У. Махешвари
1, А. П. Кабилан2, Р. Венкатеш3
 

1P.S.N.A Инженерно-технический колледж, Диндигул, Индия
2Инженерно-технический колледж, Карур, Индия
3P.V.S. Инженерно-технический колледж, Диндигул, Индия
 

Получена 4 июля 2009 г.

 

Независимая от говорящего система распознования речи важна для успешной разработки устройств распознавания речи для большинства реальных приложений. В то время как зависящие от говорящего распознаватели речи достигли точности 100%, системы распознавания, независящие от говорящего, имеют низкую точность, не превышающую 75%. В работе описывется двух-модульная независящая от говорящего система распознавания речи для англоязычной речи. Первый модуль выполняет распознавние фонем, используя двухслойную нейронную сеть. Второй модуль выполняет распознавание слов, исходя из строки фонем, используя скрытую марковскую модель. Система была протестирована англоязычной речью, состоящей из 2000 слов, произнесенных 100 говорящими. Точность распознавания составила 92%, что намного выше результатов предыдущих работ.

 

Ключевые слова: независящее от говорящего распознавание речи, нейронная сеть, скрытая марковская модель, фонемы.

 

Speaker Independent Speech Recognition System Using Neural Networks

 

N.Uma Maheswari1, A.P.Kabilan2 , R.Venkatesh3  

 

1Senior Lecturer, Dept. of CSE, P.S.N.A College of Engg& Technology, Dindigul-624622,India

2Principal, Chettinad college of Engg& Technology, Karur-639114,India

3Senior Lecturer, Dept. of CSE, R.V.S College of Engg& Technology, Dindigul-624005,India

 

Received July 4, 2009

 

Speaker independent speech recognition is important for successful development of speech recognizers in most real world applications. While speaker dependent speech recognizers have achieved close to 100% accuracy, the speaker independent speech recognition systems have poor accuracy not exceeding 75%. In this paper we describe a two-module speaker independent speech recognition system for all-British English speech. The first module performs phoneme recognition using two-level neural networks. The second module executes word recognition from the string of phonemes employing Hidden Markov Model. The system was trained by British English speech consisting of 2000 words uttered by 100 speakers. The test samples comprised 1000 words spoken by a different set of 50 speakers. The recognition accuracy is found to be 92% which is well above the previous results.

 

Keywords: speaker independent speech recognition, Neural Network, Hidden Markov Model, phonemes.

   xxx