ЖУРНАЛ РАДИОЭЛЕКТРОНИКИ. eISSN 1684-1719. 2025. №8

Оглавление выпуска

Текст статьи (pdf)

English page

 

 

DOI: https://doi.org/10.30898/1684-1719.2025.8.15  

УДК: 004.934.2

 

 

ОБНАРУЖЕНИЕ РЕЗКИХ ИЗМЕНЕНИЙ
ИНТЕНСИВНОСТИ РЕЧЕВОГО СИГНАЛА
НА ОСНОВЕ КОНЦЕПЦИИ РЕЦЕПТИВНЫХ ПОЛЕЙ

 

М.М. Гуторов, В.Е. Анциперов

 

ИРЭ им. В.А. Котельникова РАН
125009, Москва, ул. Моховая, 11, корп.7

 

Статья поступила в редакцию 10 сентября 2025 г.

 

Аннотация. В статье рассматривается возможность автоматического выделения временных границ слов и вокализованных звуков в речевом сигнале, представленном в выборочном представлении нейроморфной модели периферического отдела биологической слуховой системы человека. Предложен методический подход, реализующий последовательную обработку речевых сигналов для детектирования временных границ речевых элементов. На первом этапе с использованием временных рецептивных полей формируются признаки резкого изменения интенсивности сигнала, позволяющие определить потенциальные границы речевых фрагментов. Далее осуществляется фильтрация событий начала и окончания речевых сегментов по интенсивности сигнала и показателю максимальной частоты спайков. Для вычисления точности определения границ слов методом рецептивных полей использовался также анализ огибающей сигнала с применением пороговых значений, обеспечивающих устойчивость и воспроизводимость результата. Объективная оценка качества расчетов временных границ звуков методом рецептивных полей проведена путём расчетов среднеквадратичной ошибки результата в сравнении с ручной разметкой. Полученные результаты демонстрируют высокую точность детектирования, достигающую уровня десятков миллисекунд, что подтверждает практическую применимость предложенного метода. Отмечена избыточная чувствительность метода на окончаниях гласных, приводящая к ложным срабатываниям, что указывает на необходимость внедрения адаптивных контекстных правил. Представленный метод может быть использован в задачах анализа и сегментации речевых сигналов в реальном времени.

Ключевые слова: речевая сегментация; детектирование гласных; границы слов; нейроморфная обработка; модель восприятия звука; рецептивные поля; импульсная активность; детектирование событий; обработка речевого сигнала; акустический анализ.

Финансирование: Работа выполнена в рамках государственного задания (номер АААА-А19-119041590070-1) Института радиотехники и электроники им. В.А. Котельникова Российской академии наук.

Автор для переписки: Михаил Михайлович Гуторов gutorov.m.m@gmail.com

Литература

1. Bello J.P., Daudet L., Abdallah S., Duxbury C., Davies M., Sandler M.B. A Tutorial on Onset Detection in Music Signals // IEEE Transactions on Speech and Audio Processing. 2005. Vol. 13, No. 5. P. 1035–1047. https://doi.org/10.1109/TSA.2005.851998

2. Osses A., Varnet L., Carney L.H., Dau T., Bruce I.C., Verhulst S., Majdak P. A comparative study of eight human auditory models of monaural processing // Acta Acustica. 2022. Vol. 6. P. 17. https://doi.org/10.1051/aacus/2022008

3. de Cheveigné A. Simple and efficient auditory-nerve spike generation // bioRxiv. 2023. https://doi.org/10.1101/2023.05.02.539135

4. Land E.H., McCann J.J. Lightness and Retinex Theory // Journal of the Optical Society of America. 1971. Vol. 61, №1. P. 1–11. https://doi.org/10.1364/JOSA.61.000001

5. V.E. Antsiperov, M.M. Gutorov, Signal Intensity Change Point Detection by System of Overlapped Receptive Fields Based on Modeling Perception Mechanisms of Living Sensory Systems // Proc. 25th International Conference on Digital Signal Processing (DSP 2025), Costa Navarino, Greece. 2025. (to appear).

6. Boersma, P.; Weenink, D. Praat: doing phonetics by computer. Version 6.4.42 [Электронный ресурс]. — Amsterdam: University of Amsterdam, 1992–. — Режим доступа: http://www.fon.hum.uva.nl/praat/ (дата обращения 14.09.2025)

Для цитирования:

Гуторов М.М., Анциперов В.Е. Обнаружение резких изменений интенсивности речевого сигнала на основе концепции рецептивных полей. // Журнал радиоэлектроники. – 2025. – №. 8. https://doi.org/10.30898/1684-1719.2025.8.15