Способ селекции признаков для распознавания речевых сигналов

Номер патента: 1037292

Авторы: Кузнецов, Лялин, Поздеев

ZIP архив

Текст

10 15 20 г 5 30 35 40 45 50 55 60 Изобретение относится к технической кибернетике, в частности кспособам распознавания образцов, иможет быть использовано при идентиФикации личности по голосу.Известен способ селекции признаков для распо:навания речевых сигналов, основанный на преобразованииречевого сигнала в последовательностьопорных сигналов, измерении амплитуд этих .сигналов и их сравнении самплитудами пороговых сигналов Г 13,Наиболее близким к изобретению по;технической сущности является способ,основанный на преобразовании речевого сигнала в последовательностьопорных сигналов, выделении спектральных характеристик сигналов исравнении их с эталонными характеристиками образцов 2 3Недостаток известных устройствсостоит в невысокой надежностиселекции признаков.Цель изобретения состоит в повышении надежности селекции признаков.Поставленная цель достигается тем,что согласно способу, основанному навыделении огибающей речевого сигнала,сравнении ее амплитуды с амплитудойпорогового напряжения и формированиипорогового временного интервала,опорных последовательностей речевыхсигналов и импульсов, инвертируютамплитуды опорных речевых сиГналов,последовательно суммируют их самплитудой огибающей речевого сигнала и в моменты формирования порогового Временного интервала преобразуют амплитуду полученного суммарного сигнала. в последовательностьсигналов признаков путем временноймодуляции опорной последовательностиимпульсов длительностью соответствующего порогового временного интервала,На чертеже представлена предлагаемая блок-схема устройства.Речевой сигнал поступает на входусилителя 1, с выхода которого подается на формантные Фильтры 2-4 сдетекторами огибающей, выделяющиеамплитуды А- А опорных сигналов,Амплитуда огибающей речевого сигналавыделяется детектором 5 и подаетсяна блоки 6-8 последовательного вычитания. Блок 9 формирует пороговыйинтервал, начало которого определяется по превышению амплитуды речевого сигнала над амплитудой эталонного сигнала, а конец, наоборот -по превышению амплитуды эталонногосигнала над амплитудой речевогосигнала Выход блока 9 подается науправляющий вход генератора 10импульсов, который через схемы совпадения 11-13 осуществляет вводразностных сигналов в блок 14 приня",тия решения,Импульсы основного тона выделяются блоком 15 и через схему 16 сов падения подаются на счетчик 17. Время счета определяется длительностью временного интервала, вырабатыва 5 емого блоком 18,Для управления работой блока 14 принятия решения, блока 19 памяти и счетчика 17 служит блок 20 управления,Речевой сигнал усиливается усилителем 1 и разделяется на формантные области спектра, Фильтрами 2-4, на выходах которых получаются амплитуды опорных сигналов А - А. На выходе детектора 5 выделяется амплитуда речевого сигнала. На выходах блоков 6-8 последовательного вычитания из опорных сигналов А - АЗ формируются разностные сигналы. Время анализа определяется длительностью временного интервала, вырабатываемого блоком 9. Б течение этого времени интервала генератор 10 импульсов вырабатывает последовательность импульсов, которые через схем 11-13 совпадения осуществляют ввод разностных сигналов в блок 14 принятия решения. Для выделения импульсов основного тона используется блок 15, средняя частота основного тона пропорциональна числу импульсов, прошедших через схему 16 совпадения, и подсчитывается счетчиком 17, Время счета определяется длительностью заданного временного интервала, формируемого блоком 18. Эталонные характеристики образов хранятся в блоке 19 памяти. Блок 20 управления вырабатывает необходимые управляющие, сигналы для начальной установки счетчика 17, запуска блока 14 принятия решения и выдачи эталонных характеристик образов из блока 19 памяти. Проводились экспериментальные исследования предлагаемого способа. В качестве речевого материала использовались 1200 произнесений слова "Аэлита" для 60 мужских и женских голосов, по 20 произнесений на одного диктора. Граничные частоты формантных фильтров 2-4 были равны соответственно 200-850, 850-2200, 2200-3400 Гц. Временной интервал соответствовал участку слова "Аэли". За это время в блок 14, в качестве которого использовалась ЭВМ "Наири-1", оснащенная устройством ввода аналоговых сигналов, вводилось в среднем, 30 отсчетов разностных сигналов. Программным путем формировалось для любого произнесения 10 отсчетов, нормализованных по времени. Средняя частота основного тона под1037292 Введение новой последовательности операций позволило существенно повысить надежность селекции признаков для распознания речевых сигналов. Составитель Т. НичипоровичРедактор Л. Гратилло Техред М.Тепер Корректор М. Демч Заказ 6013/52 Подписно Тираж 706 ВНИИПИ Государственного ко по делам изобретений и от113035, Москва, Ж, Раушская филиал ППП."Патент", г. ужгород, ул. Проектн считывалась на временном интервале,равном 0,4 с.Надежность идентификации личностичелоека по голосу составила 98,4тета СССРытийаб., д. 4/

Смотреть

Заявка

3435440, 06.05.1982

ИЖЕВСКИЙ МЕХАНИЧЕСКИЙ ИНСТИТУТ

КУЗНЕЦОВ ПЕТР ГРИГОРЬЕВИЧ, ЛЯЛИН ВАДИМ ЕВГЕНЬЕВИЧ, ПОЗДЕЕВ ВЛАДИМИР СТЕПАНОВИЧ

МПК / Метки

МПК: G10L 15/08

Метки: признаков, распознавания, речевых, селекции, сигналов

Опубликовано: 23.08.1983

Код ссылки

<a href="https://patents.su/3-1037292-sposob-selekcii-priznakov-dlya-raspoznavaniya-rechevykh-signalov.html" target="_blank" rel="follow" title="База патентов СССР">Способ селекции признаков для распознавания речевых сигналов</a>

Похожие патенты