Способ разделения речевых и нестационарных шумовых сигналов

Номер патента: 1781701

Авторы: Бабкина, Денисон, Молчанов

ZIP архив

Текст

.фи по по на ру тел огр нич над вл т лов опис лиш нал/ Уже ГОСУДАРСТВЕННЫЙ КОМИТЕТПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМПРИ ГКНТ СССР ОПИСАНИЕ ОМУ СВИДЕТЕЛЬСТВ 1(54) СПОСОБ РАЗДЕЛЕНИЯ РЕЧЕВН Е СТАЦИ О НАР Н ЫХ ШУМ О В ЫХ СИЛОВ(57) Изобретение относится к измериной технике и может быть использован Изобретение относится к измерительной технике и может быть использовано при создании устройств для анализа сигналов сложной Формы, применяемых в технике связи, акустике, в системах распознавания речевых и иных сигналов.Известен способ распознавания речевых сигналов в телефонной линии по оценке наличия в них пауз характерной длительности, Недостатком такого способа является необходимость использования достаточно длительной выборки анализируемого сигнала не менее нескольких десятков секунд для выявления и определения распределения длительностей, встречающихся в нем пауз.Наиболее близким к заявленному способу разделения сигналов на речевые и не- речевые является известный способ классификации речевых сигналов, в котором предусматривается усиление анализируемого сигнала, фильтрация его через НЧ сигнало е помех и нест Сущнос усилени кочасто значени ного си их с пора которог ационар ле низко ла в ег ибольше ределяю в. 2 ил. создании устройств для анализа сложной формы. Цель: повышени устойчивости разделения речевых ционарных шумовых сигналов. изобретения: способ состоит в анализируемого сигнала, его ниэ ной Фильтрации, определении числа нулевых переходов получен нала с последующим сравнением говой величиной, по результатам идентифицируют речевые и нест ные шумовые сигналы, причем пос частотной фильтрации сигна выборке выделяют участки с на интенсивностью, для которых и оп значения числа нулевых переходо ьтр с частотой среза 3 кГц, ограничение амплитуде и цифровое кодирование с ледующим сравнением нулевых перехов анализируемом сигнале с заданным чением, определенным для сигналов гих типов. Для реализации способа соно устройство, содержащее последоваьно соединенные усилитель, фильтр, С аничитель, АЦП с компараторами. Огра- ф итель описанного устройства выполнен вух встречно включенных диодах, Недостатком вышеописанного способа яется его низкая помехоустойчивость по ошению к помехам типа белого шума. Проведенные исследования показали, разделение речевых сигналов и сигнатипа нестационарного шума с помощьюанного выше способа идет эффективно ь в том случае, если отношение сигшум для речевого сигнала не менее 10.при отношении сигнал/шум менее 8наблюдается существенное ухудшение вероятности правильной классификации.Целью изобретения является повышение помехоустойчивости разделения речевых и нестационарных шумовых сигналов,Для достижения поставленной цели в способе разделения речевых и нестационарных шумовых сигналов, заключающемся в усилениианализйруемого сигнала, его низкочастотной фильтрации, определении значений числа Ъулевых переходов палученйого сигнйй с йоследующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, после низкочастотной фильтрации анализируемого сигнала в его выборке выделяют участки с наибольшей интенсивностыа, для которых определяют значение числа нулевых переходов.Значение числа переходов анализируемого сигнала через ноль, определенное только для его участков с наибольшей энергией в случае речевого сигнала, в меньшей степени зависит от отношения сигнал/шум, чем значение числа переходов через ноль, определенное для всей выборки речевого сигнала,В та же время для нестационарных шумовых сйгналов значения числа переходов через ноль как для всей выборки, так и для ее участков с наибольшей энергией близки друг к другу и мало зависят от отношения сигнал/шум. Таким образом, в предлагаемом способе отличие в значениях числа переходов разделяемых сигналов через ноль оказывается менее зависимым от отношения сигнал/шум, т.е, более помехоустойчивым, в чем и состоит полезность предлагаемого способа.На фиг.1 изображена функциональная схема, реализующая предлагаемый способразделения речевых и нестационарных шумовых сигналов; на фиг.2 - гистограммы значений чисел перехода речевых сигналов (пунктир) и нестационарных шумовых сигналов сплошная линия) через ноль, определенных для всей выборки сигналов (а,б) и для наибольших элементов в выборках сигналов (в.г) при различных отношениях сигнал/шум: а,в) - отношении сигнал/шум 10, (б,г) - сигнал/шум 5.На фиг.1 использованы следующие обозначения: 1 - источник синалою; 2 - усилитель; 3 - фильтр низких частот; 4 - выделитель элементов выборки сигнала; 5 - определитель числа переходов через ноль для элементов выборки сигналов; 6 - определитель энергии элементов выборки сигнала; 7 - блок запоминания значений числа переходов через ноль для элементов выборки сигнала и их энергией; 8 - выделительэлементов в выборках сигнала, имеющихнаибольшую энергио интенсивность); 95 определитель средней частоты переходовчерез ноль для выделенных элементов выборки сигнала; 10 - блок сравнения; 11 -источник порогового значения.По предлагаемому способу сигнал10 после усиления и фильтрации Делят наэлементы, для каждого из которых определяют число переходов через ноль и энергию. Полученные данные запоминают для. всех элементов, входящих в выборку анали 15 зируемаго сигнала. После чего определяютсреднюю частоту перехода через ноль дляэлементов, имеющих наибольшую энергию(например, превышающую д от значения120 максимальной энергии элемента в даннойвыборке). Полученнбе значение средней частоты перехода через ноль сравниваот спороговым значением, на основании чего ипроизводят разделение речевых и шумовых25 нестационарных сигналов,Функциональная схема на фиг.1, реализующая предлагаемый способ, включает всебя источник сигнала 1, усилитель 2,фильтр 3, выделитель элементов выборки30 сигнала 4, определитель числа переходовсигнала через ноль для элемента выборкисигнала 5, определитель энергии элементавыборки сигнала б, Блок запоминания зна"чений числа переходов через ноль и энергий35 элементов, входящих в выборку сигнала 7,выделиталь элементов с наибольшей энергией 8, определитель значения средней частоты перехода через ноль для элементов снаибольшей энергией 9, схема сравнения40 10, источник порогового значения 11, .Выполнение описанных выше операцийв функциональной схеме, изображенной нафиг.1, обеспечивается тем, что выход источника сигнала 1, соединен со входом усили 45 теля 2, выход которого соединен со входомфильтра 3, выход которого соединен со входам выделителя элементов выборки сигнала4, один из выходов которого соединен совходом определителя числа переходов че 50 рез ноль для элемента выборки сигнала 5,выход которого соединен со входом блоказапоминания 7, другой вход которого соединен с выходом определителя энергии элемента выборки сигнала 6, один вход55 которого соединен са вторым выходом выделителя элементов выборки сигнала 4, авторой вход соединен с выходом фильтра 3,причем выход блока запоминания 7 соединен со входом выделителя элементов с наибольшей энергией (интенсивнастыа) 8,выход которого соединен с определителемсредней частоты перехода через ноль длявыделенных элементов выборки сигнала 9,выход которого соединен со входом схемысравнения 10, другой вход которой соединен с выходом источника порогового значения 11, а выход схемы сравнения 10является выход всей схемььПрактическая реализация узлов, входящих в функциональную схему, изображенную на фиг,1, может быть выполнена насерийно выпускаемых элементах.Так усилитель 2 и фильтр низкйх частот3, выполняотся на операционных усилителях по типовым схемам например, на микросхемах типа 140 ИО 2 А и 140 ИО 4),Выделитель элемейтов выборкй сигнала 4 может быть реализован в соответствиисо схемой сегментатора, описанной в авторском свидетельстве В 485565,В простейшем случае в качестве выделителя элементов выборки сигнала 4 мокет использоваться ключевая схема,уп равляемая интеграл ьн ым и рограммируемым (например, 580 ВИ 53) или непрограммируемым (например, 1006 ВИ 1)таймером с периодом порядка 10 мс.Определитель числа переходов черезноль для элементов выборки сигналов 5 может быть реализован на интегральных компараторе и счетчике (например, намикросхемах 597 САЗА и 561 ИЕ 10). Определитель энергии элементов выборки сигнала 6в простейшем случае может быть образованпоследовательно включенными двухполупериодным измерительным выпрямителем, интегратором, схемой выборки хранения ианалого-цифровым преобразователем, управляемым узлом 4. Эти компоненты могутстроиться на микросхемах 140 УД 20,544 УД 1 А, 590 КН 12, 1100 СК 2 Б. 1113 ПВ 1 А илогических схемах малой интеграции.Дальнейшую обработку целесообразновести средствами микропроцессорного контроллера, имеющего оперативную памятьдостаточной емкости, выполняющей функции блока 7 запоминания значений числапереходов через ноль и энергии для элементов выборки сигнала,Выделитель элементов с наибольшейэнергией 8 реализуется программно, Оносуществляет операцию выбора наибольшего значения энергии (интенсивности). Евах элемента из запомненных в блоке памяти и определяет номера тех элементов,значения энергии интенсивности которыхЕвахпревышают величину - , где И - заранеезаданная величина (например, 2), 40 взрывных, фрикативных, дрожащих звукахсоздает микропаузй даже в намеренно непрерывной речи, К таким микропаузам прибааля ются паузы между словами, интонационные паузы и т.п,,В целом вероятностное распределениепауз в непрерывной речи описывается распределением Вайбулла.Таким образом, в выборке из речевогосигнала длительностьк в 0,5 с суммарноевремя пауз составит около 250 мс.Частота перехода через ноль у чистогоречевого сигнала в основном обусловлена частотой перехода на участках гласных звуков, которые занимают основное время втечении звучания речи. Характерные значения частоты перехода через ноль для гласных звуков гораздо ниже тактовых для нестационарного шума, что и позволяет поэтому признаку разделять эти два класса сигналов,5 10202530 35 В контроллере, выполняющем указанную операцию, может использоваться микропроцессорный комплект серии 580 с микросхемами памяти серии 537. Определитель средней частоты переходов через ноль для выделенных элементов выборки сигнала 9 выполняется с помощью того же контроллера,Значения частот переходов через ноль для выделенных элементов складываются и полученная величина делится на число выделенных элементов.Схема сравнения 10 реализуется программно средствами типового контроллера, выполняющего операцию вычитания двух чисел, занесенных в блок памяти.В качестве источника порогового значения 11, используется блок памяти, в заданной ячейке которого записано значение пороговой величины, определенное на основе анализа обучающих выборок разделяемых классов сигналов,В целом функции, выполняемые совокупйостью"узлов 7, 8, 9, 10, 11, могут быть полностью реализованы с помощью малыхуниверсальных ЭВМ типа "Электроника 60 М", СМ 1425, ЕС 1841 и т,п.Для анализа причин, обуславливающих недостаточную помехоустойчивость существу 1 ощих способов разделения речевых и нестационарных шумовых сигналов по частоте перехода через ноль, рассмотрим особенности временных структур разделяемых сигналов.Основной особенностью структуры речевых сигналов являются микропаузыНаличие в речи микропауз обусловленосамой природой процесса формированиязвуков речи. Так наличие прерываний во10 15 20 25 30 40 55 В то же время появление шумовой помехи в речевом сигнале на участках гласных мало влияет на частоту перехода через ноль.Однако на участках пауз,шум обеспечивает резкое возрастание частоты переходов через ноль, что влияет на общее значение этого параметра, определенного по всей выборке анализируемого речевого сигнала,В то же время у шумового нестационарного сигнала паузы практически отсутствуют и, следовательно, наличие шумовой помехи у сигналов такого класса должно мало влиять на среднее значение частоты перехода через, ноль.Для проверки эффективности предлагаемого способа разделения речевых и нестационарных шумовь 1 х сигналов был разработан и испытан макет, реализующий функциональную схему, изобракенную на фиг.1.В качестве источника сигнала использовались: магнитофон "Электроника" (для речевых сигналов) и генераторы Г 2 - 57 36 201 и ГЗ(для шумовых сигналов); Формирование смеси сигнала с шумом осуществлялось сумматорами на операциойных усилителях типа 140 УД 7,В качестве речевого сигнала использовалась повествовательная речь на различных языках. Длительность записей составляла не менее 3-х мин каждая. Всего было использовано при экспериментах 25 записей различньх дикторов, При построении гистограмм использовалось не менее 100 выборок каждого сигнала, Длительность анализируемой выборки сигнала составляла менее 0,5 с. В качестве фильтра использовался активный РС фильтра Бесселя низких частот 10 порядка с частотой среза 4 кГц Фильтр реализован на операционныхусилителях 140 УД 7. Выделение элементов выбор"ки сигнала осуществлялось с помощью тактового генератора (Г 5-60), Длительность элемента составляла 10 мс, Всего в выборке использовалось 32 элемента.Определитель энергии элемента сигнала реализовывался с помощью интегратора, собранногона Операционном усилителе типа 544 УД 1 А со схемой сброса на ключах 590 КН 5, срабатывающей от импульсов тактового генератора после задержки необходимой для записи сигнала интегратора схемой выборки-хранения 1100 СК 2. Преобразование сигнала с выхода этой схемы в код производилось с помощью АЦП типа 1113 П В 1 А. Определитель частоты перехода через ноль для элемента сигнала реализовывался с помощью микросхем типа597 САЗ и 133 ИЕ 5,Код числа переходов через ноль и код свыхода АЦП в конце каждого элемента считывались через интерфейс ЭВМ по командеот тактового генератора.Блоки 7,8,9,10,11, а также алгоритмы управления экспериментом были реализованы средствами ЭВМ "Электроника",программы управления считыванием данных, их накопления и предоставления ре"зультатов разрабатывались и отлаживалисьсредствами операционной системы РАФОСна комплекс "Электроника-В", дополненном накопителем на гибких магнитных дисках ГМД.На фиг 2 представлены гистограммы,характеризующие эффективность существующего и предлагаемого способов разделения речевых и шумовых нестационарныхсигналов.На фиг.2(а,б), представлены числа переходов через ноль, определенных по существующему способу, т.е, для всей выборкисигналов для речевых (пунктирная линия) ишумовых нестационарных сигналов (сплошная линия) при отсутствии помех (фиг.2 а -отношение сигнал/шум больше 10) и при ихналичии (фиг,2 б - отношение сигнал/шумравно 5).Сопоставление гистограмм, изображенных на фиг,2(а и б), показывает; что в товремя как для чистых сигналов оба класса почастоте переходов через ноль, определенной по существующему способу, хорошоразделяются, появление даже незначительной помехи резко ухудшает разделение сигналов. Такдля отношения сигнал/шум,равного 5, вероятность ошибки разделениясоставляет 350.Характерна, что появление шумовой помехи мало влияет на характер гистограммыдля нестационарного шума и ухудшениеразделения сигналов идет за счет деформации шумовой помехой гистограмма для речевого сигнала.Рассмотрение аналогичных гистограмм, приведенных на фиг.2 в, 2 г для значений частоты переходов через ноль,определенных по предлагаемому способу,показывает и значительно большую помехоустойчивость.Из фиг,2(в, г) следует, что процесс разделения по предлагаемому способу дляшумовых и речевых нестационарных сигналов при соотношении сигнал/шум, равном 5, происходит с вероятностью ошибкине хуже 6.Таким образом, экспериментально подтверждено, что предлагаемый способ обеспечивает увеличение помехоустойчивости разделения речевых и шумовых нестационарных сигналов не менее, чем в 5 раз по сравнению с существующим способом, что и определяет его полезность.Формула изобретения Способ разделения речевых и нестационарных шумовых сигналов, заключающийся в усилении анализируемого сигнала, его низкочастотной фильтрации, определении значений числа нулевых переходов полученного сигнала с последующим сравнением их с пороговой величиной, по результатам которого идентифицируют речевые и нестационарные шумовые сигналы, о т л и ч а ю- .5 щ и й с я тем, что, с целью повышенияпомехоустойчивости разделения, после низкочастотной фильтрации анализируемого сигнала в его выборке определяют участки с наибольшей интенсивностью, для 10 которых определяют значения числа нулевых переходов.1781701Я О 3 Оаг О 2.2 Составитель А,МолчановТехред М.Моргентал . Корректор Н.Бучок акт аказ 4276 ТиражВНИИПИ Государственного комитета по изобр113035, Москва, Ж, Рауш Н Производственно-издательский комбинат "Патент", г, Ужгород, ул.Гагарина, 1 с320 25 30 3 Г ФОе АЗ череЗ ноль Подписноеиям и открытиямя наб 4/5

Смотреть

Заявка

4870056, 27.09.1990

ЛЕНИНГРАДСКИЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКИЙ ИНСТИТУТ "ВЕКТОР"

МОЛЧАНОВ АЛЕКСАНДР ПАВЛОВИЧ, БАБКИНА ЛЮДМИЛА НАЗАРОВНА, ДЕНИСОН БОРИС ГЕОРГИЕВИЧ

МПК / Метки

МПК: G10L 5/00, G10L 7/00

Метки: нестационарных, разделения, речевых, сигналов, шумовых

Опубликовано: 15.12.1992

Код ссылки

<a href="https://patents.su/6-1781701-sposob-razdeleniya-rechevykh-i-nestacionarnykh-shumovykh-signalov.html" target="_blank" rel="follow" title="База патентов СССР">Способ разделения речевых и нестационарных шумовых сигналов</a>

Похожие патенты