Способ верификации диктора

Номер патента: 1675936

Автор: Рамишвили

ZIP архив

Текст

.1 1 б 5)5 6 10 1. 9/ ПИСАНИЕ ИЗОБРЕТЕАВТОРСКОМУ СВИДЕТЕЛЬСТВУ а влеки ОСУДАРСТВЕННЫЙ КОМИТЕТПО ИЗОБРЕТЕНИЯМ И ОТКРЫТИЯМПРИ ГКНТ СССР(71) Институт систем упр я АН ГССР (72) Г. С. Рамишвили(56) Авторское свидетельство СССР М 898496, кл, 6 10 . 9/06, 1984.Розенберг А. Автоматическая верификация диктора. Обзор, Тематический выпуск "Речевая связь с машиной", ТИИЭР, 1976, т.64, Ф 4.(54) СПОСОБ ВЕРИФИКАЦИИ ДИКТОРА (57) Изобретение относится к области автоматического распознавания образов на основе анализа речевых сигналов и может быть использовано для автоматизации контрольно-пропускных пунктов и разработки Изобретение скому распозна анализа речевы использовано д рольно-пропуск дений и разраб обеспечиваю щи ступ определенн или механизмам на основе пред свидетельства о относится к автоматичеванию образов на основе х сигналов и может быть ля автоматизации контных пунктов (КПП) учрежотки "голосовых ключей", х санкционированный доых лиц к банкам данных специального назначения ъявления этими лицами личности своей речи,Целью изобретения является упрощение процесса верификации и повышение ее быстродействия при сохранении высокого уровня надежности верификации,На фиг, 1 на конкретном примере контрольной фазы (слова) дается временная диаграмма анализа акустического матери"голосовых ключей", обеспечивающих санкционированный доступ определенных лиц к банкам данных. Способ упрощает процесс верификации и повышает ее быстродействие при сохранении надежности, Способ заключается в произнесении диктором контрольной фразы, содержащей последовательность глухих и однофонемных звонких участков, выделении звонких участков и их фильтрации в полосах частот основного тона голоса и третьей и четвертой формант, определении последовательности значений плотностей нулевых пересечений сигналов в отфильтрованных частотных полосах и пороговом сравнении параметров выделенных признаков с эталонными самостоятельно в пределах каждого выделенного участка от его начала. 2 ил,ала; фиг, 2 - приведена блок-схема устройства, реализующего способ.Способ поясняется на конкретном примере анализа контрольной фразы (слова) "афиша" (фиг, 1).На фиг. 1 а приведена осцилограмма речевого сигнала; на фиг, 1 б - вид речевого сигнала, который сегментирован по признаку эвонкость-глухость.В пределах выделенных звонких участков, начало и конец которых определяют управляющие импульсы (фиг. 1 в), в моменты времени, соответствующие тактовым импульсам (фиг. 1 г), дискретно определяют значения плотностей нулевых пересечений сигналов, соответствующих выделенным участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса р 0 (фиг. 1 д), третьей р 1 и четвертой р 2формант (фиг. 1 е и ж, соответственно). Эти признаки характеризуют индивидуальную манеру произнесения говорящего, а также тональные и тембральные особенности его голоса. По дискретным значениям признаков р,(+),р 1(+), ир 2(+) формируют матрицу данных (фиг. 1 з), Матрица данных содержит подматрицы, которые сравнивают с соответствующими эталонными подматрицами раздельно, .4 исло строк всех трех подматриц (в указанном примере) равно трем, число столбцов в первой подматрице равно четырем, во второй - шести и в третьей - четырем.Полученная матрица подлежит сравнению с эталонной в соответствии с заранее выбранным значением порога сравнения 9,Устройство, реализующее способ, (фиг. 2) состоит из усилителя 1, разделителя 2 речевого сигнала на звонкие и глухие участки, низкочастотных фильтров 3 для выделения первой гармоники сигнала и двух полосовых фильтров 4 и 5, выделяющих участки спектра, соответствующее третьей и четвертой формантам, Блоки 6 - 8 осуществляют выделение признака плотностей нулевых пересечений р р 1, и р 2 речевого сигнала, проходящего, соответственно, через фильтры 3-5. Данные об изменении плотностей р нулей во времени записываются в запоминающее устройство - формирователь 9 матрицы данных в виде дискретных значений в дискр.,тные моменты времени. Управление записью соответствующих данных в блок 9 осуществляется с помощью блока 10, фиксирующего начало и конец звонких участков сигнала, и блоком 11, генерирующим в этих промежутках времени тактовые импульсы, дискретизирук)- щие значения,Устройство работает в режиме обучения - правое положение переключателя 12, и верификации - левое положение переклк)- чателя 12,Данные из блока 9 в режиме обучения передаются в блок 13, который представляет собой запоминающее. устройство, В режиме верификации данные о неизвестном произнесении фиксируются в блоке 14, который является сравнивающим устройством, сопоставляющим данные блоков 13 и 9. Блок 15 принятия решения анализирует результаты сравнения и констатирует факт принадлежности или непринадлежности контрольного произнесения эталон ному.Устройство работает следующим образом.10 Речевой сигнал после усиления до величины. необходимой для поддержанияработы следующих блоков, подается на разделитель 2, который содержит набор узкополосных фильтров, накрывающих диапаэон частот 100-500 Гц, Ширина полосы пропускания каждого фильтра не больше возможной частоты основного тона голоса и составляет примерно 70 - 80 Гц, Во времяпроизнесения звуков устройство позволяет определять линейчатую структуру сигнала иотделять его от сплошного спектра, имеющего место при глухих звуках,Выделенные блоков 2 звонкие участки15 речи подаются на три фильтра, Г 1 ервый изних (3) представляет собой низкочастотныйфильтр с крутизной спада 18 дБ/окт, начиная от 200 Гц, Этот фильтр служит для выделения первой гармоники сигнала, Фильтр 420 является полосовым фильтром а областиспектра третьей форманты 2200 - 3200 Гц.Фильтр 5 также является полосным фильтром в области четвертой форманты спектра2800-4000 Гц.25 Проходящие через указанные фильтры сигналы далее подаются на блоки6, 7 и 8 ( р-метры), формирующие последовательность значений нулевых точек сигнала, р-метры поедставляют собой30 простые конденсаторные накопители илиинтеграторы, выдающие определенныепотенциалы в зависимости от числа нулевых точек поступающего на них сигнала впромежутке между двумя тактовыми им 35 пульсами,Очевидно, чем выше частота речевогосигнала, проходящего через фильтры 3, 4 и5, тем больше число нулевых точек и, поэтому, тем выше потенциал на накопителе в40 пределах двух соседних тактовых импульсов. Измеренные таким образом значенияна выходах блоков б - 8 отражают как индивидуальные особенности основного тонаголоса и двух высших формант, так и осо 45 бенность их изменения во времени в дискретные моменты времени, обусловленныетактовыми импульсами. Последовательности этих дискретных значений отражают навыходе блока б характер изменения (мело 50 дию) основного тона голоса, на выходах жеблоков 7 и 8 характер изменения третьей ичетвертой формант речи,Для формирования матрицы данныхдискретные значения всех выделенных55 признаков (ро,р 1, ирг) записывают в запоминающее устройство (блок 9) со строгоопределенной адресацией. Управлениепроцессом дискретизации значенийР 0 Р 1 Ы ИР 2(х) р и запись этих значенийв ЗУ осуществляет блок 10, фиксирующий начало и конец звонких участков. сигнала и, тем самым, определяющий адрес записи соответствующих данных в 3 и блок 11, представляющий собой генератор так товых импульсов, служащий для преобразования с частотой 25 Гц аналоговых значений признаков в цифровые в промежутке между управляющими импульсами (блок 10). Сформированная таким образом 10 матрица данных служит основой для характеристики голоса человека. В режиме обучения (правое положение переключателя .12) матрица данных передается в долговременное запоминающее устройство (блок 13) 15 в режиме верификации (левое положение переключателя 12) эти данные передаются в блок 14, где происходит их сравнение с данными блоками 13. Блок 14 фактически является арифметическим устройством, вы числяющим разницу между двумя матрицами. При этом разность берется раздельно по различным участкам матрицы, соответствующим подматрицам, Каждая подматрица отражает соответствующий звонкий 25 участок произносимого речевого отрезка, При неравенстве числа подматриц в контрольном произнесении и эталоне на блок 15 принятия решения выдается отрицательный сигнал, указывающий на "чу жое" произнесение, При равенстве числа подматриц блок принятия решен ия а нал из и рует значение разности матриц и, в зависимости от того, меньше или больше полученное в блоке сравнения аб солютное значение разности матриц некоторого порога 9, констатирует, что диктор "свой" или "чужой", соответственно. В качестве порога 0 берут 10-20 суммы всехчленов эталонной матрицы, В случае реше ния "свой" блок 15 выдает на выходе исполнительный импульс.В случае неравенства числа столбцов контрольной подматрицы и эталонной подматрицы сравнение производят по тем столбцам, которые в обоих подматрицах имеют место ненулевые значения, т, е. сравнение происходит по наикратчайшей (по числу столбцов) матрице (по значимым отличным от нуля столбцам матрицы).Формула изобретения Способ верификации диктора, заключающийся в произнесении диктором заранее выбранной контрольной фразы, выделении акустических признаков речевого сигнала, определении их параметров и порогового сравнения параметров выделенных признаков с заранее установленными эталонными значениями, о т л и ч а ющ и й с я тем, что, с целью упрощения и повышения быстродействия путем упрощенного упорядочения сопоставляемых сигналов, обеспечивающего минимизацию ошибок без применения операции нелинейной нормализации сигналов, в качестве контрольной фразыы испол ьзуют речевой отрезок, с последовательностью глухих и однофонемных звонких участков, выбранный речевой отрезок сегментируют на звонкие и глухие участки, определяют последовательность значений плотностей нулевых пересечений сигналов, соответствующих выделенным звонким участкам речевого отрезка в отфильтрованных частотных полосах основного тона голоса и третьей и четвертой формант, а пороговое сравнение параметров выделенных признаков производят самостоятельно в пределах каждого выделенного участка.ЮУрю 4 иие ФуэиюА,ЬмйЯи ф 1 юуиаВюзи Фис. с Составитель Ю.Ал Техред М,Моргент едактор Н,Гунь Кундри ек Заказ 3006 Тираж Подписное ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СС 113035, Москва, Ж, Раушская наб., 4/5 Производственно-издательский комбинат "Патент", г. Ужгород, ул.Гагарина, 101 ФР,ьф е)У6 РУ- Р Ра " Ь Ри"

Смотреть

Заявка

4740098, 25.06.1989

ИНСТИТУТ СИСТЕМ УПРАВЛЕНИЯ АН ГССР

РАМИШВИЛИ ГУРАМ СОЛОМОНОВИЧ

МПК / Метки

МПК: G10L 17/00

Метки: верификации, диктора

Опубликовано: 07.09.1991

Код ссылки

<a href="https://patents.su/4-1675936-sposob-verifikacii-diktora.html" target="_blank" rel="follow" title="База патентов СССР">Способ верификации диктора</a>

Похожие патенты