Способ идентификации говорящего
Похожие патенты | МПК / Метки | Текст | Заявка | Код ссылки
Текст
СОЮЗ СОВЕТСНИХСОЦИАЛИСТИЧЕСНИХРЕСПУБЛИН(1) 10 Ь 9 ИСАНИЕ РЕТЕН 1 О ГОСУДАРСТ 8 ЕННЫЙ НОМИТЕТПО ИЗОБРЕТЕНИЯМ И ОТНЯТИЯПРИ ГКНТ СССР АВТОРСКОМУ СВИ ТЕЛ(46) 23.01.89. Бюл В 3 (71) Институт систем управления АН ГССР(56) Авторское свидетельство СССР У 1117687, кл. С 10 Ь 9/06, 1983.Заявка Японии У 56-80100 кл. 6 10 Ь 9/06, 1981. (54) СПОСОБ ИДЕНТИФИКАЦИИ ГОВОРЯ- ЩЕГО 1453442 А 1(57) Изобретение касается анализаречевых сигналов и автоматического распознавания образов и можетбыть использовано для автоматизацииконтрольно-пропускных пунктов и разработки "голосовых ключей"; Применение способа повышает надежность идентификации личности и обеспечение устойчивости систеию к попыткам имитации голоса. Способ заключается в сравнении временной последовательностикомплекса параметров речевого сигнала с индивидуальными для диктораэталонами.Изобретение относится к анализуречевых сигналов и автоматическому распознаванию образов и может быть использованодля автоматизации контрольно-пропускных пунктов (КПП) уч. реждений и разработки "голосовых11ключей , обеспечивающих санкционированный доступ определенных лиц к банкам или механизмам специального назначения на основе предъявления этими лицами в качестве свидетельст-ва о личности своей речи.Целью изобретения является повышение надежности. идентификации говорящего путем анализа наиболее информативных с точки зрения различения , голосов гласных фонем, выделяемых ;лишь по признаку наибольшей интенсив ности и звонкости звука.Способ свободен от необходимости осуществления сложных процедур нели" нейной нормализации продолжительнос ти звучания фразы. Действительно, простая по своей природе операция 25 не вносит больших интраиндивидуальных вариаций при различных произнесениях одного и того же диктора, и в то же время может обеспечить сущест,венный вклад при отстранении чужих"30 голосов за счет возможной неидентичной экстракции опорных гласных для разных дикторов даже в случае, если мистификатору известна парольная фраза.На фиг. 1 показан пример устройства, реализующего способ; на фиг. 2 - вре-. менные диаграммы, иллюстрирующие способ идентификации.Устройство содержит кнопку 1 запуска, усилитель 2, выделитель 3 звонких участков еигнала, механический фикса:тор 4 кода для установки числа выделяемых опорных сегментов, экстрактор 5 интенсивных фонем, а также начального и конечного сегментов сигнала,45 измеритель 6 длительности между опорными сегментами, счетчик-определитель7 числа экстремальных точек, детектор 8 первой гармоники сигнала, счетчик. 9 числа нулевых точек, формирова тель 10 матрицы признаков, переключа- . тель 11 режимов обучения и верификации, блок 12 обучения, блок 13 сравнения и блок 14 принятия решения.Пусть в качестве парольной фразы йденти 4 щцируемым лицом выбрана фраЗа: "Мой голос-мой код" (фиг. 2). Жарактер огибающего речевого сигнала, соответствующего этой парольной фразе, приводится на фиг. 2 а. Для удобства под иллюстрацией дается буквенная (а не фонематическая) запись парольной фразы.С произнесением фразы сигнал через усилитель 2 поступает на вьщелитель звонких участков сигнала 3, Этот блок состоит иэ набора узкополосных фильтров с частотным диапазоном 100- 500 Гц. Ширина полосы пропускания каждого фильтра не больше возможного периода основного тона голоса и составляет примерно 70-80 Гц, Во время произнесения звонких звуков это позволяет определить линейчатость структуры сигнала, так как гармони" ки сигнала не смогут одновременно попасть во все фильтры. Обратная картина имеет место при произнесении глухих звуков.Разделение сигнала на звонкие и не звонкие участки сигнала показа" но на фиг. 2 б, Заштрихованная часть диаграммы указывает на звонкий характер сигнала.Далее с помощью экстрактора 5 из сигнала вьщеляются интенсивные участки на местах ударных гласных звуков, а также в начале и в конце произнесения. Этот блок представля" ет собой микропроцессор, включающий в себя запоминающее устройство и вычислитель числа (задаваемого заранее с помощью фиксатора 4) энергетически мощных участков сигнала, а также стандартных по длительности участков в начальной и конечной части сигнала, Для случая п = 5 эта операция показана на фиг. 2 в.Далее с помощью блока 6 определяются длительности Т., - Т между началами выбранных мощных учатсков (опорных сегментов) сигнала, а также длительность времени То от запуска (кнонкой 1) устройства до начала произнесения. Эти параметры показаны на фиг.2 г.Счетчик 7 определяет число экстремумов речевого сигнала за стандартный период выбранных опорных сегментов (фиг, 2 д), счетчик 9 - число нулевых точек после детектирования блоком 7 (этот блок представляет собой низкочастотный фильтр с крутизной спада 18 дБ/окт начиная с 200 Гц) первой гармоники сигнала (фиг. 2 е). Эти последние параметры используют в дальнейшем для вычисления значенияИн/И, где И- число нулевых точекпервой гармоники сигнала в начальномоопорном сегменте; И- в конечном опорном сегменте.Формирователь 10 признаков (мат 5 рицы) представляет собой буферное запоминающее устройство, куда поступают перечисленные данные из блока б и счетчиков 7 и 9: ТО-Т, И 1 И и 10о оИнИ кНеобходимо отметитьчто. число столбцов матрицы для разных случаев задания будет разным и, таким образом, оно также, как и другие призна ки индивидуальности голоса, участвует в правильной верификации диктора.В режиме обучения, т.е. в режиме запоминания голосовых и произноси- тельных характеристик идентифицируемого лица, переключатель 11 находится в правом положении. В этом случае все данные из формирователя 10 мат" рицы передаются в блок 12, который представляет собой долговременное 25 запоминающее устройство (ДЗУ).В режиме идентификации (переключатель 11 находится в левом положении) данные анализа контрольной фразы из блока 10 формирования признаков по- З 0 даются уже на блок 13, который производит сопоставление и сравнение этих данных с данными обучения из блока 12. В результате формируется разностный сигнал а между сравниваемыми матрица 35 ми, который подается на блок 14 принятия решения. В этом блоке, также представляющем сравнивающее устройство, происходит сопоставление д с некоторым заранее установленным порогом О . При Д 8 происходит отстранение лица, произносящего испытательную фразу, при д ( О диктор квалифици- . руется как личность, на которую настроен верификатор.45Таким образом, сущность способа соссостоит в том, что преобразованный из парольной фразы речевой сигнал усиливают, выделяют из него звонкие участки, из которых выделяют заранее выбранное число сегментов одинаковой длительности на местах интенсивных гласных звуков и в начале и в конце парольной фразы, определяют временные интервалы между сегментами, определяют выдержку времени до началапроизнесения парольной фразы, подсчитывают число экстремальных точекв каждом из выделенных сегментов,определяют отношение числа нулей, подсчитанных на первой гармонике сигнала в начальном и конечном сегментах,и сравнивают полученный комплекспараметров с индивидуальными длядиктора эталонами. При этом из звонких участков на местах интенсивныхгласных звуков и в начале и в концепародьной фразы выделяют заранеевыбранное число сегментов одинаковойдлительности; определяют временныеинтервалы между этими сегментами;определяют выдержку времени до начала произнесения парольной фразы; подсчитывают число экстремальных точекв каждом иэ выделенных сегментов;определяют отношение числа нулей,подсчитанных по первой гармонике сигнала в начальном и конечном сегментах,Формула изобретенияСпособ идентификации говорящего путем произнесения им парольной фра" зы, выделения временных параметров1этой фразы и порогового сравнения с эталонными параметрами, о т л и ч аю щ и й с я тем, что, с целью повышения надежности идентификации, параметры произнесения контрольной фразы устанавливают индивидуально по трудно имитируемьм неконтролируемым на слух особенностям речевогоповедения говорящего, при этом параметры для идентификации выбирают из совокупности временных интервалов между заранее выбранными наиболее ин-. тенсивными сегментами одинаковой длительности на звонких участках и в начале и конце парольной фразы, определяют выдержку времени до начала произнесения парольной фразы,. опре" деляют интервалы между переходами через нуль речевых колебаний, соответствующих этим сегментам, и определяют соотношение фильтрованных в частотной области первой гармоники сигнала числа нулей в начальной и конечном сегментах.. ФЮЯ и Ворович орре ираж 34 бретениямаушская на митета по и сква, Ж,Проектная, 4 роизводственно-полиграфическое предприятие, г. Укгор Составитель Вр С. Патрушева Техред М.Дидык Заказ 7289/48ВНИИПИ Государственного113035,Подписноеоткрытиям при ГКНТ СГСУд. 4/5
СмотретьЗаявка
4082720, 05.05.1986
ИНСТИТУТ СИСТЕМ УПРАВЛЕНИЯ АН ГССР
РАМИШВИЛИ ГУРАМ СОЛОМОНОВИЧ, СААКЯН РОМАН РАЧИКОВИЧ, ТУШИШВИЛИ МИХАИЛ АКАКИЕВИЧ
МПК / Метки
МПК: G10L 17/00
Метки: говорящего, идентификации
Опубликовано: 23.01.1989
Код ссылки
<a href="https://patents.su/4-1453442-sposob-identifikacii-govoryashhego.html" target="_blank" rel="follow" title="База патентов СССР">Способ идентификации говорящего</a>
Предыдущий патент: Генератор кругов для телевизионного устройства отображения информации
Следующий патент: Устройство для преобразования сигналов воспроизведения цифровой магнитной записи
Случайный патент: 398752