Способ опознания говорящего и устройство для его осуществления

Номер патента: 1117687

Авторы: Беликов, Карасев, Мулюкин, Тунис

ZIP архив

Текст

СОЮЗ СОВЕТСКИХСОЦИАЛИСТИЧЕСКИХРЕСПУБЛИК ЗШ С 10 Ь 1/14 ИСАНИЕ ИЗОБРЕТЕНИ 10 теку иост ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССРПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ ТОРСКОМУСВИДЕТЕЛЬСТ(72). А,П. Беликов, И,А. Карасев, Н.В. Мулюкин и К.В, Тунис (71) Московский государственный педагогический институт иностранных языков им. М. Тореза(56) 1. Авторское свидетельство СССР В 847347, кл. С 10 Ь 1/00, 1979.2. фант Г. Анализ и синтез речи, Новосибирск, "Наука", 1970.3. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. М., "Радио и связь", 1981, с. 66, (54) СПОСОБ ОПОЗНАНИЯ ГОВОРЯЩЕГО И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ, (57) 1. Способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично, о т л ич а ю щ и й с я тем, что, с целью сокращения объема произвольного речевого материала, необходимого для опознания говорящего, при формировании признаков выделяют признаки среднеквадратичной частоты и среднеквадратичной амплитуды спектра, а изображение формируют в координатах .текущих значений выделенных признаков, при этом оптическую плотность каждой точки устанавливают пропорциональной,801112687 А щей плотности совместной верояти появления этих значений,2. Устройство для опознания говорящего, содержащее блок выделения спектральных признаков, аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор, о т л и ч а ю щ е е с я тем, что, с целью расширения функциональных возможностей устройства, в него введены второй аналого-цифровой преобразователь, два коммутатора, трехвходовой селектор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адре- ЕР са и синхрогенератор, блок выделения спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды, выходы которых через аналогоцифровые преобразователи и коммутатоМвй ры соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преобразователей; причем третий вход 3 селектора записи, управляющие входы 15 коммутаторов, синхровход формировате ля видеосигналов и вход считывания оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминающего устройства соединены с селектором записи и с ЭЦВМ соответственно.687 1 1117Изобретение относится к технике анализа и визуализации свойств речевых волн на экране электроннолучевой трубки и может быть использовано для опознания говорящего и выявления его языковой принадлежности, диалектных5 особенностей и эмоционального состояния,Известен способ обработки речевого сигнала путем формирования спектральных признаков, характеризующих текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды мгновенного спектра речи. Этот способ позволяет отобразить речевой сигнал без развертки спектральных признаков во времени без потери существенной информации об особенностях артикуляции 1 .ФНедостатком способа является потеря сведений об относительных частотах проявления различных особенностей артикуляции.Известен также способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично. Этот способ позволяет легко обучить экспертов опознанию говоря 30 щего путем визуального сопоставления фрагментов изображения, полученного временной разверткой спектральных признаков речи, с фрагментами силуэтов спектральных признаков ключевых З 5 звукосочетаний 2 .Недостатком способа является большая избыточность формируемых изображений и большой объем произвольного речевого материала, необходимого для 40 опознания говорящего. Известно также устройство для опознания говорящего, содержащее блок вьделения спектральных признаков, 45 аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор. Это устройство позволяет экспертам сравнивать на 50 экране телевизионного монитора фрагменты изображений, полученных разверткой признаков речи, формируемых из текущих спектральных признаков и из памяти ЭЦВМ 3 . Недостатком 55 устройства является невозможность визуализации текущего статистического описания артикуляции говорящего, реализующей предлагаемый способопознания говорящего.Цель изобретения - сокращение объема произвольного речевого материала, необходимого для опознания говорящего, а также расширение функциональных возможностей устройства реализующего способ опознания говорящего.Поставленная цель достигаетсятем, что согласно способу опознанияговорящего, основанному на формировании плоского полутонового изображения спектральных признаков его речии визуальном сравнении этого изображения с эталонным, полученным аналогично, при формировании признаков,выделяют признаки среднеквадратичной частоты и среднеквадратнчнойамплитуды спектра, а изображение формируют в координатах текущих значений выделенных признаков, при этомоптическую плотность каждой точкиустанавливают пропорциональной текущей плотности совместной вероятности появления этих значений,Кроме того, в устройство для опознания говорящего, содержащее блоквьделения спектральных признаков,аналого-цифровой преобразователь, исоединенные последовательно ЭЦВМ,блок формирования видеосигналов ителевизионный монитор, введены второй аналого-цифровой преобразователь,два коммутатора, трехвходовой селектор записи и оперативное запоминающееустройство и соединенные с ним двадешифратора адреса и синхрогенератор,блок вьделения спектральных признаков выполнен на измерителях текущихсреднеквадратичной частоты и среднеквадратичной амплитуды спектра, выходы которых через аналого-цифровыепреобразователи и коммутаторы соединены с входами дешифраторов адреса,два входа селектора записи соединены с выходами аналого-цифровых преобразователей, причем третий вход селектора записи, управляющие входыкоммутаторов, синхровход формирователя видеосигналов и вход считыванияоперативного запоминающего устройства соединены с соответствующимивыходами синхрогенератора, а входи выход оперативного запоминащегоустройства соединены с селекторомзаписи и с ЭЦВМ соответственно.формированием изображения в координатах текущих значений выделенныхспектральных признаков с установлени3 1117 ем оптической плотности, пропорциональной текущей локальной плотности совместной вероятности появления этих значений, достигнуто безизбыточное пред- ставление артикуляционных укладов говорящих, взвешенное вероятностями проявления этих уклаДов, которое мало зависит от произносимого текста, Такое безизбыточное представление позволяет распознавать говорящего10 по 90 с его речи. При опознании по изображениям ключевых фрагментов необходимы:более 10 мин речи, включающей эти ключевые звукосочетания.На фиг. 1-4 приведены фотографии изображений, полученных фотооптической аналоговой обработкой записей коротких фонограмм двух различных текстов, произнесенных двумя разными дикторами; на фиг, 5 - блок-схема устройства для осуществления способа опознания говорящего.Фиг. 1 и фиг. 2 показывают сходство изображений, полученных обработкой речи первого диктора при произне 25 сенин первого и второго текстов соответственно, а фиг. 3 и фиг. 4 получены обработкой произнесений этих текстов вторым диктором. Фотографии получены экспонированием луча, перемещавшегося по экрану электроннолучевой трубки при изменениях текущей среднеквадратичной частоты, отклонявшей луч по горизонтали, и среднеквадратичной амплитуды спектра, отклонявшей луч по вертикали. Каждое прохож-. 35 дение лучем точки экрана приводит к новому экспонированию соответствующей точки фотоматериала, чем достигается пропорциональность между оптической плотностью каждой точки не гатива и числом совместных появлений соответствующих значений спектральных признаков, отклонявших луч.Блок-схема устройства для осущест. - вления способа опознания говорящего 45 содержит блок 1 выделения спектральных признаков, первый 2 и второй 3 аналого-цифровые преобразователи,коммутаторы 4 и.5, дешифраторы 6 и 7 адреса, оперативное запоминающее 50 устройство 8, селектор 9 записи, ЭЦВМ 10, блок 11 формирования видеосигналов, телевизионный монитор 12 и синхрогенератор 13.Вход устройства для осуществления 55 способа опознания говорящего соединен с блоком 1 выделения спектральных признаков 1, который первым и вторым 687 4выходами соединен с входами первого 2 и второго 3 аналого-цифрового преобразователей соответственно, Выходы преобразователей через коммутаторы 4 и 5 и дешифраторы 6 и 7 адреса соединены с оперативным запоминающим устройством 8, селектор 9 записи которого своими первым и вторым входами соединен с соответствующими лходами коммутаторов. Выход оперативного запоминающего устройства через ЭЦВМ 10 и блок 11 формирования видеосигналов соединен с телевизионным монитором 12. Выходы синхрогенератора 13 соединены с соответствующими синхровходами коммутаторов, селектора записи, оперативного запоминающего устройства и блока формирования видеосигналов.Устройство для осуществления способа опознания говорящего работает следующим образом.Речевой сигнал, поступивший на вход устройства с микрофона или магнитофона, в блоке выделения спектральных признаков преобразуется в текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды спектра, которые преобразуются в цифровую форму соответствующими аналого-цифровыми преобразователями, Каждое новое появление кодов цифрового представления спектральных признаков с помощью селектора записи, коммутаторов и дешифраторов адреса вызывает увеличение на единицу содержимого ячейки оперативного запоминающего устройства, адрес которой соответствует указанным кодам, Записываемое в оперативное запоминающее устройство накапливается в нем до тех пор, пока продолжается обработка исследуемого речевого сигнала, после чего накопленная информация вводится в ЭЦВМ и с помощью блока формирования видеосигналов отображается на экране телевизионного монитора. На этот же экран эксперт, производящий опознание говорящего или выявление его эмоционального состояния, языковой принадлежности и диалектных особенностей, может вызвать с помощью ЭЦВМ эталонные изображения сформированные аналогичнЬ.Предлагаемый способ опознания говорящего и устройство для его осуществления позволят ускорить экспертизу фонограмм и повысить надежность принимаемых экспертами решений

Смотреть

Заявка

3555361, 22.02.1983

МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ ИНОСТРАННЫХ ЯЗЫКОВ ИМ. М. ТОРЕЗА

БЕЛИКОВ АВЕНИР ПАВЛОВИЧ, КАРАСЕВ ИГОРЬ АЛЕКСЕЕВИЧ, МУЛЮКИН НИКОЛАЙ ВАСИЛЬЕВИЧ, ТУНИС КОНСТАНТИН ВИКТОРОВИЧ

МПК / Метки

МПК: G10L 17/00

Метки: говорящего, опознания

Опубликовано: 07.10.1984

Код ссылки

<a href="https://patents.su/6-1117687-sposob-opoznaniya-govoryashhego-i-ustrojjstvo-dlya-ego-osushhestvleniya.html" target="_blank" rel="follow" title="База патентов СССР">Способ опознания говорящего и устройство для его осуществления</a>

Похожие патенты