Способ опознания говорящего и устройство для его осуществления
Похожие патенты | МПК / Метки | Текст | Заявка | Код ссылки
Текст
СОЮЗ СОВЕТСКИХСОЦИАЛИСТИЧЕСКИХРЕСПУБЛИК ЗШ С 10 Ь 1/14 ИСАНИЕ ИЗОБРЕТЕНИ 10 теку иост ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССРПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ ТОРСКОМУСВИДЕТЕЛЬСТ(72). А,П. Беликов, И,А. Карасев, Н.В. Мулюкин и К.В, Тунис (71) Московский государственный педагогический институт иностранных языков им. М. Тореза(56) 1. Авторское свидетельство СССР В 847347, кл. С 10 Ь 1/00, 1979.2. фант Г. Анализ и синтез речи, Новосибирск, "Наука", 1970.3. Рамишвили Г.С. Автоматическое опознавание говорящего по голосу. М., "Радио и связь", 1981, с. 66, (54) СПОСОБ ОПОЗНАНИЯ ГОВОРЯЩЕГО И УСТРОЙСТВО ДЛЯ ЕГО ОСУЩЕСТВЛЕНИЯ, (57) 1. Способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично, о т л ич а ю щ и й с я тем, что, с целью сокращения объема произвольного речевого материала, необходимого для опознания говорящего, при формировании признаков выделяют признаки среднеквадратичной частоты и среднеквадратичной амплитуды спектра, а изображение формируют в координатах .текущих значений выделенных признаков, при этом оптическую плотность каждой точки устанавливают пропорциональной,801112687 А щей плотности совместной верояти появления этих значений,2. Устройство для опознания говорящего, содержащее блок выделения спектральных признаков, аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор, о т л и ч а ю щ е е с я тем, что, с целью расширения функциональных возможностей устройства, в него введены второй аналого-цифровой преобразователь, два коммутатора, трехвходовой селектор записи и оперативное запоминающее устройство и соединенные с ним два дешифратора адре- ЕР са и синхрогенератор, блок выделения спектральных признаков выполнен на измерителях текущих среднеквадратичной частоты и среднеквадратичной амплитуды, выходы которых через аналогоцифровые преобразователи и коммутатоМвй ры соединены с входами дешифраторов адреса, два входа селектора записи соединены с выходами аналого-цифровых преобразователей; причем третий вход 3 селектора записи, управляющие входы 15 коммутаторов, синхровход формировате ля видеосигналов и вход считывания оперативного запоминающего устройства соединены с соответствующими выходами синхрогенератора, а вход и выход оперативного запоминающего устройства соединены с селектором записи и с ЭЦВМ соответственно.687 1 1117Изобретение относится к технике анализа и визуализации свойств речевых волн на экране электроннолучевой трубки и может быть использовано для опознания говорящего и выявления его языковой принадлежности, диалектных5 особенностей и эмоционального состояния,Известен способ обработки речевого сигнала путем формирования спектральных признаков, характеризующих текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды мгновенного спектра речи. Этот способ позволяет отобразить речевой сигнал без развертки спектральных признаков во времени без потери существенной информации об особенностях артикуляции 1 .ФНедостатком способа является потеря сведений об относительных частотах проявления различных особенностей артикуляции.Известен также способ опознания говорящего, основанный на формировании плоского полутонового изображения спектральных признаков его речи и визуальном сравнении этого изображения с эталонным, полученным аналогично. Этот способ позволяет легко обучить экспертов опознанию говоря 30 щего путем визуального сопоставления фрагментов изображения, полученного временной разверткой спектральных признаков речи, с фрагментами силуэтов спектральных признаков ключевых З 5 звукосочетаний 2 .Недостатком способа является большая избыточность формируемых изображений и большой объем произвольного речевого материала, необходимого для 40 опознания говорящего. Известно также устройство для опознания говорящего, содержащее блок вьделения спектральных признаков, 45 аналого-цифровой преобразователь и соединенные последовательно ЭЦВМ, блок формирования видеосигналов и телевизионный монитор. Это устройство позволяет экспертам сравнивать на 50 экране телевизионного монитора фрагменты изображений, полученных разверткой признаков речи, формируемых из текущих спектральных признаков и из памяти ЭЦВМ 3 . Недостатком 55 устройства является невозможность визуализации текущего статистического описания артикуляции говорящего, реализующей предлагаемый способопознания говорящего.Цель изобретения - сокращение объема произвольного речевого материала, необходимого для опознания говорящего, а также расширение функциональных возможностей устройства реализующего способ опознания говорящего.Поставленная цель достигаетсятем, что согласно способу опознанияговорящего, основанному на формировании плоского полутонового изображения спектральных признаков его речии визуальном сравнении этого изображения с эталонным, полученным аналогично, при формировании признаков,выделяют признаки среднеквадратичной частоты и среднеквадратнчнойамплитуды спектра, а изображение формируют в координатах текущих значений выделенных признаков, при этомоптическую плотность каждой точкиустанавливают пропорциональной текущей плотности совместной вероятности появления этих значений,Кроме того, в устройство для опознания говорящего, содержащее блоквьделения спектральных признаков,аналого-цифровой преобразователь, исоединенные последовательно ЭЦВМ,блок формирования видеосигналов ителевизионный монитор, введены второй аналого-цифровой преобразователь,два коммутатора, трехвходовой селектор записи и оперативное запоминающееустройство и соединенные с ним двадешифратора адреса и синхрогенератор,блок вьделения спектральных признаков выполнен на измерителях текущихсреднеквадратичной частоты и среднеквадратичной амплитуды спектра, выходы которых через аналого-цифровыепреобразователи и коммутаторы соединены с входами дешифраторов адреса,два входа селектора записи соединены с выходами аналого-цифровых преобразователей, причем третий вход селектора записи, управляющие входыкоммутаторов, синхровход формирователя видеосигналов и вход считыванияоперативного запоминающего устройства соединены с соответствующимивыходами синхрогенератора, а входи выход оперативного запоминащегоустройства соединены с селекторомзаписи и с ЭЦВМ соответственно.формированием изображения в координатах текущих значений выделенныхспектральных признаков с установлени3 1117 ем оптической плотности, пропорциональной текущей локальной плотности совместной вероятности появления этих значений, достигнуто безизбыточное пред- ставление артикуляционных укладов говорящих, взвешенное вероятностями проявления этих уклаДов, которое мало зависит от произносимого текста, Такое безизбыточное представление позволяет распознавать говорящего10 по 90 с его речи. При опознании по изображениям ключевых фрагментов необходимы:более 10 мин речи, включающей эти ключевые звукосочетания.На фиг. 1-4 приведены фотографии изображений, полученных фотооптической аналоговой обработкой записей коротких фонограмм двух различных текстов, произнесенных двумя разными дикторами; на фиг, 5 - блок-схема устройства для осуществления способа опознания говорящего.Фиг. 1 и фиг. 2 показывают сходство изображений, полученных обработкой речи первого диктора при произне 25 сенин первого и второго текстов соответственно, а фиг. 3 и фиг. 4 получены обработкой произнесений этих текстов вторым диктором. Фотографии получены экспонированием луча, перемещавшегося по экрану электроннолучевой трубки при изменениях текущей среднеквадратичной частоты, отклонявшей луч по горизонтали, и среднеквадратичной амплитуды спектра, отклонявшей луч по вертикали. Каждое прохож-. 35 дение лучем точки экрана приводит к новому экспонированию соответствующей точки фотоматериала, чем достигается пропорциональность между оптической плотностью каждой точки не гатива и числом совместных появлений соответствующих значений спектральных признаков, отклонявших луч.Блок-схема устройства для осущест. - вления способа опознания говорящего 45 содержит блок 1 выделения спектральных признаков, первый 2 и второй 3 аналого-цифровые преобразователи,коммутаторы 4 и.5, дешифраторы 6 и 7 адреса, оперативное запоминающее 50 устройство 8, селектор 9 записи, ЭЦВМ 10, блок 11 формирования видеосигналов, телевизионный монитор 12 и синхрогенератор 13.Вход устройства для осуществления 55 способа опознания говорящего соединен с блоком 1 выделения спектральных признаков 1, который первым и вторым 687 4выходами соединен с входами первого 2 и второго 3 аналого-цифрового преобразователей соответственно, Выходы преобразователей через коммутаторы 4 и 5 и дешифраторы 6 и 7 адреса соединены с оперативным запоминающим устройством 8, селектор 9 записи которого своими первым и вторым входами соединен с соответствующими лходами коммутаторов. Выход оперативного запоминающего устройства через ЭЦВМ 10 и блок 11 формирования видеосигналов соединен с телевизионным монитором 12. Выходы синхрогенератора 13 соединены с соответствующими синхровходами коммутаторов, селектора записи, оперативного запоминающего устройства и блока формирования видеосигналов.Устройство для осуществления способа опознания говорящего работает следующим образом.Речевой сигнал, поступивший на вход устройства с микрофона или магнитофона, в блоке выделения спектральных признаков преобразуется в текущие значения среднеквадратичной частоты и среднеквадратичной амплитуды спектра, которые преобразуются в цифровую форму соответствующими аналого-цифровыми преобразователями, Каждое новое появление кодов цифрового представления спектральных признаков с помощью селектора записи, коммутаторов и дешифраторов адреса вызывает увеличение на единицу содержимого ячейки оперативного запоминающего устройства, адрес которой соответствует указанным кодам, Записываемое в оперативное запоминающее устройство накапливается в нем до тех пор, пока продолжается обработка исследуемого речевого сигнала, после чего накопленная информация вводится в ЭЦВМ и с помощью блока формирования видеосигналов отображается на экране телевизионного монитора. На этот же экран эксперт, производящий опознание говорящего или выявление его эмоционального состояния, языковой принадлежности и диалектных особенностей, может вызвать с помощью ЭЦВМ эталонные изображения сформированные аналогичнЬ.Предлагаемый способ опознания говорящего и устройство для его осуществления позволят ускорить экспертизу фонограмм и повысить надежность принимаемых экспертами решений
СмотретьЗаявка
3555361, 22.02.1983
МОСКОВСКИЙ ГОСУДАРСТВЕННЫЙ ПЕДАГОГИЧЕСКИЙ ИНСТИТУТ ИНОСТРАННЫХ ЯЗЫКОВ ИМ. М. ТОРЕЗА
БЕЛИКОВ АВЕНИР ПАВЛОВИЧ, КАРАСЕВ ИГОРЬ АЛЕКСЕЕВИЧ, МУЛЮКИН НИКОЛАЙ ВАСИЛЬЕВИЧ, ТУНИС КОНСТАНТИН ВИКТОРОВИЧ
МПК / Метки
МПК: G10L 17/00
Метки: говорящего, опознания
Опубликовано: 07.10.1984
Код ссылки
<a href="https://patents.su/6-1117687-sposob-opoznaniya-govoryashhego-i-ustrojjstvo-dlya-ego-osushhestvleniya.html" target="_blank" rel="follow" title="База патентов СССР">Способ опознания говорящего и устройство для его осуществления</a>
Предыдущий патент: Резонатор для язычкового музыкального инструмента
Следующий патент: Устройство для магнитной записи и воспроизведения информации
Случайный патент: Многоканальная система управления процессом приготовления смесей