Способ обработки речевого сигнала

Номер патента: 404122

Способ обработки речевого сигнала. Страница 2.

Способ обработки речевого сигнала. Страница 3.

ZIP архив

Текст

404122 Союз Советский Социалистических Республикаявлецо цием заявки-с присое оритетбликовацо 26.Х.1973, Бюллетень4а опубликования описания 19.111.1974 осударстаенныи комитетСовета Министров СССРпо делам изобретенийи открытий УДК 621,391.19 (088.8 Авторыизобретецг В. Н. Сорокин и аи Заявитель Институт проблем передачи информации АН СС СПОСОБ ОБРАБОТКИ РЕЧЕВОГ НАЛА Изобретение касается автоматической обработки речевого сигнала,Известные способы обработки речевого сигнала характеризуются недостаточной цадежцостью распозпавапия звуков речи из-за зцачительцой изменчивости соответствующих им акустических сигпалов. Частично эта измепчивость определяется помехами, цакладываемыми ца речевой сигнал в процессе его распрострацеция по каналу связи, и описывается статистическими закономерностями. Осцовцая же доля этой изменчивости вносится за счет различия в геометрических размерах голосовых трактов разных людей. Известно, например, что длины голосовых трактов колеблются в пределах 25%, что приводит, согласно акустической теории речеобразовация, к соответствующему разбросу в значениях резоцацсцых частот (формацт). Влияние других геометрических параметров ца свойства акустического сигнала значительно труднее поддается ацалитической оценке, хотя и це менее велико. Наряду с изменчивостью геометрических размеров голосового тракта зцачительцые вариации речевых сигналов, относящихся к одним и тем же звукам, создают индивидуальные особепцости произцошеция, в частности темпа и громкости речи.Попытки уменьшения влияния изменчивости речевых сигналов ца результаты распозцавация путем более грубого измерения их параметров це дали должных результатов.Нормализация речи по громкости и линейцая нормализация по темпу также цс дают5 существенных результатов. Это объясняетсятем, что ряд геометрических параметров голосового тракта претерпевает це только мешающие измецеция при переходе от одного человека к другому, цо и одцовремецпо создает 10 информативную модуляцию речевого сигцалав процессе артикуляции.Цель изобретения - сжатие речевой ицформации и повышение цадежцости распозцавация,15 Для этого по предлагаемому способу ца огибающей в каждой частотной полосе выделяют амплитуды частоты ц времена характерных точек, которые сравнивают со значениями этих же величиц для соответствующих точек одного 20 из эталонных спектров, из результирующихсигналов сравцеция формируют сигналы, пропорциоцальцые параметрам преобразований мгновенного спектра текущего речевого сигнала к данному эталону, и классифицируют этц 25 сигналы.Если представить речевой сигнал в видедвумерной функции Ь(ю, 1) как мгцовеццый взвешенный амплитудцо-частотный спектр акустических колебаний речи, то искомый спо соб количественного описания уклоцецця45 50 55 спектра 5;,(о,1) 1 - реализации -ого звука от эталона 5;(о,1) состоит в аппроксимации преобразований 5(о,1) уравнениями конечных непрерывных групп преобразований (групп Ли) на плоскости, общая форма записи которых имеет вида =1,(а,1; а, а, ., а)1= ,(а 1; аа, ., ап),где (о, 1) - координаты некоторой точки на 5(о, 1); (а, 1) - координаты соответственной ей точки на 5;(в, 1); (аь , а) - параметры преобразований.Среди групп Ли различают два основных класса - примитивные и импримитивные группы. К числу примитивных групп относятся группы, преобразования которых не связаны с каким-либо фиксированным направлением на плоскости, например группы движения, подобия. Максимальное число параметров в таких группах равно восьми (у проективной группы). Для импримитивных групп характерно наличие некоторого преобладающего направления в плоскости (в каноническом виде - направление оси о) и потому их преобразованиям свойственна некоторая анизотропность. Вместе с тем числом п параметров для большинства импримитивных групп не ограничено.Следующие уравнения дают пример импримитивной группы:=а, +а,- из + и 4 + и 5 + и 6 ++ ОпАпизотроппость преобразований проявляется очевидным образом и в асимметрии этих уравнений.Наличие естественных разрывов в речевом сигнале, например смычек, позволяет использовать уравнения со сравнительно небольшим числом параметров за счет использования кусочной аппроксимации преобразований.Параметры уравнений групп преобразований вычисляются путем решения соответствующего уравнения для 5(со, ) путем подстановки в него координат соответственных точек на видеограммах эталона и текущей реализации некоторого звукосочетания. В качестве таких соответственных точек рационально выбирать характерные, в чем-либо отличающиеся от других, точки, например точки локальных максимумов, миксимумов ее градиентов и т. д.Параметры уравнений групп образуют а-мерное пространство, в котором обычными методами теории распознавания образов проводятся разделяющие границы между звуками и звукосочетаниями. Тогда каждая фонема описывается номером эталона 5;(в, 1) и об 5 10 15 20 25 ЗО 35 40 ластью в пространстве параметров. Достоийствами такого способа обработки является возможность отделить случайные и неинформативные преобразования в речевых сигналах, причем число параметров преобразований можно сколь угодно приблизить к теоретически минимальному, а надежность распознавания - за счет сохранения всей информации о 5 (а, 1) - к потенциально достижимой.На чертеже изображена блок-схема устройства, реализующего предлагаемый способ.Речевой сигнал поступает на микрофон 1, подвергается разложению на ряд частотных полос в гребенке полосовых фильтров 2, на выходах которых стоят амплитудные детекторы 3, выделяющие огибающие в каждой полосе. Огибающие проходят через систему блоков 4, определяющих значения амплитуды, частоты и времени характерных точек разного типа (локальные экстремумы, градиенты и т. д.), а также через блок 5, определяющий тип эталона для текущего звука. Сигналы с выхода системы блоков 4 подаются в блок 6, в котором происходит вычисление параметров уравнений преобразований. Начало и конец вычислений, а также тип используемых уравнений определяются сигналами блока 5.Сигналы из блока 6, пропорциональные параметрам преобразований, вместе с сигналом из блока 5 о типе эталона поступают в канал связи, а в случае распознавания - в блок решающего правила 7, сигналы на выходе которого соответствуют распознанным звукам, Кроме того, в канал связи (или блок решающего правила) подается сигнал, пропорциональный частоте основного тона, выделенной детектором основного тона 8. Тип эталона определяется видом источника возбуждения (голосовой или шумовой) и числом формант в спектральном разрезе. Предмет изобретения Способ обработки речевого сигнала, согласно которому сигнал разлагают на ряд частотных полос, выделяют огибающие в каждой полосе и огибающую спектрального разреза, детектируют частоту основного тона, отличаощийся тем, что, с целью сжатия речевой информации и повышения надежности распознавания, на огибающей в каждой частотной полосе выделяют амплитуды, частоты и времена характерных точек, которые сравнивают со значениями эчих же величин для соответствующих точек одного из эталонных спектров, из результирующих сигналов формируют сигналы, пропорциональные параметрам преобразований мгновенного спектра текущего речевого сигнала к данному эталону, и классифицируют сигналы.404122 тавитель В. КудрявцевТехред Т. Миронова Корректор М. Лейзер Редактор анова каз 612/14ЦНИИ Подписноеов СССР ография, пр. Сапунова, 2 Изд. 1 хз 165осударственного комит по делам изобретен Москва, Ж, Рауш Тираж 467та Совета Минй и открытийкая наб., д. 4/5

Смотреть

Заявка

1624604

В. Н. Сорокин, В. С. Фаин Институт проблем передачи информации СССР

Авторы изобретени

МПК / Метки

МПК: G10L 15/02, G10L 19/02

Метки: речевого, сигнала

Опубликовано: 01.01.1973

Код ссылки

<a href="https://patents.su/3-404122-sposob-obrabotki-rechevogo-signala.html" target="_blank" rel="follow" title="База патентов СССР">Способ обработки речевого сигнала</a>

Похожие патенты

Способ измерения временных интервалов между двумя точками синхронизированных сигналов с заданными уровнями сигнала в этих точках

Номер патента: 669329

Опубликовано: 25.06.1979

Автор: Очков

МПК: G04F 10/00

Метки: временных, двумя, заданными, интервалов, между, сигнала, сигналов, синхронизированных, точками, точках, уровнями, этих

...в результате дифференцирования сигнала, до момента сопоставления, :итоговый суммарный результат интегрирования доводят до нулевого уровня перемещением момента сопоставления.Способ иллюстрируется чертежом.Сигнал 1 У(О (эпюра а") подвергается дифференцированию с постоянной Г, т. е, имеем: (эиюра б"). В тедц(Мчение временного интервала, равного и расположенного на участке,с постоянным уровнем сигнала равного Чн , интегрируется величина О(1)" Ч, гдеЧ- заданный уровень точки А (эпюра "в, у"сток о 4 м+)где Т - постоянная интегрирования.С момента 1,+7 до момента сопостав ления 1 н интегрируют результат дифференцирования, суммируя одновременно ;результаты интегрирования ( эпюра "в", участок Ф, 4 фС,И). Сумма результатов интегрирования...

Устройство для автоматического слежения за артикуляционными параметрами речи по речевому сигналу с возможностью выделения сигнал-остатка речи

Номер патента: 143430

Опубликовано: 01.01.1961

Автор: Акинфиев

МПК: G01R 23/16, H04B 1/64, H04M 11/06

Метки: артикуляционными, возможностью, выделения, параметрами, речевому, речи, сигнал-остатка, сигналу, слежения

...параметрами включен одновременно в цепь обратной связи по основному сигналу и в цепь обратнойсвязи по текущим параметрам. Контур используется для формированиячастотной характеристики всего устройства по основному сигналу и дляформирования сигналов для датчика текущих параметров. В результатеиспользования многосекционного контура повышается точность выделения параметров и упрощается система синтеза. Описываемое устройство представляет собой линейный четырехполюсник с самонастраивающейся частотной характеристикой, автоматически следящей за параметрами текущего энергетического спектра, подаваемого на вход четырехполюсника сигнала.На чертеже изображена блок-схема устройства.Речевой сигнал Л (1) подается на вход 1 усилителя 2. Сигнал...

Устройство для распознавания речевых сигналов

Номер патента: 619953

Опубликовано: 15.08.1978

Автор: Золотарев

МПК: G10L 13/02, G10L 15/02, G10L 19/02

Метки: распознавания, речевых, сигналов

...речи диктора. Это затрудняет процесс сравнения текущих параметров сиГналов с эталонным и, следовательно, понижает надежность распознавания,Белью изобретения является упрощениеустройства путем использования клиппированной речи.Это достигается тем, что предлагаемоеустройство содержит блок клиппирования,вход которого подключен к выходу микрофона, а выход к блоку дискретной фильтрации и блоку управления.Кроме того, блок дискретной фильтрации состоит из й 1 . параллельно подклю19953брации состоит из тпараллельно подключенных к блоку клиппирования блоков определения коэффициентов разложения по чиолу признаков речевого сигнала, генератора функций Уолша, выход которого соединен со вторымн входами блоков определе ния коэффициентов разложения, и...

Способ вокодерных преобразований речевых сигналов и устройство для его осуществления

Номер патента: 1525731

Опубликовано: 30.11.1989

Автор: Абакумов

МПК: G10L 19/02, G10L 21/00

Метки: вокодерных, преобразований, речевых, сигналов

...демодуляторы 7-9, асштабирующие усилители 10-12, амодемы 13-15 и сумматоры 16, 17.Предлагаемый способ основан на пек 1 ральном . разделении речи на олосы частот, соответствующие отельным формантным колебаниям сигнала. После разделения,амплитудной и угловой демодуляции продуктами раз;дельной демодуляции совместно модулируют колебания, на которые переносят компоненты сообщений, При переносе угловую модуляцию сокра.щают так, чтобы зто сообщение трансформировалось в соответствии с общим сокращением полосы частот, При реконструкции речи, наоборот, угловые модуляции усиливают до уровней, характерных для натуральных сигналов,35Входом устройства служат полосовые фильтры 1-3, их выходы через выходные цепи демодуляторов связаны с модемами...

Способ автоматического распознавания речевых сигналов

Номер патента: 1775730

Опубликовано: 15.11.1992

Автор: Дрюченко

МПК: G10L 5/00, G10L 5/06

Метки: распознавания, речевых, сигналов

...2 перекодирования речевого сигнала, выход которого соединен с первым входом блока 3 определения границы начала и конца речевого сигнала, Выход блока 3 связан с первым входом блока 4 сегментации, выход которого подключен ко входу блока 5 формирования классифицирующих параметров. Первый выход блока 5 формирования классифицирующих параметров подключен ко второму входу блока 4 сегментации, второй выход - к первому входу блока 6 сравнения классифицирующих параметров, а третий выход - ко входу блока 7 эталонов, выход которого соединен со вторым входом блока 6 сравнения классифицирующих параметров. Выход блока 6 сравнения классифицирующих параметров через блок 8 нормирования связан со входом классификатора 9, выход которого подключен ко второму...

Предыдущий патент: Устройство для получения тремоло и вибрато в электромузыкальных инструментах

Следующий патент: Способ пространственного разнесения сигналов в многоканальных накопителях

Случайный патент: Способ определения амплитудно-фазового распределения поля антенны

В верх страницы

Способ обработки речевого сигнала

Текст

Заявка

МПК / Метки

Код ссылки

О сайте

Архивы

Контакты