Способ преобразования амплитудно-временного представления звуковой волны

Номер патента: 1795515

Авторы: Мышко, Шевченко

ZIP архив

Текст

)5 0 10 ) 7/02 ГОСУДАРСТВЕННОЕ ПАТЕНТНОЕВЕДОМСТВО СССР(ГОСПАТЕНТ СССР) ОПИСАНИЕ ИЗОБРЕТЕН ВТОРСКОМУ СВИДЕТЕЛЬС(71) Специальное конструкторское бюро икусственного интеллекта "Интеллект" иДонецком государственном университете(56) Авторское свидетельство СССРМ 559269, кл. 6 101 7/02, 1977,(54) СПОСОБ ПРЕОБРАЗОВАНИЯ АМПЛИТУДНО-ВРЕМЕННОГО ПРЕДСТАВЛЕНИЯЗВУКОВОЙ ВОЛНЫ Изобретение относится к речевои акустике и может быть использовано при проектировании систем автоматического распознавания и синтеза звуковых волн, являющихся носителями речевой информации.Известно устройство кодирования речевых сигналов, в котором в качестве признаков в системах распознавания речи предлагается использовать экстремальные значения речевых сигналов и интервалы времени между ними.Однако такое представление зашумленных сигналов, когда на полуволнах существует множество экстремумов, которые не несут важной информационной нагрузки, приводит к избытку информации.Наиболее близким техническим решением является способ построения "динамических портретов", при котором кЦ. 1795515 А 1(57) Изобретение относится к речевой акустике и может быть использовано при проектировании систем автоматического распознавания и синтеза звуковых волн, являющихся носителями речевой информации, Цель изобретения - повышение точности представления образа звуковой волны, Поставленная цель достигается тем, что амплитудно-временное представление звуковой волны разделяют на временные отрезки, представляющие собой элементарные составляющие еолновога процесса и соответствующие полному колебанию функции, и преобразуют в последовательность значений длин полных колебаний и колебаний функции на них. 3 ил. амплитудно-временное представление речевого сигнала разбивается на временные отрезки длиной 10 мс, Для каждого из этих отрезков определяют значение максимального отсчета и количество переходов функции через ноль. Таким образом звуковую волну представляют в виде последовательностей значений максимального отсчета на временном отрезке и количества переходов функции через ноль на этом отрезке,Известный способ имеет следующие недостатки. Во-первых, произвольный выбор длины временного интервала лишает фи-. зического смысла такое представление звуковой волны и сводит его к субьективностатистическому - не понятно, что же представляет собой отрезок звуковой волны на интервале, например. 10 мс, и почему именно такой длины выбран интервал.Во-вторых, одна полуволна может иметь множество локальных экстремумов, и при произвольном разбиении амплитудно- временного представления на временные отрезки, локальные экстремумы данной полуволны могут войти в соседние интервалы, и таким образом искажается картина представления звуковой волны.Проблема преобразования амплитудно- временного представления звуковой волны в виде последовательности отрезков, обладающих определенными физическими свойствами волнового процесса сводится к обоснованию выбора длины этих отрезков и отображени 1 о их физической сущности через определенные физические параметры волнового процесса.Целью способа является повышение точности представления образа звуковой волны,Поставленная цель достигается тем, что амплитудно-временное представление звуковой волны расчленяют на временные отрезки, представляющие собой элементарные составляющие волнового процесса и соответствующие полному колебанию функции, и преобразуют в последовательность значений длин полных колебаний и колебаний функции на них.Представление звуковой волны в виде последовательности элементарных составляющих АВП," соответствующих полным колебаниям функции позволяет решить проблему выбора длин временных отрезков, с точки зрения физической сущности волнового процесса.Длина временного отрезка определяется периодом полного колебания функции. Выбор величин, характеризующих элементарные составляющие волнового процесса, значений длин полных колебаний и колебаний функции на этих длинах, позволяет подойти к изучению речевого сообщения как волнового процесса, характеризующегося определенными параметрами, с точки зрения которых можно оценить источники звуковых волн. Функция 0(т) соответствует образу волнового процесса, элементарной составляющей которого является полное колебание, то есть отрезок области определения функции ) на концах которого 0=0, всуществует единственная точка с, принадлежащая отрезку, такая, что 0(И) = О.Если обозначить через К 1-е полное колебание функции Щ), а через р( К 1) - вектор-функцию признаков Кь то функция будет иметь вид у(К) = (Ф г), где б - длина полного колебания Ь, а г 1- колебание функции Щ) на Кь т.е. г = 30 Р(0(т 1) - 0(тг.у 1, г 4" К Предлагаемое представление функции0(т) приводит к выбору исследуемых фрагментов функции, согласно ее физическойсущности, соответствующей отражению5 волнового процесса. Предлагаемое техническое решение поясняется чертежами.На фиг,1,2 приведены амплитудно-временное представление речевого сигнала ипредставление речевого сигнала в видепо 10 следовательностей значений длин полныхколебаний - штриховые линии 2 и колебаний функций АВП звуковых волн - штриховые линии 1 соответственно: на фиг.Зприведена структурная схема устройства,15 реализующего АВП звуковых волн в видепоследовательностей значений длин полных колебаний и колебаний функции на этихдлинах,На фиг.1,2 приведено представление20 речевого сигнала согласно предлагаемомуспособу, Такое представление используетсяпри анализе речевых сообщений,Устройство, реализующее способ(фиг.З), состоит из генератора эталонной ча 25 стоты 1, счетчика 2, регистра 3, блока выделения нулей 4, блока выделениямаксимумов 5, блока выделения минимумов6, сумматора 7, аналого-цифрового преобразователя 8, параллельных интерфейсов 930 и 10. Выход генератора 1 соединен с первымвходом счетчика 2 и первым входом блокавыделения нулей 4. Выход счетчика 2 соединен с первым входом регистра 3, выходыблока выделения нулей 4 соединены соот-.35 ветственно со вторыми входами счетчика 2,регистра 3, АЦП 8 и интерфейса 9. Выходыблоков выделения максимумов 5 и минимумов 6 соединены со входом сумматора 7,выход которого соединен с первым входом40 АЦП 8. Второй выход АЦП 8 соединен совторыми входами блоков выделения максимумов 5 и минимумов 6 и интерфейса 10.блок выделения нулей 4 состоит из триггераготовности, триггера Шмитта, четырех одно 45 вибраторов, Блоки выделения максимумов 5и минимумов 6 состоят из детектора, ключаи одновибратора.Устройство работает следующим обра.зом, Входной сигнал поступает на второй50 вход блока выделений нулей 4 и первые входы блоков выделения максимумов 5 и минимумов 6, Для выделения длины полногоколебания используется генератор 1, счетчик 2 и регистр 3, В блоке выделения нулей55 4 на выходе триггера Шмитта формируетсяпоследовательность прямоугольных импульсов, соответствующая моментам перехода через ноль. По переднему фронту этихимпульсов формируется сигнал записи в регистр 3 текущего значения счетчика 2 и сиг1795515 20 Фиг нал готовности к обмену интерфейса 9 с микропроцессорной системой, а также сигнал сброса счетчика 2. Для выделения амплитуды полного колебания используются блоки выделения максимумов 5 и минимумов 6, в которых за период полных колебаний на накопительных конденсаторах запоминаются амплитуды глобальных максимума и минимума. затем они суммируются по абсолютной величине в сумматоре 7 и поступают на вход АЦП 8, Запуск АЦП 8 осуществляется по переднему фронту импульсов, поступающих с триггера Шмитта блока выделения нулей 4, По завершению аналого-цифрового преобразования вырабатывается сигнал, по которому происходит разряд накопительных конденсаторов и формируется сигнал готовности к обмену Формула изобретения Способ преобразования амплитудно- временного представления звуковой волны путем разбиения его на временные отрезки, отличающийся тем,что,сцелью повышения точности представления образа интерфейса 1 О с микропроцессорной системой,Предлагаемый способ преобразованияамплитудно-временного представления5 звуковых волн может применяться при анализе и синтезе речевых сообщений. Речевойсигнал представляется в виде последовательности значений длин полных колебанийи колебаний функции на них, При такое10 представлении объем памяти необходимойдля хранения речевой информации по сравнению с традиционным АВП сокращается в4 раза,Информационное содержание, передава 15 емое звуковой волной может быть восстановлено путем синтеза по последовательностизначений длин полных колебаний и колебаний. функции на соответствующих длинах. звуковой волны, амплитудно-временное представление звуковой волны разделяют на временные отрезки, соответствующие полным колебаниям функции и преобразуют в последовательность значений длин полных колебаний и колебаний функции на них.1795515 Составитель С.Мы Техред М.Моргента Редактор орректор С Пека Производственно-издательский комбинат "Патент", г. Ужгород, ул. Гагарина, 101 Заказ 434 Тираж Подписное ВНИИПИ Государственного комитета по изобретениям и открытиям при ГКНТ СССР 113035, Москва, Ж, Раушская наб 4/5

Смотреть

Заявка

4840016, 19.06.1990

СПЕЦИАЛЬНОЕ КОНСТРУКТОРСКОЕ БЮРО ИСКУССТВЕННОГО ИНТЕЛЛЕКТА "ИНТЕЛЛЕКТ" ПРИ ДОНЕЦКОМ ГОСУДАРСТВЕННОМ УНИВЕРСИТЕТЕ

МЫШКО СЕРГЕЙ ВАСИЛЬЕВИЧ, ШЕВЧЕНКО АНАТОЛИЙ ИВАНОВИЧ

МПК / Метки

МПК: G10L 7/02

Метки: амплитудно-временного, волны, звуковой, представления, преобразования

Опубликовано: 15.02.1993

Код ссылки

<a href="https://patents.su/4-1795515-sposob-preobrazovaniya-amplitudno-vremennogo-predstavleniya-zvukovojj-volny.html" target="_blank" rel="follow" title="База патентов СССР">Способ преобразования амплитудно-временного представления звуковой волны</a>

Похожие патенты