Способ возбуждения синтезаторов речи

Номер патента: 966725

Авторы: Власов, Сорокин

ZIP архив

Текст

Союз СоветсиикСоциалистическихреспублик ОЛ ИСАНИЕИЗОБРЕТЕН ИЯК АВТОРСКОМУ СВИДЕТЕЛЬСТВУ оц 966725(53) УДК 621.391, 19 (088.8) Дата опубликования описания 18. 10. 82"ЕЬР Институт проблем передачи информации(54) СПОСОБ ВОЗБУЖДЕНИЯ СИНТЕЗАТОРОВ .РЕЧИ го 1Изобретение относится к автоматическому синтезу речи, а именно к ме. . тодам возбуждения синтезаторов речи источником голосовых импульсов, и может быть использовано в системах вывода информации в речевой форме и в системах синтетической телефонии.Характеристики источника голосовых импульсов, как известно, оказывают решающее влияние на натуральность звучания синтезированного речевого сигнала. До настоящего времени способы и устройства голосового возбуждения синтезаторов речи опирались, главным образом, на исследования поведения воздушного потока, протекающего через голосовую щель и модулируемого колебаниями голосовых связок. Этот источник называется источником объемной скорости.Известен источник объемной скорости,11 1, представляющий собой модель голосовых связок, рассматриваемых как система с сосредоточенными 2параметрами, причем автоколебания связок возникают за счет эффекта Бернулли, создаваемого движущимся потоком воздуха. Детальные исследования движений голосовых связок показали, что они совершают изгибные колебания во всех трех измерениях: вдоль голосовой щели, поперек голосовой щели во фронтальной плоскости и вдоль оси голосового тракта. Колебания голосо-, вых связок во фронтальной плоскости. проявляются В основном, в разности Фаз движения верхней и нижней кромок связок, Этот эффект положен в основу так называемой двухмассовой модели голосового источника. Известна двухмассовая модель голосового источника, в которой голосовые связки определены в виде двух сосредоточенных масс, связанных друг с другом и жесткими стенками через упругие и деформирующие элементы. Выбирая определенные соотношения этих масс и966725 1верх. Непосредственные измерения верикальных движений связок показывают,то на интервале открытой голосовойели они однозначно связаны с амплитуой горизонтальных движений связок,этот факт может быть использованля упрощения вычислений.Когда связки сомкнуты, подъем верхней поверхности происходит в результате того, цто после соударения связок движение, частиц их массы по инерции продолжается, но поскольку ихгоризонтальное движение ограничено,то происходит растекание смещений,главным образом, в вертикальном направлении. Кроме того, несовпадениевертикальных координат центров тяжести связок и точки приложения равнодействующих сил при соударении приводит к возникновению вращающего мо.мента и дополнительному подъему верхних кромок связок.Акустические следствия вертикальных смещений верхней поверхности голосовых связок можно продемонстрировать,рассмотрев волновое уравнение и егограничные условия. Обозначив черезЯ(й) объемную скорость воздушного потока через голосовую щель и черезН(т.) - вертикальное смещение верхнейповерхности голосовых связок, считая,что все точки этой поверхности совершают синфазное движние, тогда для волнового уравнения относительно акустического давления-- ( ) - --= О,дхдх с дграничные условия на голосовых связках естьсИ Р дН: - " - - К в - - 7(2)дх х=о 5 сЫ Ро сйгде х - криволинейная кординатавдоль оси голосового тракта(х = 0 на верхней кромке гоф лосовых связок);т, - время;р -. акустическое давление;5 - площадь поперечного сеченияголосового тракта;с - скорость звука в воздухе;.о - плотность воздуха;4050 - площадь голосового трактанепосредсТвенно у связок;- длина голосовых связок;К . - некоторый коэффициент,Неоднородные граничные условия (2)сводятся к однородным путем переходак новой искомой переменной р, чтоприводит к, появлению возбуждающей сижесткости упругих элементов, добиваются сдвига колебаний масс 2. тОднако данная модель характеризуется неправдоподобностью параметров щпо сравнению с данными о геометрии идхарактеристиках голосовых связок, атакже недостаточной натуральностью дзвучания синтезированной речи, прояв/ляющейся в "машиноподобном" тембре.Наиболее близкой к предлагаемой 1 вявляется модель трехмерных упругихколебаний голосовых связок (3 ,Однако в известной модели не выявлена роль вертикальных смещений голосовых связок в возбуждении акусти- дческих колебаний в голосовом тракте.Цель изобретения - повышение натуральности синтезированной речи и расширение возможйостей в управлении еетембром.26Поставленная цель достигается тем,цто для голосового источника возбуждения синтезаторов речи используетсямоксель трехмерных колебаний голосовых связок, причем сигнал голосового 2возбуждения формируют как сумму первой и третьей производных от сигнала,пропорционального объемной скоростивоздушного потока, протекающего черезголосовую щель, и второй и четвертый .зрпроизводных от сигнала, пропорционального вертикальному смещению верхней поверхности голосовых связок.Источник, возбуждающий акустическиеколебания в трубе за счет движенияверхней поверхности голосовых связок,называется поршневым.На фиг. 1 показаны импульсы объемной скорости воздушного потока черезголосовую щель; на фиг. 2 - смещениеверхней поверхности голосовых связок;на фиг. 3 - синтезированные речевыесигналы, соответствующие гласномузвуку "А".На фиг. 3 обозначено: 1 - толькообъемный источник возбуждения, 2 объемный и поршневой источники.физические причины вертикальногодвижения верхней поверхности голосовых связок различны для интервалов,0на которых голосовая щель открытаили закрыта. В первом случае подъемкромки связок происходит под влияниемизбыточного, давления в легких и в ре-.зультате того, что нижние кромкисвязок начинают расходиться раньше верх- Иних. Вследствие этого толщина верхних кромок уменьшается и под действи ем легочного давления они прогибаютсяСпособ возбуждения синтезаторовречи, использующий трехмерную модельколебаний голосовых связок, о т л ич а ю щ и й с я тем, что, с цельюповышения натуральности синтезированной речи и расширения возможности в1 управлении ее тембром, сигнал голосового возбуждения формируют как сумму первой и третьей производных отсигнала, пропорционального объемнойскорости воздушного потока, протекающего через голосовую щель, и второйи четвертой производных от сигнала,пропорционального вертикальному смещению верхней поверхности голосовыхсвязок,Источники информации,принятые во внимание при экспертизе1. Патент США Ь" 3511932,кл. 179/1, 19702. ЭзЬ 1 га 1 ц К Р 1 ападап 3 .5 упЬез 1 З ОГ чо 1 сед 5 оцпдз Ггоа аио-вагиз, щоде 1 о 1 Юе Чоса 1 Согдз."Ве 11 5 уз. Тесйп. 3 ", 1972, ч. 50,У 6, р. 1233-1268.3. Т.1 ге 5 . К., Та 1)1 п О.Т. А йеоге 1 са 1 5 цду о 1 Юе еГ 1 есз ОГ чаг 1 оцз 1 агупеа 1 соп 11 дцга 1 опз оп ЬеасоцзСз ОГ руопа 1 оп. - "3. Асоцз,5 ос. Ае. 1979, ч,бб, Ю 1, р. 60-71. 5 96672 лы Г (х, )в правой части волнового уравнения (1), Иожно показать, что конечный результат этих преобразований приводит к уравнению-- (5 -1) ",- - - = Е(х, ),1 д д 1 Р5 дх дхс дЪгде возбуждающая сила Г(х, ) естьГ(х ) = - - 11- -(-Е) 6)- о1 д 5ф 1 з дх(х Р)2 д1 О2 С д 2дй К ФНит = -- 4 у -- в5 о д" о д1 где 3 - длина голосового тракта.Таким образом, возбуждающая функция Г(х,зависит от первой и третьей производных по времени от объемной скорости Я и от второй и чет 26 вертой производных по времени от вертикального смещения верхней поверх. Ности гОлОсовых связОК Н.Аналитические оценки энергетического вклада поршневого источника ве 2 акустические колебания на интервале открытой голосовой щели показывают, что по порядку величины он сравним с вкладом объемного источника. Вертикальные смещения голосовых связок на интервале закрытой голосовой щели, хотя и меньше по степени их влияния, приводят к тому, цто свободные затухающие акустические колебания в голосовом тракте отсутствуют. Эти результаты объясняют некоторые эксперимен- Зэ ты по обратной фильтрации речевых сигналов, в которых обнаружено дополнительное возбуждение колебаний на интервале закрытой голосовой щели. 5еАудиторская экспертиза звуков ре" чи, синтезированных с поршневым источником. показывает улучшение натуральности звучания по сравнению с объемным источником и возможность управления тембром речи эа счет соответствующего выбора параметров поршневого источника.формула изобретения966725 оставитель Б. Поспеловехред С. Мигунова Корректор Г. Решетни Редактор К. Волощ Заказ 849/68 ф филиал ППП "Патент", г. Ужгород, ул, Проектная, 4 Тираж 390ВНИИПИ Государственного по делам изобретений й 113035, Москва, Ж; Раушс Подписное митета СССР крытий я наб д.

Смотреть

Заявка

3267947, 30.03.1981

ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ АН СССР

СОРОКИН ВИКТОР НИКОЛАЕВИЧ, ВЛАСОВ ЕВГЕНИЙ ВАСИЛЬЕВИЧ

МПК / Метки

МПК: G10L 13/02, G10L 19/08, G10L 21/02

Метки: возбуждения, речи, синтезаторов

Опубликовано: 15.10.1982

Код ссылки

<a href="https://patents.su/4-966725-sposob-vozbuzhdeniya-sintezatorov-rechi.html" target="_blank" rel="follow" title="База патентов СССР">Способ возбуждения синтезаторов речи</a>

Похожие патенты