Способ слоговой компиляции речи

Номер патента: 1075300

Авторы: Вайншток, Книппер, Орлов, Потапов

ZIP архив

Текст

СОЮЗ СОВЕТСНИХСОЦИАЛИСТИЧЕСНИХРЕСПУБЛИН ГОСУДАРСТВЕННЫЙ КОМИТЕТ СССРПО ДЕЛАМ ИЗОБРЕТЕНИЙ И ОТКРЫТИЙ яц 1 0753003(511 С 10 1. 1/06(541 (57ЛЯЦИИ Р щий наб 1. СПОСОБ СЛОГОВОЙ КОМПИИ по тексту, использую- заранее записанных сигна(711 Ийститут проблем передачи инфоРмацйй АН СССР(561 1. Патент СИ Р 4278838,кл. 6 10 (, 1/00, 1981,2. Патент Франции 9 1602936,кл. С 10 (1/00, 1971.3. Токура Е. и Сагисаки Е. Синтез по правилам, использующийСГ-слоги и его качество. - Докладсекции речи Акустического обществЯпонии, 1980, с. 371-376лов открытых слогов типа согласный гласный и отдельных гласных фиксированной длительности, о т л и ч а ю щ и й с я тем, что, с целью повышения качества звучания компилированной речи, перед согласными звуками слогов формируют переходные сегменты различной длительности из последующих гласных звуков2. Способ по п. 1, о т л и - ч а ю щ и й с я тем, что длительность переходных сегментов выбирают в зависимости от предшествующего звука в пределах 0,1-0,4 от фиксированной длительности гласных, при этом, если этот звук согласный, то длительность берут наименьшую, а если гласный, то длительность берут тем большую, чем больше различия в характеристиках между типам асиных.Изобретение относится к приборостроению и может быть использованодля синтеза произвольного речевогосообщения.Известны способы компиляции речииз отдельных речевых элементов, 5которые реализуются последовательнымсоединением аллофонов (частей фонем )или дифонов (сочетанием отрезков.двух звуков 1 3 и Г 21.Однако указанные способы обладают тем недостатком, что при аллофонном или дифонном синтезах речи требуются, соответственно, или сложныепрограммы управления, осуществляющие сшивание речи иэ аллофонов с 15учетом их контекстной и позиционной вариативности, или большое числодифонов разнообразного типа, отражающих коартикуляционные связи междудвумя соседними звуками.20Наиболее близким по техническойсущности к изобретению является способ слоговой компиляции речи потексту, использующий набор заранеезаписанных сигналов открытых слоговтипа согласный - гласный и отдельных:.гласных фиксированной длительности,в котором произвольное сообщение формируют последовательным выбороми объединением слогов и отдельныхзвуков линейным интерполированиемих параметров на постоянном временном интервале. Позиционную изменчивость звуков задают контуром основного тона и длительностью гласныхи согласных звуков на основе фонетико-просодического анализа синтезируемого текста 3 1,Однако известный способ слоговойкомпиляции речи не имитирует естественные коартикуляционные связи 40между соединяемыми слогами и звуками при их линейном интерполировании на постоянном временном интервале. Поэтому слоговая компиляцияречи, обладая высокой разборчивостью,45имеет выраженную слоговую структуру,что воспринимается слушающими как ухудшение качества звучания компилированной речи.Целью изобретения является повышение качества звучания компилированной речи.Поставленная цель достигаетсятем, что согласно способу слоговойкомпиляции речи по тексту, использующему набор заранее записанныхсигналов открытых слогов типа согласный - гласный и отдельных гласных фиксированной длительности, перед согласными звуками слогов Формируют переходные сегменты различной бОдлительности иэ последующих гласныхзвуков Фиксированной длительности.При этом длительность переходныхсегментов выбирают в зависимостиот предшествующего звука в пределах 65 0,1-0,4 от фиксированной длительности гласных, причем, если этот звук согласный, то длительность берут наименьшую, а если гласный, то тем большую, чем больше различия в характеристиках между типами гласных.Более высокое качество звучания компилированной речи по предлагаемому способу объясняется тем, что при сшивании слогов и звуков в слитное речевое сообщение между естественными речевыми элементами формируют переходные сегменты различной длительности из гласного звука последующего слога. Эти переходные сегменты создают искусственную коартикуляцию звуков, близкую к естественной, так как для тех случаев, когда перестройка артикуляторных органов человека более длительна, обеспечивается большая длительность переходных сегментов.1На фиг. 1 показано формирование переходов, имитирующих коартикуляцию между сшиваемыми базовыми элементами речи", на Фиг, 2 - блоксхема системы, реализующей способ слоговой компиляции речи.Различия между параметрами гласных, иитерпретируемые фазовыми портретами на плоскостях формантных частот Г- Р 2, Р- Гопределяются как расстояние в этих пространствах.Длительность элементов речи, хранящихся в памяти,300 мс. Если предшествующий звук согласный, то длительность переходного сегмента составляет 20-30 мс, а если гласный, то 50-120 мс, т.е. длительность переходного гласного составляет 0,1-0,4 от фиксированной длительности гласных, хранящихся в памяти.Способ слоговой компиляции речи манжет быть реализован в соответствии со структурной схемой (фиг. 2) .В лингвистическом процессоре 1 осуществляют Фонетико-просодическое преобразование текстовой записи синтезируемой речи. На выходе этого блока текст представляют цепочкой открытых слогов и отдельных гласных звуков. Просодический анализатор задает контур основного тона и производит маркировку слогов на ударные, предударные и эаударные. В блоке эмуляции эффекта коартикуляции 2 осуществляют вставку гласных сегментов в цепочку символов с блока 1 в соответствии с предлагаемым способом. В вычислителе временных интер" валов 3 формируют временные траектории параметров синтезируемого сообщения и его просодические характеристики для дальнейшего их преобразования в речевой сигнал синтезатором 4 вокодерного типа. Базовые1075300 Составитель В.Сухановдактор Н.Пушненкова Техред С,МигуноваКорректор Г,Огар аказ 508/44 75твенногретенийЖ,ПодписноеСР комитета открыти ушская н д, 4/5 лиал ППП "Патент", г. Ужгород, ул. Проектная, 4 элементы, которые могут быть представлейы для экономии памяти впараметрическом виде, хранят в блоке 5 памяти и вызывают блоком 3по мере образования временных траекторий параметров синтезируемогосообщения. Громкоговоритель б осуТиражВНИИПИ Государпо делам изо113035, Москва ществляет преобразование речевого сигнала на выходе синтезатора 4 в акустические колебания.Использование предлагаемого способа слоговой компиляции речи позво лит повысить качество звучания синтезированной речи.

Смотреть

Заявка

3525639, 21.12.1982

ИНСТИТУТ ПРОБЛЕМ ПЕРЕДАЧИ ИНФОРМАЦИИ АН СССР

ВАЙНШТОК АРКАДИЙ ПИНХОСОВИЧ, КНИППЕР АЛЕКСАНДР ВЛАДИМИРОВИЧ, ОРЛОВ ИГОРЬ АЛЕКСЕЕВИЧ, ПОТАПОВ ВЛАДИМИР ГЕОРГИЕВИЧ

МПК / Метки

МПК: G10L 13/08

Метки: компиляции, речи, слоговой

Опубликовано: 23.02.1984

Код ссылки

<a href="https://patents.su/3-1075300-sposob-slogovojj-kompilyacii-rechi.html" target="_blank" rel="follow" title="База патентов СССР">Способ слоговой компиляции речи</a>

Похожие патенты