Устройство для обнаружения искажений в тексте
Похожие патенты | МПК / Метки | Текст | Заявка | Код ссылки
Номер патента: 1056198
Авторы: Евстигнеев, Седаков, Тимонин
Текст
ОЮЗ СОВЕТСНИОЦИАЛИСТИЧЕСНЕСПУБЛИН 19) (11) 51) б 061 1/00 ОСУДА О ДЕЛ САН РЕТЕНИЯ ЕПЬСТВУ во ССС1982 уппои тимых ЕННЫЙ КОМИТЕТ СССР Э ОБРЕТЕНИЙ И ОТНРЫТИ(56) 1. Авторское свидетельст РУ 920730, кл, б 06, 1 11/00,(54)(57) УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯИСКА)1 ЕН 16 В ТЕКСТЕ по авт, св,В 920730, о т л и ч а ю щ е е с ятем, что, с целью расширения Функциональных возможностей путем обеспечения локализации места искажения иуказания позиции ошибки в тексте,в него введены Аормирователь позиции.ошибки в слове, состоящ)й из трехэлементов И, элемента ИЛИ и блокаприоритетов, и индикатор, соединенный управляющим входом с выходом регистра фиксации ошибок, а первым ивторым информационными входами - соответственно с выходом блока приоритетов и с третьим выходом регистракодов символов, первый и второй входы первого элемента И соединены спервым и вторым выходами блока дешифрации допустимых корреляций символов, третий и четвертый выходы которого соединены с первым и вторымвходами второго элемента И, выходкоторого соединен с первыми входамиэлемента ИЛИ и третьего элемента И,выход которого соединен с первым входом блока приоритетов, а второй,вход - с выходом первого элемента Ии с вторым входом блока приоритетов,второй вход элемента ШВ 1 соединен спервым выходом блока дешиАрации допустимых биграмм, а выход - с третьимвходом блока приоритетов, группавходов которого соединена с грвыходов блока дешифрации допусбиграмм.Изобретение относится к вычислительной технике и может быть использовано в системах обработки текстовой инАормации.По основному авт, св, Р 920730известно устройство для обнаруженияискажений в тексте, содержащее регистр кодов символов, распределитель инАормации, блоки дешиАрации допустимых биграмм и корреляций симво Олов, регистр Аиксации ошибок и блоквыделения слова, первым и вторым входами соединенный соответственно с информационным и тактовым входами устройства, причем первый выход и входрегистра кодов символов соединенысоответственно с третьим входом и выходом блока выделения слова, а второй выход - с управляющими входамиблоков дешиАрации допустимых биграмми корреляций символов, выходы которыхсоединены с соответствующими входами регистра фиксации ошибок, выходкоторого является выходом устройства, инАормационные входы блоков дешифрации допустимых биграмм корреляций символов через распределительинАормации соединены с группой инАормационных выходов регистра кодов символов 1 1,30Недостаток известного устройствасостоит в том, что оно не позволяетлокализовать место искажения - искаженные символы в словах текста,Цель изобретения - расширениефункциональных возможностей устпойства путем обеспечения локализацииместа искажения и указания позицииошибки в тексте.Поставленная цель достигается тем,что в устройство введены Аормирова 40тель позиции ошибки в слове, состоящий из трех элементов И, элемента ИЛИи блока приоритетов, и индикатор, соединенныйуправляющим входом с выходом45регистра Аиксации ошибок, а первыми вторым.инАормационными входами - соответственно с выходом блока приоритетов и с третьим выходом регистракодов символов, первый и второй входы первого элемента И соединены с 50первым и вторым выходами блока дешиАрации допустимых корреляций символов,третий и четвертый выходы которогосоединены с первым и вторым входамивторого элемента И, выход которого 55соединен с первыми входами элементаИЛИ и третьего элемента И, выход которого соединен с первым входом блокаприоритетов, а второй вход - с выходом первого элемента И и вторым входом блока приоритетов, второй входэлемента ИЛИ соединен с первым выходом блока деширации допустимых биграмм, а выход - с третьим входомблока приоритетов, группа входов кото 4рого соединена с группой выходов блока дешиАрации допустимых биграмм.На чертеже представлена блок-схема предлагаемого устройства для обнаружения искажений в тексте.Устройство содержит регистр 1 кодов символов, распределитель 2 инАор.мации, блок 3 дешиАрации допустимыхбиграмм, блок 4 дешиАрации допустимых корреляций символов, регистр 5фиксации ошибок, блок 6 выделенияслова, Аормирователь 7 позиции ошибки в слове, состоящий из первого,второго и третьего элементов И 8, 9,1 О, элемента ИЛ 1 11 и блока 12 приоритетов, индикатор 13, инАормационные выходы 14 и 15 распределителяинформации, тактовый .вход 16 устройства, выход 17 блока приоритетов,информационный вход 18 устройства,выходы 19,1, 19.219(п) блокадешиАрации 3 и выходы 20.1, 20,2,20.3, 20.4 блока 4 дешиАрации,Блок 12 приоритетов представляетсобок известную схему последовательного опроса заявок и предназначендля поиска крайней правой единицы 12 1.Устройство работает следующим образом.В исходном состоянии регистр 1находится в обнуленном состоянии.Распределитель 2 инйормации вырабаты.вает на своих выходах 14 и 15 нулевые коды, На выходах блока 3 (навыходах 19,119,п), блока 4(на выходах 20.1 .,20.4), регистра5 и Аормирователя 7 присутствуют нулевые сигналы, На индикаторе 13 от,сутствует инАормация об ошибках,Поступление кодов символов текстачерез блок 6 разрешается по тактовым1сигналам в цепи 16. При поступлениина вход 18 неискаженного текста нарегистре 1 производится накоплениекодов символов слова до появленияпробела после последнего символа слова. В этом случае по сигналу, поступающему на управляющий вход блока 61с регистра 1, запрещается дальнейшее поступление кодов символов. Таким образом, на регистре 1 оказывается выделенной совокупность кодов символов, соответствующая одному словутекста.Каждое слово текста представляется в устройстве как совокупность.первого символа и наборов комбинаций последующих символов слова двухвидов." отношений "2-3" "3-4"1 фсимволов, отражающих зависимость предыдущего символа в слове от последующего, корреляций "2-4", "2-5" "3-5" О11 11 -3-6 символов в слове.Каждый начальный символ алфавитаиспользуемого языка имеет свой комплект эталонных (разрешенных) комбинаций символов, соответствующих различным позициям в слове, Тем самым5учитываются устойчивые комбинациисимволов в словах используемого языка, Ошибки в тексте обнаруживаютсяпри сравнении эталонных комбинацийс поступившими в слове.20Запрещенные сочетания символов представляют собой такие сочетания, которыеникогда не встречаются в русском языке.При определении является ли некотороесочетание разрешенным или запрещенным25анализируется большой массив словрусского (или другого) языка.Итак, после приема очередного слова текста распределитель 2 информацииформирует в цепях 14 пары кодов отношений (биграмм) "2-3", "3-4","(и"1)-и" символов, а в цепях 15 -пары кодов корреляции символов "2-4",111 11 11 11 11"2- 5 , 3-5 , 3 -6 выдел енно го слова . По коду первого символа , поступающе го с второго выхода регистрав блоках 3 и 4 осуществляется подключени е рабочих дешиАраторов кодов парволов выделенного слова соотв ет с твенно . Для неискаженных слов текста кодыотношений символов и корреляций символов , соответ ст вующие зафиксированному первому символу слова , являют- . 45ся р азр ешенными , При этом на выходах1 9 . 1 , . . . , 1 9 , и -2 , подключенных к выходам бл ока 3 дешиАр ации допустимыхби грамм "2- 3 " . . . , , " ( и - 1 ) - и " символов и на выходах 20 . 1 . . . , 2 0 . 4 , подключ енных к выходам блока 4 деиийр ации допустимых корреляций " 2 - 4 " ,"2- 5 " , " 3-5" , "3 -6 " символов формируют ся нулевые сигналы , На выходе р егистр а 5 отсутствует сигнал об оши бке в слове,на выходе блока 12 - сигнал опозиции ошибки в слове. На индикаторе 13информация об ошибке не индицируется. Работа устройства в случае ошибокв поступающем кодированном текстепроизводится следующим образом,Лолустим, что на вход устройствапо входу 18 поступает последовательность кодов символов текста, соответствующая искаженному слову "ОИГНАЛ",образованному вследствие искаженияпервого символа (лравильно 11011 ГНАЛ"),По тактовым сигналам с входа 16 осуществляется разблокировка поступления кОдированного текста на регистр 1на котором производится накоплениекодов символов слова до появленияпробела после символа "Л". В этомслучае по сигналу, поступающему науправляюгий вход блока 6 с первоговыхода регистра 1, запрещается дальнейшее поступление кодов символов.Таким образом, на регистре 1 оказываются выделенными коды символов слова 110 ИГНАЛ".Р; пределитель 2 индврмации Гюрмирует на выходе 14 пары кодов отношеволов, т,е. лары кодов символовИГ"2-.5" "ИА"1. "3-5" ("ГА") и "3-6"1 11ГЛ символов слова, просмотр которых осуществляется с помощью блоков3 и 4. Так как пары кодов отношений"3-5" ("ГА") и "3-6 ("ГЛ") символов являются запрещенными комбинациями для слова, начинающегося с симво 11ла 0 , то блоки 3 и 4 выр абатывают на соответствующих выходах 1 9 . 1 ,1 9 , 2 , 1 9 , 3 , 1 9 . 4 и 2 0 . 1 , 2 0 , 2 , 20 . 3 ,20 , 4 единичные сигналы ,Единичные сигналы , поступающие наблок2указывают на выходе 1 9 . 2на огни бку в четвертой позиции , навыходе 1 9 , 3 - на ошибку в пятой позиции , на выходе 1 9 , 4 - на оши бку в .шестой позиции . По единичным си гналам на выходах 20 . 1 и 20 , 2 элементИ Я формирует единичный сигнал , указывающий на ошибку во второй позицииФпо единичным сигналам на выходах 20,3и 20.4 элемент И 9 формирует единйчный сигнал, указывающий на ошибкув третьей позиции, Кроме того, единичный сигнал на выходе 19,1, поступающий на блок 2 через элемент ИЛИ1, также указывает на ошибку в третьей позиции. Элемент ИЛИ 11 орми рует единичный сигнал, указывающий на ошибку в третьей позиции. Элемент И 10 Формирует сигнал об ошибке в первой позиции слова.таким образом, на первый - шес той входы блока 12 поступают сигналы об ошибках в первой-шестой позициях поступившего слова, Блок 12 осуществляет поиск крайней правой единицы из поступивших входных сигналов 10 и формирует на шинах 17 инАормацию об ошибке в первой позиции слова, поступающую на индикатор 13. Для искажений в первом символе слова характерным является появление сигналов 15 об ошибках в последующих позициях поступившего слова, Одновременно на индикатор 13 передается по управляющему сигналу регистра 5 содержимое регистра 1. Таким образом, на инди каторе 13 после соответствующей дешифрации отображается поступившее слова ООИГНАЛ" и индюрмация об обнаруженной ошибке в первой позиции этого слова, 25Допустим, что на вход устройства 18 поступает последовательность кодов символов текста, соответствующая искаженному слову "ДЙИЕТА", образованному вследствие ошибочного 30 добавления второго символа (правильно. "ДИЕТА" ), На регистре 1 осуществляется накопление кодов символов до появления пробела после последнего симво- ла "А", В этом случае по сигналу, поступающему на управляющий вход блока 6 с регистра 1, запрещается дальнейшее поступление кодов символов, Таким образом, на регистре 1 оказываются выделенными коды символов слова "Д 101 ГТА",Распределитель 2 информации на выходе 14 пары кодов отношений "2-3", пары кодов символов "ЙИ", "Е.", "ЕТ" фЗл (фф 11 Тфф) и ффЗ-бл (ф 1 ИАфф) символов слова, просмотр которых осуществляется с помощью рабочих дешиАраторов50 блоков 3 и 4, Так как пары кодов оти корреляции "2-4" ("ЙЕ"), "2-5" ("ЙТ ) символов являются запрещенными комбинациями дпя слова, начинающегося с символа Д , то блоки 3 и 4ею л 55 вырабатывают на выходах 19.1, 19.2, 20.1, 20,2 соответственно единичные сигналы. Единичный сигнал на выходе 19.1, поступающий на блок 12 через элемент ИЛИ 11, указывает наошибку и третьей позиции слова, Единичный сигнал на выходе 19.2, поступающий на вход блока 12, указываетна ошибку в четвертой позиции, Поединичным сигналам на выходах 20.1и 20.2 элемент И 8 формирует единичный сигнал, указывающий на ошибкуво второй позиции слова,Таким образом, на второй, третийи четвертый входы блока 12 поступаютсигналы об ошибках во второй, третьейи четвертой позициях поступившегослова. Для ошибок во втором символеслова наиболее характерно то, чтозапрещенными комбинациями являетсясовокупность символов корреляции"2-4" и "2-5", Поэтому единичный сигнал элемента И 8, поступающий на втоорой вход блока 12, будет определяющим при указании позиции ошибки. Замеченные ошибки в последующих позициях поступившего слова - следствиеошибки в предыдущем символе. Таким.образом, ошибка в младшем разрядесчитается основной. Блок 12 осуществляет поиск крайней правой единицы из посгупивших входных сигналов иФормирует на выходе 17 индюрмацию обошибке во второй позиции слова, поступающую на индикатор 13. Одновременно на индикатор 13 передается по управляющему сигналу регистра 5 содержимое оегистра 1, Таким образом, наиндикаторе 13 после соответствующейдешифрации отображается поступившееискаженное слово "ДЙИЕТА" и индюрмация об обнаруженной ошибке во второйпозиции этого слова,Допустим, что на вход устройства 18 поступает последовательность кодов символов текста, соответствующая искаженному слову "ДИМКТОР", образованному вследствие добавления третьего символа (правильно "ДИКТОР" ), На регистре 1 осуществляется накопление кодов символов до ,появления пробела после последнего символа "Р", В этом случае по сигналу, поступающему на управляющий вход блока 6 с регистра 1, запрещается дальнейшее поступление кодов символов, Таким образом, на регистре 1 оказываются выделенными коды символов слова "ДВ 1 КТОР" .Распределитель 2 информации формирует иа выходе 14 пары кодов отноше"6-7" символов, т, е. пары кодов символов "1 П", "МК", "КТ", "ТО" и "ОР", а на выходе 15 - коды корреляции В 2 411 (1 ИКв ) 112 511 (111 К 1) 11511 ("Мт") н "3-6" ("МО") символов слова, просмотр которых осуществляется с помощью рабочих дешиАраторов блоков 3 и 4. Так как пары кодов отноще- ("МТ"), "3-6" ("МО") символов являются запрещенными для слова, начинающегося с символа "Д", блоки 3 и 4 вырабатывают на выходах 19,3 и 20.3, 20.4 Соответственно единичные сигналы,Еди ничный сигнал на выходе 19.3, поступающий на блок 12, указывает на ошибку в пятой позиции. По единичным сигналам на выходах 20.3 и 20,4 элемент И 9 формирует единичный сигнал, указывающий на ошибку в третьей позиции.Таким образом на третий и пятый входы блока 12 поступают сигналы об ошибках в третьей и пятой позициях поступившего слова, Для ошибок в третьем символе слова наиболее характерно то, что запрещенными комбинациями является совокупность символов корреляции "3-5" и "3-6" или.символы отношений "2-3". Поэтому единичный сигнал элемента ИЛИ 11, .поступающий на третий вход, блока 12, будет определяющим при указании позиции ошибки; Замеченные ошибки в последующих позициях поступившего. слова - следствие ошибки в предыдущем ,символе, Таким образом, ошибка в младшем разряде считается основной, Блок 12 осуществляет поиск крайней правой единицы из поступивших входных сигналов и дюрмирует на шинах 17 информацию об ошибке в третьей позиции слова, поступающую на индикатор 13. Одновременно иа инидкатор 13 передается по управляющему сигналу регистра 5 содержимое регистра 1, Таким образом, на индикаторе 13 после соответствующей дешиАрации отображается поступившее искаженное слово "Д 1 ПКТОР" и индюрмация об обнаруженной ошибке в третьей позиции этого слова.Допустим, что на вход устройства 18 поступает последовательность кодов символов текста соответствующая искаженному слову "РЕГИ" ", образованному вследствие пропуска шестого символа "Т" (правильно "РЕГИСТР" ),Па регистре 1 осуществляется накопление кодов символов до появления.пробела после последнего символа"Р", В этом случае по сигналу, поступающему на управляющий вход блока 6 с регистра 1, запрещается даль.нейшее поступление кодов символов.Таким образом, на регистре 1 оказываются выделенными .коды символов,слова "РЕГИС Р",Распределитель 2 информации формирует иа выходе 14 пары кодов отношений "2-3", "3-4", "4-5" и "5-6" сим-.волов, т.е, пары кодов символов "ЕГ",ды корреляций "2-4" ("ЕИ"), "2-5"("ЕГ") "3-5" ("ГС") и "3-6" ("ГР").символов слова, просмотр которых осу.ществляется с помощью блоков 3 и 4,Так как пара кодов отношений "5-6"("СР") и корреляций "3-6" ("ГР") являются запрещенными комбинациями для11 11слова, начинающегося с символа Рблоки 3 и 4 вырабатывают на выходах19.4 и 20.4 соответственно единичныесигналы, Единичный сигнал иа выходе19,4, поступающий на вход блока 12,указывает на ошибку в шестой позиции,Таким образом, на шестой входблока 12 поступает единичный сигналоб ошибке в шестой позиции поступившего слова, Для ошибок в четвертом.и-м символе наиболее характерно то,что запрещенной комбинацией являетсясоответственно биграмма "3-4","(и"1)"и", т.е, для ошибки в шестомсимволе биграмма "5-,6" является запрещенной, Поэтому единичные сигналы на выходах 19,2-19.п(19.4 - длябиграмьы "5-6") являются определяющими при указании ошибки. Таким образом, ошибка в младшем разряде считается основной, Блок 12 дюрмнрует на выходе 17 информацию об ошибкев шестой позиции слова, поступающуюна индикатор 13, одновременно на индикатор 13 передается по управляющему сигналу регистра 1, Таким образом, на индикаторе 13 после соответствующей дешифрации отображается,поступившее искаженное слова "РЕГИС Р"и индюрмация об обнаруженной ошибке в шестой позиции этого слова. Использование Формирователя 7 позиции ошибки в слове, включающего элементы И 8-10, ИЛИ 11, блок 12 поиска крайней правой единицы и инд1056198 10 Тираж 70 аказ 9308/4 ИИ 1 П дписно Проектная,хатор 13, соединенные указанным выше образом, позволяет расширить функциональные возможности устройства путем отображения искаженного слова и указания позиции ошибки 5в нем. Вероятность обнаружения ошибок в тексте составляет 0,8-,97 в зависимости от типа ошибок, (пропуск, добавлениеили замена символа), позилиал ППП Патент , г. Ужго ции ее в слове и начального символа слова.Преимущество предлагаемого метода биграмм по сравнению с другими известными методами заключается в возможности обнаружения искажений в тексте, связанных с изменением длины слова, при использовании имеющейся избыточности русского языка. Дополнительная информационная избыточность не вводится.
СмотретьЗаявка
3363124, 11.12.1981
ВОЙСКОВАЯ ЧАСТЬ 01168
ЕВСТИГНЕЕВ ВИТАЛИЙ ЕВГЕНЬЕВИЧ, СЕДАКОВ АЛЕКСАНДР ВИКТОРОВИЧ, ТИМОНИН СЕРГЕЙ ИВАНОВИЧ
МПК / Метки
МПК: G06F 17/21
Метки: искажений, обнаружения, тексте
Опубликовано: 23.11.1983
Код ссылки
<a href="https://patents.su/6-1056198-ustrojjstvo-dlya-obnaruzheniya-iskazhenijj-v-tekste.html" target="_blank" rel="follow" title="База патентов СССР">Устройство для обнаружения искажений в тексте</a>
Предыдущий патент: Устройство для контроля распределителя импульсов
Следующий патент: Устройство для контроля параллельного двоичного кода на четность
Случайный патент: Аспирируемая шахта для погрузки сыпучих грузов в штабель