Устройство для обнаружения искажений в тексте

Номер патента: 920730

Авторы: Евстигнеев, Седаков, Тимонин

ZIP архив

Текст

ОП ИСАНИЕ ИЗОБРЕТЕНИЯ К АВТОРСКОМУ СВИДЕТЕЛЬСТВУ Союз СоветсннхСоцналнстнчесннхреспублнн 11920730( )м. кл. С 06 Г 1100 3 Ьвударстюай каатат СССР ао аваан кзфбрвтеккй н открытий(54) УСТРОЙСТВО ДЛЯ ОБНАРУЖЕНИЯ ИСКАЖЕНИЙВ ТЕКСТЕ Изобретение относится к вычислительной технике и может быть использовано в системах обработки текстовой инФормации,Известны устройства дпя проверкиправильности текстов, содержащиерегистр сдвига, память и схемы сравненя и осуществляющие анализ тек"ста на основе априорных вероятностей биграмм, триграмм и болеедлинных сочетаний симовлов 1,Недостаток этих устройств состоит в их сложности.Наиболее близким к предлагаемомупо технической сущности являетсяустройство для обнаружения искажений в тексте, содержащее регистрсдвига кодов символов, входом соединенный с инФормационным входомустройства, а выходом - со входомблока хранения вероятностей биграмм,выходы которого соединены с первымивходами соответствующих схем сравнения, вторыьи входами подключены ко входу задания порога, а выходами к регистру Фиксации ошибок, вы" ход которого является выходом уст" ройства 2 1Недостаток этого устройства сос" ф тоит в низкой достоверности работыи значительных аппаратурных эатра" тах, так как обнаружение ошибок в тексте основано на существовании для определенного словаря используеф мого языка ограниченного количестваразрешенных биграмм, вероятности которых помещаются в блоке хранения вероятностей биграмм. При этом в устройстве не обнаруживаются ошибки, связанные с изменением длины слова или порядка следования символов в тексте. Кроме того, в нем необходимо использовать блок хранения 20вероятностей биграмм большой емкос ти, что требует значительных затрат оборудования,Целью изобретения является повышение достоверности работы и сокра"3 9щение аппаратурных затрат устройст ва,Поставленная цель достигаетсятем, что в устройство, содержащеерегистр кодов символов и регистрФиксации ошибок, выход которого является выходом устройства, введеныблок выделения слова, включающийдва элемента И и дешифратор кодапробела, распределитель, блок дешифрации допустимых биграмм и блокдешифрации допустимых корреляцийсимволов, причем первый выход регистра кодов символов соединен через дешифратор пробепа с первым входом первого элемента И, вход - свыходом второго элемента И, второйвыход - с управляющими входами бло"ков дешифрации допустимых биграмм икорреляций символов, выходы которыхподключены к соответствующим входамрегистра фиксации ошибок, а информационные входы через распределительк группе выходов регистра кодов символов, первый и второй входы второго элемента И подключены соот ветственно к информационному входу устройства и выходу первого элемента И,вторым входом соединенного с тактовым входом устройства.На чертеже представлена структурная схема устройства.Устройство содержит регистр 1 кодов символов, распределитель 2, подключенный цепями 3 и 4 к блоку 5 дешифрации допустимых биграмм и к блоку 6 дешифрации допустимых корреля"ций символов, регистр 7 ФиксацииОшибОк, подключенный к Выходу 8 Устройства блок 9 выделения словавключающий элементы И 10 и 11 и дешифратор 12, информационный 13 итактовый 14 входы устройства,Устройство работает следующимобразом,В исходном состоянии регистрнаходится в обнуленном состоянии.Распределитель 2 вырабатывает нулевые коды. На выходах блоков 5 и 6и регистра 7 сигналы отсутствуют,По тактовым сигналам, поступающимпо входу 14, через элемент И 10разрешается последовательное поступление кодов символов текста через элемент И 11,При поступлении неискаженноготекста по входу 13 коды символовнакапливаются на регистре 1 до техпор, пока не появится код очередно 0730 4го пробела. Б этом случае дешифратор 12 формирует сигнал, блокирующий элемент И 10 и прерывающий поступление кодов символов через элемент И 11, Таким образом, на регист.ре 1 оказывается выделенной совокупность кодов символов, соответствующи х слову текста,Распределитель 2 Формирует в цепях 3 пары кодов биграммы отношений 2-3, 3-4, и т.д, символов, а вцепях 4 - пары кодов корреляции 2-4,3- 5, 2-5, 3-6 и т. д. символов выделенного слова. В соответствии с кодом первого символа слова, поступающего со второго выхода регистра 1 блоки 5 и 6, осуществляется подключение рабочих дешифраторов кодов пар 2-3, 3-4 и т.д. символов и пар 2-4 2-5 3-5 3-6 и теде символов выделенного слова соответственно, Искажения обнаруживаются блоками 5 и 6 в том случае, если хотя бы одна из биграмм анализируемого слева является запрещенной комбинацией, Дпя неискаженных слов текста коды отношений символов и корреляции символов, соответствующие зафиксированному первому символу слова, являются разрешенньЪИ. При этом на выходах блоков 5 и 6 отсутствуют сигналы, а на вьХоде регистра 7 отсутствуют сигналы об ошибке в тек" сте, Дальнейшая разблокировка поступления кодированного текста через элемент И 11 осуществляется тактовым сигналом с выхода элемента И 10,Работа устройства в случае ошибок в кодированном тексте производится следующим образом.Допустим, чтс по входу 13 поступает последовательность кодов символов текста, соответствующих искаженному слову НАОК образованному вследствие пропуска символа 3 на третьей позиции слова (правильно МАЗОК). Коды символов накапливаются на регистре 1 до гоявления пробела по сле по след не го си м вол а "К", В этому случае дешифратора 12 Формирует сигнал, по которому запрещается поступление кодов символов через элемент И 11. Таким образом, на регистре 1 выделены коды символов слоИАОКРаспределитель 2 вырабатывает в цепях 3 пары кодов отношений 2-3 и 3-4 символов слова, т.е. пары кодов символов "АСИ и "ОК". В цепях 4 фор5 9207мируются коды корреляции 2-4 (ЯК)символов слова, просмотр которыхосуществляется .с помощью рабочих .де.шифраторов блоков 5 и 6. Так какпары кодов отношений 2-3 ("АО") и("ОК") символов являются запрещенными комбинациями для слова, на"чинающего с символа "М", то блок 5вырабатывается сигнал, записываемыйв регистр 7, по которому в выходной цепи 8 формируется сигнал обошибке в тексте.Допустим, что по входу 13 поступает последовательность кодов сим"волов текста, соответствуоцих иска" 1женному слову "УКВА" (правильно"БУКВА" ), образованному вследствиепропуска первого символа "Б" слова.После ввода слова в регистр 1, т.е,появления кода пробела вслед за по" 30следним символом "А", распредели"тель 2 вырабатывает в цепях 3 парыкодов отношений 2-3 и 3"4 символовслова, т.е. пары кодов отношенийсимволов "КВ" и "ВА". В цепях формируются пары кодов корреляции символов 2-4 ("КА"), В блоках 5 и 6 осуществляется анализ кодов символовслова. Так как пары кодов 2-3 ("КВ")и 3-4 ("ВА") символов являются за- зопрещенными комбинациями для слов,начинающихся с символа "У", то навыход блока 5 вырабатывается сигналоб ошибке, поступающий на регистр 7.Пара кодов 2-4 ("КА") символов является запрещенной для слова, начинающегося с символа "У", поэтому рабо"чие дешифраторы блока б вырабатывают на выходных шинах сигнал, покоторому на выходе 8 устройства Фор вмируется сигнал об ошибке в тексте,Таким образом .осуществляется работаустройства при обнаружении ошибок,связанных с пропуском символов слова. 43Допустим, что в последовательности символов текста содержится ис.каженное слово "БУКХВА", образовавшееся вследствие добавления символа"Х" на четвертую позицию слова правильно(фБУКВА"),После ввода слова с регистр 1распределитель 2 вырабатывает в це-пях 3 пары кодов отношений 2-3, 3-4,4-5 5-6 символов слова, т.е, парыкодов отношений символов "УК", "КХ","ВА", В цепях 4 формируются парыкодов корреляции 2-4, 2-5 3"5 . 3-6символов, т,е. "УХ", "УВ", "КВ","КАф, Так как пары кодов 3-4 (ВАКХ") символов, 4-5 ("ХВ") 5-6 (нВАи) являются запрещенными комбинациями для слова, начинаоцегося с символа "Б", то рабочие дешифраторы блока 5 вырабатывают на выходнах шинах сигнал об ошибке, поступающий на регистр 7. Пары колов символов 2-4 (нУХ,2-5("УВ"),3-5 ("КВ"),3-6 ("КА") является запрещенными для слова, на.чинающегося с символа "Б", поэтому рабочие дешифраторы блока 6 вырабатывают на выходных шинах сигнал, поступающий в регистр 7, с выхода, которого на выход 8 выдается сигнал об ошибке в текстеИспользование блока выделения слова позволяет осуществить просмотр смысловых элементов текста - группы символов, заключенных между последовательныип пробелами в тексте. Фор" мирование пар кодов отношений и ко" дов корреляции символов, число кото. рых определяется длиной слова, поэ" воляет учитывать позиции занимаемых символов в слове.Дешифратор кодов пар символов в зависимости от кода первого символа слова позволяет обнаруживать сочет ани я си мволо в, недопустимые с точки зрения словарных конструкций используемого языка.Таким образом, устройство позво" ляет исключить возможность пропус"ка ошибок в текстах, связанных с изменением длины слова, что повы" шает достоверность работы устройст" ва. Кроме того, устройство не содержит многоразрядного блока памяти большого объема.Формула изобретенияУстройство для,обнаружения искажений в тексте, содержащее регистр кодов символов и регистр фиксации ошибок, выход которого является выходом устройства, о т л и ч а ю - . щ е е с я тем, что, с целью повышения достоверности работы устройства, в него введены блок выделения слова, включающий два элемента И и дешифратор, распределитель, блок дешифрации допустимых биграмм и блок дешифрации допустимых корреля ций символов, причем первый выход регистра кодов символов соединен через дешифратор с первым входом920730 ВНИИПИ Заказ 2344/56 Тираж 732, Подписно филиал ППП "Патент", г.ужгород, ул,Проектная,7первого элемента И, вход - с выходом второго элемента И, второй выход - с управляющими входами бло-" ков дешиФрации допустимых биграмм и корреляций символов, выходы которых подключены к соответствующим входам регистра Фиксации ошибок, а инФормационные входы через рас" пределитель - к группе выходов ре" гистра кодов символов, первый и второй входы второго элемента И подключены соответственно к инФормационному входу устройства и выходупе р во го элемента И, вторым входомсоединенного с тактовым входом устройства. Ист очни ки и нфор ма ци и,принятые во внимание при экспертизе1. ЕЕЕ ,Тгапьасй 1 оп ь оп Сощрийегчо 1. с"23 1974, У 5,Мау, р.с. 4841 е 485.2, Патент СВА М 3188609,кл. 340-146 1,.1965 (прототип).

Смотреть

Заявка

2915613, 24.03.1980

ВОЙСКОВАЯ ЧАСТЬ 01168

ЕВСТИГНЕЕВ ВИТАЛИЙ ЕВГЕНЬЕВИЧ, СЕДАКОВ АЛЕКСАНДР ВИКТОРОВИЧ, ТИМОНИН СЕРГЕЙ ИВАНОВИЧ

МПК / Метки

МПК: G06F 17/21

Метки: искажений, обнаружения, тексте

Опубликовано: 15.04.1982

Код ссылки

<a href="https://patents.su/4-920730-ustrojjstvo-dlya-obnaruzheniya-iskazhenijj-v-tekste.html" target="_blank" rel="follow" title="База патентов СССР">Устройство для обнаружения искажений в тексте</a>

Похожие патенты