Способ контроля достоверности распознавания символов

Номер патента: 533947

Автор: Коршак

ZIP архив

Текст

ег;т )и .Ф ) 11, н 1ы;,СПИ НИЕ ИЗОБРЕТЕНИЯ р 533947 Союз Советских Социалистических Республикосударственныи комитет овета Министров СССР(088,8) нь40 18,11.76 Опубликовано 30.10,76. Бюлле Дата опубликования описани по делам изобретении и открытий2) Автор изобретения В К Коршакна Ленина институт кибернетики 71) Заявитель краинской С НОСТИ РАСПОЗНАВАН ОНТРОЛЯ ДОСТО СИМВО(54) СПО Изобретенитики и вычислиспользованораспознаваниматами,ных изобраставляющихтомата, гдетребуемои дки, напримеравной 90ошибки, харпознаванияных читающ10- - : 110 -считываниютомате докунее нескочь области кибернеки и может быть я достоверности итающим автоотносится к тельной техн для контролсимволов 15 Большой объем подлежащих считыванию наконтролируемОм читающем автомате знаков является основным недостатком известного способа, так как время выполнения проверки достоверности читающего автомата по извест ному способу составляет несколько часов машинного времени даже в случае применения современных электронных вычислительных машин для обработки результатов проверки.Цель изобретения - сокращение времени 25 контроля.Это достигается тем, что изображения символов контрольной выборки синтезируют совщением изображений каждых двух симвов из входного алфавита.3 В синтезированных изображениях символовнтрольной выборки удаляют несовпадающие ме ло 0ко азличБудучи отлажен перед началом эксплуатации, читающий автомат со временем теряет настройку, качество распознавания его ухудшается. Чтобы определить момент, когда нужно прекратить работу и поставить читающий автомат на подналадку, необходимо периодически проверять качество распознавания по всем распознаваемым данным типом автоматов классам изображений.Известен способ оценки качества распознавания 1, использующий полную характеристику плотности распределения признаков при их пороговом выделении.Известный способ основан на теоретическом определении достоверности распознающих устройств и технически трудно реализуется.Наиболее близким по существу к предлагаемому способу является известный способ контроля достоверности распознавания символов 2, основанный на формировании контрольной выборки изображений символов.Согласно этому способу контролируемому читающему автомату предъявляют для распознавания контрольную выборку изображеКний символов, содержащую У= рРош жений символов всех классов, совходной алфавит читающего ав- Й - коэффициент, определяемый оверительной вероятностью оценр для доверительной вероятности, %; 1=2, 3; Р,ш - вероятность актеризующая достоверность расданного автомата. Для современих автоматов значение Р,ш= 1так что массив подлежащих на контролируемом читающем авментов должен содержать не меких миллионов знаков,55 60 65 между собой фрагменты изображения символов входного алфавита.Сущность предлагаемого способа заключается в следующем.Путем фотомонтажа или другим методом синтезируют изображения символов контрольной выборки для всех возможных пар эталонных изображений символов путем их совмещения так, что к эталонному изображению одного символа добавляются фрагменты изображения другого эталонного символа из входного алфавита. В результате формируется укороченная контрольная выборка синтезированных изображений символов, ее предъявляют читающему автомату, у которого отключен канал для формирования сигналов, соответствующих отказу от распознавания на неразборчивых символах или знаках.В синтезированных символах с помощью известных методов (например, ретуши) удаляют несовпадающие фрагменты изображений каждьех двух совмещенных между собой эта- ЛОЕЕЕЕЫХ СИМВОЛОВ.В результате такой операции получают новый синтезированный символ, отличный от эталонного, который может быть включен в контрольную выборку.Частным случаем способа по п. 1 является совещение двух букв: ПиН, в результате которого получается синтезированный символ Н. Исправный и хорошо отлаженный читающий автомат примерно в 500/О случаев классифицирует такое синтезированное изображение, как Н, и в стольких же случаях, как П, Затем изготавливают документы, содержащие все синтезированные изображения, и проводят стадию опробования на заведомо исправных читающих автоматах, однотипных с контролируемым. Для дальнейшего использования оставляют граничные изображения, правильно распознаваемые исправными читающими автоматами с вероятностью, возможно более близкой к 500/О. Синтезированное изображение считается распознанным правильно, если оно отнесено к любому из классов, из элементов изображений которых это граничное изображение синтезировано. Полученные в результате многократного отбора синтезированные изображения предъявляют для распознавания контролируемого читающему автомату. Если у последнего в результате длительной эксплуатации наметилась тенденция к предпочтению одного из классов, например класс символов Н предпочитается классу П, то это немедленно отразится на распределении ответов при распознавании выборки из граничных изображений типа Н: увеличится число ответов класса Н за счет ответов класса П.Необходимо отметить, что даже с помощью большой выборки из обычных изображений эту тенденцию предпочтения у контролируемого автомата не всегда можно обнаружить. Таким образом, предлагаемый способ обладает 5 10 15 20 25 30 35 40 45 50 в известной степени диагностическими качествами.Сравним объем выборки, который требуется для проверки качества распознавания читающего автомата на обычных изображениях, с требуемым объемом выборки граничных изображений. Сравнительный анализ проведем для случая двух классов.Пусть читающий автомат работает с вероятностью ошибки, равной 10-, а решение о том, что автомат неисправен, принимается, если вероягность ошибки превышает 2 10 - .Обычная в таких случаях процедура проверки исправности автомата заключается в том, что проводится распознавание выборки объема и и принимается решение об исправности или неисправности автомата в зависимости от того, превышает ли количество ошибочно распознанных знаков порог 1 5 10- и. Для того чтобы такая процедура обеспечивала достоверность принятого решения не ниже 0,95, объем выборки должен равняться около 80 млн.Можно показать, что если вероятность ошибочного распознавания обычных знаков меняется в пределах 10- - 2 10-, то вероятность ошибочного распознавания граничных знаков изменяется в пределах 05 - 0,54. Процедура проверки автомата в этом случае заключается в распознавании выборки граничных знаков и сравнении процента ошибочно распознанных знаков с порогом 52% . Для обеспечения достоверности принятого об автомате решения не ниже 0,95 достаточен объем 6300 знаков.Таким образом, из приведенных цифр видно, что требуемый объем выборки при предлагаемом способе значительно (более чем в 10000 раз) меньше, чем при известном, Технико-экономическую эффективность способа можно оценить следующем образом. Если читающий автомат считывает документы формата 210 К 297, то на таком документе помещается около 2000 знаков. При предлагаемом способе нужно для проверки качества распознавания (для двух классов) подготовить 3 документа (страницы), а при известном - 40000 документов. При производительности 40 страниц в день для одной машинистки и машбюро в 10 человек для подготовки такой выборки необходимо 100 дней. Формула изобретения1. Способ контроля достоверности распознавания символов, основанный на формировании контрольной выборки изображений символов, отличающийся тем, что, с целью сокращения времени контроля, изображения символов контрольной выборки синтезируют совмещение изображений каждых двух символов из входного алфавита,2. Способ контроля достоверности распознавания символов по п. 1, отличающийся тем, что в синтезированных изображениях символов контрольной выборки удаляют не533947 Составитель В. Киселев Корректор Т. Добровольская Редактор И. Грузова Текред В. Рыбакова Заказ 237377 Изд. ЛЪ 1766 Тираж 864 Подписное ЦНИИПИ Государственного комитета Совета Министров СССР по делам изобретений и открытий 113035, Москва, )К, Раушская наб., д. 4/5Типография, пр. Сапунова, 2 совпадающие мсякду собой фрагменты изобрахкенпя символов входного алфавита,Источники информации, принятые во внимание при экспертизе:1. Бирман Н. Я. Статистические способы выделения признаков и оценка качества распознаванпя. Сб, Лвтоматическое чтение текста, М., 1967, с. 30.2. 5 Клабис Р. К вопросу контроля и оценки параметров читающих устройств. Сб. Автоматизация ввода письменных знаков в ЭВМ. Материалы Всесоюзной конференции, Вильнюс. 1967, с. 57 (прототип).

Смотреть

Заявка

1956399, 13.08.1973

ОРДЕНА ЛЕНИНА ИНСТИТУТ КИБЕРНЕТИКИ АН УКРАИНСКОЙ ССР

КОРШАК ВИТАЛИЙ КИРИЛЛОВИЧ

МПК / Метки

МПК: G06K 9/00

Метки: достоверности, распознавания, символов

Опубликовано: 30.10.1976

Код ссылки

<a href="https://patents.su/3-533947-sposob-kontrolya-dostovernosti-raspoznavaniya-simvolov.html" target="_blank" rel="follow" title="База патентов СССР">Способ контроля достоверности распознавания символов</a>

Похожие патенты