Колико су тачни резултати ОЦР препознавања? Који фактори утичу на тачност препознавања?


Тачност резултата ОЦР препознавања
ОЦР (Оптицал Цхарацтер Рецогнитион) технологија може претворити текст на слици у формат текста који се може уређивати. Тачност његових резултата препознавања је важан показатељ перформанси ОЦР технологије. Уопштено говорећи, модерна ОЦР технологија има веома високу стопу тачности препознавања на стандардним штампаним документима, скоро достижући више од 99%. Међутим, приликом обраде сложених слика, руком писаног текста или одређених фонтова, стопа тачности може да се смањи.
Фактора који утичу на тачност препознавања
1: Квалитет слике
Јасноћа, услови осветљења, бука итд. Утицаће на способност препознавања ОЦР-а.
2: Фонт и величина фонта
Неки посебни фонтови или премали фонтови могу бити тешки да их ОЦР систем прецизно препозна. Сложеност фонтова је такође важан фактор, а сложена структура фонтова ће повећати потешкоће у препознавању.
3: Изглед текста
Када је текст поређан у нереду, преклапан, нагнут или има пуно елемената који ометају, то ће утицати на тачност препознавања ОЦР система.
4: Вишејезички и вишеабецедни систем
ОЦР систем треба да подржава више језика и скупова знакова. Различити језици и скупови знакова имају различите потешкоће у препознавању, што ће такође утицати на укупну тачност препознавања.