OCR, zkratka pro optické rozpoznávání znaků, označuje technologii používanou k převodu tištěných, psaných nebo napsaných znaků do digitálního formátu. Tento proces umožňuje čtení textu počítačem, což umožňuje editaci a vyhledávání znaků. Tato technologie přinesla nejen revoluci v zadávání dat, ale je také užitečným nástrojem pro nevidomé a slabozraké.
Jak funguje OCR?
Po použití optického skeneru ke skenování dokumentu a jeho rozdělení na znaky má technologie OCR dva různé přístupy k převodu znaků na digitální formát rozpoznávání vzorů a detekci funkcí.
Rozpoznávání vzorů, známé také jako porovnávání matic a porovnávání vzorů, funguje tak, že porovnává znak, který skenuje, s nevyřízenými obrázky obrázků, které má program v souboru. Funguje to pouze v případě, že znaky přesně odpovídají pixelům se znaky, které OCR používá jako referenci. V 1960. letech bylo vytvořeno písmo OCR-A, které bylo vytištěno na šeky, aby bylo standardizováno písmo pro programy OCR banky. Nakonec se rozpoznávání vzorů rozšířilo na rozpoznávání více běžných písem, jako je Arial a Times New Roman, ale program byl stále omezen pouze na převod znaků, které byly v několika vybraných písmech.
Detekce funkcí, označovaná také jako extrakce funkcí, umožňuje OCR číst znaky téměř jakýmkoli písmem. Místo hledání přesné repliky postavy funguje detekce funkcí rozlišením konkrétních funkcí, které znak bude mít bez ohledu na písmo. Například pokud program skenuje znak, který má dvě šikmé čáry, které se setkávají nahoře, aby vytvořil bod, může zjistit, že písmeno je velké A. Detekce funkcí rozšiřuje použití a možnosti programů OCR a je běžný typ OCR používaný dnes.
Přestože se OCR omezuje na převod tištěného textu, inteligentní rozpoznávání znaků (ICR) může změnit rukopis na text, který lze číst, prohledávat nebo upravovat počítačem. I když je to ve stejné rodině jako OCR, ICR je mnohem obtížnější proces, protože rukopis je mnohem pestřejší než písma.
Používá pro OCR
- Vstup dat
- Pomozte nevidomým a zrakově postiženým
- Digitalizujte knihy
- Třídění pošty
- Umožněte prohledávání souborů PDF, knih a fyzických dokumentů
- Rozpoznání SPZ
- Rozpoznávání pasu