Wat is OCR?
Optical Character Recognition
OCR is de afkorting voor Optical Character Recognition. Met deze digitale techniek, in het Nederlands wordt deze optische tekenherkenning genoemd, kan een computer letters, cijfers en leestekens aflezen van een image. Stel: u scant een historisch document in, dan slaat de computer deze op als image. Met OCR software wordt hier bewerkbare tekst van gemaakt. Dit maakt het zeer eenvoudig om de tekst te doorzoeken; handig als u een grote database aan wilt leggen en deze wilt raadplegen.
Het unieke aan onze OCR software is het zogenoemde preprocessing. Met behulp van diverse filters kunnen wij de gescande “images” voorbewerken, totdat ze de kwaliteit hebben die we zoeken. Vervolgens maakt onze software er een bewerkbare tekst van. De special door ons ontwikkelde software is zo geavanceerd, dat we ook zonder problemen het Frakturschrift (of Gotische letter) kunnen OCR’en. Dit is een doorbraak in de OCR-markt, waar we zeer trots op zijn!
Hoe werkt OCR?
Bij Optical Character Recognition gaat het om scansoftware die patronen herkent. Het ingescande document, met daarop tekst, wordt door de software herkend als afbeelding, waarna het letters, cijfers en leestekens kan herkennen op pixelniveau. Deze pixels vormen woorden die vervolgens gedigitaliseerd worden. Dit zorgt ervoor dat een digitaal document doorzoekbaar wordt. Dankzij onze unieke software kunnen nu ook heel eenvoudig historische boeken gescand en doorzoekbaar gemaakt worden.
Meer weten? Voor vragen, neem gerust contact met ons. We helpen u graag.
Jannes Hoekman
CEO Frakturschrift.nl