Autor: MacFlieger
Dezember 15, 2009, 08:12:00
Sehe ich dann die falsche 6 an der Stelle wo eigentlich eine 5 stehen müsste oder sehe ich die richtige Bilddatei mit der richtigen 5.
Ich würde sagen, dass kann man nicht so einfach und generell beantworten. Es kann so oder so sein.
Es hängt davon ab, wie die Software, die das OCR macht und das durchsuchbare PDF erstellt, eingestellt ist oder aber wie es grundsätzlich das durchsuchbare PDF erstellt. Eine generell gültige Antwort wird es da wohl nicht geben.
Am einfachsten ist es, Du scannst mal ein Dokument schlecht ein, machst die ganze Prozedur und schaust, ob die im durchsuchbaren PDF angezeigten Zahlen/Texte sehr gut angezeigt werden oder genauso schlecht wie im Scan.
Im ersteren Fall bekommst Du also im durchsuchbaren PDF das Ergebnis der OCR angezeigt, d.h. als erkannter evtl falscher aber gut lesbarer Text.
Im zweiteren Fall bekommst Du im durchsuchbaren PDF das Original-Dokument angezeigt, d.h. als qualitativ schlechterer dafür aber originaler Text.