Menü
Mit Leidenschaft recherchiert in Berlin

OCR-Software: Dokumente fehlerfrei digitalisieren

Der moderne Haushalt könnte ganz ohne abgeheftete Dokumente auskommen. Dazu müssen diese nur »durchsuchbar« gescannt werden..

© Brandi Redd

Wie schön wäre es doch, wenn im Briefkasten landende Post auch digitalisiert wäre. Wir hätten sie dann immer und überall auch am PC oder Handy parat. Beispiel: Die neue Betriebskostenabrechnung Ihres Vermieters wollen Sie mit der von 2016 vergleichen. Die meisten von uns gehen jetzt ans Regal und blättern im Ordner mit den Wohnungsunterlagen. Ein anderer Teil beginnt, in einem Karton mit ganz vielen Papieren zu wühlen: Nämlich wenn es seinerzeit viel zu viel Arbeit war, das alles zu sortieren und abzuheften.

Im Zeitalter der Digitalisierung, in dem wir uns befinden, gibt es eine Ideallösung, die jeder dieser Gruppen entgegenkommt: Alle Schriftstücke, die bei Ihnen eintrudeln, legen Sie auf Festplatte ab. Wenn sie nun wieder gebraucht werden, finden Sie etwa mit den Suchwörtern »Betriebskosten« und »Hausmeister« im Nu alle Betriebskostenabrechnungen und holen sie sich auf den Bildschirm.

Dafür könnten Sie Ihre Papiere einfach einscannen. Viele Tintendrucker mit Kopierfunktion können das ja. Das Problem: Einfach nur zu scannen ergibt nur einen Datenhaufen. Ihn durchzublättern wäre mühselig. Das Zauberwort heißt: Durchsuchbarkeit.

Optical Character Recognition (OCR)

Manche Scanner haben nämlich eine besondere Software, die nach dem Scanvorgang im pünktchenweise abgetasteten Schriftstück die Buchstaben erkennt. Am Ende haben Sie eine PDF-Datei, die sich am Computer wie auch am Handy öffnen und nach Begriffen durchsuchen lässt.

Im Fachjargon nennt sich das OCR, die Abkürzung für Optical Character Recognition (engl. »optische Zeichenerkennung«).Solche Apps gibt es auch schon kostenlos fürs Handy, etwa »Adobe Scan« oder auch »Microsoft Lens«. Hier unten haben wir das mit dem Handy demonstriert und einen Artikel aus Guter Rat gescannt. Im linken Bild ist erkennbar, dass sich in der App stürzende Linien und überschüssige Bildteile vor der Weiterverarbeitung korrigieren lassen.

© Guter Rat
Durchsuchbar machen: Scannen geht am Handy prima: links mit der App »Adobe Scan«. Bei der Suche in der fertigen PDF-Datei (r.) wird sogar das getrennte Wort »Personal« erkannt

Wenn Sie sich allerdings die Vision vom »papierlosen Haushalt« erfüllen wollen, lohnt sich die Anschaffung eines Tisch-Scanners. Den gibt es von ganz billig bis ganz teuer. Das Entscheidende ist hier die OCR-Funktion, also eine beiliegende, möglichst fehlerarme Texterkennungssoftware. Bei preiswerten Multifunktionstintendruckern fehlt sie oft. Bei den drei Geräten rechts ist sie bereits inklusive.

Mit so einer Lösung lässt sich dann fließbandartig der ganze Posteingang scannen. Und landet als durchsuchbare PDF-Dateien auf einem Speicher Ihrer Wahl, also der Computerfestplatte, einem Netzwerkspeicher zu Hause oder bei einem Cloud-Anbieter.

Preise

Für die Anschaffung eines solchen Scanners müssen Sie um die 200 Euro einkalkulieren. Es war schon mal weniger, aber in der neuen Homeoffice-Ära sind die Preise deutlich gestiegen. Traditionell ist Computerzubehör Ende Februar/Anfang März im Jahrespreistief. Tipp: Auf Preissuchmaschinen im Internet wie geizhals.de oder idealo.de können Sie einen Preisverlauf der letzten Monate oder Jahre aufrufen und sich einen »Preisalarm« einstellen. Dann kriegen Sie eine E-Mail, wenn die von Ihnen vorgegebene Summe unterschritten wird. Wenn Sie auf Modellsuche gehen, achten Sie auf die folgenden Begriffe: TWAIN & Co.

Dahinter verstecken sich speziell zum Scannen benutzte Softwaretreiber für Windows und Mac. Auch bei älteren Scannern, die man gebraucht kaufen kann, ist TWAIN oft vorhanden. Dann können Sie zum Beispiel direkt aus Windows auf den Scanner zugreifen. Ein vergleichbarer, fortgeschrittener Treiber nennt sich ISIS. Weitere ähnliche solcher Schnittstellen heißen SANE (für Linux), WIA (für Windows) und ICA (für Mac).

Die besseren Scanner erfassen Vorder- und Rückseite von Schriftstücken, ohne dass Sie das Blatt per Hand wenden müssen. Manche Scanner tasten in einem Durchzug die Vorder- und Rückseite ab, Fachabkürzung DADF. Andere haben eine eingebaute Wendemechanik fürs Papier (RADF), ziehen nacheinander Vorder- und Rückseite am Sensor vorbei.

Software

Falls Sie schon einen Scanner ohne Texterkennungssoftware (OCR) besitzen, können Sie die Dateien auch für Durchsuchbarkeit nachbehandeln.

Tipp: Versandhändler pearl.de hat zurzeit das OCR-Programm Readiris für rund zwölf Euro. Weitere bekannte OCR-Programme sind FineReader und OmniPage.

Bis sich so ein »papierloser Haushalt« eingespielt hat, ist es natürlich sicherer, die Schriftstücke doch erst mal für eine Weile wie gewohnt abzuheften. Aber das geht dann mit weniger Sortieraufwand einfach fortlaufend, nach Eingangsdatum. Um später nach der Suche am Computer auch das Papierexemplar leicht wiederzufinden, beschriften Sie es mit dem Dateinamen, den der Scanner vergibt. Dieser ist nämlich auch in der Regel selbsterklärend – Datum und laufende Nummer.

Tisch-Scanner

© Pressematerial

Brother DSmobile DS-940DW

Mini-Scanner mit Akku, 700 Gramm. Erfasst Vorder- und Rückseite (DADF). PC- und Handy-Anbindung per WLAN oder USB-Kabel. Kann aber auch direkt im Gerät auf SD-Karte speichern. Texterkennungssoftware PaperPort ist inklusive. Ab 200 Euro

© Pressematerial

Epson WorkForce DS-80W

Mini-Scanner mit Akku, 300 Gramm, scannt nur einseitig, kein Speicher. Dafür liegt die Software Document Capture Pro 2.0 bei, die sonst nur teurere Büro-Scanner von Epson haben. PC-Anbindung (Windows, Mac) per WLAN oder USB, auch am Handy. Ab 190 Euro

Auf Cyberport.de kaufen

© Pressematerial

Avision AD225WN

Tisch-Scanner, der mit 1,5 Kilo und 30x10x7 cm auch eine Art Mobilgerät ist. Scannt doppelseitig ohne Wenden (DADF). Die Windows-Software PaperPort liegt bei; als Treiber funktionieren auch TWAIN und ISIS. Anschluss per WLAN, LAN-Kabel oder USB. Ab 250 Euro