Microsoft Office: Schrifterkennung mit `Microsoft Office Document Imaging (MODI)`

Texte einscannen und erkennen lassen

Bei MS Office XP, 2003 und 2007 gehört das Office-Tool `MODI` zum Paket. Bedauerlicherweise ist es ab der Version 2010 nicht mehr enthalten. Sie können aber `MODI` für die Verwendung mit Office 2010 oder höher verfügbar machen, indem Sie das kostenlose Microsoft-Tool `SharePoint Designer 2007` installieren. Nähere Informationen zu diesem Tool und einen direkten Download-Link finden Sie
hier.

Um das Scannen und Erkennen von Dokumenten zu starten, klicken Sie im Startmenü unter `MS Office` auf `Office Tools` und dort auf `Office Document Scanning`. Falls dieser Programmbestandteil bei der Installation nicht mitinstalliert wurde, müssen Sie bei der entsprechenden Aufforderung die Office-CD einlegen und den Programmteil nachinstallieren.

Alternativ können Sie auch eine Verknüpfung mit der exe-Datei auf dem Desktop oder im Startmenü anlegen, die das Einscannen übernimmt. Hier ist der genaue Pfad zu dieser Datei:

  1. Klicken Sie nun im `Datei`-Menü den Menüpunkt `Neues Dokument scannen` an.

  2. Wählen Sie nun Ihre Scan-Methode mit der Tab-Taste und den Cursortasten aus. Ich habe mit `Schwarz-weiß von farbigem Dokument` die besten Ergebnisse erzielt.

  3. Mit einem Klick auf `Scannen` zum Starten des Scanners.

  4. Nach dem Scan-Vorgang erscheint das Fenster `Microsoft Office Document Imaging`, in dem das gescannte Dokument als Grafik im TIF-Format geladen ist.

  5. Klicken Sie nun im `Extras`-Menü den Menüpunkt `in MS-Word exportieren` an und bestätigen Sie die folgende Abfrage mit Enter. Nun wird ein HTML-Dokument mit dem gleichen Namen erzeugt und in MS Word geöffnet.

  6. Dieses können Sie ggf. noch bearbeiten und mit der Option `Speichern unter ...` im `Datei`-Menü im gewünschten Format und mit dem gewünschten Namen abSpeichern.

  7. Nun können Sie dieses Dokument und die TIF-Datei schließen und die Sicherheits-Abfrage, ob das TIF-Dokument gespeichert werden soll, verneinen.

Mehrspaltige Texte

Bei Texten mit zwei oder mehr Spalten wird die Sache komplizierter, denn die Spalten müssen nacheinander eingescannt werden, weil MODI nicht über eine Spaltenerkennung verfügt. Ein solcher Text kann also nur spaltenweise nacheinander in eine Text-Datei exportiert werden.


Navigation:
Zurück zur Übersicht