OCR-Software kann den Büro-Alltag deutlich erleichtern: Sie analysiert den Text in gescannten Dokumenten, abfotografierte Briefen und PDF-Dateien. Dadurch werden die Dokumente durchsuchbar und der Text kann ohne Abtippen direkt am Computer weiterverwendet werden.
💡 Das Wichtigste in Kürze |
|
Es ist ein Problem, mit dem jeder PC- und Mac-Nutzer im Büro irgendwann konfrontiert wird: Ein wichtiger Brief soll als PDF gescannt werden oder ein abfotografiertes Dokument archiviert werden. Das Problem dabei: Der Scan oder das Foto allein sorgt zwar für eine digitale Kopie des Dokuments, das sich von Menschen lesen lässt. Doch sobald der Computer das Dokument in irgendeiner Form nutzen soll, wird es knifflig. Soll der Text extrahiert oder der Inhalt der Datei indexiert werden, stellt sich der Rechner an, als wäre kein Text enthalten. Vor allem im Hinblick auf das papierlose Büro ist das ausgesprochen lästig, weshalb es seit geraumer Zeit sogenannte Texterkennungs-Software gibt. Sie untersucht Dokumente auf Buchstaben und Zahlen und gibt das Ergebnis wahlweise direkt in der PDF-Datei oder als separaten Text aus. Dadurch kann der Inhalt nicht nur vom Rechner durchsucht, sondern auch vom Nutzer weiterverwendet werden.
OCR ist ein praktischer Alltagshelfer
Was zunächst ein wenig bräsig klingt, hat in der Praxis handfeste Vorteile: Klassische OCR-Anwendungsbereiche sind zum Beispiel die Recherche für wissenschaftliche Arbeit oder journalistische Beiträge. Liegen Forschungsarbeiten oder Artikel nur in gedruckter Form vor, ist zum Beispiel für Zitate oder die Archivierung langwieriges Abtippen notwendig. Nicht so mit einer leistungsfähigen Texterkennung. Die Dateien werden auf den enthaltenen Text analysiert und dieser kann anschließend bei Bedarf entnommen werden. Praktisch ist OCR daher überall dort, wo regelmäßig Dokumente gescannt werden – und daher natürlich auch im Büro-Alltag.
Wie funktioniert OCR-Software?
Dass es einen Bedarf nach Texterkennung gibt, ist schon lange bekannt. Schon die ersten Scanner für Heimbüros in den Neunzigerjahren wurden daher immer mit einer mehr oder weniger leistungsstarken Texterkennung ausgestattet. Deren Ergebnisse waren aber nicht selten durchwachsen und fehlerhaft. Vor allem komplexe Dokumente konnten die ersten OCR-Tools recht einfach aus dem Tritt bringen, auch grafisch aufwändige Formbriefe, Einladungen und Deko-Zeichen, die Schriftzeichen ähneln, waren (und sind) Stolperfallen für Texterkennungsprogramme. Die Funktionsweise ist seit den frühen Jahren gleich: Die Dokumente werden mittels Mustererkennung Pixel für Pixel auf „bekannte“ Muster – in diesem Fall Buchstaben und Zeichenketten – untersucht. Was ein Menschliches Gehirn ohne Verzögerung vollbringt, nämlich einen Text zu lesen, ist für den Computer deshalb Schwerstarbeit. Das ist auch der Grund, warum Live-OCR-Software wie Google Lens oder Apples Live-Text trotz aller Rechenleistung erst in den letzten Jahren auf den Markt kamen. Die Hersteller professioneller Software hüten ihre Routinen daher wie ihre Augäpfel. Und wie überall, wo viel Informatik-Know-How notwendig ist, sind die Software-Produkte daher relativ hochpreisig. Die Gratis-Programme, die bis heute den Scannern beiliegen, sind dementsprechend einfach gestaltet und oft wenig leistungsfähig.
Moderne OCR-Software ist sehr treffsicher
Inzwischen wurde die Mustererkennung durch KI-Routinen und Cloud-Anbindung sowie Deep-Learning-Routinen in Hard- und Software von Computern und Smartphones deutlich verbessert . Auch sonst hat Texterkennung viel hinzugelernt: So ist inzwischen sogar die Erkennung handgeschriebener Texte gängig, die den Nutzen entsprechender Software noch einmal deutlich erweitert. Das sorgt dafür, dass Text deutlich zuverlässiger erkannt wird und viele Schritte der Texterkennung automatisch ablaufen. Im besten Fall muss der Anwender ein Dokument nur als Bild oder PDF scannen und anschließend durch die Texterkennung jagen. Diese speichert das Dokument erneut als PDF ab, ergänzt allerdings den von der Texterkennung ausgelesenen Inhalt des Dokuments. Vorhandener Text wird markier- und kopierbar, Suchroutinen können innerhalb der PDF-Datei nach Suchbegriffen suchen, wodurch sie besser auffindbar wird. Das passiert bei kommerzieller OCR-Software inzwischen mit einer Präzision, von der die ersten Nutzer dieser Software-Gattung nur träumen konnten.
Spezialisten, Cloud-Allrounder oder Desktop-Lösung?
Grundsätzlich gibt es OCR-Lösungen für jeden Einsatzbereich. So gibt es professionelle Scanner-Systeme mit integrierter Texterkennung für den gezielten industriellen Einsatz, die auf Spezialanwendungen – etwa Barcodes, spezielle Dokumenttypen oder ganze Bücher – spezialisiert sind. Am unteren Ende der Texterkennung spielen Allround-Tools mit Cloud-Anbindung, wie sie etwa in Evernote, Google Docs eingebaut oder als Standalone-Online-Dienst wie OnlineOCR erhältlich sind. Diese Allrounder leisten vollautomatisiert Erstaunliches für einen kleinen Preis oder sogar kostenlos. Allerdings sind die Ergebnisse nicht immer optimal und natürlich ist immer auch die Cloud des Anbieters involviert – und das ist nicht immer gewünscht. Im Mittelfeld rangieren Anwendungen wie Abbyy Fine Reader oder Adobe Acrobat Pro, die auf dem normalen Desktop-Rechner laufen und hier mit jedem Update deutliche Leistungssteigerungen verzeichnen.
Texterkennung: Worauf achten?
Grundsätzlich sollten Nutzer von Texterkennungs-Software vor der Auswahl eines Produkts überlegen, welche Art der Texterkennung sie durchführen wollen und welche Qualität der Nachbearbeitung sie benötigen. Um einfach ein PDF durchsuchbar zu machen, reichen meist kostenlose oder preiswerte Lösungen. Geht es hingegen um die Transkription (historischer?) Dokumente, handgeschriebener Briefe, älterer Scans schlechter Qualität, Zeitschriften oder Bücher, sollte zu einem Produkt gegriffen werden, das entsprechende Funktionen aufweist. Während die meisten OCR-Tools bei der Erkennung gedruckten Textes in Alltagssprache keine Schwierigkeiten haben, wird es knifflig, wenn der Druck schlecht, die Schriftart exotisch oder das Layout unüblich ist. Auch sollte im Auge behalten werden, was mit dem erkannten Text passieren soll: Text aus einem PDF indexierbar zu machen, ist deutlich weniger anspruchsvoll, als lange Texte aus einem Foto einer Zeitschriftenseite oder eines handgeschriebenen Briefes zu extrahieren.
Texterkennungssoftware in der Übersicht
Im folgenden Abschnitt stellen wir einige Texterkennungssoftware-Kandidaten vor, die sich für das Umwandeln von Texten in durchsuchbare, kopierbare und bearbeitbare Dokumente eignen.
Adobe Acrobat Pro: Der Allrounder für PDF-Dateien
🛈 Windows, Mac | ab 29,74 € (Monatslizenz)
Adobe Acrobat Pro* ist ein Allround-Tool für die Erstellung und Bearbeitung von PDF-Dateien. Die Texterkennungs-Funktion ist ein Teil der leistungsstarken Software, aber nicht ihre Kernkompetenz. Was nicht bedeutet, dass sie leistungsschwach ist: Adobe Acrobat Pro kann PDF-Dateien, gescannte Bilder und Dokumente auf Textinhalte durchsuchen und diese anschließend direkt in eine „intelligente“ PDF-Datei ausgeben. Dabei wird das gescannte Dokument kopiert und die PDF-Datei neu angelegt, wobei zum Beispiel auch die Schriftart erhalten bleibt. Adobe Acrobat Pro besitzt also auch eine Schriftart-Erkennung. Handschrift kann derzeit aber nicht vom PDF-Tausendsassa erkannt und verschriftlicht werden. Da Adobe das PDF-Format erfunden hat, gibt es zudem die Möglichkeit, PDF-Dateien samt des enthaltenen Textes und der Bilder direkt zu bearbeiten, ähnlich wie in einer Bildbearbeitung.
Der Aktionsassistent hilft zudem dabei, auch größere Mengen Dokumente in wenigen Handgriffen durch die Texterkennung zu schubsen und in durchsuchbare PDFs umzuwandeln – und das sogar mehrsprachig. Standard-Office-Anwendungen werden dabei auch unterstützt, so lassen sich PDFs auch als Word- und Excel-Dateien ausgeben. Anwender, die viel mit Dokumenten und PDFs zu tun haben, werden diese Möglichkeiten zu schätzen wissen. Acrobat Pro ist für Mac und Windows erhältlich, allerdings wie bei Adobe üblich ausschließlich als Abo.
➤ Adobe Acrobat Pro*Für 29,74 € pro Monat kaufen
Spartipp: Bis zum 28.08.2024 ist die Adobe Creative Cloud mit allen Anwendungen, darunter auch Photoshop, Premiere, Lightroom, Illustrator und Acrobat Pro im Paket für 39,85 € pro Monat* im Jahres-Abo erhältlich. Das entspricht einem Rabatt von über 40 %. Das Abo ist innerhalb der ersten 14 Tage kostenlos kündbar. (Stand: 08.08.2024)
Aiseesoft PDF Converter Ultimate: Converter mit OCR
🛈 Windows, Mac | ab 77,33 € (Einmalzahlung)
Auch der PDF Converter Ultimate* besitzt die OCR-Funktion quasi nebenbei: Hauptsächlich dient das Tool dazu, PDF-Dokumente in andere Dateiformate umzuwandeln, neben Bilddateien auch Word- und Rich-Text-Dokumente. Genau hier kommt dann auch die OCR-Technik zum Tragen, die den im PDF enthaltenen Text analysiert und erkennt, um ihn anschließend als Textdatei oder Word-Dokument ausgeben zu können. Aiseesoft PDF Converter Ultimate glänz mit sehr guter Erkennungsqualität, auch weil das Programm problemlos über 200 Sprachen beherrscht. Zudem erhält das Programm Routinen, die die Texte unter Beibehaltung der originalen Formatierung erkennt.
Dank der ebenfalls enthaltenen Batch-Konvertierung können so schnell und zuverlässig Dokumente im großen Stil gelesen und konvertiert werden. Praktisch ist dabei, dass die typischen Zielformate für Text – etwa TXT oder DOC – ausgegeben werden können. Diese können wiederum in beliebigen Office-Programmen und Texteditoren weiterverwendet werden. Aiseesoft PDF Converter Ultimate ist vor allem für den Privateinsatz gedacht und als Einmalkauf sowohl für MacOS, als auch für Windows erhältlich.
➤ Aiseesoft PDF Converter Ultimate*Für 77,33 € kaufen
Perfect PDF Premium: PDF-Taschenmesser mit Google-Texterkennung
🛈 Windows | 49,99 € (Einmalzahlung)
Bei Perfect PDF Premium handelt es sich im Kern um einen PDF-Drucker. Das Programm ermöglicht die Erstellung von PDF-Dokumenten aus jeder beliebigen Anwendung heraus. Das ist jedoch nicht alles: Neben regulären PDFs kann es auch Dateien im Archivformat PDF/A ausgeben. Neben dieser ohne Frage praktischen Funktion hat Perfect PDF Premium jedoch noch viele andere PDF-bezogene Funktionen, darunter das Bearbeiten vorhandener PDFs inklusive Textersetzung und Veränderung der Dokumentstruktur sowie Aufteilen und Zusammenfügen von PDF-Dateien. Kurzum: Perfect PDF Premium ist das Schweizer Taschenmesser für alle PDF-Anwendungen. Natürlich ist auch eine Texterkennung an Bord, die sich allerdings als Add-In bei der OCR-Engine von Google bedient: Zum Einsatz kommt die quelloffene Tesseract-Schnittstelle des Suchmaschinen-Riesen.
Das ist jedoch alles andere als schlecht: Ursprünglich bereits in den 1980ern von Hewlett-Packard entwickelt, gehört Tesseract auch dank der Google-Unterstützung heutzutage zu den leistungsfähigsten OCR-Engines. Perfect PDF Premium profitiert davon natürlich auch. Das Gesamtpaket ergibt eine preiswerte Alternative zum Adobe-Platzhirsch, vor allem im Home-Office kann Perfect PDF Premium Windows-Nutzern dabei helfen, möglichst papierlos zu arbeiten und Dokumente jederzeit als digitales Dokument zur Hand zu haben.
➤ Perfect PDF PremiumFür 49,99 € kaufenSodaPDF Premium + OCR
🛈 Windows | ab 159,95 € (Einmalzahlung)
Der PDF-Editor SodaPDF* bietet zahlreiche Möglichkeiten der PDF-Erstellung,- Konvertierung und -Bearbeitung. In der Pro-Version gibt es zudem die Möglichkeit, PDF/A-Archivdokumente zu erstellen und PDF-Dateien zu unterzeichnen sowie maßgeschneiderte Dokumente zu erstellen. Wie bei den anderen Lösungen ist die OCR-Funktion sozusagen „nebenbei“ an Bord, um die anderen Bearbeitungsfunktionen in PDFs anbieten zu können. SodaPDF greift dazu auf sein spezielles OCR-Modul zurück, das laut dem Anbieter „eine Reihe von Ressourcen, die für verschiedene Situationen designt wurden“. So kann die Texterkennung automatisch für das gesamte Dokument erfolgen, auch per Stapelverarbeitung, oder manuell Bild für Bild innerhalb des Dokuments.
Letzteres ist sinnvoll, wenn der Scan Bilder enthält, die ihrerseits Text enthalten, der aber nicht in der Texterkennung auftreten soll – etwa bei Screenshots. Dementsprechend gut eignet sich das Tool zum Beispiel für technische Dokumentation, weshalb zum Beispiel auch Teile der NASA oder der indische TATA-Konzern das Tool nutzen. Interessant an SodaPDF ist, dass das Programm sowohl desktopbasiert als auch in der Cloud arbeitet, und das nahtlos. Zum Testen kann die Cloud mit Basisfunktionen zunächst nahtlos verwendet werden.
➤ Soda PDF Premium + OCR*Für 159,95 € kaufen
Abbyy FineReader: Das OCR-Genie
🛈 Windows, Mac | ab 129,00 € (Einmalzahlung, Mac-Version)
Wer eine ganz klassische OCR-Software sucht, sollte einen Blick auf ABBYY FineReader PDF* werfen. FineReader steht seit über einem Vierteljahrhundert für ausgesprochen leistungsfähige Texterkennungssoftware. Seit einigen Jahren ist das Programm zur vollwertigen PDF-Lösung im Stil von Adobe Acrobat herangewachsen. Die Texterkennung – inzwischen KI-basiert – steht aber nach wie vor im Zentrum der Software, die es für Mac, Windows und Mobilgeräte gibt. FineReader PDF erlaubt das Erstellen, Bearbeiten und Organisieren von PDF-Dateien, das Erstellen von PDF-Dokumenten und deren digitale Signierung und Archivierung.
Bemerkenswert ist aber vor allem die OCR-Funktion, die leistungsfähig ist wie bei wenigen anderen Produkten auf dem Markt: FineReader kommt auch mit komplexen Formularen und aufwändigen Dokumenten zurecht, weil die Texterkennung durch künstliche Intelligenz gestützt wird. So kann das Programm sogar Dateien in verschiedenen Dateiformaten vergleichen, natürlich den Text auslesen und vorhandene Dokumente archivieren. Sowohl für Unternehmen als auch Privatanwender ergibt sich dadurch ein Rundumsorglos-Paket in Sachen Texterkennung, das ganz nebenbei auch den Umgang mit PDFs deutlich erleichtert.
➤ ABBYY FineReader Pro*Für 199,00 € kaufen
Spartipp: Während der Black-Friday-Woche ist der FineReader PDF Standard 60% günstiger* zu haben. Sie zahlen statt 199 € lediglich 79,60 €. (Stand: 22.11.2021)
Microsoft OneNote: Microsofts kleiner Helfer
🛈 Windows, Mac | ab 69,00 € (Jahreslizenz Microsoft 365 Single)
Mit OneNote* liefert Microsoft einen Evernote-Mitbewerber, der nach einem ähnlichen Prinzip funktioniert. Anwender sollen hier ihre täglichen Notizen und Dateien ablegen, das OneNote-System übernimmt die Organisation und hilft dabei, diese Sammlungen weiterzuverwenden. Diese Idee eines digitalen Notizbuchs setzt natürlich auch eine leistungsfähige Texterkennung voraus, damit die Inhalte sich schnell wiederfinden lassen. OneNote integriert sich nahtlos in die Microsoft-Cloud und damit auch in die hauseigenen Office-Anwendungen Word, Excel, PowerPoint und Co. Die Ergebnisse gibt die Texterkennung aber immer auch an die Microsoft-Cloud weiter. Das sorgt für eine deutliche Leistungssteigerung, zumal OneNote auch Handschrift erkennen und in „normalen“ Text umwandeln kann.
Im Zusammenspiel mit einem Tablet und Microsoft Office ergeben sich hier völlig neue Möglichkeiten. Allerdings ist die Texterkennung bei weitem nicht so flexibel einsetzbar, wie es bei dedizierten PDF- und OCR-Tools der Fall ist, auch die Ausgabemöglichkeiten sind beschränkt. Durch die Cloud-Anbindung kann es eine ganze Weile dauern, bis die Texterkennung in einem Bild erfolgt ist. Dafür ist OneNote kostenlos erhältlich und kann sowohl unter MacOS, als auch unter Windows und auf Mobilgeräten verwendet werden
➤ Microsoft OneNote*Für 69,00 € pro Jahr kaufen
Texterkennung kostenlos?
Grundsätzlich ist Texterkennung auch kostenlos möglich. So besitzen zum Beispiel iPhones und iPads seit iOS 15 eine Funktion, die Text aus Fotos auslesen kann. Google Lens ergänz diese Funktion unter Android. Gratis-Apps wie QuickScan besitzen oft ebenfalls OCR-Basisfunktionen und speichern die mit der Smartphone-Kamera aufgenommenen Scans direkt mit Texterkennung ab. Ebenfalls Teil der Notizen-Apps vieler Smartphones und Tablets ist inzwischen eine Handschrifterkennung, die jedoch ein gewisses Training voraussetzt und in aller Regel nur gut lesbare Handschriften zuverlässig erkennt.
Echte Texterkennungsprogramme für den Desktop, die auch mit längeren Dokumenten zurechtkommen, sind allerdings rar: Das leider seit längerem nicht mehr gepflegte FreeOCR ist ein entsprechendes Programm, das ebenfalls auf Googles Tesseract Engine setzt. Moderner ist gImageReader, das als GUI für die Texterkennungs-Engine von Google funktioniert und für Windows und verschiedene Linuxe erhältlich ist. Ansonsten müssen Anwender leider in aller Regel zur Bezahlsoftware greifen.
Grundsätzlich ist Texterkennung ein faszinierendes Software-Genre, das sich im Alltag durch Praxistauglichkeit schnell bewährt. Wer häufiger mit gescannten Dokumenten arbeitet, wird die OCR-Funktionen der großen PDF-Tools zu schätzen wissen, zumal diese ganz nebenbei auch als leistungsfähige PDF-Editoren fungieren. Wer nur gelegentlich Text aus Bildern extrahieren will, kann im Zweifel auf die Texterkennungsfunktionen von OneNote, Evernote oder modernen iOS- und Android-Smartphones zurückgreifen. Hier gibt es zudem kostenlose oder sehr preiswerte Apps, die den Scan samt OCR per Foto erlauben, was einen zusätzlichen Scanner in vielen Fällen spart. Die Auswahl kostenloser OCR-Lösungen für den Desktop ist leider eher dünn, wer diese Art Software häufiger benötigt, wird sich aber schnell mit SodaPDF, Adobe Acrobat, FineReader und Co. anfreunden, zumal sich der Kaufpreis in kürzester Zeit durch die gesparte Arbeit amortisiert.
➤ Zurück zur Liste: Texterkennungssoftware in der Übersicht
* Mit einem Stern markierte Links sind Affiliate-Links, für die wir unter Umständen eine Provision erhalten. Der Kaufpreis erhöht sich dadurch nicht!
Redaktion & Aktualisierung: heise Download-Team