Was bedeutet OCR? | anaptis Glossar

Der Begriff Optical Character Recognition (abg.: OCR, Deutsch: optische Zeichenerkennung) stammt aus der Informationstechnologie und bezeichnet die automatisierte Texterkennung in Bildern (z. B. gescannte Papierdokumente, PDF-Dateien oder Digitalbilder) sowie Umwandlung in ein maschinenlesbares Format und damit bearbeitbare und durchsuchbare Dateien.

Wenn Sie beispielsweise ein Dokument scannen, speichert Ihr Computer den Scan als Bilddatei. Schließlich kann ein Scan nur ein Bild eines Dokuments und damit lediglich schwarze, weiße oder farbige Bildpunkte in tabellarischer Anordnung erstellen. Das heißt: Sie können die Wörter einer Bilddatei nicht mit einem Texteditor bearbeiten. Dieses Problem löst OCR, indem der Inhalt konvertiert wird.

Haftungsausschluss: Die Inhalte dieses Artikels sind lediglich unverbindliche Informationen und Hinweise. Die anaptis GmbH übernimmt keine Gewähr für die inhaltliche Richtigkeit der Angaben.