Abstract | Im Jahr 2014 wurde eine Schätzung der OCR-Genauigkeit von 11 354 digitalisierten Seiten aus der Allgemeinen Zeitung [Allgemeine Zeitung: Herausgegeben in Augsburg (1807-1882), München (1882-1929).] durchgeführt. Die getesteten Zeitungsbände stammen aus dem Zeitraum 1871-1921. Um die Genauigkeit zu schätzen, wurden Regeln für die Bewertung der Fehler aufgestellt, Textstichproben automatisch per Skript erstellt und die Stichproben manuell ausgewertet. Mit einer geschätzten Zeichengenauigkeit zwischen 94,70 Prozent und 97,65 Prozent (Konfidenzzahl: 95 Prozent) [Mit der (berechneten) Anzahl der Zeichen im Scan als Grundmenge. Siehe auch: "Problemstellung: Zeichen-Grundmenge aus dem Scan oder aus der OCR?" in Abschnitt 3.4 und die Bemerkung dazu in Abschnitt 5.1.] wurde ein gutes, zufriedenstellendes Resultat erreicht. Außer der Zeichengenauigkeit wurde auch die Erkennung des Leseflusses und des Formats geprüft. Bei der Evaluierung von OCR-Genauigkeit gilt es viele Faktoren zu beachten. Dies trifft vor allem auf den späteren Vergleich verschiedener Evaluierungen zu, weil Faktoren wie Fehlerklassifikation und Zweck der Digitalisierung variieren können. |