Humboldt-Universität zu Berlin | Institut für Bibliotheks- und Informationswissenschaft

DABI - Datenbank Deutsches Bibliothekswesen

Bibliografische Datenbank zum Handbuch "Das Bibliothekswesen der Bundesrepublik Deutschland"
Suche | Recherchehinweise | Über die Datenbank | Über das Handbuch | Kontakt | Statistik



Vollanzeige des Datensatzes 19508: Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung

Artikel-ID 19508
Titel Evaluation von automatisch erzeugten OCR-Daten am Beispiel der Allgemeinen Zeitung
Untertitel
Autoren Wernersson, Maria
Zeitschrift ABI-Technik
Jahr 2015
Band 35
Heft 1
Anfangsseite 23
Endseite 35
URL
Abstract Im Jahr 2014 wurde eine Schätzung der OCR-Genauigkeit von 11 354 digitalisierten Seiten aus der Allgemeinen Zeitung [Allgemeine Zeitung: Herausgegeben in Augsburg (1807-1882), München (1882-1929).] durchgeführt. Die getesteten Zeitungsbände stammen aus dem Zeitraum 1871-1921. Um die Genauigkeit zu schätzen, wurden Regeln für die Bewertung der Fehler aufgestellt, Textstichproben automatisch per Skript erstellt und die Stichproben manuell ausgewertet. Mit einer geschätzten Zeichengenauigkeit zwischen 94,70 Prozent und 97,65 Prozent (Konfidenzzahl: 95 Prozent) [Mit der (berechneten) Anzahl der Zeichen im Scan als Grundmenge. Siehe auch: "Problemstellung: Zeichen-Grundmenge aus dem Scan oder aus der OCR?" in Abschnitt 3.4 und die Bemerkung dazu in Abschnitt 5.1.] wurde ein gutes, zufriedenstellendes Resultat erreicht. Außer der Zeichengenauigkeit wurde auch die Erkennung des Leseflusses und des Formats geprüft. Bei der Evaluierung von OCR-Genauigkeit gilt es viele Faktoren zu beachten. Dies trifft vor allem auf den späteren Vergleich verschiedener Evaluierungen zu, weil Faktoren wie Fehlerklassifikation und Zweck der Digitalisierung variieren können.
Schlagwörter Zeitung; Hochschulbibliothek; Wissenschaftliche Bibliothek; Optische Zeichenerkennung; Scannen; Digitalisierung; Evaluation; Bestandserhaltung; Optical Character Recognition (OCR); Bewertung
Klassen


Datensatz im BibTeX-Format ausgeben

Datensatz als Zitation nach DIN 1505 ausgeben.

Angaben zur Zeitschrift: ABI-Technik


Sie können mit den Schlagwörtern, Autoren und Klassen dieses Artikels weiterrecherchieren:

Schlagwörter:
Zeitung
Hochschulbibliothek
Wissenschaftliche Bibliothek
Optische Zeichenerkennung
Scannen
Digitalisierung
Evaluation
Bestandserhaltung
Optical Character Recognition (OCR)
Bewertung

Autoren:
Wernersson, Maria

Klassen: