Humboldt-Universität zu Berlin | Institut für Bibliotheks- und Informationswissenschaft

DABI - Datenbank Deutsches Bibliothekswesen

Bibliografische Datenbank zum Handbuch "Das Bibliothekswesen der Bundesrepublik Deutschland"
Suche | Recherchehinweise | Über die Datenbank | Über das Handbuch | Kontakt | Statistik



Vollanzeige des Datensatzes 22051: Konvertierung von PDF in XML für die Langzeitarchivierung und Weiterverarbeitung

Artikel-ID 22051
Titel Konvertierung von PDF in XML für die Langzeitarchivierung und Weiterverarbeitung
Untertitel
Autoren Friedrichsen, Merle; Bähr, Thomas
Zeitschrift ABI-Technik
Jahr 2017
Band 37
Heft 1
Anfangsseite 21
Endseite 29
URL
Abstract In der Darstellung, Weitergabe und Aufbewahrung elektronischer Publikationen steht das Format PDF unangefochten an erster Stelle. Die Stärken des ISO-standardisierten Formats liegen in der Plattform- und Hardwareunabhängigkeit, in der seitengenauen Darstellung von Publikationen sowie in der einfachen Navigierbarkeit von komplexen Dokumenten. Dank der stetigen Weiterentwicklung des Formats existiert mittlerweile eine große Anzahl an PDF Profilen wie PDF/A, PDF/X, PDF/UA oder PDF/E. Eine flexiblere Dokumentendarstellung ermöglicht hingegen die eXtensible Markup Language XML, welche nicht nur im Web, sondern auch vermehrt in der Druckvorstufe eingesetzt wird. Wie PDF ist auch XML medienneutral und plattformunabhängig. Im Gegensatz zu PDF-Dokumenten erlaubt XML hingegen mittels Erfassung der Inhalte in einer dokumentierten und transparenten Struktur eine Validierung der Inhalte wie auch eine gezielte Weiternutzung einzelner Teilinhalte. Die Technische Informationsbibliothek (TIB) führte eine Analyse zur Machbarkeit einer PDF-nach-XML-Konvertierung durch. Ziel ist die Vorhaltung von XML-Dokumenten für zwei Prozesse: Erstens zur automatischen Katalogisierung von Kongressbänden auf Aufsatzebene, zweitens zur Aufbewahrung einer parallelen Repräsentation neben PDF-Dokumenten im Langzeitarchiv. Dieser Artikel stellt die Ergebnisse der Machbarkeitsstudie dar.
Schlagwörter Extensible Markup Language (XML); Datenformat; Portable Document Format (PDF); Technische Informationsbibliothek (TIB) Hannover; Langzeitarchivierung; Strukturanalyse; Dateiformatkonvertierung
Klassen


Datensatz im BibTeX-Format ausgeben

Datensatz als Zitation nach DIN 1505 ausgeben.

Angaben zur Zeitschrift: ABI-Technik


Sie können mit den Schlagwörtern, Autoren und Klassen dieses Artikels weiterrecherchieren:

Schlagwörter:
Extensible Markup Language (XML)
Datenformat
Portable Document Format (PDF)
Technische Informationsbibliothek (TIB) Hannover
Langzeitarchivierung
Strukturanalyse
Dateiformatkonvertierung

Autoren:
Friedrichsen, Merle
Bähr, Thomas

Klassen: