Aktuelle Branchen-Mitteilungen

Dokumentenarchivierung nicht dem Zufall überlassen

03.11.2021

callas-Office-Konvertierung 1000x350

Unternehmen und öffentliche Einrichtungen profitieren von PDF/A, da Dokumente mit diesem Standard dauerhaft archiviert werden können. Während das Format ursprünglich in erster Linie als Ersatz für gescanntes Papier bzw. TIFFs in Archiven verwendet wurde, kommt es inzwischen vor allem für digital erzeugte Dokumente zum Einsatz. Das Format hat sich durchgesetzt und zahlreiche Software-Produkte bieten bereits eine Export-Funktion nach PDF/A, wie beispielsweise Microsoft bzw. Libre Office. Die damit generierten PDF/A-Dokumente sind von guter Qualität und erfüllen die Anforderungen des Standards. Dennoch sollten Unternehmen aus mehreren Gründen die Erzeugung von PDF/A nicht den Mitarbeitern überlassen, sondern eine zentralisierte Lösung präferieren.

Ein Argument, das dafür spricht, ist die Tatsache, dass nicht allen Mitarbeitern die Funktion „Exportieren nach PDF/A“ bekannt ist bzw. nicht sichergestellt werden kann, dass diese sie auch verwenden. Die Einstellung zu setzen, kann bei zahlreichen zu konvertierenden Dokumenten schnell vergessen werden. Darüber hinaus ist die die PDF/A-Option nicht in allen Erzeugungsprogrammen vorhanden. In solchen Fällen ist der Weg über einen Druckertreiber häufig der direkteste– mit schwerwiegenden Folgen. Es ist zunächst nur eine PDF- und keine PDF/A-Datei. Selbst eine anschließende Konvertierung nach PDF/A kann entstandenen Schaden nicht mehr beheben.

Ein Office-Drucker muss nicht mehr als alle auf der Seite sichtbaren Objekte wiedergeben. Bei digital erzeugten Dateien gibt es aber häufig zusätzliche Informationen, die bei der Archivierung erhalten werden sollten. Dazu gehören Metadaten, z. B. der Name des Autors und Tagging-Strukturen, die die Inhaltsmerkmale wie Überschriften oder die Lesereihenfolge abbilden.

Diese Metadaten erleichtern eine gezielte Suche und Identifikation von Dokumenten, ermöglichen deren automatisierte Verarbeitung und vereinfachen die Zuordnung zu anderen Dokumenten oder Prozessen. Beispielsweise können sie dafür genutzt werden, Dokumente bei der Übernahme in ein Enterprise-Content-Management-System (ECM) automatisch zu indexieren.

Den Prozess automatisieren
Aufgrund dieser Argumente ist es empfehlenswert, die Konvertierung von Office-Dateien nach PDF/A zentral zu automatisieren und somit sicherzustellen, dass „saubere“ Dateien ohne Informationsverlust entstehen. Insbesondere bei einem hohen Dokumentenvolumen sollte dies serverbasiert erfolgen.

Für die zentrale, automatische Verarbeitung gibt es verschiedene Möglichkeiten. Die einfachste Variante basiert auf Hotfoldern. Ein Hotfolder verfügt über ein zugehöriges Profil und mehrere Ausgabeordner. Alle Dateien, die in einem Hotfolder eingehen, werden automatisch abgeholt und mit dem ausgewählten Profil nach ihren Spezifizierungen ohne manuelle Eingriffe verarbeitet und anschließend in den jeweiligen Zielordnern abgelegt. Moderne Konvertierungslösungen verfügen über weitreichende Funktionen, die beispielsweise ungültige PDF-Dateien oder eingebettete, unvollständige Schriften reparieren bzw. fehlende Schriften nachträglich integrieren und inkonsistente Metadaten korrigieren. Über ein entsprechendes Reporting erhält der Anwender Informationen über Dateien, die bei der Konvertierung zu Problemen führten, etwa wenn eine Datei kennwortgeschützt ist.

Elegantere und direktere Möglichkeiten zur Automatisierung sind über die Integration in umfassendere Abläufe per Skripting oder Programmierung möglich. Dabei steht der gleiche Funktionsumfang für die Konvertierung selbst zur Verfügung.

Ein weiteres Argument, das für die zentrale Konvertierung spricht, ist, dass dann auch die Qualitätssicherung zentral erfolgen kann. Konkret geht es dabei um die Validierung, also die Überprüfung, ob die vermeintlich erzeugten PDF/A-Dateien auch die Vorgaben des ISO-Standards einhalten. Die Validierung läuft in den zuverlässigeren Konvertierungswerkzeugen automatisch nach jeder Verarbeitung. Daher ist es empfehlenswert, auf Werkzeuge zu setzen, die mit dem veraPDF-Test-Corpus kompatibel sind.

Konvertierung und Validierung in einem Guss
Dietrich von Seggern, Geschäftsführer von callas software, fasst zusammen: „Grundsätzlich ist es ratsam, sämtliche Dokumente in einem Format vorzuhalten, und da ist PDF als kleinster gemeinsamer Nenner für digital erzeugte bzw. papierbasierte Dokumente die erste Wahl. Damit Mitarbeiter von der Konvertierung entlastet werden und gleichzeitig sichergestellt ist, dass alle PDF/A-Dateien eine gleichbleibend hohe Qualität haben, sollten Entscheider auf serverbasierte Lösungen setzen, die sowohl die Konvertierung als auch die Validierung beinhalten und darüber hinaus Features bereitstellen, die die Prozesse rund um die Verarbeitung von PDFs automatisieren.“

Kasten: Über PDF/A
PDF/A wurde Ende 2005 als ISO 19005-1 veröffentlicht und ist seit Ende 2020 als Standardteil PDF/A-4 verfügbar. Da es sich bei PDF/A um ein Archivierungsformat handelt, ist es wichtig zu wissen, dass alle Versionen des Standards, von PDF/A-1 an, für immer gültig sein werden. Dennoch ist es für neue Dokumente sinnvoll, den aktuellen Standardteil zu verwenden, da er auf der aktuellen PDF-Version (PDF 2.0) basiert und somit mehr PDF-Funktionen zulässt, wodurch der Konvertierungsaufwand sinkt. Mindestens die Verwendung von PDF/A-2 ist empfehlenswert, da in PDF/A-1 für digitale Dokumente häufig interessante Features wie Ebenen oder bei gestalteten Seiten Transparenz nicht erlaubt sind. Das Entfernen dieser Eigenschaften ist möglich, aber eben mit Informationsverlust verbunden.

Über den Autor:
Dietrich von Seggern, Geschäftsführer von der callas software GmbH, ist seit 1991 im Bereich der Druckvorstufe tätig. Der Diplom-Ingenieur ist Experte im Bereich Publishing und PDF. callas software entwickelt PDF-Technologien für das Publishing, Prepress, den Dokumentenaustausch und die Dokumentenarchivierung. Das Unternehmen ist Gründungsmitglied der PDF Association und engagiert sich von Anfang an im Vorstand des internationalen Verbandes.

Über callas software:
callas software bietet einfache Möglichkeiten, um komplexe Herausforderungen im PDF-Umfeld zu bewältigen. Als Innovator von Verfahren entwickelt und vermarktet callas software PDF-Technologien für das Publishing, Prepress, den Dokumentenaustausch und die Dokumentenarchivierung. callas software unterstützt Mediendienstleister, Agenturen, Verlage und Druckereien darin, ihre Aufgabenstellungen zu lösen, indem es mit pdfToolbox eine Lösung zum Prüfen, Korrigieren und Wiederverwenden von PDF-Dateien für die Produktion von Druckvorlagen und das elektronische Publizieren bereitstellt.

Unternehmen und Behörden aus aller Welt vertrauen pdfaPilot für die zukunftssichere, vollständige PDF/A-konforme Archivierung von PDF- und Office-Dokumenten.

Darüber hinaus ist die callas-Technologie auch als Programmierbibliothek (SDK) für Entwickler erhältlich, die PDFs optimieren, validieren und korrigieren müssen. Software-Anbieter wie Adobe®, Foxit®, Kodak®, Quark®, Xerox® und viele andere haben verstanden, welche Qualität und Flexibilität die callas-Werkzeuge bieten, und sie in ihre eigenen Lösungen integriert.

callas software unterstützt aktiv internationale Standards und beteiligt sich aktiv in DIN, ISO, CIP4, der European Color Initiative (ECI), und der Ghent Workgroup. Darüber hinaus ist callas software Gründungsmitglied der PDF Association und engagiert sich von Anfang an im Vorstand des internationalen Verbandes. Der Firmensitz des Unternehmens befindet sich in Berlin. Weitere Informationen finden Sie im Internet unter www.callassoftware.com

Click Here!
HDS Portalpartner
HDS Portalpartner
AXA_Company_logo_rgb_Graustufen
HDS Portalpartner
Die Satzkiste Stuttgart - Startseite
HDS Portalpartner
callas_grau
HDS Portalpartner
PBU_Logo_weiss