Das wichtigste auf einen Blick:
- Metadaten sind beschreibende Zusatzinformationen zu den eigentlichen Daten
- Indexierung von Dokumenten macht Metadaten maschinenlesbar
- Metadaten eines Buches sind z.B.: Autor, Erscheinungsjahr, Seitenzahl, ISBN
- Strukturierte Metainformationen ermöglichen eine gezielte Datenabfrage sowie Filterfunktionen in einem DMS
- Metadatenerfassung ermöglicht Interoperabilität
Was sind Metadaten - Definition
Metadaten sind beschreibende Informationen über die eigentlichen Daten. Sie bilden nicht den inhaltlichen Kern, sondern beschreiben den Inhalt (z.B. Dokumente, Bilder, Personen, Bücher oder Gebäude etc.) einheitlich und liefern präzisere Details zum Kontext.
Metadaten sind maschinell lesbar und auswertbar und geben beispielsweise Aufschluss über den Inhalt von Dokumenten, ohne diese öffnen zu müssen.
Beispiel Buch
Wenn Sie an ein Buch denken, dann stellt der Inhalt des Buches, also der Text, die eigentlichen Daten dar. Metadaten eines Buches können u.a. der Name des Autors, die Anzahl der Seiten, das Erscheinungsjahr oder auch die ISBN sein.
Sie möchten Aktenordner scannen und indexieren lassen?
KontaktformularWarum sind Metadaten wichtig?
Metadaten ergänzen die eigentlichen Daten durch eine strukturierte Zusatzebene von Informationen.
Sie tragen dazu bei, archivierte Objekte eindeutig zu identifizieren, zu filtern und zu selektieren, während sie gleichzeitig wichtigen Kontext und Dokumentation über die Herkunft, Inhalte und die Verwendung dieser Daten bereitstellen.
Metadaten zu einem Dokumentenscan sind zum Beispiel:
- Dokumententitel
- Zeitstempel (Datum der Digitalisierung)
- Autor oder Ersteller des Dokuments
- Dokumententyp (Rechnung, Vertrag, Lieferschein etc.)
- Kundennummer
- Rechnungsnummer
- Rechnungsbetrag
Beispiel Suchmaschinen (SEO)
Metadaten (Metatags) spielen auch eine entscheidende Rolle für die Suchmaschinenoptimierung (SEO) bezüglich des Rankings von Suchergebnissen in Suchmaschinen.
Meta-Elemente wie der Seitentitel (Meta-Title) und die Seitenbeschreibung (Meta-Description) beschreiben den Inhalt einer Website und helfen dabei, die relevantesten Suchergebnisse für spezifische Suchanfragen bereitzustellen. Sie sind in den HTML-Head-Elementen einer Website zu finden.
Durch Metainformationen zu Webseiten können Suchende den Inhalt eines Suchergebnisses einschätzen, ohne die Seite besuchen zu müssen.
Weitere Beispiele von Metadaten nach Art der Ressource:
- Brief: Absender, Empfänger, Briefmarke (Wert)
- Digitale Bilder: Erstellungsdatum, Aufnahmeort (GPS-Koordinaten), Dateiformat
- Videos: Spieldauer, Dateiformat, Codec, Bildrate, Abmessungen
- Personen: Name, Geburtsdatum, Geschlecht, Nationalität
Wie werden Metadaten erfasst?
Indexierung von Dokumenten
Die Metadatenerfassung wird als Indexierung bezeichnet, bei der Informationen und Schlagworte aus Geschäftsdokumenten extrahiert und strukturiert gespeichert werden. Jedes Schlagwort erhält ein bestimmtes Indexfeld, was computergestütztes Auslesen der Indexdaten ermöglicht.
Die Indexierung kann entweder manuell vorgenommen werden (intellektuelle Indexierung) oder automatisiert mit Hilfe von Computerprogrammen (automatische Indexierung). Auch Kombinationen sind möglich.
Wo werden Metainformationen gespeichert?
Bei elektronisch erstellten Dateien werden die Metainformationen in der Regel direkt angehängt und können somit leicht zusammen mit dem Hauptdokument verwaltet und übertragen werden.
Bei Dokumentenscans werden die Metainformationen in der Regel in Form einer separaten Referenzdatei in einem formatierten Dateiformat gespeichert.
Dazu zählen beispielsweise:
- XML
- CSV
- Excel-Dateien
- JSON
Vorteile
Strukturierte Indexdaten inkl. der Metadaten ermöglichen wichtige Steuerungsfunktionen in einem Dokumentenmanagement-System (DMS) bzw. digitalen Archiv. Zum einen lässt sich dadurch die Effizienz der internen Prozesse erhöhen, zum anderen können auch die Einhaltung gesetzlicher Anforderungen (Compliance) sowie Datensicherheit verbessert werden.
Recherche und Filterfunktionen
Um auch in umfangreichen Archivbeständen schnell auf Dokumente zugreifen zu können, ermöglicht die Verwendung von Schlagworten (Indexfeldern) eine gezielte Suche nach bestimmten Dokumenten, wie beispielsweise nach Kunden- oder Rechnungsnummern. Zudem können Datenfilter entsprechend spezifischen Kriterien (wie Dokumententyp) oder zeitlicher Einschränkungen angewendet werden.
Zugangsbeschränkungen
Um Datenschutzanforderungen (DSGVO) gerecht zu werden, kann der Zugriff auf spezifische Unterlagen im Archiv anhand von Metadaten beschränkt werden. Diese Funktion ist beispielsweise für die digitale Personalakte von großem Nutzen.
Aufbewahrungsfristen und Löschkonzept:
Geschäftsdokumente müssen je nach Art eines Dokuments 6 oder 10 Jahre aufbewahrt werden. Anhand der Metainformationen kann eine Erinnerungsfunktion für den Ablauf der Aufbewahrungsfrist integriert oder archivierte Unterlagen automatisch gelöscht werden.
Nach Vorgaben der DSGVO dürfen ausgewählte Schriftstücke mit personenbezogenen Daten nur so lange aufbewahrt werden, wie Sie auch benötigt werden. Anhand von Indexdaten lassen sich automatische Löschkonzepte implementieren, um Rechtsverstöße auszuschließen.
Workflows
Die Metainformationen spielen eine entscheidende Rolle bei der Steuerung von Geschäftsunterlagen innerhalb der verschiedenen Prozesse und Abteilungen von Unternehmen oder Behörden. Durch die Nutzung von Indexdaten können Arbeitsabläufe automatisiert werden, beispielsweise im Bereich der Rechnungsverarbeitung.
Interoperabilität
Die Metadatenerfassung ist unerlässlich, um die Interoperabilität (Kompatibilität) zwischen verschiedenen Systemen zu gewährleisten und einen reibungslosen Datenaustausch zu ermöglichen. Dafür ist die Standardisierung von Metadaten erforderlich.
Zum Beispiel erfassen wir mit unserem Scanservice Indexfelder gemäß dem Metadatenstandard XDOMEA, der auf der Auszeichnungssprache XML basiert, um die Übermittlung und Aussonderung von Schriftgutobjekten in der öffentlichen Verwaltung zu gewährleisten.
Ausführliche Informationen finden Sie auf unserer Themenseite XDOMEA.
Auch im Gesundheitsbereich verwenden Leistungserbringer für die gleichen medizinischen Dokumente unterschiedliche Bezeichnungen, was beim Austausch der Unterlagen zwischen den Informationssystemen zu Problemen führen kann.
Bei der Digitalisierung von Patientenakten klassifizieren wir Patientenunterlagen beispielsweise nach Vorgaben der klinischen Dokumentenklassen-Liste (KDL) und fügen den Indexdateien entsprechende Informationen hinzu. Die KDL dient dabei als ein Werkzeug der Standardisierung, um eine Kommunikationsfähigkeit der einzelnen Systeme zu ermöglichen.
Im Gesundheitswesen verwenden Leistungserbringer für dieselben medizinischen Dokumente oft unterschiedliche Bezeichnungen, was den Austausch der Unterlagen zwischen Informationssystemen erschwert.
Daher können wir Patientenunterlagen zum Beispiel gemäß den Richtlinien der klinischen Dokumentenklassen-Liste (KDL) klassifizieren und ergänzen die Metadaten entsprechend.
Ausführliche Informationen finden Sie auf unserer Themenseite KDL.
Zusammenfassung
Metadaten stellen beschreibende Informationen über andere Daten dar und spielen eine zentrale Rolle im Dokumentenmanagement, um Unterlagen effizient in einem digitalen Archiv zu verwalten. Die Indexierung digitaler Dokumente strukturiert die Metadaten und macht sie maschinenlesbar. Dies eröffnet vielfältige Möglichkeiten zur Organisation von Dokumenten in einem Dokumentenmanagementsystem (DMS), darunter Datenabfragen, Filterung und die Anwendung von Regeln. Darüber hinaus ermöglicht die Erfassung von Metadaten einen nahtlosen Datenaustausch zwischen verschiedenen Verwaltungssystemen.
Scanservice mit Metadatenerfassung
Akten scannen und
Metadaten erfassen lassen?
Jetzt anfragen!
Kostenlose Info Hotline