Datenerfassung Erfassen von Indizes
Sie viel wie nötig, so wenig wie möglich
Die Datenerfassung oder oftmals auch als Indexierung bezeichnet, ist bei der Archivierung von Dokumenten einer von drei entscheidenden Arbeitsschritten. Nach der Belegaufbereitung und dem Scannen (Digitalisieren) der Akten, müssen diese noch für die spätere Recherche mit Suchbegriffen verschlagwortet werden.
Als Scandienstleister erfassen wir bei einer Digitalen Archivierung auch immer alle Suchbegriffe die Sie benötigen um Ihre digitalen Dokumente schnell und komfortabel wiederfinden zu können.
Wir orientieren uns bei dem Aufbau Ihres Digitalen Archivs immer an der bereits vorhandenen Ablagestruktur und versuchen diese mithilfe der digitalen Möglichkeiten zu erweitern und zu optimieren.
Möglichkeiten der Datenerfassung
Die Datenerfassung kann sowohl automatisiert per OCR (Texterkennung) erfolgen, oder aber wir führen die Datenindexierung manuell anhand der Scanimages durch. Bei der manuellen Datenerfassung werden die für die digitale Recherche notwendigen Suchbegriffe vom gescannten Bild erfasst.
Gerade bei der Digitalisierung und Archivierung von älteren Bestandsarchiven oder sehr inhomogenen (unterschiedlichen) Dokumenten, ist oftmals keine Texterkennung für spezielle Suchbegriffe möglich.
Bei der manuellen Indexierung werden ausgewählte Indexwerte aus den einzelnen digitalen Dokumenten sicher extrahiert. Im Anschluss erfolgt eine Qualitätskontrolle der entnommenen Informationen.
Welche Formen der Datenerfassung gibt es?
Auf Ordnerbasis
Der Umfang der Datenerfassung hängt von der Art der Archivierung ab. Die einfachste Form der elektronischen Archivierung stellt ein Dokument pro Ordner/Akte dar, also zumeist eine PDF Datei, die alle Seiten eines Aktenordners beinhaltet. In diesem Fall werden die notwendigen Suchkriterien vom Ordnerrücken erfasst. Dies können Jahrgänge, Belegart oder Bezeichnungen sein. Möglichst alle Informationen werden vom Ordnerrücken als digitale Daten erfasst und im Dateinamen, oder als Verzeichnisstruktur gespeichert.
Bei der Erfassung auf Ordnerbasis werden die Belege meist zusätzlich mit einer Texterkennung hinterlegt.
Auf Registerbasis
Die nächste Stufe der Erfassung stellt die Registerebene dar. Enthalten die Akten sog. „Trenner“ oder auch „Reiter“, so bilden diese die Dokumentenebene (1 Trenner = 1 PDF-Datei). In diesem Fall wird zusätzlich zur Ordnerrückenbeschriftung auch die Beschriftung des Trenners erfasst.
Auf Vorgangsbasis
Die detaillierteste Form der Datenerfassung bildet dann die Ebene der einzelnen Vorgänge. Jede einzelne Rechnung (inkl. Anhänge) oder Schriftstück wird mit speziell vorher festgelegten Begriffen indiziert. Beispielsweise Empfänger, Datum, Betreff usw. Jeder Vorgang wird in diesem Fall eine PDF Datei, auch hier ist es sinnvoll die Ordnerrückenbeschriftung ebenfalls als Suchbegriff zu erfassen.
Die Datenerfassung auf Vorgangsebene kommt zumeist bei aktueller/früher Archivierung zum Einsatz, da nur auf Vorgangsebene sehr gezielte Belegrecherchen möglich sind.
Welche Daten werden erfasst?
Wie oben beschrieben richtet sich die Feld Anzahl zunächst nach der Form der Archivierung. Erfasst werden können grundsätzlich alle Daten die klar und eindeutig auf den Belegen erkannt werden können.
Dies können Daten wie EMPFÄNGER, ein LIEFERDATUM oder eine RECHNUNGSNUMMER sein. Im Idealfall gibt es mind. ein Kriterium, nach dem ein digitaler Beleg unzweifelhaft identifiziert werden kann (z.B. eine Rechnungsnummer). Es sollten die Indizes gewählt werden, die notwendig sind, einen Beleg problemlos finden zu können, oder zumindest die Suchbegriffe die bereits im analogen Ordner zur Verfügung standen.
Es gilt der Grundsatz: „Soviel wie nötig, so wenig wie möglich“
Nicht nur das eine hohe Anzahl an Suchfeldern den späteren Nutzer verwirren kann, auch erhöht eine hohe Anzahl an zu erfassenden Indizes die möglichen Fehlerquellen. Und da eine manuelle Datenerfassung auch Aufwand bedeutet, ist es letztlich auch immer eine Kostenfrage, wie viele Indizes pro Dokument erfasst werden sollen.
Wie nutze ich die erfassten Daten?
Die Datenerfassung findet bei uns mithilfe spezieller Tools statt. Im Ergebnis liefern wir die Daten entweder in Form einer übersichtlichen, hierarchischen Verzeichnisstruktur an deren Ende vollindizierte PDF Dateien archiviert werden, oder als Referenzdateien (Bsp. XML) zu den gescannten Images (PDF, TIF, JPL).
Setzen Sie ein DMS (Dokumentenmanagement-System) ein, liefern wir die Indizes inklusive Scanimages in dem Format, wie Ihr DMS es benötigt um die digitalen Daten zu importieren und zu archivieren. Dieser Importvorgang kann weitgehend automatisiert werden.
Ohne DMS im Einsatz nutzen Sie entweder unser Online-Archiv oder die oben erwähnte PDF Struktur.
In jedem Fall können haben Sie später die Möglichkeit der gezielten Suche nach speziellen Daten oder der Recherche mithilfe der Volltexterkennung nach Stichworten. Bei der Digitalen Archivierung finden Sie grundsätzlich jedes benötigte Dokument innerhalb von Sekunden.
Datenerfassung & Datenindexierung
Mit unserem Scanservice erfassen wir Indizes
nach Ihren Vorgaben.
Wir helfen gerne bei der Strukturierung Ihrer Daten.
Sprechen Sie uns jetzt an