HowTo: Papierkram digitalsieren

… mit Paperwork

19. Dezember 2018 | #linux #werkzeuge #backup #backintime #paperwork #scanner

Schon vor ein paar Jahren bin ich mal auf einen Blogpost bei Andreas Gohr gestoßen, der ein schönes Setup beschreibt, wie man (nach einmaliger Einrichtung) seinen Papierkram mit wenig Aufwand einscannen und wiederfindbar ablegen kann.

Die Vorteile auf liegen auf der Hand: Statt mit dicken Aktenordnern hantieren zu müssen, lassen sich Schriftstücke per Suchfunktion finden und im Falle von Naturkatastrophen und Wohnungsbränden liegt zumindest ein digitales Backup aller wichtigen Dokumente vor, besser als nix. Gar nicht schlecht also, könnte man ja bei Gelegenheit so und so oder so ähnlich nachbauen …

… Andererseits: So oft brennt es jetzt ja auch wieder nicht und im vierten Stock sind wir auch nur begrenzt von Hochwassern betroffen. Also habe ich die Geschichte einfach so lange aufgeschoben, bis es tatsächlich nur ein paar Häuser weiter gebrannt hat – Glück für mich, dass der Black Friday ohnehin gerade vor der Tür stand und sich die benötigte Hardware für vergleichsweise kleines Geld beschaffen ließ.

Wen jetzt auch die Lust packt, der mag sich vielleicht durch diesen Artikel inspirieren lassen. Der Schwerpunkt liegt wie immer auf Linux, aber das hier vorgestellte Setup sollte sich in etwa genau so auch unter Windows realisieren lassen.

Papier digitalisieren

Zunächst das Offensichtliche: Wie ist der Scanvorgang am besten zu bewerkstelligen? Klar, der alte Flachbettscanner in Kombination mit einer beliebigen Bildverarbeitung tut's grundsätzlich auch, aber etwas flotter darf es schon gehen. Das Mittel der Wahl:

Hardware: Dokumentenscanner

Für mein Setup wählte ich einen Dokumentenscanner, da dieser im Gegensatz zu den typischen Flachbettscannern oder den meisten All-in-One-Geräten vor allem mit hoher Geschwindigkeit und einfachem Handling punktet. Zettel rein, auf „Scannen“ klicken, Zettel wird eingezogen und ausgespuckt. Wer ohnehin schon in Besitz eines flotten Multi-Geräts ist: Umso besser!

Linux-Nutzer achten wie immer schon beim Kauf auf gegebene Kompatibilität. In meinem Fall war der Brother ADS-2100e gerade preiswert zu haben (ca. 260 Euro), welcher auch mit wenig Aufwand unter Linux lauffähig ist.

Software: Paperwork

Ein schickes kleines Programm, das Dokumente in einem Rutsch scannen, mittels OCR durchsuchbar machen und ablegen kann, nennt sich Paperwork.

Auf diese Weise archivierte Dokumente lassen sich per Volltextsuche und eigenen Tags schnell bei Bedarf schnell wieder hervorholen und beispielsweise als PDF exportieren.

Bildschirmfoto von Paperwork: Im linken Bereich befindet sich die Suche sowie eine Übersicht aller gescannten Dokumente mit Datum und (optionalen) Schlagworten. Rechts daneben lässt sich das ausgewählte Dokument betrachten und bei Bedarf – etwa für den Versand per Mail – exportieren.

Das Programm muss entweder manuell oder per Flatpak installiert werden und bedarf eigentlich keiner großen Erklärung.

Backup

Vorabüberlegung: Wahl des Speicherortes

Damit wäre der Papierkram schon mal digitalisiert. Solange sich die Originale und der verwendete Rechner allerdings im selben Haushalt befinden, ist die Sicherung im Fall der Fälle natürlich nicht besonders effektiv.

Sinnvoller ist dagegen ein Backup, das sich physisch an einem anderen Ort befindet. Hier kommen die unterschiedlichsten Ansätze in Frage, die alle ihre individuellen Vor- und Nachteile haben:

Cloud-Speicherdienste wie Dropbox oder Google Drive sind preiswert und bieten womöglich den maximalen Schutz gegen Datenverlust. Aber Geburtsurkunden und Arbeitsverträge einem kommerziellen Dienstleister anbieten? Für mich wär das nichts.

Wer lieber selbst entscheidet, wem er vertraut, für den kommt vielleicht eine selbst gehostete Lösung wie NextCloud oder einen ssh-Zugang auf einen externen Speicher infrage. Einziges Manko könnte hier noch die Übertragungsgeschwindigkeit sein.

Warum also nicht einfach eine externe 2,5-Zoll-Festplatte? Die ist schnell und landet einfach nach Benutzung im Handschuhfach des Autos oder im Schreibtisch bei der Arbeit. Verschlüsselung (z.B. VeraCrypt) schützt vor den Blicken Neugieriger oder Dieben. Und so kommen die Daten auf die Platte:

Durchführung: Back in Time

Treue Leser kennen bereits meine alte Abhandlung über inkrementelle Backups, die ich kurz nach einem größeren Datenverlust schrieb. Kurz gesagt geht es darum, nicht jedes mal riesige Datenmengen zu kopieren, wenn ein Backup angelegt werden soll. Stattdessen sollen nur diejenigen Dateien kopiert werden, die seit dem letzten Backup neu dazugekommen oder verändert worden sind – und das ganze bitteschön möglichst ohne eigenes Zutun.

Mac-User kennen einen solchen Ansatz als Time Machine. Dieses Programm ist so gut geraten, dass es für Linux in ähnlicher Form unter dem Namen Back in Time nachgebaut wurde:

Das Programm identifiziert alle Dateien, die noch nicht gesichert worden sind und kopiert diese auf ein beliebiges Speichermedium (der eben eine anderweitigen ins Dateisystem eingebundenen Speicherort). Jedes Backup ist einem eindeutigen Zeitpunkt zugeordnet und kann bei Bedarf wieder eingespielt werden – als würde man in der Zeit zurückspringen.

Eine ideale Lösung also nicht nur für das hier vorgestellte Setup sondern auch für Backups ganz im Allgemeinen. Back in Time liegt in den Paketquellen der meisten Linux-Distributionen vor. Wie immer haben die UbuntuUsers eine schöne Anleitung zur Konfiguration parat.

Fazit

Der Artikel ist etwas länger geworden als geplant, was wohl auch daran liegt, dass ein Dreizeiler der Backup-Thematik – egal ob es um Dateien oder echte Dokumente aus Papier geht – einfach nicht gerecht wird.

Das beschriebene Setup ist trotzdem nur auf dem ersten Blick komplex und lässt sich innerhalb einer überschaubaren Zeit nachbauen. Wer's primitiver angehen will, kann natürlich auch einfach sämtlichen Papierkram mit dem Smartphone abfotografieren.

Echte Fleißarbeit ist so oder so nur das erstmalige Digitalisieren aller wichtigen Dokumente. Hier natürlich jeder selbst entscheiden, wie viel Aufwand er hierbei betreiben möchte – ich habe mich beispielsweise bei den ganz alten Dokumenten darauf beschränkt, nur noch Nachweise für die Rente und anderweitig Relevantes einzuscannen.

Wie die letzten Wochen gezeigt haben, ist der tägliche Betrieb allerdings deutlich entspannter und auch wenn der Katastrophenfall (zum Glück!) ausbleibt, ist die Volltextsuche eine super bequeme Alternative zum Durchblättern alter Gehaltsabrechnungen oder Versicherungsunterlagen.


(Artikelfoto von Christa Dodoo auf Unsplash)