HowTo: Papierkram digitalsieren

Schon vor ein paar Jahren bin ich mal auf einen Blog­post bei Andreas Gohr gesto­ßen, der ein schö­nes Setup beschreibt, wie man (nach ein­ma­li­ger Ein­rich­tung) seinen Papier­kram mit wenig Auf­wand ein­scan­nen und wie­der­find­bar able­gen kann.

Die Vor­teile auf liegen auf der Hand: Statt mit dicken Akten­ord­nern han­tie­ren zu müssen, lassen sich Schrift­stü­cke per Such­funk­tion finden und im Falle von Natur­ka­ta­stro­phen und Woh­nungs­brän­den liegt zumin­dest ein digi­ta­les Backup aller wich­ti­gen Doku­mente vor, besser als nix. Gar nicht schlecht also, könnte man ja bei Gele­gen­heit so und so oder so ähn­lich nach­bauen …

… Ande­rer­seits: So oft brennt es jetzt ja auch wieder nicht und im vier­ten Stock sind wir auch nur begrenzt von Hoch­was­sern betrof­fen. Also habe ich die Geschichte ein­fach so lange auf­ge­scho­ben, bis es tat­säch­lich nur ein paar Häuser weiter gebrannt hat – Glück für mich, dass der Black Friday ohne­hin gerade vor der Tür stand und sich die benö­tigte Hard­ware für ver­gleichs­weise klei­nes Geld beschaf­fen ließ. 

Wen jetzt auch die Lust packt, der mag sich viel­leicht durch diesen Arti­kel inspi­rie­ren lassen. Der Schwer­punkt liegt wie immer auf Linux, aber das hier vor­ge­stellte Setup sollte sich in etwa genau so auch unter Win­dows rea­li­sie­ren lassen.

Papier digi­ta­li­sie­ren

Zunächst das Offen­sicht­li­che: Wie ist der Scan­vor­gang am besten zu bewerk­stel­li­gen? Klar, der alte Flach­bett­s­can­ner in Kom­bi­na­tion mit einer belie­bi­gen Bild­ver­ar­bei­tung tut’s grund­sätz­lich auch, aber etwas flot­ter darf es schon gehen. Das Mittel der Wahl: 

Hard­ware: Doku­men­ten­scan­ner

Für mein Setup wählte ich einen Doku­men­ten­scan­ner, da dieser im Gegen­satz zu den typi­schen Flach­bett­s­can­nern oder den meis­ten All-in-One-Gerä­ten vor allem mit hoher Geschwin­dig­keit und ein­fa­chem Hand­ling punk­tet. Zettel rein, auf Scan­nen“ kli­cken, Zettel wird ein­ge­zo­gen und aus­ge­spuckt. Wer ohne­hin schon in Besitz eines flot­ten Multi-Geräts ist: Umso besser!

Linux-Nutzer achten wie immer schon beim Kauf auf gege­bene Kom­pa­ti­bi­li­tät. In meinem Fall war der Bro­ther ADS-2100e gerade preis­wert zu haben (ca. 260 Euro), wel­cher auch mit wenig Auf­wand unter Linux lauf­fä­hig ist.

Soft­ware: Paper­work

Ein schi­ckes klei­nes Pro­gramm, das Doku­mente in einem Rutsch scan­nen, mit­tels OCR durch­such­bar machen und able­gen kann, nennt sich Paper­work.

Auf diese Weise archi­vierte Doku­mente lassen sich per Voll­text­su­che und eige­nen Tags schnell bei Bedarf schnell wieder her­vor­ho­len und bei­spiels­weise als PDF expor­tie­ren.

Bild­schirm­foto von Paper­work: Im linken Bereich befin­det sich die Suche sowie eine Über­sicht aller gescann­ten Doku­mente mit Datum und (optio­na­len) Schlag­wor­ten. Rechts dane­ben lässt sich das aus­ge­wählte Doku­ment betrach­ten und bei Bedarf – etwa für den Ver­sand per Mail – expor­tie­ren.

Das Pro­gramm muss ent­we­der manu­ell oder per Flat­pak instal­liert werden und bedarf eigent­lich keiner großen Erklä­rung.

Backup

Vor­ab­über­le­gung: Wahl des Spei­cher­or­tes

Damit wäre der Papier­kram schon mal digi­ta­li­siert. Solange sich die Ori­gi­nale und der ver­wen­dete Rech­ner aller­dings im selben Haus­halt befin­den, ist die Siche­rung im Fall der Fälle natür­lich nicht beson­ders effek­tiv.

Sinn­vol­ler ist dage­gen ein Backup, das sich phy­sisch an einem ande­ren Ort befin­det. Hier kommen die unter­schied­lichs­ten Ansätze in Frage, die alle ihre indi­vi­du­el­len Vor- und Nach­teile haben:

Cloud-Spei­cher­dienste wie Drop­box oder Google Drive sind preis­wert und bieten womög­lich den maxi­ma­len Schutz gegen Daten­ver­lust. Aber Geburts­ur­kun­den und Arbeits­ver­träge einem kom­mer­zi­el­len Dienst­leis­ter anbie­ten? Für mich wär das nichts.

Wer lieber selbst ent­schei­det, wem er ver­traut, für den kommt viel­leicht eine selbst gehos­tete Lösung wie Next­Cloud oder einen ssh-Zugang auf einen exter­nen Spei­cher infrage. Ein­zi­ges Manko könnte hier noch die Über­tra­gungs­ge­schwin­dig­keit sein.

Warum also nicht ein­fach eine externe 2,5-Zoll-Festplatte? Die ist schnell und landet ein­fach nach Benut­zung im Hand­schuh­fach des Autos oder im Schreib­tisch bei der Arbeit. Ver­schlüs­se­lung (z.B. Ver­a­Crypt) schützt vor den Bli­cken Neu­gie­ri­ger oder Dieben. Und so kommen die Daten auf die Platte:

Durch­füh­rung: Back in Time

Treue Leser kennen bereits meine alte Abhand­lung über inkre­men­telle Back­ups, die ich kurz nach einem grö­ße­ren Daten­ver­lust schrieb. Kurz gesagt geht es darum, nicht jedes mal rie­sige Daten­men­gen zu kopie­ren, wenn ein Backup ange­legt werden soll. Statt­des­sen sollen nur die­je­ni­gen Dateien kopiert werden, die seit dem letz­ten Backup neu dazu­ge­kom­men oder ver­än­dert worden sind – und das ganze bit­te­schön mög­lichst ohne eige­nes Zutun.

Mac-User kennen einen sol­chen Ansatz als Time Machine. Dieses Pro­gramm ist so gut gera­ten, dass es für Linux in ähn­li­cher Form unter dem Namen Back in Time nach­ge­baut wurde:

Das Pro­gramm iden­ti­fi­ziert alle Dateien, die noch nicht gesi­chert worden sind und kopiert diese auf ein belie­bi­ges Spei­cher­me­dium (der eben eine ander­wei­ti­gen ins Datei­sys­tem ein­ge­bun­de­nen Spei­cher­ort). Jedes Backup ist einem ein­deu­ti­gen Zeit­punkt zuge­ord­net und kann bei Bedarf wieder ein­ge­spielt werden – als würde man in der Zeit zurück­sprin­gen.

Eine ideale Lösung also nicht nur für das hier vor­ge­stellte Setup son­dern auch für Back­ups ganz im All­ge­mei­nen. Back in Time liegt in den Paket­quel­len der meis­ten Linux-Dis­tri­bu­tio­nen vor. Wie immer haben die Ubun­tuUsers eine schöne Anlei­tung zur Kon­fi­gu­ra­tion parat.

Fazit

Der Arti­kel ist etwas länger gewor­den als geplant, was wohl auch daran liegt, dass ein Drei­zei­ler der Backup-The­ma­tik – egal ob es um Dateien oder echte Doku­mente aus Papier geht – ein­fach nicht gerecht wird.

Das beschrie­bene Setup ist trotz­dem nur auf dem ersten Blick kom­plex und lässt sich inner­halb einer über­schau­ba­ren Zeit nach­bauen. Wer’s pri­mi­ti­ver ange­hen will, kann natür­lich auch ein­fach sämt­li­chen Papier­kram mit dem Smart­phone abfo­to­gra­fie­ren.

Echte Fleiß­ar­beit ist so oder so nur das erst­ma­lige Digi­ta­li­sie­ren aller wich­ti­gen Doku­mente. Hier natür­lich jeder selbst ent­schei­den, wie viel Auf­wand er hier­bei betrei­ben möchte – ich habe mich bei­spiels­weise bei den ganz alten Doku­men­ten darauf beschränkt, nur noch Nach­weise für die Rente und ander­wei­tig Rele­van­tes ein­zu­scan­nen.

Wie die letz­ten Wochen gezeigt haben, ist der täg­li­che Betrieb aller­dings deut­lich ent­spann­ter und auch wenn der Kata­stro­phen­fall (zum Glück!) aus­bleibt, ist die Voll­text­su­che eine super bequeme Alter­na­tive zum Durch­blät­tern alter Gehalts­ab­rech­nun­gen oder Ver­si­che­rungs­un­ter­la­gen.