Archivista

aus Wikipedia, der freien Enzyklopädie
Wechseln zu: Navigation, Suche
Archivista
Archivista Version 2010/III beim Durchstöbern archivierter Dokumente
Archivista Version 2010/III beim Durchstöbern archivierter Dokumente
Basisdaten
Entwickler Archivista GmbH
Aktuelle Version 2011/IV
(6. April 2011)
Betriebssystem Linux
Programmier­sprache Perl, PHP
Lizenz GPL (Freie Software)
Deutschsprachig ja
www.archivista.ch

Archivista (italienisch für „Archivar“) ist eine Webanwendung zur Realisierung des papierlosen Büros. Mit ihr können Dokumente aus unterschiedlichen Quellen erfasst, sicher und durchsuchbar digital gespeichert und wieder exportiert werden. Sie wird von der Schweizer Archivista GmbH hergestellt, die dazu auch vorinstallierte Komplettlösungen mit Hardware, die sogenannten ArchivistaBoxen, und technischer Unterstützung vertreibt.[1]

Die Software wird als freie Software unter den Bedingungen von Version 2 der GNU General Public License (GPL) verbreitet. Die Entwicklung begann in den frühen 1990er Jahren zunächst als Software zur Verschlagwortung der Scans von Papierdokumenten. Die Software ist unter anderem bei dem schweizerischen Amt für Grundstückschätzungen des Kantons Schaffhausen und EADS Astrium im Einsatz.[2]

Merkmale[Bearbeiten]

Das gesamte System wird unter anderem in Form von ISO-Abbilddateien angeboten, aus denen sich optische Medien erstellen lassen, die als direkt nutzbares sogenanntes Live-System bootfähig sind.[1] Es kann als lokale Installation (auf der Maschine des Benutzers) oder über ein Rechnernetz genutzt werden. Es stellt mittels CUPS einen Druckerserver zur Verfügung, der Druckaufträge abfangen und in elektronischen Dokumentenformaten archivieren kann. Inhalte von IMAP-E-Mail-Postfächern können archiviert werden. Geräte wie Dokumentenscanner können im laufenden Betrieb eingebunden werden. Es setzt Langzeitarchivierung nach gesetzlich vorgeschriebenen Standards um. Die Dokumentenarchiv-Datenbank kann mit Volltextsuche durchforstet und sämtliche Dokumente im PDF ausgegeben werden.[3] Es können auch Archiv-DVDs mit enthaltener Betrachter-Software erzeugt werden. Es enthält eine Texterkennungslösung, durch die die gespeicherten rastergraphischen Abbilder gescannter Papierdokumente durchsuchbar gemacht werden können. Auch Strichcodes und die Inhalte ausgefüllter Papier-Formulare können maschinell ausgelesen werden.[4]

Technik[Bearbeiten]

Die Software basiert auf dem Linux-Distributionsbaukasten T2 und anderen freie-Software-Komponenten und verwendet durchgängig offene Dateiformate. Zum Zugriff auf Scannergeräte wird SANE verwendet. Die Texterkennungsfunktionalität basiert standardmäßig auf CuneiForm, Tesseract und dem Hilfsprogramm hocr2pdf, in den kommerziell vertriebenen Komplettpaketen wird die Kommandozeilen-Version von FineReader mitgeliefert.[1] Der Kern der modularen Anwendung ist in Perl und PHP geschrieben.

Weblinks[Bearbeiten]

Quellen[Bearbeiten]

  1. a b c Ulrich Bantle: Archivista-Box mit Open-Source-OCR. In: Linux-Magazin. Linux New Media AG, 6. August 2007, abgerufen am 26. Juni 2011.
  2.  Urs Binder: Eine Box fürs Dokumentenmanagement. In: IT Magazine. Nr. 22, Swiss IT Media GmbH, Dezember 2008 (http://www.itmagazine.ch/artikel/art_details.cfm?aid=27071, abgerufen am 26. Juni 2011).
  3.  Hans-Peter Schüler: Quelloffenes Dokumentenarchiv. In: c't. Nr. 23, Heise Zeitschriften Verlag, Oktober 2008, S. 34.
  4.  Peter Schüler: Loses Blattwerk im Griff. Unterlagen per PC sortieren und aufbewahren. In: c't. Nr. 9, Heise Zeitschriften Verlag, April 2008, S. 146–155.