Projekt Veřejná správa online
Veřejná správa online
Příloha časopisu
Časopis Obec a finance
Nové informační technologie
ve veřejné správě
Veřejná správa online

Kam s ním?

Ročník: 2010, Číslo: 4, Rubrika: Z domova

Dlouhodobé ukládání digitálních dokumentů je problematika, kterou v současné době řeší většina moderních států. Je třeba zajistit, aby dalším pokolením byly k dispozici veškeré potřebné informace vzniklé z lidské činnosti v současné době a byly uchovány pro současnost i budoucnost. Tato problematika se dostala do popředí zájmu především nyní s budováním technologických center v obcích a krajích. Nezávislá Iniciativa informatiky pro občany vydala poměrně rozsáhlou studii věnující se právě výkladu a koncepci v táto oblasti a vy teď můžete nahlédnout pod pokličku.

Procesy a činnosti dlouhodobého ukládání dokumentů musejí zajistit zaručené uložení digitálního dokumentu po prakticky neomezeně dlouhou dobu. Cílem je uchovat digitální dokumenty zejména trvalé hodnoty, ať už se jedná o dokumenty úředního charakteru, které jsou důkazem činnosti veřejné moci, či dokumenty kulturního a společenského dědictví. Pro řadu institucí, které legislativa pojímá jako takzvané 'určené původce' je povinnost dlouhodobého důvěryhodného uchovávání dokumentů stanovena i legislativou, zejména v ustanovení § 69a, odst. 3, Zákona č. 499/2004 Sb., o archivnictví a spisové službě. Potřeba dlouhodobě zaručeně ukládat dokumenty mající význam je však velmi vnímána i komerční sférou.

Ze všeho nejdříve bychom si měli vyjasnit, k čemu právě v našem případě dlouhodobé ukládání dokumentů potřebujeme a jak jej budeme zajišťovat. Je nezbytné vypracovat alespoň hrubou koncepci toho, jak chceme tuto problematiku řešit. V koncepci bychom si měli vyjasnit:

  • Obsahovou a technickou potřebu dlouhodobého ukládání dokumentů;
  • Finanční zdroje a obecné plánování rozpočtu;
  • Personální a lidské zdroje, zejména pro oblast řízení projektu a jeho následné realizace;
  • Současný stav práce s dokumenty v naší organizaci;
  • Plán rozvoje správy dokumentů v návaznosti na jejich dlouhodobé uložení.

Tuto koncepci bychom si měli vytvořit jako základní schematický dokument pro přípravu a realizaci celého projektu. Musíme počítat také s tím, že zejména na počátku této složité aktivity bude řada neznámých, které se budou objasňovat teprve postupně.

Souborů principů dlouhodobého ukládání dokumentů je více a je třeba zvolit ten nejvhodnější. Pro výběr správného způsobu dlouhodobého uložení dokumentu musíme být schopni zodpovědět si následující otázky:

  • Jaké dokumenty chceme uchovat?
  • V jakém bezpečnostním režimu se nacházíme?
  • Chceme dokumenty považovat za důvěryhodné?
  • Po jakou minimální dobu hodláme dokumenty ukládat?
  • Ukládáme je pro provozní, nebo pro archivní účely?
  • Umíme zajistit správnou přípravu dokumentů k uložení?

Těchto několik otázek si musíme zodpovědět již při vybudování koncepce pro dlouhodobé ukládání. Jejich zodpovězením získáme cenné podkladové informace a teprve teď můžeme přistoupit nejen k plánování, ale hlavně k realizaci této problematiky. Obecně ale platí, a to jak u úřadu, tak i u komerční firmy, několik zásad, které si stručně nastíníme.

  1. Musíme vybudovat správnou infrastrukturu a to z pohledu stavebního i technického, postavit taková úložiště, aby splňovala všechny potřebné nároky po velmi dlouhou dobu, vybudovat pokud možno několik nezávislých úložišť a zajistit tak zaručené zálohování a zrcadlení dat. Nad úložišti je třeba vybudovat skutečně důvěryhodné spisovny a nastavit technické a procesní principy pro nezpochybnitelnost ukládaných dat.
  2. Uchovávané dokumenty se musejí ukládat v takových datových formátech, které zaručí jejich čitelnost i po několika desetiletích. Musí se zvolit vhodné archivní formáty a zajistit převod obsahu dokumentů do těchto formátů beze ztráty informací. Dále musí být popsán mechanismus principu případné konverze do jiných datových formátů, pokud budou v budoucnu vhodnějšími archivními formáty. Je nutné zajistit i dlouhodobě čitelná metadata a podrobně popsat jejich strukturu, aby i za dlouhou dobu byla možná jejich správná interpretace.
  3. U uchovávaných dokumentů musí být vždy k dispozici věrohodné informace o vzniku, původu a zpracování daného dokumentu. Musí být jasný jeho původce, způsob a důvod, proč byl dokument vytvořen a měly by být známé i informace o všech operacích s dokumentem.
  4. Musí se zajistit nezpochybnitelný princip autenticity všech informací a dokumentů v jednotlivých balíčcích. Nesmíme pouze důvěřovat danému softwaru a zaručenost těchto informací musíme doložit i externím zdrojem (například časovou autoritou, nebo jiným zaručeným způsobem nesvázaným s danou softwarovou technologií). Při dlouhodobém uložení neověřujeme zaručenost původního dokumentu, ale naopak to, že dokument a informace o něm vedené jsou po celou dobu uložení autentické a důvěryhodné.

Typů úložišť pro dlouhodobé ukládání dokumentů je více, nejčastěji se ale i u nás využijí spisovny a repozitáře. Do důvěryhodné digitální spisovny ukládáme (archivujeme) digitální dokumenty pro střednědobou a dlouhodobou periodu uchování. Dokumenty se uloží ve formě balíčků a spisovna musí zajistit po celou dobu uložení zaručenost a důvěryhodnost uchovaných dat. Jedná se o nejbezpečnější způsob dlouhodobého ukládání zejména úředních dokumentů. Digitální repozitář je také garantované úložiště, ale je určeno pro uložení 'nespisových' fondů, je vhodné zejména pro ukládání rozsáhlejších dokumentů neúředního charakteru, nebo dokumentů kulturně-společenského dědictví. Na repozitáře většinou nejsou kladeny takové nároky, na druhou stranu jsou budovány spíše pro zpřístupňování dokumentů, než pro pouhou archivaci.

Tato problematika je ve světě stále ještě oblastí výzkumu. Jedná se o relativně nový, dosud neustálený obor IT. Obor vznikl především pro uchování dat, která primárně vznikla v digitální podobě a nemají tedy žádný analogový protějšek (tzv. digital born). I v Evropě je řada projektů, které se touto problematikou zabývají, často financována z prostředků EU (CASPAR, PLANETS, DPE a další).

V období let 1998 až 2002 byl definován obecný model systému pro dlouhodobé uchovávání dat nazývaný Open Archival Information System (OAIS). Později byl tento model přijat jako ISO standard (ISO 14721:2003). Tento model se stal konceptuálním základem většiny projektů v této oblasti. Kromě toho se stal i terminologickým standardem. Pokud si vybudujete třeba digitální spisovnu na principu OAIS, máte prakticky vyhráno, ale k tomuto standardu se ještě vrátíme.

Hodně odborných otázek se točí kolem bezpečnosti, respektive zajišťování autenticity. Dají se shrnout do jediné: 'Musí spisovna zajišťovat autenticitu? Musíme neustále prověřovat platnost původního digitálního dokumentu?' V okamžiku, kdy je dokument předán k dlouhodobému uložení, již musí být dostupné veškeré informace vedoucí k jeho identifikaci a musí být také známa a prověřena jeho autenticita. Od okamžiku zahájení dlouhodobého uložení se již dokument nesmí pozměnit a z pohledu důvěryhodnosti již by neměl být následně zpochybňován.

Je tedy nutné, aby již ve fázi vytvoření, nebo uzavření, či odeslání digitálního dokumentu, byla známa jeho autenticita. Dokument musí být ještě před uložením (například do digitální spisovny) opatřen takovými autentifikačními prvky, aby bylo možno jej považovat za důvěryhodný a pravý. Sám proces autentifikace a důvěryhodnosti v rámci dlouhodobého ukládání nesmí neustále nutit prověřovat důvěryhodnost původního dokumentu. V době uložení dokumentu pro dlouhodobé uchování musí být dokument považován za důvěryhodný a tato samotná skutečnost nemusí být již dále systémem prověřována.

Přestože legislativa určuje povinnosti zajišťování důvěryhodnosti dokumentů a důvěryhodnosti o nich vedených informací v čase (paragraf 69a, odst. 3 Zákona č. 499/2004 Sb., o archivnictví a spisové službě), není princip důvěryhodnosti, ani elektronických systémů spisové služby (a agendových informačních systémů), ani elektronických spisoven nijak blíže specifikován.

To, že není nijak určeno, za jakých okolností považujeme spisovnu za důvěryhodnou, je poměrně velký problém. Mohlo by se tak zdát, že se opět opíráme o poněkud pochybný výklad stylu 'věříme spisovně'. Při zachování principů stanovených v OAIS a dalších obecných prvků důvěryhodnosti jistě můžeme data uložená ve spisovně za důvěryhodná považovat.

Dokumenty ukládáme ve formě celých balíčků
  • Balíčky po celou dobu uložení nerozdělujeme na dokumenty a metadata, ale naopak s nimi pracujeme jako s jedním objektem;
  • Kromě opatření přímo poskytovaných hardwarem a softwarem spisovny zajistíme i externí prvky důvěryhodnosti (například balíčky, nebo jejich skupiny opatřujeme 'kvalifikovaným časovým razítkem);
  • Veškeré operace s balíčkem musejí být zaprotokolovány a tyto protokoly nesmí být pozměňovány a musí jim být zajištěn stejný princip důvěryhodnosti jako samotným balíčkům.

Tyto povinnosti ale nejsou nikde jednoznačně uvedeny, a tak přesto, že bez nich nemůžeme zajistit skutečně nezávislou důvěryhodnost, mnozí se domnívají, že postačí menší prostředky zabezpečení a zajištění autentifikace.

Nevíme, jak k technologiím a k datům budeme přistupovat za několik desítek let. Dnešní koncept, kdy data ukládáme na hardwarových úložištích a spravujeme softwarovými prostředky, se postupem času může změnit v něco zcela odlišného a nám dnes neznámého a nepředstavitelného. Od vědecko-fantastických představ o globální informační síti představované komunikátory v mozku každého z nás, až po maxiutopickou představu elektronické smrti a návratu k papíru – v tomto rozsahu se pohybujeme, když se dnes snažíme odhadovat budoucnost technologií a informací.

Při jakékoliv skutečně vážné koncepci dlouhodobého ukládání dat a dokumentů bychom se měli soustředit také na obecné principy plánování, jak bude s daty v budoucnu nakládáno. Tím se nemyslí jen technické a lidské zdroje, ale sama koncepce práce s informacemi. Musíme stavět takové systémy, které budou schopny převádět v budoucnu jednoduše data do úplně jiných formátů a datových rozměrů. Proto je nezbytné vše dobře a logicky popsat a popisovat nejen datové struktury, ale i návazné procesy a principy, s jejichž pomocí se procesy vykonávají. Jinak se nám může stát, že budeme mít v budoucnu sice zaručená a věrohodná data, ale buď jim nebudeme rozumět, nebo je nebudeme schopni automatizovaně interpretovat správně.

Mohlo by se zdát, že dlouhodobé ukládání dokumentů je vlastně oblast plná nejistoty a beznaděje. Ti, kteří se tím zabývají se dělí na dvě skupiny. Jedni tvrdí, že stačí nasadit nějaký holý systém – třeba nějaké DMS a tím to mají za vyřízené a ti druzí tomu rozumějí. Ti nevěřícně kroutí hlavou, ale pokud se jich zeptáte, jak se to tedy má dělat, panice rozhodně nepropadnou. Naopak vám poradí, že nemá cenu vymýšlet pověstné 'kolo' a je třeba se inspirovat v zahraničí a již zaběhlými a používanými standardy – a tady nám jako sluníčko ozařující chmurnou krajinu zase vychází OAIS.

Open Archival Information System (OAIS) je referenční model popisující principy budování systémů pro dlouhodobé uchovávání digitálního obsahu. Nepředepisuje konkrétní technologie, ale definuje jednotlivé funkční celky, jejich vzájemné návaznosti a potřebná rozhraní vůči externím systémům a uživatelům. Hlavními funkčními celky jsou vstupní modul (Ingest), modul správy dat (Data Management), archivní úložiště (Archival Storage), přístupový modul (Access). Pro účely správy jsou definovány moduly pro administraci (Administration) a plánování uchovávání (Preservation Planning).

Zároveň OAIS obsahuje doporučení týkající se způsobu dlouhodobého uchování digitálního obsahu, zejména použití balíčků a jejich životního cyklu. Samotné definování jednotlivých cílů ještě nezaručí důvěryhodnost dlouhodobého úložiště. Na základě definice cílů by měly být stanoveny závazné metodiky pro řízení provozu úložiště. Stanovení a dodržování závazných metodik v souladu s jednotlivými dimenzemi metodiky PLATTER umožňuje podrobit takové úložiště provoznímu auditu. Provozní audit především kontroluje, že provoz úložiště se provádí podle nastavených plánů a metodik.

Jak sami vidíte, o těchto věcech by se daly psát stovky takových článků. Jak jsme řekli již na počátku, zde také zmiňujeme teze uvedené v jednom z koncepčních dokumentů, které se připravovaly v rámci dokumentace k tvorbě zejména krajských technologických center. Dokument 'Koncepce řešení dlouhodobého ukládání dokumentů v souvislosti s budováním Technologických center krajů' se sice specializuje na projekty technologických center, ale vychází z dlouhodobé výzkumné činnosti v této oblasti, vždyť ostatně také čeští odborníci přispívali ke vzniku a rozvoji standardů typu OAIS a Platter. V rozsáhlé studii, kterou najdete také třeba na webu www.iio.cz najdete obecný výklad této problematiky a také její zasazení do širšího kontextu. A také několik velmi důležitých doporučení, která je vhodné si prostudovat a zamyslet se nad nimi.

Michal Rada

Napište nám

Veřejná správa online, příloha časopisu Obec a finance
© 2017 Triada, spol. s r. o., webmaster@triada.cz
Zpět na titulní stranu