Pokroky v projektu v roce 2018

Vědečtí pracovníci nebo pracovníci paměťových institucí stále častěji pracují s digitalizovanými zdroji. V projektu INDIHU postupně vznikají inovativní řešení, která jim práci s elektronickými daty usnadní. A to na dvou úrovních. Část vyvíjeného softwaru je zaměřena na usnadnění samotné vědecké práce. Zde se jedná zejména o projekt „Virtuální znalostní báze“ nebo možnost digitalizace dokumentů pomocí OCR. Druhá část je software INDIHU Exhibition, který umožní vytvářet zajímavou online prezentaci vědecké práce formou virtuálních výstav pro širší publikum.

Virtuální výstavy

Software jsme nazvali INDIHU Exhibition. V první polovině roku probíhaly intenzivní programátorské práce, které provádí brněnská firma inQool. Zástupci společnosti nás pravidelně osobně informovali o postupech a celkově práce probíhaly podle předem stanoveného harmonogramu. Při vývoji probíhala užitečná spolupráce se
specialistou na tvorbu uživatelských rozhraní z firmy Interaction4u. Vizuální stránku a grafickou čistotu výsledného produktu jsme konzultovali s pracovníky grafického studia Dipozitiv.

V polovině roku se nám do rukou dostala první „použitelná“ verze softwaru, který jsme začali v rámci celého řešitelského týmu intenzivně testovat. Jako platformu pro komunikaci a zpracovávání chyb a podnětů k vylepšení se osvědčil GitHub. Celý vývoj je transparentní a otevřený již od samého počátku a je možné ho sledovat právě na GitHub.

V zimních měsících pracujeme na tvorbě manuálu, jehož finální podoba bude dostupná uživatelům v prvním čtvrtletí následujícího roku. V roce 2019 máme v úmyslu zrealizovat v rámci zapojených institucí kompletní výstavy, které by mohli inspirovat další potenciální uživatele. Doposud má vznik INDIHU Exhibition mezi odbornou veřejností kladnou odezvu.

OCR – digitalizace materiálů

Úspěšně proběhla příprava online OCR řešení založeného na open source OCR nástroji Tesseract. OCR, neboli optické rozpoznávání znaků (z anglického Optical Character Recognition) umožňuje uživatelům z fotografie textu vytvořit digitální dokument v několika formátech. Pokud uživatel zvolí např. formát .txt, může s textem pracovat obvyklým způsobem. Naše řešení je dostupné ve webovém prohlížeči, což je velkým přínosem pro odbornou veřejnost, neboť nástroj Tesseract nemá jednoduché uživatelské rozhraní.

Virtuální znalostní báze

Zatím trochu neintuitivní název „Virtuální znalostní báze“ v sobě skrývá nástroj, který v budoucnu umožní vědcům či studentům shromažďovat dostupné materiály či svoje vlastní nápady, texty či fotografie. Nástroj nebude pouhým adresářovým systémem či shromaždištěm, ale umožní vědcům efektivně vyhledávat informace, označovat si je, shlukovat je do celků, psát si k nim poznámky. Naším cílem je vytvořit nástroj, díky kterému přijdou uživatelé na neotřelé myšlenky.

V posledním čtvrtletí jsme detailněji rozebrali náš záměr a pečlivě se seznámili s ostatními nástroji, které slouží k práci s dokumenty a informacemi, abychom nekopírovali již existující řešení. Vzniklo tak zadání pro firmu InQool.

Co nás čeká v roce 2019

Průběžně probíhají práce na přípravě zastřešujícího řešení, které zpřístupní jednotlivé digitální databáze zapojených institucí a ústavů. Postupně upravujeme data, jejichž nesourodost rozhodně znamenala výzvu pro jejich sjednocení, a testujeme řešení ve společném vyhledávacím rozhraní zajištěném v open source softwaru VuFind.

V nadcházejícím roce budeme věnovat pozornost zejména virtuální znalostní bázi. Dále budeme podnikat další logické kroky k vytvoření zastřešující platformy INDIHu pro jednotný přístup k databázím ústavů. Ze zřetele nepustíme ani již z větší části dokončené výstupy, neboť je budeme používáním průběžně testovat, optimalizovat a případně i vylepšovat.

Comments are closed.