Vernieuwingstraject KU Leuven IIIF infrastructuur

IIIF logo

In 2014 ging KU Leuven live met het International Image Interoperability Framework (IIIF).  Zes jaar later was het tijd voor een grondige vernieuwing.

Onze eerste IIIF-implementatie kwam tot stand in samenwerking met de Alamire Foundation in het kader van het onderzoeksinfrastructuurproject Alamire Digital Lab (ADL). De Alamire Foundation bestudeert het muzikale verleden van de Lage Landen en digitaliseert hiervoor waardevolle bronnen op locatie. Het ADL-project resulteerde in de ontwikkeling van de Integrated Database for Early Music (IDEM), een veelzijdige databank bedoeld voor de studie, preservering en valorisatie van bronnen van muzikaal erfgoed. De IDEM-infrastructuur bestaat uit verschillende componenten, maar een belangrijk sluitstuk is de beschikbaarheid van de hogeresolutiebeelden als IIIF-manifesten en hun representatie in de Mirador viewer.

IIIF-manifesten en viewers

Over de technische aspecten is al voldoende goede informatie beschikbaar[1]. Kort samengevat is een manifest een JSON-bestand dat alle informatie bevat om de beelden, onderliggende structuur en bijhorende metadata van een object op te roepen en te presenteren. Hierdoor is het eenvoudig en snel delen van digitale objecten voor onderzoek en consultatie mogelijk, zonder deze te moeten downloaden. Een onderzoeker kan aan de hand van de manifest URI - de URI die verwijst naar het JSON-bestand - IIIF-objecten vanuit verschillende locaties binnenhalen in IIIF-viewers. Voor de Alamire Foundation en het ADL-project werd de Mirador viewer opgezet[2]. Deze hogeresolutieviewer laat toe om op eenvoudige wijze beelden van verschillende objecten naast elkaar te leggen voor vergelijkend onderzoek. Deze objecten kunnen uit een of meerdere IIIF-compatibele beeldbanken afkomstig zijn.

IIIF example Idemdatabase.org & Vatican Library
Afbeelding 1: Het Mechels Koorboek in de Integrated Database for Early Music en, in dezelfde viewer, een handschrift uit de Sixtijnse kapel op de website van de bibliotheek van het Vaticaan.

Vernieuwingstraject IIIF-infrastructuur

Hoewel de infrastructuur sinds het live gaan regelmatig werd geüpdatet en kleine aanpassingen werden doorgevoerd, was een grondige herwerking na 6 jaar aangewezen.  De aanleiding hiervan was de sterke groei van collecties, een steeds evoluerend landschap van noden en projecten en enkele pijnpunten uit het verleden die wel wat aandacht konden gebruiken. Eind 2019 werd dan ook gestart met een grondige hernieuwing van onze IIIF-infrastructuur.

De eerste stappen betroffen een herwerking van de hard- en software set-up met een investering in extra servercapaciteit, de bundeling van de code en configuratie in Docker containers, en de vervanging van de IIPImage server door de Cataloupe image server. In 2014 was de IIPImage server de beste keuze naar performantie toe[5] en voldeed deze aan de noden van onze partners. Met de evolutie van IIIF naar de representatie van andere formaten zoals video’s (IIIF versie 3 API’s)[6] wilden we ons echter voorbereiden op de toekomst. De Cantaloupe image server laat toe om naast traditionele TIFF en JPEG2 beelden ook pdf en video’s te tonen.

Een ander hiaat was het ontbreken van een persistente manifest URI[7]. Uiteraard had elk object van bij de start een manifest URI, maar in tegenstelling tot representatie URI’s[8] waren deze niet opgenomen in onze Resolver database die ervoor zorgt dat objecten altijd vindbaar blijven, ook als hun locatie of onderliggende infrastructuur veranderd. De hele manifest-opbouw werd onder de loop genomen en deze zijn nu oproepbaar via persistente resolver URI’s[9]. Verder werd voor de KU Leuven objecten de standaard metadata mapping geïmplementeerd. Met de implementatie van de standaardmapping konden inconsistenties rond visualisering van metadata weggewerkt worden. Bij elk gedigitaliseerd object wordt nu een standaard metadataset getoond met een link naar de volledige metadataset in Limo, de discovery omgeving van KU Leuven. Daarnaast werden de licentievoorwaarden (open data, onder licentie, …) van elk digitaal object bepaald en getoond in de viewers (Open Beeldenbeleid)[10].  De standaardmapping werd ook doorgetrokken naar het manifest waarin de link naar de volledige beschrijving en informatie over de licentievoorwaarden vervat zit.

IIIF voorbeeld KU Leuven Bibliotheken Bijzondere collecties
Afbeelding 2: Metaphysica. Physica. KU Leuven Bibliotheken Bijzondere Collecties, Ms. 211 (https://lib.is/IE4987988/manifest)

Eveneens werd de in 2015 ontwikkelde zoek- en pagineringsfunctie - bedoeld voor het snel laden en doorzoeken van zeer grote manifestcollecties - gebruiksvriendelijk en visueel aantrekkelijk gemaakt.

Voorbeeld zoek- en pagineringsfunctie KU Leuven Mirador viewer
Afbeelding 3: Zoek- en pagineringsfuctie voor het doorzoeken en snel laden van grote manifestcollecties

Nieuwe projecten en toekomstplannen

De vernieuwingswerken vormen een belangrijke basis voor nieuwe projecten. Dankzij het nieuwe grootschalig infrastructuurproject Library of Voices[11] zal de Alamire Foundation in de nabije toekomst ook audiovisueel materiaal toevoegen aan IDEM. Met de vernieuwing van de image server zijn we klaar om deze volgende stappen te nemen. Daarnaast wordt er volop getest met een IIIF annotatie server en IIIF Content Search API voor de toegang tot OCR materiaal via een eigen set-up van de Universal viewer. Binnenkort wordt bijvoorbeeld de Gulden Librije[12] op deze manier ontsloten.

Voorbeeld OCR representatie in KU Leuven Universal viewer
Afbeelding 4: De belydenis van den H. Augustinus, KU Leuven Bibliotheken Artes Erasmushuis, PRETIOSA AUG 1741

Van een grotere orde zijn de projecten rond de ontwikkeling van een Manifest generator in samenwerking met TU Delft en de visualisatie van mutispectrale opnames in Mirador in het kader van het 3Pi project[13] i.s.m. het Book Heritage Lab en KU Leuven Bibliotheken Digitalisering.

De Manifest generator heeft als doel een manifest te genereren op basis van metadata en beelden die zich op verschillende locaties bevinden. In het geval van TU Delft komt de metadata uit CollectiveAccess[14]. De manifesten van de individuele beelden worden echter opgeslagen bij Digirati, een Brits softwarebedrijf. Alle benodigde gegevens worden door middel van OAI-PMH en API’s verzameld uit de verschillende systemen en samengevoegd tot een volwaardig manifest met persistente manifest URI. Vervolgens worden de gegenereerde manifests klaargezet op de Github account van TU Delft. Dit volledige geautomatiseerde proces biedt ons in de toekomst de mogelijkheid om flexibel om te springen met systemen. Zo kan de metadata van bibliothecair erfgoed uit ons bibliotheeksysteem in MARC-formaat komen en gecombineerd worden met de beelden bewaard in Teneo, terwijl archiefmateriaal beschreven in Lias en beschikbaar in EAD-formaat eveneens kan opgehaald en samengevoegd worden met de beelden. Hierdoor is onze IIIF-infrastructuur volledig systeemonafhankelijk.

De focus in het 3Pi project ligt op interdisciplinair onderzoek naar fragiel historisch documentair erfgoed, zoals manuscripten op papyrus, perkament en papier, waarbij wetenschappelijke beeldvorming, analytische gegevens, conserveringswetenschappen en valorisatie worden betrokken. Een belangrijk aspect is de organisatie, langetermijnbewaring en visualisatie van de wetenschappelijke beeldvorming met onder meer multispectrale belichting. In het kader van dit project wordt de Mirador viewer uitgebreid om onderzoekers een gebruiksvriendelijke manier te bieden om de verschillende representaties van één object te consulteren en te combineren. Mogelijk wordt er verder gewerkt op basis van het pilootproject van Preservation Research and Testing Division van de Library of Congress[15], maar hiervoor is bijkomend onderzoek noodzakelijk.

Voorbeeld visualsatie lagen in Mirador viewer
Afbeelding 5: prtd.app door de Preservation Research and Testing Division van de Library of Congress

Conclusie

Het International Image Interoperability Framework staat niet stil en het groeiende aantal collecties, gebruikers, noden en ideeën maakt een continue investering van tijd en middelen noodzakelijk.  Toch heeft IIIF zich sinds 2014 bewezen als een duurzame en hoogwaardige oplossing om digitale bronnen te delen over de grenzen van lokale instellingen heen. Dankzij projecten als het Alamire Digital Lab en recent Library of Voices en 3Pi, is innovatie en het investeren in verdere onwikkelingen binnen IIIF mogelijk.

[1] Officiële documentatie: iiif.io ; Nederlandstalige informatie: projectcest.be
[2] Meer informatie over het oorspronkelijke project: libis.be/mirador-iiif/ ; libis.be/alamirefoundation_idem  
[3] Idemdatabase.org – ‘Het Mechels Koorboek’ manifest: https://lib.is/IE9002686/manifest
[4] Bibliotheca Vaticana – ‘Capp.Sist.160’ manifest: https://digi.vatlib.it/iiif/MSS_Capp.Sist.160/manifest.json 
[5] Zie: Getty Common Image Service, Research & Design Report, Stefano Cossu op https://drive.google.com/drive/folders/1Vn4Ptx8UN5s-Tf7o1OdPWPchT109-sJe
[14] Meer informatie over de TU Delft collectiedatabank en website: libis.be/tu_delft
[15] Preservation Research and Testing Division LoC: prtd.app ; https://www.loc.gov/preservation/about/rt/index.html ;


Collecties van Europese topuniversiteiten samengebracht in ReIReSearch databank

 Nieuwe bronnen voor religiewetenschappers (persbericht)

Collecties van Europese topuniversiteiten samengebracht in ReIReSearch databank

ReIReS, het Europese onderzoeksproject voor religiestudies lanceert deze maand ReIReSearch, een geïntegreerde onderzoeksdatabank voor religiestudies. ReIReSearch is ontwikkeld door KU Leuven-LIBIS in samenwerking met een Europees consortium van twaalf partners. Deze partners werken samen binnen het kader van Horizon 2020, een onderzoeks- en innovatieprogramma van de Europese Unie dat onderzoek en innovatie financiert met een focus op de grootste problemen van deze tijd. De databank combineert historische collecties van verschillende Europese onderzoeksinstellingen en biedt religiewetenschappers een nieuw zoekinstrument en een betere toegang tot bronnen. 

 Uitdagingen voor onderzoekers

Religiewetenschappers ze onderzoeken gebeurtenissen die plaatsvonden in verschillende periodes, contexten en culturen. Ze gebruiken een veelheid aan bronnen, soorten data en onderzoeksmethoden. Die bronnen die zijn soms moeilijk te vinden. Zelfs universiteitsbibliotheken met een online catalogus blijven vaak onbekend voor onderzoekers buiten de eigen instelling. Onderzoekers zijn verder beperkt in hun zoektocht naar nieuwe informatie. Heel wat collecties, eenmaal dat ze gevonden zijn, kunnen enkel via eigen interfaces benaderd worden. 

 Betere toegang

ReIReSearch helpt wetenschappers in hun zoektocht met geïntegreerde zoekmachine. Tegelijkertijd maakt de onderzoeksdatabank minder zichtbare datasets beschikbaar voor een breed publiek. Het doel van ReIReSearch is om nog meer gegevens te integreren en beschikbaar te maken op één platform. Het ontwerp van dit platform is tot stand gekomen met hulp van de onderzoekers die hun behoeften uitgebreid hebben beschreven.


Nieuwe technologische mogelijkheden maken het nu eenvoudig om grote hoeveelheden data te vinden, te ontsluiten en opnieuw te gebruiken. Door belangrijke collecties van instellingen uit heel Europa samen te brengen, kunnen onderzoekers de kwaliteit en de efficiëntie van hun onderzoek verbeteren. Academici profiteren daarbij van een betere toegang tot informatie.


ReIReSearch bevat momenteel bijdragen van de academische bibliotheken van de Fondazione per le Scienze Religiose Giovanni XXIII, de Johannes Gutenberg Universiteit in Mainz, KU Leuven en de Universiteit van Sofia. Op dit moment bevat ReIReSearch onder andere Hebreeuwse manuscripten daterend van 1700 tot 1920 van de Joodse gemeenschap van Mainz, een gedigitaliseerde versie van de bronnen van kerkelijke concilies en boeken die betrekking hebben op Slavische studies en religie. Vanuit de collectie van KU Leuven Bibliotheken wordt een selectie van boeken en manuscripten uit de Maurits Sabbe Bibliotheek en werken met betrekking tot religie uit de Oost-Aziatische Collecties en Bijzondere Collecties ontsloten. ReIReSearch levert ook zoekresultaten op uit de Index Religiosus-database van Brepols Publishers voor gebruikers die een abonnement hebben.

Door het toevoegen van data van andere (academische) instellingen en onderzoeksdatabanken wil ReIReS het bereik en gebruik verder vergroten.


ReIReSearch is toegankelijk via: https://reiresearch.eu
Over ReIReS: https://reires.eu
Over LIBIS: https://bib.kuleuven.be/libis
Over de Faculteit Theologie en Religiewetenschappen: https://theo.kuleuven.be/