Vernieuwingstraject KU Leuven IIIF infrastructuur

IIIF logo

In 2014 ging KU Leuven live met het International Image Interoperability Framework (IIIF).  Zes jaar later was het tijd voor een grondige vernieuwing.

Onze eerste IIIF-implementatie kwam tot stand in samenwerking met de Alamire Foundation in het kader van het onderzoeksinfrastructuurproject Alamire Digital Lab (ADL). De Alamire Foundation bestudeert het muzikale verleden van de Lage Landen en digitaliseert hiervoor waardevolle bronnen op locatie. Het ADL-project resulteerde in de ontwikkeling van de Integrated Database for Early Music (IDEM), een veelzijdige databank bedoeld voor de studie, preservering en valorisatie van bronnen van muzikaal erfgoed. De IDEM-infrastructuur bestaat uit verschillende componenten, maar een belangrijk sluitstuk is de beschikbaarheid van de hogeresolutiebeelden als IIIF-manifesten en hun representatie in de Mirador viewer.

IIIF-manifesten en viewers

Over de technische aspecten is al voldoende goede informatie beschikbaar[1]. Kort samengevat is een manifest een JSON-bestand dat alle informatie bevat om de beelden, onderliggende structuur en bijhorende metadata van een object op te roepen en te presenteren. Hierdoor is het eenvoudig en snel delen van digitale objecten voor onderzoek en consultatie mogelijk, zonder deze te moeten downloaden. Een onderzoeker kan aan de hand van de manifest URI - de URI die verwijst naar het JSON-bestand - IIIF-objecten vanuit verschillende locaties binnenhalen in IIIF-viewers. Voor de Alamire Foundation en het ADL-project werd de Mirador viewer opgezet[2]. Deze hogeresolutieviewer laat toe om op eenvoudige wijze beelden van verschillende objecten naast elkaar te leggen voor vergelijkend onderzoek. Deze objecten kunnen uit een of meerdere IIIF-compatibele beeldbanken afkomstig zijn.

IIIF example Idemdatabase.org & Vatican Library
Afbeelding 1: Het Mechels Koorboek in de Integrated Database for Early Music en, in dezelfde viewer, een handschrift uit de Sixtijnse kapel op de website van de bibliotheek van het Vaticaan.

Vernieuwingstraject IIIF-infrastructuur

Hoewel de infrastructuur sinds het live gaan regelmatig werd geüpdatet en kleine aanpassingen werden doorgevoerd, was een grondige herwerking na 6 jaar aangewezen.  De aanleiding hiervan was de sterke groei van collecties, een steeds evoluerend landschap van noden en projecten en enkele pijnpunten uit het verleden die wel wat aandacht konden gebruiken. Eind 2019 werd dan ook gestart met een grondige hernieuwing van onze IIIF-infrastructuur.

De eerste stappen betroffen een herwerking van de hard- en software set-up met een investering in extra servercapaciteit, de bundeling van de code en configuratie in Docker containers, en de vervanging van de IIPImage server door de Cataloupe image server. In 2014 was de IIPImage server de beste keuze naar performantie toe[5] en voldeed deze aan de noden van onze partners. Met de evolutie van IIIF naar de representatie van andere formaten zoals video’s (IIIF versie 3 API’s)[6] wilden we ons echter voorbereiden op de toekomst. De Cantaloupe image server laat toe om naast traditionele TIFF en JPEG2 beelden ook pdf en video’s te tonen.

Een ander hiaat was het ontbreken van een persistente manifest URI[7]. Uiteraard had elk object van bij de start een manifest URI, maar in tegenstelling tot representatie URI’s[8] waren deze niet opgenomen in onze Resolver database die ervoor zorgt dat objecten altijd vindbaar blijven, ook als hun locatie of onderliggende infrastructuur veranderd. De hele manifest-opbouw werd onder de loop genomen en deze zijn nu oproepbaar via persistente resolver URI’s[9]. Verder werd voor de KU Leuven objecten de standaard metadata mapping geïmplementeerd. Met de implementatie van de standaardmapping konden inconsistenties rond visualisering van metadata weggewerkt worden. Bij elk gedigitaliseerd object wordt nu een standaard metadataset getoond met een link naar de volledige metadataset in Limo, de discovery omgeving van KU Leuven. Daarnaast werden de licentievoorwaarden (open data, onder licentie, …) van elk digitaal object bepaald en getoond in de viewers (Open Beeldenbeleid)[10].  De standaardmapping werd ook doorgetrokken naar het manifest waarin de link naar de volledige beschrijving en informatie over de licentievoorwaarden vervat zit.

IIIF voorbeeld KU Leuven Bibliotheken Bijzondere collecties
Afbeelding 2: Metaphysica. Physica. KU Leuven Bibliotheken Bijzondere Collecties, Ms. 211 (https://lib.is/IE4987988/manifest)

Eveneens werd de in 2015 ontwikkelde zoek- en pagineringsfunctie - bedoeld voor het snel laden en doorzoeken van zeer grote manifestcollecties - gebruiksvriendelijk en visueel aantrekkelijk gemaakt.

Voorbeeld zoek- en pagineringsfunctie KU Leuven Mirador viewer
Afbeelding 3: Zoek- en pagineringsfuctie voor het doorzoeken en snel laden van grote manifestcollecties

Nieuwe projecten en toekomstplannen

De vernieuwingswerken vormen een belangrijke basis voor nieuwe projecten. Dankzij het nieuwe grootschalig infrastructuurproject Library of Voices[11] zal de Alamire Foundation in de nabije toekomst ook audiovisueel materiaal toevoegen aan IDEM. Met de vernieuwing van de image server zijn we klaar om deze volgende stappen te nemen. Daarnaast wordt er volop getest met een IIIF annotatie server en IIIF Content Search API voor de toegang tot OCR materiaal via een eigen set-up van de Universal viewer. Binnenkort wordt bijvoorbeeld de Gulden Librije[12] op deze manier ontsloten.

Voorbeeld OCR representatie in KU Leuven Universal viewer
Afbeelding 4: De belydenis van den H. Augustinus, KU Leuven Bibliotheken Artes Erasmushuis, PRETIOSA AUG 1741

Van een grotere orde zijn de projecten rond de ontwikkeling van een Manifest generator in samenwerking met TU Delft en de visualisatie van mutispectrale opnames in Mirador in het kader van het 3Pi project[13] i.s.m. het Book Heritage Lab en KU Leuven Bibliotheken Digitalisering.

De Manifest generator heeft als doel een manifest te genereren op basis van metadata en beelden die zich op verschillende locaties bevinden. In het geval van TU Delft komt de metadata uit CollectiveAccess[14]. De manifesten van de individuele beelden worden echter opgeslagen bij Digirati, een Brits softwarebedrijf. Alle benodigde gegevens worden door middel van OAI-PMH en API’s verzameld uit de verschillende systemen en samengevoegd tot een volwaardig manifest met persistente manifest URI. Vervolgens worden de gegenereerde manifests klaargezet op de Github account van TU Delft. Dit volledige geautomatiseerde proces biedt ons in de toekomst de mogelijkheid om flexibel om te springen met systemen. Zo kan de metadata van bibliothecair erfgoed uit ons bibliotheeksysteem in MARC-formaat komen en gecombineerd worden met de beelden bewaard in Teneo, terwijl archiefmateriaal beschreven in Lias en beschikbaar in EAD-formaat eveneens kan opgehaald en samengevoegd worden met de beelden. Hierdoor is onze IIIF-infrastructuur volledig systeemonafhankelijk.

De focus in het 3Pi project ligt op interdisciplinair onderzoek naar fragiel historisch documentair erfgoed, zoals manuscripten op papyrus, perkament en papier, waarbij wetenschappelijke beeldvorming, analytische gegevens, conserveringswetenschappen en valorisatie worden betrokken. Een belangrijk aspect is de organisatie, langetermijnbewaring en visualisatie van de wetenschappelijke beeldvorming met onder meer multispectrale belichting. In het kader van dit project wordt de Mirador viewer uitgebreid om onderzoekers een gebruiksvriendelijke manier te bieden om de verschillende representaties van één object te consulteren en te combineren. Mogelijk wordt er verder gewerkt op basis van het pilootproject van Preservation Research and Testing Division van de Library of Congress[15], maar hiervoor is bijkomend onderzoek noodzakelijk.

Voorbeeld visualsatie lagen in Mirador viewer
Afbeelding 5: prtd.app door de Preservation Research and Testing Division van de Library of Congress

Conclusie

Het International Image Interoperability Framework staat niet stil en het groeiende aantal collecties, gebruikers, noden en ideeën maakt een continue investering van tijd en middelen noodzakelijk.  Toch heeft IIIF zich sinds 2014 bewezen als een duurzame en hoogwaardige oplossing om digitale bronnen te delen over de grenzen van lokale instellingen heen. Dankzij projecten als het Alamire Digital Lab en recent Library of Voices en 3Pi, is innovatie en het investeren in verdere onwikkelingen binnen IIIF mogelijk.

[1] Officiële documentatie: iiif.io ; Nederlandstalige informatie: projectcest.be
[2] Meer informatie over het oorspronkelijke project: libis.be/mirador-iiif/ ; libis.be/alamirefoundation_idem  
[3] Idemdatabase.org – ‘Het Mechels Koorboek’ manifest: https://lib.is/IE9002686/manifest
[4] Bibliotheca Vaticana – ‘Capp.Sist.160’ manifest: https://digi.vatlib.it/iiif/MSS_Capp.Sist.160/manifest.json 
[5] Zie: Getty Common Image Service, Research & Design Report, Stefano Cossu op https://drive.google.com/drive/folders/1Vn4Ptx8UN5s-Tf7o1OdPWPchT109-sJe
[14] Meer informatie over de TU Delft collectiedatabank en website: libis.be/tu_delft
[15] Preservation Research and Testing Division LoC: prtd.app ; https://www.loc.gov/preservation/about/rt/index.html ;










Geen opmerkingen:

Een reactie posten