• nl
beeldband

Verslag studiedag webarchivering 30 oktober 2014

2 december 2014 Gepubliceerd door

Tekst: Kirsten Hulsker en Peter de Bode
Redactie: Jeanine Tieleman

Hoge opkomst studiedag webarchivering NCDD, KB en NIBG

Op de studiedag ‘De vluchtigheid voorbij: over webarchivering in Nederland’, die de Nationale Coalitie Digitale Duurzaamheid (NCDD), de Koninklijke Bibliotheek (KB) en het Nederlands Instituut voor Beeld en Geluid (NIBG) in Hilversum organiseerden, kwamen zo’n 130 professionals af. Er was een afwisselend programma samengesteld, waar zowel archiefvormers èn gebruikers aan het woord kwamen.

DSC_0252

Aanleiding

Het wereldwijde web zoals wij dat nu kennen, bestaat inmiddels bijna 25 jaar en is niet meer weg te denken uit ons dagelijks leven. In die 25 jaar zijn wij er steeds afhankelijker van geworden, zowel voor het verzamelen van informatie als voor het delen van kennis. Desondanks is er nog maar weinig aandacht voor het archiveren van websites en wordt dit slechts door enkele instellingen op structurele basis gedaan. Een van de redenen hiervoor is dat het archiveren van een website niet zo eenvoudig, omdat deze veelal is opgebouwd uit een grote hoeveelheid aan elkaar gekoppelde objecten en links naar andere websites. Daarnaast vormt de korte levensduur van websites een hindernis: om een compleet archief aan te kunnen bieden, moeten alle wijzigingen gearchiveerd worden en dat vergt veel inspanning.

Archiefvormers en gebruikers aan het woord

Het doel van de studiedag was om meer inzicht te geven in en aandacht te vragen voor de praktijk van webarchivering in Nederland. Verschillende organisaties in Nederland houden zich bezig met het archiveren van websites. Maar wie doet wat? En waarom? En is dat genoeg? Welke tools worden daarbij gebruikt? En is het verzamelde archief ook bruikbaar en toegankelijk voor onderzoekers? Wat zijn de wensen en eisen die gebruikers aan een webarchief stellen en kunnen de webarchivarissen daaraan tegemoet komen?

Introductie door Marcel Ras (NCDD)

Marcel Ras (NCDD) bijt de spits af met een korte introductie over webarchivering. In Wikipedia wordt webarchivering als volgt gedefinieerd: het preserveren van het world wide web in een digitaal archief. Het doel van de studiedag is om enerzijds in kaart brengen welke instellingen zich hiermee bezig houden en wie de/hun gebruikers zijn, en anderzijds om kennis en expertise uit te wisselen en tot samenwerking te komen op relevante (deel)gebieden.
Bekijk de presentatie van Marcel Ras.

DSC_0253

Keynote: Working together to archive the UK Web

Het tweede onderdeel van het programma was de keynote van Helen Hockx-Yu, hoofd afdeling Webarchivering van de British Library (BL). Zij legde uit hoe webarchivering in het Verenigd Koninkrijk is georganiseerd. Zes bibliotheken met een wettelijke depottaak houden zich daar met deze activiteit bezig. De afgelopen tien jaar zijn er 14.000 websites door hen gearchiveerd en via de website van de British Library toegankelijk gemaakt. Vooraf moet aan de afzonderlijke webbeheerders toestemming voor opname worden gevraagd, want de wetgeving inzake het wettelijk depot regelde tot april 2013 alleen de archivering van papieren publicatievormen. In april 2013 is de Non-Print Legal Deposit Regulations 2013 in werking getreden en nu is de BL in staat om het gehele UK-domein te archiveren zonder daar vooraf toestemming voor te hoeven vragen. De enige beperking is dat die gearchiveerde websites alleen binnen de muren van de zes ‘wettelijke depot’-bibliotheken geraadpleegd mogen worden. Daardoor zijn er nu twee soorten ‘webarchiefcollecties’ ontstaan: een openbare, waar vooraf toestemming voor is gevraagd en die op internet getoond mag worden en een niet-openbare die is opgebouwd dankzij een aanpassing van de depotwetgeving. Daarnaast wordt nog een derde collectie gevormd door de UK-websites die tussen 1996 en 2013 door het Internet Archive zijn geharvest aan de BL beschikbaar zijn gesteld. Ook voor deze laatste collectie geldt dat de toegankelijkheid beperkt is. BL hecht veel belang aan het contact met de gebruikers van het webarchief. Een van de manieren om deze groep bij het selectieproces te betrekken is door het bestuderen van onderzoeksaanvragen die op diverse manieren binnen komen. Hierdoor krijgt de BL inzicht in de informatie die gebruikers uit het materiaal (willen) halen en krijgt de BL tevens inzicht hoe zij haar collectie beter toegankelijk kan maken. Zo geeft BL onderzoekers inzicht in hun selectieprocessen door bijvoorbeeld een crawl log ter beschikking te stellen, omdat dit voor onderzoekers belangrijke informatie is.
Website: http://www.webarchive.org.uk/ukwa.
Bekijk de presentatie van Helen Hockx-Yu.

DSC_0260

Het eeuwigdurende nu: Webarchivering bij de KB

René Voorburg, in de Koninklijke Bibliotheek verantwoordelijk voor de kwaliteit van de binnengehaalde (‘geharveste’) websites, gaf een overzicht van de webarchiveringsactiviteiten van deze instelling. De webcollectie van de KB telt na zeven jaar ruim 6.000 websites, die minstens jaarlijks worden geharvest. Net zoals in het Verenigd Koninkrijk moet in Nederland ook toestemming aan de webbeheerders worden gevraagd. De KB heeft gekozen voor de zogenaamde opt out-methode, waarbij de webbeheerder een e-mail ontvangt waarin wordt gemeld dat de website in een selectie is opgenomen en tevens wordt uitgelegd wat het belang van een webarchief is. Indien de webbeheerder dit niet wil, kan hij dit binnen een maand laten weten. Tot op heden is het nog maar 50 keer voorgekomen dat een beheerder heeft laten weten geen prijs te stellen op opname. De motivatie hierachter heeft over het algemeen te maken met auteursrecht.
Bij de selectie van te archiveren websites houdt de KB rekening met enkele andere initiatieven op dit gebied in het land. Zo worden websites van politieke partijen (Archipol, Groningen) en lokale Rotterdamse websites (Stadsarchief Rotterdam) bijvoorbeeld niet in de selectie meegenomen, net zo min als websites met een extreem karaker, sociale media en websites die vanwege de technische structuur niet te harvesten zijn. Tresoar (Leeuwarden) vult de selectie van de KB aan met Friese websites.
Website: https://www.kb.nl/organisatie/onderzoek-expertise/e-depot-duurzame-opslag/webarchivering.
Bekijk de presentatie van René Voorburg.

Webarchivering in het audiovisuele domein

Dat niet alle websites zijn te archiveren, lieten Julia Vytopil (NIBG) en Chloé Martin (Internet Memory Research, IMR) zien in hun co-presentatie over audiovisuele websites. NIBG en IMR hebben zich aangesloten bij het project Living Web Archives (LiWA 2008-2011). Doel van dit project was om methoden te ontwikkelen waarbij web content die nu moeilijk te harvesten is, in het webarchief kan worden opgenomen. Een duidelijk voorbeeld hiervan is audiovisuele content. Als het al mogelijk is om dergelijke websites compleet te archiveren, dan komt het beeldmateriaal in lage resolutie binnen. Webarchivering kan zo niet de plaats innemen van de traditionele archiveringstaken van NIBG. Een oplossing kan liggen in het koppelen van het webarchief aan het audiovisuele archief. Omroepwebsites worden dan geharvest op het moment van de (corresponderende) live-uitzending.
NIBG archiveert momenteel een beperkt aantal websites, maar de selectie wordt uitgebreid. De selectie zal ook websites óver media bevatten. Net zoals andere instellingen is NIBG bij archiveren van websites ook gebonden aan het auteursrecht en de privacywetgeving. Een website als ‘Vermist’ is dan ook vooralsnog niet opgenomen in de selectie.
IMR werkt ondertussen gestaag aan het uitbreiden van de technische mogelijkheden (tools en platform) waarmee gangbare problemen kunnen worden ondervangen. De urgentie is groot omdat dit materiaal niet alleen voor toekomstige generaties belangrijk is maar ook, als gevolg van de elkaar snel opvolgende wijzigingen in het omroepbestel en het medialandschap, voor hedendaagse onderzoekers, journalisten en archivarissen. Chloé geeft uitleg over de werkwijze van IMR en gaat daarbij in op vragen als wat?, waarom?, voor wie? en hoe? Het Het IMR-project ondersteunt niet alleen in technisch opzicht, maar helpt ook de processen te structureren die nodig zijn voor audiovisuele webarchivering. Ze demonstreert dit aan de hand van enkele voorbeelden.
Website: http://www.beeldengeluidwebarchief.nl/ http://archivethe.net/en/index.php/about/
Bekijk de presentatie van Julia Vytopil en Chloé Martin.

Bieslog: Van digitale voorhoede tot archiveringspuzzel

Na de lunch kwamen de gebruikers aan het woord. Wim de Bie en GertJan Kuiper (VPRO) haalden herinneringen op aan Bieslog (2002-2008), een weblog dat zijn tijd ver vooruit was. Niet alleen was op het web publiceren destijds vernieuwend, ook de combinatie van tekst en zelf gemaakte audiovisuele opnames was uitermate vooruitstrevend. Beeld en geluid vormden de belangrijkste componenten. Vóór Bieslog startte De Bie in 1998 al een website waar met behulp van een webcam met tussenpozen van 30 seconden een spreuk van de dag werd opgebouwd. Ondanks toezeggingen van de VPRO verdwenen zowel deze website als Bieslog van het web. Dankzij gearchiveerde versies en het door Kuiper bewaarde beeld- en geluidmateriaal is NIBG er in geslaagd om Bieslog ten dele te reconstrueren.
Bekijk de presentatie van Wim de Bie en GertJan Kuiper.

DSC_0266

WebART: Hoe maak je webarchieven bruikbaar voor de wetenschap?

Als laatste spreker gaf Hugo Huurdeman van de Universiteit van Amsterdam (UvA) inzicht in de activiteiten van WebART. In dit onderzoeksproject staan de onderzoekers/gebruikers van een webarchief centraal, want momenteel is er bij de webarchiefbouwers nog weinig aandacht voor deze groep. Een van de ontwikkelde tools is WebARTist (Web Archives Temporal Information Search System), die mogelijkheden biedt tot onderzoek, analyse en visualisatie van webarchiefdata. Ontwikkelaars werken samen met gebruikers in workshops en summerschools om gezamenlijk mogelijkheden te ontwikkelen. WebART krijgt regelmatig de vraag of het mogelijk is om data te exporteren, waarna met eigen tools verder onderzoek verricht kan worden. Een andere constatering is dat onderzoekers minder geïnteresseerd zijn in afzonderlijke websites, maar het webarchief voornamelijk gebruiken voor data mining. http://www.webarchiving.nl/

Paneldiscussie: de webarchivaris en de gebruiker

Tot slot verenigden publiek en sprekers zich onder leiding van Jantje Steenhuis (Stadsarchief Rotterdam) in een levendige discussie aan de hand van een viertal stellingen. Een uur lang werden ideeën uitgewisseld over de wenselijkheid van opgelegde regels voor webontwerpers in de publieke sector, het wel of niet archiveren van sociale media en het nut van samenwerking tussen de instellingen die zich met webarchivering bezighouden. Over het laatste was iedereen het eens.
Bekijk de stellingen.

SONY DSC

Conclusie

De uitkomst van deze bijeenkomst was dan ook het verzoek aan de NCDD om deze samenwerking te coördineren. In de komende weken zal de NCDD onderzoeken hoe deze samenwerking tot stand gebracht kan worden.

 

 

Gecategoriseerd in :

Commententaren zijn gesloten.



Top