Hoe gaat Clio in de toekomst om met digitale tools? Bieden computertechnieken echt ongehoord nieuwe hoeveelheden onderzoeksgegevens en onderzoeksmethoden of zijn historici op de traditionele manier nog voldoende met inventaris, notitieblok, potlood en vergrootglas toegerust? Op dinsdag 14 en woensdag 15 januari 2014 stonden deze vragen centraal op een congres in het Huygens ING instituut in Den Haag. De manier waarop het allemaal aan de orde werd gesteld, was volgens die van een THAT Camp, een afkorting voor een bijeenkomst over The Humanities And Technology. De opzet daarvan is dat men zowel praktisch als theoretisch met een onderwerp bezig gaat en in gesprek kan gaan met zowel experts als gebruikers. De deelnemers werden ruim bediend, o.a. door demonstraties van specifieke onderzoekscomputerprogramma’s. Ook het snel leren van programmeren werd niet geschuwd en wie dat wilde, kon zich bekwamen in het bouwen van een website. Het hele programma is te vinden via thehague2014.thatcamp.org/schedule/.
Globaal kent de wereld van digital humanities twee takken: data mining en text mining. Text mining gaat uit van gescande tekstuele bronnen, die met gebruik van OCR (Optical Character Reading) software wordt getransformeerd tot een tekstbestand met een bepaalde foutmarge. Meestal is dat een woordenlijst, die met trefwoorden en door patroonherkenning kan worden onderzocht. Vooral voor taalkundigen is dat nuttig. Historici hebben meer aan data mining, waarin grote verzamelingen databases zoveel gegevens leveren, dat er in jargon gesproken wordt over “big data”. Een voorbeeld daarvan is het online krantenarchief van de Koninklijke Bibliotheek (kranten.kb.nl/search), met zo’n 80 miljoen artikelen uit 1453 verschillende kranten. De informatie is dan is te groot om handmatig door onderzoekers te worden verwerkt. Daar moeten speciale programma’s bij te hulp komen. Historici willen de hoeveelheid woorden of data graag door zo’n applicatie via een subjectieve weging laten filteren op relevantie voor hun onderzoek. Programmeurs willen daar liever niet aan, omdat subjectieve wegingen nu eenmaal moeilijk te programmeren zijn. Beide groepen kwamen in Den Haag in gesprek met elkaar. Behalve technische en subjectieve problemen werd er ook gesproken over juridische voetangels rondom digitale onderzoeksprojecten.
Wie zich over de toekomst van digital humanities in Nederland van tevoren wilde inlezen, werd daarbij ruimschoots op weg geholpen door de nieuwe uitgave van de BMGN, het peer reviewed tijdschrift van het Koninklijk Nederlands Historisch Genootschap (KNHG), vanaf nu geheel volgens de regels voor Open Access (www.knaw.nl/nl/thematisch/open-access-en-digitale-duurzaamheid/open-access) gratis beschikbaar op de site www.bmgn-lchr.nl/index.php/bmgn/issue/current/showToc. Daarin viel o.a. te lezen dat van het gehele corpus aan in Nederland bewaard archiefmateriaal nu nog maar enkele procenten zijn gedigitaliseerd en dat het niet haalbaar is om dat vlot tot 10 of 20% te brengen, o.a. vanwege de kosten. Toch menen archivarissen een recente trend te kunnen bespeuren dat onderzoekers vooral digitale bronnen in hun onderzoek gebruiken en de originele papieren (“analoge”) bronnen laten liggen. Een discussie hierover kwam helaas niet uit de verf.
Voor iedere in geschiedenis geïnteresseerde was de lancering van de nieuwe website van het KNHG en Huygens ING van belang: www.historici.nl. De oude website had al een belangrijke agenda, de nieuwe site voegt hier nog de mogelijkheid aan toe om onderzoeksgegevens te delen of lid te worden van groepen en communities rondom thema’s als de Gouden Eeuw, VOC, de Eerste en Tweede Wereldoorlog, reis- en digitale geschiedenis. Een welkome vernieuwing.
Over digital humanities is recent een lezingenserie door de KNAW gestart; zie hiervoor www.knaw.nl/nl/actueel/agenda/digital-humanities-hype-of-revolutie#! Over het copyright van online publicaties als databases geeft libereurope.eu/copyrightconsultation nuttige informatie.