Tags
Het internet is een zegen voor elke onderzoeker die gebruik maakt van corpora, enquêtes, lijsten en andere materiaalverzamelingen. Als men tegenwoordig zelf gegevens verzamelt, komen die rechtstreeks in een digitale databank terecht, die via allerlei zoekfuncties gemakkelijk opvraagbaar en doorzoekbaar is. Er kunnen zelfs verschillende onderzoekers zonder problemen tegelijkertijd werken met dezelfde databank. En het internet zelf is een onuitputtelijke bron van taalgegevens: chatgesprekken, online kranten, fora,…
Dat is prima en prachtig, maar er is ook een nadeel. Materiaalverzamelingen die uit het pre-internettijdperk stammen en dus alleen op papier bestaan, worden veel minder vaak geraadpleegd. Niet omdat ze volledig onderzocht zijn, maar omdat ze nu eenmaal minder goed toegankelijk en gemakkelijk doorzoekbaar zijn. En dat is jammer, want vaak bevatten deze corpora heel wat gegevens die, net omdat ze al langer geleden verzameld zijn, niet op het internet te vinden zijn. Daarom worden er ook inspanningen geleverd om deze materiaalverzamelingen digitaal te ontsluiten, en ze via databanken op het internet toegankelijk te maken voor onderzoekers en vaak ook het grote publiek. Helaas is dit een tijdrovende en dus dure zaak, en daarom gaat het vaak enorm traag en moeizaam.
Als wetenschappelijk medewerker en redacteur van het Woordenboek van de Limburgse Dialecten en dat van de Brabantse Dialecten heb ik veel gebruik gemaakt van dit type materiaalverzamelingen. De woordenboeken zijn namelijk gebaseerd op alle bekende dialectverzamelingen tot dan toe, aangevuld met eigen vragenlijsten. Toen ik einde jaren 90 op het project startte, stonden we aan de drempel van het internettijdperk. In de praktijk betekende dit dat e-mail wel ingeburgerd was, er ook flink wat informatieve websites beschikbaar waren, maar dat er nog amper digitale dataverzamelingen waren, en al helemaal niet op het net. Onze gegevens typten we uit papieren vragenlijsten over in een databank die alleen gebruikt werd om de woordenboeken te maken. Het was pas in een later stadium dat deze databanken ook geschikt werden gemaakt om rechtstreeks via het net te consulteren.
Tijdens het werk aan de woordenboeken heb ik kennisgemaakt met het merendeel van de materiaalverzamelingen die in de loop van de tijd voor de dialectologie zijn samengesteld. Ze omvatten een periode van iets meer dan 100 jaar, van het einde van de 19de eeuw tot het begin van de 21ste eeuw. Ook met alle ‘kinderziektes’ die de eerste vragenlijsten onvermijdelijk bevatten, en ondanks het feit dat niet alle respondenten even betrouwbaar blijken, is dit materiaal van onschatbare waarde. Er is nu niemand meer aan wie we bijvoorbeeld kunnen vragen welke dialectwoorden honderd jaar geleden gebruikelijk waren in de diverse dorpen en steden, maar in deze lijsten zijn ze wel vastgelegd.
Daarom wil ik graag de 19de- en 20ste-eeuwse materiaalverzamelingen uit de dialectologie een voor een aan u voorstellen. Ik zal u vertellen wanneer ze tot stand zijn gekomen, door wie, op welke manier, wat het opzet was en waar ze momenteel geraadpleegd kunnen worden. Ik nodig u alvast uit om af en toe eens te snuisteren in de verzamelingen die al digitaal beschikbaar zijn. Misschien wordt u nog wel verrast door uw eigen dialect.