Bestandsnamen voor onderzoeksdata


Samenvatting

Dit artikel legt het belang uit van het toepassen van goede naamgeving en geeft tips voor bestandsnamen voor onderzoeksdata.

null

Introductie

Bestandsnamen zijn een essentieel onderdeel van het organiseren en opslaan van onderzoeksdata. Wanneer je een consistent systeem toepast met beschrijvende bestandsnamen, blijven je bestanden makkelijk vindbaar en herkenbaar. Dit helpt dataverlies te voorkomen, helpt bij het sorteren van bestanden en het terugvinden door zowel mens als computer.

Waarom zijn bestandsnamen belangrijk?

Beschrijvende systematische bestandsnamen zijn essentieel voor het organiseren en herkennen van bestanden, vooral in samenwerkingsverbanden. Hoe een systeem voor het geven van namen aan bestanden eruit ziet, hangt af van je project and de soorten onderzoeksdata daarin. Toch zijn er sleutelelementen die je kunt gebruiken om een goed systeem te implementeren ongeacht het soort onderzoeksdata.

Hoe moet ik mijn bestanden noemen?

Wat is de meest belangrijke en benodigde informatie om de inhoud van je bestanden te herkennen, beschrijven en categoriseren? Normaal gesproken zijn dit een naam of afkorting om de inhoud van het bestand en/of het (sub)project te beschrijven.

Wat je hier verder aan kan toe voegen is andere (gecodeerde) informatie die de inhoud verder beschrijven. Dit helpt onder andere bij het sorteren van je bestanden. Denk daarom kritisch na over welke informatie de inhoud van je bestanden het beste beschrijft en probeer een bestandsnaam niet langer te maken dan 30-35 tekens. We raden de volgende information toe gebruiken in bestandsnamen:                   

  • Datum: gebruik de internationale standard YYYYMMDD or YYYY-MM-DD
  • Bestandsversie: gebruik ‘leading zeros’, v01 or v001 (afhankelijk van het aantal versies dat je verwacht) in plaats van v1, v2 voor betere sortering
  • Project fase: identificeer of in het bestand ruwe,erwerkte of geanalyseerde onderzoeksdata zit, documentatie, of andere informatie gerelateerd aan een specifieke fase in je onderzoek
  • Een andere parameter die belangrijk is, zoals data type, methode etc.

Door beschrijvende bestandsnamen te gebruiken, zorg je dat deze gemakkelijk kunnen worden begrepen door anderen. Wanneer je afkortingen en acroniemen gebruikt, zorg dat je ze documenteert en bij je onderzoeksdata opslaat.

Tips voor bestandsnamen

Overweeg de volgende tips bij het creëren van bestandsnamen:

  • Vermijd spaties, punten en niet-alfanumerieke tekens zoals #$^&()+=?\/!@*%{}[]<>. Niet alle software kan bestandsnamen met deze tekens lezen en openen. Gebruik daarom het (lage) streepje of CamelCase.
  • Vermijd beschrijvend versiebeheer, zoals ‘final’, ‘dit_is_de_nieuwste_versie’, ‘laatste_versie_opmerkingen_final’. Vaak is een versie nooit echt de laatste versie en het maakt bestandsnamen onduidelijke en onnodig lang. Gebruik daarom een numeriek systeem voor versies en/of pas de datum aan.

Voorbeeld van een bestandsnaam

Een beschrijvende en consistente bestandsnaam is duidelijker dan bijvoorbeeld data.csv, zoals:
[project]_[onderwerp]_[deelonderwerp]_[datum]_[versie].[extensie]

In een echt project zou dit er zo uit kunnen zien:

ProjectNaam_Amsterdam_SurveyResponses_20250105_v01.csv

Dat weer verkort kan worden in:

PN_AMS_SurveyResponses_20250105_v01.csv

De gebruikte afkortingen en/of codes worden dan in je data documentatie gedefinieerd en uitgelegd.

Vragen & ondersteuning

Heb je vragen over deze dienst of wil je persoonlijke ondersteuning? Neem gerust contact op met ons. Je kunt een mailtje sturen naar data@wur.nl.

Benieuwd wat WUR Library nog meer voor je kan betekenen?

Kijk op de Library website voor directe toegang tot alle literatuur databases en voor een overzicht van alle Library diensten, tools en ondersteuning. Via de chatfunctie op de website kom je direct in contact met een bibliotheekmedewerker of klik hier Chat online. We helpen je graag!