Metadata
Metadata is een nieuw woord op basis van een oud concept. Elke samenvatting van de inhoud van een bibliotheek of archief, zoals een kaartenbak, bevat meta-data. Het is de voorkeursterm van de technische gemeenschap om te verwijzen naar kaartenbak-data. Meta-data zal daarom meer en meer worden gebruikt naarmate meer technische hulpmiddelen worden ontwikkeld voor taalkundig onderzoek. Het doel van dit artikel is om te beschrijven wat metadata is.
Conceptueel is er weinig nieuws over meta-data. De kortste definitie voor de term is data over data, en hoewel velen van ons er misschien niet aan gewend zijn om over metadata te denken, maken we het en gebruiken we het voortdurend. Een citaat zoals hieronder, is een vorm van metadata:
Bloomfield, Leonard. 1933. Taal . New York: Holt, Rinehart & Winston.
De bovenstaande verwijzing is informatie over een boek, dat wil zeggen gegevens over gegevens.
Iets dat belangrijk is om op te merken over een referentie zoals hierboven, is dat we alleen de informatie begrijpen die volgens een conventie is weergegeven. Het eerste element is de naam van de auteur, dan het jaar, dan de titel, dan de stad en de uitgever. Onze kennis van de basisstructuur van referenties stelt ons ook in staat om er vrij zeker van te zijn dat dit citaat verwijst naar een boek.
Een andere manier om de meta-data in de bovenstaande referentie weer te geven, is als volgt:
Type document | Boek |
Achternaam van de auteur | Bloomfield |
Voornaam van auther | Leonard |
Jaar van publicatie | 1933 |
Titel | Taal |
Stad | New York |
Uitgever | Holt, Rinehart & Winston |
De standaard citatie en de bovenstaande tabel zijn beide verschillende weergaven van dezelfde metadata. De tabel heeft het voordeel dat deze expliciet de categorie informatie markeert die in de verschillende delen van de broncode is gecodeerd.
Een citaat uit het boek is een vrij bekende soort meta data, maar het algemene idee van “data over data” is veel inclusiever. Een geannoteerde bibliografie is bijvoorbeeld ook meta data die veel lijkt op een lijst met referenties, behalve dat deze naast de basismetadata voor het document ook een extra beschrijvingsniveau bevat.
Hoewel ze niet overeenkomen met de traditionele notie van datatype, is het ook gemakkelijk om metadata over software te vinden, wat vaak behoorlijk waardevol kan zijn. We kunnen metadata maken voor elke linguïstische hulpbron – er kunnen zelfs meta-data zijn over meta-data. Een beschrijving van een verzameling bibliografieën zou bijvoorbeeld gegevens over gegevens over gegevens zijn (ook wel metametadata genoemd).
Het is ook redelijk gebruikelijk om de metadata over een taalkundige hulpbron in de bron zelf op te nemen. De titelpagina van een boek is een voorbeeld. De subject- en taalindices die vaak aan het einde van een taalkundig boek worden gevonden, zijn ook goede voorbeelden van meta data. Beide indices vertellen de gebruiker iets over de inhoud van dat boek.
Hoewel het basisidee achter meta-data oud kan zijn, maakt de opkomst van het internet het mogelijk dat meta-data nuttiger wordt. Omdat meta-data veel toegankelijker is dan vroeger, dan zijn ook de bronnen beter toegankelijk. Het is wel noodzakelijk dan men zich bewust is van de noodzaak van goede metadata en het gebruik van meta-data die door anderen zijn geproduceerd.
Een van de belangrijkste toepassingen voor metadata is het vinden van een bron. Een boekreferentie is dus ontworpen om voldoende informatie te geven zodat iemand dat boek kan vinden.
Het andere primaire gebruik van metadata is resource discovery – dat wil zeggen, het vinden van bronnen die relevant zijn voor het onderzoek, maar waarvan men zich niet bewust is. De onderwerpindex van een kaartenbak is een verzameling metadata met een dergelijk doel. Met de komst van nieuwe technologieën zijn er veel meer mogelijkheden voor het ontdekken van hulpbronnen dan vroeger. Deze tools zijn op geen enkele manier perfect, maar ze vormen wel een belangrijke stap voorwaarts in het ontdekken van bronnen.
Het is belangrijk om te beseffen dat metadata eenvoudig data over data zijn en niet de data zelf. Het openbaar maken van meta data is dus redelijk veilig – metadata alleen geeft mensen geen toegang tot de data. Een boekverwijzing is geen boek en metadata over online data zijn ook niet de online data zelf.
De nuttigste meta-data maken duidelijk hoe een bron, eenmaal ontdekt, kan worden gevonden en geopend. De eigenaar van de bron moet bepalen hoe gemakkelijk of moeilijk toegang moet zijn. Vanzelfsprekend is het niet erg handig om mensen toegang te geven tot metadata voor een document waar niemand toegang toe krijgt. Het is echter belangrijk om te beseffen dat het openbaar maken van meta data op geen enkele manier impliceert dat de bron die de metadata beschrijft ook publiekelijk beschikbaar is.
Verder bepaalt de maker van de metadata welke informatie zal worden opgenomen in publiekelijk toegankelijke metadata.
Er zijn een aantal redenen om metadata te maken en te distribueren. Sommige staan hieronder vermeld.
Goede metadata maken het veel eenvoudiger voor een onderzoeker om de bronnen in een archief te beheren en bij te houden. Grote archieven hebben bijna altijd interne metadata-standaarden die belangrijk zijn voor hun onderhoud. Meta data is cruciaal voor het onderhoud van elk archief op de lange termijn, omdat het de beste manier is om ervoor te zorgen dat een bron in een archief kan worden opgespoord wanneer iemand anders dan de oorspronkelijke archivaris het moet lokaliseren.
Hoewel niet altijd wenselijk, willen veel onderzoekers actief dat academici en het grote publiek op de hoogte zijn van de bronnen die zij onderhouden. Goede metadata helpen mensen bronnen te vinden, omdat het hen op eenvoudige wijze basisinformatie over hen verschaft. Het gebruik van een standaard metadata-formaat is vooral handig op dit gebied omdat er zoekhulpmiddelen worden ontwikkeld die direct gebruik maken van deze normen.
Metadata is een van die dingen die waardevoller wordt naarmate er meer van beschikbaar wordt gemaakt. Als elke webmaster metadata voor zijn bronnen maakt, profiteren we allemaal van de mogelijkheid om de data te vinden. Dus zelfs als een van onze prioriteiten is om onze bronnen gesloten te houden kunnen we overwegen metadata over hen te maken en te verspreiden.
Zo weten andere mensen dat ze er zijn. Hoewel dit misschien geen direct voordeel oplevert, zijn de indirecte voordelen van deelname aan een gemeenschap potentieel enorm.
De meeste onderzoekers zijn al redelijk bedreven in het maken van meta data, zelfs als ze niet bekwaam zijn in het maken van gestructureerde, machineleesbare meta-data. Dit vereist eenvoudig inzicht in de belangrijke parameters die nodig zijn om een hulpbron te beschrijven en vervolgens deze parameters op een gestandaardiseerde manier op te slaan. Het creëren van een lijst met referenties aan het einde van een boek of artikel vereist een basiskennis van meta-data. Bovendien hebben de meeste goed beheerde archieven hun metadata verzameld en op een gestructureerde manier opgeslagen, meestal in een database. Een meer technische term voor het vertalen van meta data van het ene formaat naar het andere is mapping.
Mogelijk is dit een vertaling van Google Translate en kan fouten bevatten. Klik hier om mee te helpen met het verbeteren van vertalingen.