Ongestructureerde data
Ongestructureerde data is de verzamelnaam voor alle informatie binnen je organisatie die niet in een herkenbare structuur is opgeslagen.
Het bestaat uit documenten, presentaties, PDF’s, e-mails en multimedia-inhoud in datashares en oude ECM-platforms. Het is de informatie die door medewerkers wordt gemaakt als onderdeel van een bedrijfsproces of taak.
Organisaties hebben meestal veel ongestructureerde data. Het is zelfs zo dat ongeveer 80-90% van de bedrijfsgegevens ongestructureerd is. Het is niet eenvoudig om er achter te komen wat deze informatie is. Waarom is deze data gemaakt, wat bevat deze data en vooral, welke waarde heeft de data voor de onderneming.
Met andere woorden, ongestructureerde data stelt een organisatie voor grote uitdagingen.
De eerste uitdaging is dat er risico’s zijn verbonden aan het langer vasthouden van data dan is toegestaan. Maar ook aan het niet vasthouden van data zoals vereist door de wetgeving. De meeste bedrijfstakken en overheden hebben een beleid dat bepaalt hoe lang de inhoud behouden moet blijven.
Ten tweede worden de kosten van het opslaan van deze data een financiële last voor de organisatie. Hoewel de aanschafkosten voor opslag afnemen, betekent de groeiende hoeveelheid data dat de kosten stijgen in plaats van dalen.
Inmiddels is er een historische uitdaging om ongestructureerde data te beheren. De meeste organisaties hebben het probleem opgelost door telkens volume bij te kopen en de daadwerkelijke aanpak uit te stellen. Ondertussen hopen ze dat niet in strijd zijn met enige wetgeving. Het onjuist beheren van de bewaring van data verhoogt het risico voor de organisatie aanzienlijk. Het identificeren en correct beheren van deze data vermindert dit risico echter sterk.
Met de komst van de Algemene Verordening Gegevensbescherming (GDPR) zijn organisaties genoodzaakt om ongestructureerde data aan te pakken.
De ongestructureerde data van een organisatie bevat persoonlijk identificeerbare informatie (PII) zoals namen, adressen, geboortedata, rijbewijsnummers, agenda’s, e-mails, pensioengegevens en collectieve verzekeringen. Denk ook aan alle informatie die de organisatie heeft over de medewerkers, klanten, potentiële medewerkers (bijvoorbeeld CV’s) of mensen die een vakbeurs hebben bezocht en je persoonlijke informatie hebben gegeven.
Veel van deze informatie is verborgen in een overvloed aan overtollige data. Tevens wordt de data op ongepaste wijze opgeslagen en is niet beschikbaar via zoekfuncties. Bijvoorbeeld een scan van een brief die alleen in de inbox van de ontvanger is opgeslagen. Als anderen er geen toegang toe hebben heb je een probleem.
Het is belangrijk om te weten welke data je beheert, voor goede werkprocessen, maar ook om te voldoen aan de GDPR.
De GDPR moet je zien als katalysator voor positieve bedrijfsverandering en niet als vervelende regelgeving. Met de GDPR compliance als aanleiding men tegelijkertijd de productiviteit, de risico’s en de kostenstructuur verbeteren.
Er is nooit een belangrijker moment geweest om een uitgebreid overzicht te hebben van welke informatie we verwerken en opgeslaan. Slechts een van de dingen die organisaties moeten hebben voor de GDPR is een Information Asset Register. Dit kan organisaties helpen de gegevensactiva in hun bedrijf in kaart te brengen. Dit is ook nodig voor AI toepassingen en tevens kan het over het verlopen van bewaartermijnen informeren.
Dankzij een volledig Information Asset Register ontstaat een beter begrip over hoe informatie moet worden beheerd.
Gemiddeld kunnen we 60-80% van de kosten voor het opslaan van ongestructureerde data besparen. De bewaartermijn van het document is verstreken, een medewerker is vertrokken of een rapport is verouderd. Deze data staan bekend als DROT, omdat het gedupliceerde, overtollige, verouderde of triviale informatie betreft.
Daarom kan data die niet langer nodig is verwijderen of archiveren we. Eveneens kan Terabytes (en zelfs Petabytes) aan informatie worden verplaatst naar aanzienlijk goedkopere opslag in de cloud. Veel organisaties overwegen al lang een overstap naar de cloud, maar altijd was het de vraag hoe veilig de informatie ‘daar’ zou zijn.
De voordelen van Cloud zijn echter goed gedocumenteerd. Zoals vermeld zullen niet alleen de kosten van opslag verlagen, maar Cloud-platforms zijn enorm schaalbaar. Bovendien is Cloud een enorme impuls voor Het Nieuwe Werken omdat men overal en altijd kan werken.
Start een project om controle te krijgen over je ongestructureerde data. De sanering, migratie en archivering van ongestructureerde data verlaagt de kosten en het risico, terwijl het beheer van de informatie en de productiviteit verbeteren. Het is hoog tijd om in actie te komen en je ongestructureerde data aan te pakken, de GDPR eist het van je.
Discussieer mee op LinkedIn.
Mogelijk is dit een vertaling van Google Translate en kan fouten bevatten. Klik hier om mee te helpen met het verbeteren van vertalingen.