IN2 Maas & Waal, nummer 2 2016

Page 26

KENNIS & MARKT

Lean & safe omgaan

Gebruik van grote datasets voor een juiste hoeveelheid Small Data

In de serie Kennis en Markt brengt IN2 Maas & Waal steeds een ondernemer en een wetenschapper met elkaar in contact om te bezien hoe zij voor elkaar van toegevoegde waarde kunnen zijn en elkaar kunnen versterken. In deze editie spreekt Peter van Anrooij, directeur van archiefdigitaliseerder en dataspecialist 2dA met rechtsfilosoof en jurist professor Mireille Hildebrandt, onder meer hoogleraar Chair of Smart Environments, Data Protection and the Rule of Law aan de Radboud Universiteit. Onderwerp van gesprek: het ‘safe & lean’ omgaan met Big Data. Ongestructureerd Van Anrooij omschrijft Big Data als grote hoeveelheden ongestructureerde data uit verscheidene bronnen. “Dat geldt zowel voor bronnen uit het verleden als actuele bronnen.” Hildebrandt legt vooral de nadruk op het ongestructureerd zijn. “In het verleden waren die bronnen altijd lastig te onderzoeken, maar de moderne technologie en kennis geeft ons steeds meer handvatten en formats om data te analyseren en combineren. Digitalisering is de eerste stap van het vertalen van die informatie naar kennis.” Data-obesitas Volgens Hildebrandt is er vandaag de dag sprake van ‘data- en patroonobesitas’. “Veel data betekent niet per se veel bruikbare informatie. In een dataset zitten immers allerlei patronen die geen relatie met de werkelijkheid hebben. Een goede selectie is derhalve essentieel als we de informatie willen gaan gebruiken en dat vereist tevens updating en beveiliging en natuurlijk om te beginnen voorkomen dat gegevens onrechtmatig worden verwerkt. Daarnaast wil je zeker weten dat de analytics die je gebruikt betrouwbaar is en dat vraagt mathematisch én empirisch onderzoek. Je kunt veel problemen voorkomen door vooraf goed te selecteren (select before you collect is niet voor niets een belangrijk beginsel in digitale beveiliging). Een goed verdienmodel staat of valt met goede data, rechtmatige verwerking en betrouwbare analytics.”

Gericht geautomatiseerde informatieselectie Van Anrooij knikt. “Big Data worden steeds belangrijker voor bedrijven; je kunt er gedrag mee voorspellen en daardoor organisatieprocessen beter sturen. Digitalisering om je bedrijfsvoering te verbeteren is mooi, maar er zit ook waardevolle informatie in die gedigitaliseerde archieven besloten, meer dan ondernemers over het algemeen denken. Die informatie kan inzichtelijk worden door grote datasets via de computer te ondervragen en daarbij steeds specifiekere verbanden te leggen. Wel moet in dat proces steeds bepaald worden welke informatie relevant is.” Risico’s Hildebrandt vertelt dat de omgang met Big Data niet alleen kan leiden tot privacy-risico’s. “Die zijn niet altijd het grootste probleem, en we hebben daarvoor best al wel veel oplossingen. Gevaarlijker vind ik de mogelijkheid om vanuit de kennis uit Big Data te voorspellen en vervolgens te beïnvloeden. Dat reduceert mensen tot pionnen, ook omdat dat ze meestal geen toegang hebben tot dat soort voorspellingen. Het wordt problematisch als opdrachtgevers processen kunnen manipuleren ten behoeve van hun eigen belang op een manier die inbreuk maakt op fundamentele rechten en andere algemene belangen, bijvoorbeeld als het gaat om identiteitsfraude, persoonlijke veiligheid, vertrouwelijkheid van medische informatie. Dat soort risico’s spelen vooral wanneer de modellen of profielen die uit gege-


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.