De paraplu van Big Data
Column door Sander Klous (via Pulse Media Groep)
Sander Klous is hoogleraar 'Big Data Ecosystems for Business and Society' aan de Universiteit van Amsterdam en verzorgt voor de reeks Industry Shifting Technologies het college 'Wij zijn big data'.
'De meeste grote bedrijven weten tegenwoordig wel wat ze met Big Data moeten en kunnen. In feite is Big Data een parapluterm. Het komt uit de consultancy, meer specifiek Gartner, die sprak over de verschillende v's. Volume, variety en velocity. Als data aan deze ‘voorwaarden' voldeed, werd het ‘big data' genoemd. Tegenwoordig worden er nog twee v's aan toegevoegd: value en veracity, waarde en betrouwbaarheid. Eigenlijk gaat het tegenwoordig niet meer zoveel over deze v's, maar veel meer over de invloed van data op de maatschappij.
Voor bedrijven valt Big Data uiteen in verschillende initiatieven, van machine learning tot aan data organisatie, bijvoorbeeld als het gaat om de kwaliteit van data en externe bronnen op peil te houden. Ook zoeken bedrijven en organisaties in dit kader naar mogelijkheden om meer data-gedreven te worden. Zo zijn er onder de paraplu vele onderdelen te onderscheiden. Voorbeelden van wat Big Data voor bedrijven betekent zijn er in overvloed. Denk aan de muziekwereld, waar bittorrents een manier vormen om data te distribueren. Via The Pirate Bay en Popcorn Time zijn er zijn hele nieuwe businessmodellen uit ontstaan, zoals iTunes en Spotify. Of de reisbranche met Booking.com en Airbnb. Het zijn tegelijkertijd voorbeelden die laten zien dat Big Data een continue driver zijn om complete industrieën in korte tijd volledig op zijn kop te zetten. Zelfs industrieën waar je het niet verwacht, zoals Uber in de taxibranche.
Er is een groot verschil in wat we ‘datagedreven organisaties' noemen en bedrijven die met business intelligence bezig zijn. Bij business intelligence gaat het vaak om één stap: een concrete vraag vanuit de business, waarvoor een analyse wordt geïmplementeerd en waarvan de uitkomst in het management dashboard terechtkomt. Bij data gedreven organisaties gaat het meer om een tweetrapsraket. Vragen zijn veel minder concreet, waardoor er in eerste instantie een soort onderzoeksproject ontstaat om te zien of de beschikbare data de mogelijkheden biedt voor beantwoording van de vraag. Als die vraag kan worden beantwoord, heeft het echter nog geen toegevoegde waarde voor de onderneming gehad. Daar moet eerst nog een implementatietraject voor worden opgezet.
Soms wordt Big Data geassocieerd met Predictive analysis oftewel het beter kunnen voorspellen van bijvoorbeeld de omzet aan de hand van data. In feite wordt dit al jarenlang gedaan, ook onder de noemer van business intelligence. Wat wel geldt is dat er steeds meer technieken en geavanceerde analyses beschikbaar komen. De voorspellende kracht wordt zo steeds sterker. De opkomst van predictive analysis zou ik meer een evolutie dan een revolutie willen noemen.
Cybersecurity, transparantie en bescherming van privacy vormen in het hele verhaal van Big Data een belangrijke rol. Naarmate je meer data naar één punt brengt, wordt het uiteraard steeds kritischer om dat punt goed te beveiligen. Je kunt je dus ook afvragen of het zo verstandig is al die data op één punt te verzamelen. We onderzoeken nu de mogelijkheid om een netwerk van platforms op te zetten, waarbij iedere partij weliswaar zijn eigen datalake beheert, maar waar mogelijkheden bestaan om analyses op elkaars platform te kunnen draaien. Op die manier kan je wel inzichten combineren terwijl de data niet op één plek terechtkomt. Dat reduceert investeringen én risico's en verdeelt de verantwoordelijkheden. Voor privacydoeleinden worden zeker in de onderzoeksfase anonimiseringstechnieken gebruikt, zodat verantwoord aan analyses kan worden gewerkt zonder aan de creativiteit te tornen. Ook op die manier worden de risico's beperkt. Transparantie speelt daar eveneens een rol. De vraag is hoe ver een data analyse mag gaan. Onlangs was er een discussie over zorgverzekeraars die dossiers opvragen bij artsen om te controleren of ze niet teveel hadden gedeclareerd. Het belangrijkste element in de discussie was dat het helemaal niet bekend was dat verzekeraars dit deden. De transparantie ontbrak en mensen reageerden begrijpelijk emotioneel. Door transparant te zijn, krijgt de burger in ieder geval de kans om een mening te vormen en te bepalen wat we als maatschappij acceptabel vinden en wat niet.'
Meer weten?
• Deze column is gepubliceerd in de gratis e-paper ‘Data Management en Cybersecurity'. Hierin kunt u meer lezen over belangwekkende thema's zoals cybersecurity, transparantie en bescherming van privacy.
• Voor de collegereeks Industry Shifting Technologies verzorgt Sander Klous het college 'Wij zijn big data'. Leer tijdens deze reeks van vooraanstaande experts hoe nieuwe technologie onze manier van denken, werken en leven gaat veranderen.