Leestijd17 minuten leestijd

Voegt data science echt waarde toe?


Bron: https://negativespace.co/grayscale-laptop-coffee-notepad/

Dit is voor veel organisaties waarschijnlijk nog altijd de meest relevante vraag als het om data science gaat. En het antwoord is eenvoudig: ja, data science voegt waarde toe. Maar hoe en waarom dan precies?

Besluitvorming als ontwerpprincipe

Om te begrijpen waarom data science waardevol is voor organisaties moeten we iets meer weten over organisaties: wat zijn organisaties eigenlijk en waarom bestaan ze? Het meest ontwijkende antwoord is waarschijnlijk “ik weet wel of iets een organisatie is als ik er één zie”. Schieten we niet heel veel mee op, maar is voor veel van ons wel waar. Organisaties zijn de bouwstenen van de maatschappij waarin we leven. We werken in organisaties, we betalen onze belasting aan organisaties (met behulp van andere organisaties), we sporten in organisaties, we oefenen invloed uit via organisaties (politieke partijen), we communiceren bij monde van organisaties (het IMF spreekt over internationale handel, de WADA over doping, de OPEC over olie). Het herkennen van een organisatie is dus een koud kunstje voor ons. Maar hiermee zijn we niet veel dichterbij het antwoord op onze vragen.

Het opzoeken van definities helpt ook niet echt, om de eenvoudige reden dat er bijna net zoveel definities van organisaties bestaan als organisaties zelf. Allemaal belicht vanuit een net iets andere invalshoek. Als je veel van deze definities bekijkt zie je echter wel een aantal terugkerende elementen, zoals:

  • een juridische status anders dan die van personen;
  • kennis, cultuur en competenties anders dan die van ieder binnen de organisatie;
  • beïnvloedt de omgeving, maar wordt zelf ook door de omgeving beïnvloed;
  • is doelgedreven, al is het misschien lastig de doelen onder woorden te brengen en hoeven deze niet door iedereen binnen de organisatie gedeeld te worden; en
  • voert meerdere taken uit.

Als bestaansrecht van organisaties wordt, naast het feit dat mensen sociale dieren zijn, vaak genoemd dat ze helpen bij het realiseren van doelen die te groot zijn voor een individu. Zo hebben mensen beperkte cognitieve vermogens en zorgt het bundelen hiervan in organisaties ervoor dat men samen complexere problemen op kan lossen. Iets soortgelijks geldt voor doelen waarvan de realisatie langer duurt dan een mensenleven (een medicijn tegen kanker, een nederzetting op Mars) of waarvoor een juridische of politieke daadkracht groter dan dat van een individu nodig is.

Organisaties heffen dus op een bepaalde manier de (cognitieve, temporele, institutionele) beperkingen op waar we als individu mee te maken hebben. Maar hoe ontwerp je een organisatie? Welk ontwerpprincipe hanteer je om ervoor te zorgen dat de resulterende organisatie haar doelen kan realiseren?

Al sinds jaar en dag, sinds het bestaan van organisaties zelfs, zijn er ruwweg drie ontwerpprincipes; drie bouwtekeningen waarmee je bijna alle organisaties kan begrijpen. Welke op enig moment leidend was hing af van het tijdsgewricht, maar alledrie hebben ze op enig moment hun stempel gedrukt op het ontwerp van organisaties.1

Macht

In vroege samenlevingen werden organisaties ontworpen op basis van macht.2 Een stamhoofd wijst de beschikbare middelen (bevoegdheden, spullen, maar ook ondergeschikten) toe aan bloedverwanten en mensen die (politieke) trouw aan hem hebben gezworen. Het impliciete effectiviteitscriterium is het maximaliseren van de politieke macht van de leider; effectieve organisaties zijn organisaties met politiek sterke leiders.3

In niet-geïndustrialiseerde gebieden wordt dit principe nog altijd breed toegepast, maar ook daarbuiten zien we het terug (misschien zelfs wel in het continue herontwerp van het team in het Witte Huis…?). In de geïndustrialiseerde wereld staat dit ontwerpprincipe echter onder druk. Door toegenomen competitie en transparantie wordt het steeds lastiger de middelen toe te wijzen aan iemand anders dan de voor die functie best gekwalificeerde persoon; nog even los van de maatschappelijk sterk toegenomen afkeer voor ‘voortrekken’.

Verantwoording

Een ontwerpprincipe waar al over geschreven wordt sinds Moses beschreef hoe een organisatie vorm te geven voor oorlogsvoering, heeft verantwoording als belangrijkste pijler.4 Eerst moet duidelijk worden wie waarvoor verantwoordelijk is om vervolgens de middelen zodanig toe te wijzen dat de verantwoordelijken (‘managers’) over de middelen kunnen beschikken om aan die verantwoordelijkheden te voldoen. Op dit principe werd het Romeinse Rijk gebouwd, maar het is ook de hoeksteen van de moderne organisatietheorie5 en Webers invloedrijke sociologie van bureaucratieën.6 Het impliciete effectiviteitscriterium is het maximaliseren van de kans dat de managers in staat zijn om aan hun verantwoordelijkheden te voldoen; effectieve organisaties zijn organisaties waarin men in staat is aan zijn of haar verantwoordelijkheden te voldoen.

Alhoewel dit ontwerpprincipe voor velen van ons bekend en vertrouwd zal klinken en voelen, zijn er ook in dit geval ontwikkelingen waardoor de invloed van dit principe is afgenomen. Met het technischer en complexer worden van moderne organisaties is de nadruk verschoven van individuen die aan hun eigen verantwoordelijkheden proberen te voldoen op basis van hun positie en autoriteit, naar decentrale groepen die gezamenlijk proberen te voldoen aan hun collectieve verantwoordelijkheden op basis van met name expertise.

Productieproces

De Industriële Revolutie heeft een derde ontwerpprincipe bekend gemaakt, waarin de organisatie wordt ontworpen rondom het productieproces.7 Organisatieonderdelen spiegelen de beweging door en transformatie van materialen binnen de organisatie en hebben namen als ‘Inkoop’, ‘Ontwerp’, ‘Productie’, en ‘Transport’. Administratieve en communicatieprocessen worden dus afgestemd op het productieproces en het impliciete effectiviteitscriterium is het optimaliseren van het productieproces; effectieve organisaties zijn organisaties met een effectief productieproces.

Veel moderne strategieën, van Business Process Reengineering (BPR) tot Lean Manufacturing, stammen af van dit ontwerpprincipe en menig modern organogram bevat nog duidelijke verwijzingen naar het streven de efficiëntie van het productieproces te maximaliseren. Maar met het minder belangrijk worden van de maakindustrie in de Westerse wereld is de invloed van dit ontwerpprincipe ook afgenomen. In de haast profetische woorden van Nobelprijswinnaar Herbert Simon:8

“Organizational decision making in the organizations of the post-industrial world shows every sign of becoming a great deal more complex than the decision making of the past. As a consequence of this fact, the decision making processes, rather than the processes contributing immediately and directly to the production of the organization’s final output, will bulk larger and larger as the central activity in which the organization is engaged. In the post-industrial society, the central problem is not how to organize to produce efficiently (although this will always remain an important consideration), but how to organize to make decisions”.

Besluitvorming

Sinds eind jaren ’80 is er een nieuw ontwerpprincipe bijgekomen, dat in de Westerse wereld ook direct dominant is geworden en gebleven. Zoals Simon al voorzag is besluitvorming de centrale en meest belangrijke activiteit geworden en worden processen en structuren zo ontworpen dat deze de besluitvormingsprocessen zo effectief mogelijk ondersteunen. Effectieve organisaties zijn organisaties waar besluitvorming van hoge kwaliteit is.9

Vanaf hier wordt de literatuur erg technisch, maar de uitdaging blijft goed te begrijpen. Binnen een organisatie worden taken opgeknipt in deeltaken, die worden toegewezen aan specialistische teams. Deze nemen besluiten namens de organisatie en worden besliseenheden genoemd. De uitdaging ligt in het weer kunnen combineren van de uitkomsten uit de deeltaken zodanig dat de overkoepelende doelen van de organisatie worden behaald. De activiteiten en het (beslis)gedrag binnen de teams is hierbij zelf niet per sé goed of slecht; dit hangt af van de wat er binnen de andere deeltaken gebeurt. En omdat de uitvoerders van een specifieke deeltaak niet (voldoende diepgaand) kunnen communiceren met elk van de andere deeltaken waarmee een afhankelijkheid bestaat moet er een strategie ontworpen worden die coördinatie over vele, van elkaar afhankelijke deeltaken mogelijk maakt.

Het coördineren van stabiele, voorspelbare deeltaken kan bijvoorbeeld met regels (handleidingen, procesbeschrijvingen, best practices, etc.).10 Deeltaken kunnen bijna volledig in isolatie en volgens vast recept worden uitgevoerd; afstemming met andere besliseenheden is nauwelijks nodig. Wordt de onzekerheid in de deeltaken groter, dan stijgt ook de afstemming die nodig is om een bepaalde kwaliteit te halen. Als dit het geval is worden de terugkerende, voorspelbare taken nog altijd gecoördineerd met regels, maar worden uitzonderingen ingebracht in de hiërarchie, op een niveau dat alle afhankelijkheden tussen de deeltaken overziet. Bij nog hogere onzekerheid wordt coördinatie geregeld door decentrale doelen, waarbij niet langer het gedrag wordt voorgeschreven, maar de gewenste uitkomst. Dit beperkt het aantal uitzonderingen, omdat er op minder vlakken afstemming tussen besliseenheden nodig is. De uitzonderingen die resteren worden nog altijd ingebracht in de hiërarchie voor een besluit.

De afgelopen 40 jaar is er enorm veel onderzoek gedaan naar hoe organisaties te structureren om de informatiestroom te optimaliseren. Hier is een heel spectrum aan richtlijnen uit voortgekomen dat, bijvoorbeeld, gaat over de mate van centralisatie, specialisatie en flexibiliteit en hoe deze te bereiken met mechanismen als regels, hiërarchie en decentrale doelen. Net zo veel onderzoek is er gedaan naar de elementen die communicatie binnen organisaties efficiënt maakt.

Data science

De uitkomsten van al dit onderzoek zie je terug in het ontwerp van moderne organisaties. Zelfsturende teams, crossfunctioneel samenwerken, DevOps, Agile; het zijn allemaal uitingsvormen van strategieën gericht op het optimaal ondersteunen van beslisprocessen. Maar veel weten over hoe je een organisatie kan inrichten om informatie zo goed mogelijk rond te laten gaan en op basis hiervan diverse deeltaken in onderlinge coördinatie bij te laten dragen aan het realiseren van de doelen is slechts één deel van het verhaal. Naast de procesmatige informatie over wat te doen op welk moment en welke manier, is er ook feitelijke informatie nodig. Voor je weet hoe je een product of dienst het best kan realiseren moet je eerst weten welk product of welke dienst er gerealiseerd moet gaan worden. Hoe we deze grote taak opknippen en er voor zorgen dat aan alle randvoorwaarden voor uitvoering in deeltaken en coördinatie terug naar een overkoepelend geheel wordt voldaan is één, maar op basis waarvan vormen we ons een beeld van de grote taak waar het allemaal mee begint?

Het onderbuikgevoel

Iedere beslissituatie brengt voor iedere beslisser twee belangrijke inputs bij elkaar. Enerzijds de mate van overeenkomst met eerdere beslissituaties, het toen genomen besluit en de uitkomst, anderzijds de feitelijkheden van de huidige beslissituatie.11 Weinig is zo menselijk als ons ‘willen weten hoe het zit’. Dit is altijd zo geweest en zien we bijvoorbeeld terug in het instituut dat de wetenschap is geworden. Het vormen van theorieën over hoe de dingen werken, het bedenken van experimenten om deze te toetsen en het op deze manier stapsgewijs opbouwen van kennis, is iets dat we al duizenden jaren heel systematisch doen. En deze bezigheid valt of staat met data. Door ruwe data te verzamelen en met elkaar te verbinden ontstaat informatie. Dit maakt analyses mogelijk die patronen blootleggen; dit noemen we kennis. Als we vervolgens onze acties vormgeven op basis van deze kennis en begrijpen waarom we de dingen doen die we doen noemen we dit wijsheid.12

Data is dus het ruwe materiaal waaruit wijsheid ontstaat. Zonder data, zonder de dingen om ons heen meetbaar te hebben gemaakt, houdt alles op. Of beter: zonder data vullen we het gat dat ontstaat met iets anders om toch beslissingen te kunnen nemen. In vroeger tijden waren dit bijvoorbeeld diverse natuurgoden. Omdat we de werking van onze atmosfeer nog niet begrepen door een gebrek aan data (en dus informatie en kennis), vulden we dit gat met een god die de regenval bepaalde. Een lange periode van droogte moest haast wel betekenen dat deze god boos op ons was, waarmee de beslissing een offer te brengen om deze god gunstig te stemmen een logische werd.

In meer moderne tijden werd een organisatorisch gebrek aan data gevuld met inuïtie, fingerspitzengefühl, de onderbuik. Data over (wensen van) individuele consumenten ontbrak, maar beslissingen werden uiteraard gewoon genomen. Op basis van aannames (‘we veronderstellen dat alle klanten op deze manier reageren op een prijswijziging’) in combinatie met de ervaring en het goed ontwikkelde onderbuikgevoel van de directeur. Men kon ook weinig anders, de meetbaarheid, en hiermee de data, ontbrak eenvoudigweg. En omdat ook het effect van eerder genomen beslissingen niet gemeten werd bleef men lange tijd in het duister tasten. Qua vormgeving en structuur was de organisatie een geoptimaliseerde beslismachine, maar het ruwe materiaal ontbrak. Een Lamborghini zonder brandstof.

Digitalisering

Gedurende de jaren ’90 begon deze situatie drastisch te veranderen en ontstond er een hele andere uitdaging. Data is al lang het probleem niet meer. Het tempo waarin we met z’n allen data genereren is zo schrikbarend hoog dat we bijna verdrinken in het ruwe materiaal waar we ruim twintig jaar geleden nog een tekort aan hadden. Via onze telefoon, ons slimme horloge, ons surfgedrag op internet, en ga zo maar door beschikken organisaties over een veelheid aan data over ons. Dit gestructureerd opslaan en ontsluiten, wat jarenlang een probleem was, is weliswaar nog altijd uitdagend maar zeker geen showstopper meer.

En daarmee komen we aan bij het waarom van de toegevoegde waarde van data science. We hebben data, veel data. Dit kunnen we verbinden en aan elkaar relateren om er informatie van te maken. We hebben organisaties die speciaal ingericht zijn om deze informatie te delen en de verschillende deeltaken zo te coördineren dat organisatiedoelen op zeer efficiënte wijze worden gerealiseerd. So far, so good. Volgende stop: analyseren van de informatie om zo kennis te creëren en hier actie op nemen. En daar wordt het lastig…

Tuurlijk, statistiek bedrijven we al honderden jaren. We zijn echt geen groentjes als het gaat om het verwerken van data en het ontdekken van verbanden in informatie. Maar er is nogal wat veranderd. De omvang van de data is vele malen groter, het type van de data vele malen diverser (niet alleen getallen maar ook tekst, audio, video, etc.) en de omloopsnelheid vele malen hoger (streaming data). Hier goed mee omgaan vraagt om een nieuw perspectief en een nieuwe gereedschapskist. Dat is wat data science is. Data science gaat over experimenteren, over wetenschap bedrijven in je eigen organisatie, over het verzamelen van grote hoeveelheden heel verschillende data en de governance van dit verzamelen. Maar ook over het oplossen van vraagstukken rond de datakwaliteit en het analyseren met moderne methoden waarvan iedereen de naam van lijkt te kennen (machine learning, artificial intelligence, etc.) maar een veel kleiner deel ook echt begrijpt waar dit over gaat en hoe dit allemaal kan worden ingezet om de bedrijfsvoering te verbeteren door de kwaliteit van besluitvorming te verhogen.

Data science is een ongelooflijk multidisciplinair en dynamisch vakgebied. Het rust op theoretische pijlers als informatica en statistiek, maar is ook pragmatisch en hands-on. Programmeren is een belangrijke schakel, maar dat is domeinkennis ook. Het is nerdy maar tegelijkertijd uitermate strategisch. Het raakt op alle manieren aan het kloppende hart van de moderne organisatie en is niet meer weg te denken.

Data science in de vingers krijgen zorgt voor betere besluitvorming en een hogere stuurbaarheid. Dit is zo voor hele digitale organisaties me veel data, maar ook voor meer traditionele organisaties die van nature minder gericht zijn op het verzamelen van data. Iedere organisatie wordt door data science beter in haar centrale activiteit; in wat die organisatie doet. En dus voegt het voor iedere organisatie waarde toe.

Als je eens verder wil praten over dit onderwerp neem dan contact met ons op en kom langs voor een kop koffie.


  1. Zie bijvoorbeeld Huber en McDaniel (1986), “The Decision-Making Paradigm of Organizational Design”, voor meer details. 
  2. In de literatuur wordt dit principe het paternalistic/political paradigm genoemd. 
  3. Machiavelli is een van de bekendste voorvechters van dit ontwerpprincipe. 
  4. In de literatuur wordt dit principe het accountability/authority paradigm genoemd. 
  5. Zie bijvoorbeeld Fayol (1916), “General and Industrial Management”
  6. Zie bijvoorbeeld Weber (1947), “The Theory of Social and Economic Organization”
  7. In de literatuur wordt dit principe het workflow paradigm genoemd. 
  8. Simon (1973), “Applying Information Technology to Organization Design”, pp. 269-270. 
  9. Kwaliteit is hier breed gedefinieerd, dus inclusief aspecten als tijdigheid. 
  10. In de literatuur staan deze bekend als rules, programs, of routines. Zie bijvoorbeeld Nelson en Winter (1982), “An Evolutionary Theory of Economic Change”, March en Simon (1993), “Organizations”, en March, Schulz en Zhou (2000), “The Dynamics of Rules”
  11. Dit is uiteraard een versimpeling die voorbij gaat aan vele nuances. Zie bijvoorbeeld March (1994), “A Primer on Decision Making: How Decisions Happen”, voor meer details. 
  12. Zie bijvoorbeeld de DIKW pyramide voor gerelateerde achtergronden. 
Menu
Vind ons op