donderdag 8 maart 2012

Big Data: vinden van de naald in de hooiberg


'Big Data' is een term die steeds vaker klinkt in de gezondheidszorg. De naam verwijst naar zowel 'heel veel gegevens' als naar 'er kan veel gehaald worden uit die grote berg gegevens'.

Tot nu toe was het doorspitten van grote hoeveelheden gegevens voorbehouden aan het bedrijfsleven. Zo ratelen de computers van bedrijven en supermarkten onophoudelijk om patronen in voorkeuren en het bestedingsgedrag van (potentiële) klanten te herkennen. Patronen die in eerste instantie gezocht werden in doelgroepen, maar sindsdien steeds persoonlijker zijn geworden. De boodschap van een bedrijf als Albert Heijn (en anderen) is: 'ik weet wat jij nodig hebt en ik zorg er voor dat jij dat in mijn winkels kunt vinden.' Persoonlijk, op maat.

Dat 'op maat' is een kreet die ook in de gezondheidszorg steeds vaker te horen is. 'Zorg op maat' is in het huidige zorglandschap nog maar een zwakke voorbode van wat ons te wachten staat. Want Zorg op maat wordt persoonsgebonden zorg, personalized medicine. Daar wordt mee bedoeld dat een patiënt niet alleen in een mooie omgeving met aandacht ontvangen en behandeld wordt, of dat er een persoonlijk zorgplan wordt opgesteld, maar bovenal dat de unieke persoon een unieke behandeling krijgt. Uniek betekent dan: met die medicatie in die dosis die het grootste effect heeft op die persoon. Dat vereist dan wel dat de medische wetenschap in staat is die persoonlijke eigenschappen te ontdekken in een alsmaar groter wordende stroom gegevens. Een stroom die gevoed wordt door dossiers bij huisartsen, apotheken, laboratoria, fysiotherapeuten, diëtisten en ziekenhuizen. Een stroom die nog groter zal worden doordat chronisch zieken steeds meer gaan monitoren hoe hun ziekte verloopt en een nu nog ongekende hoeveelheid zal krijgen als de resultaten van genoom-onderzoek daaraan worden toegevoegd. Het sequencen van één genoom levert al snel 7 gigabyte aan gegevens op. Gegevens die daarna nog omgezet moeten worden in informatie. Er worden veel nieuwe banen in dit gebied voorspeld die samen veel geld kosten maar nog veel meer kunnen besparen. Daarnaast dreigen tekorten aan opslagcapaciteit.

Dat is de ene kant van de instroom. Aan de andere kant levert toenemend wetenschappelijk onderzoek een toename van informatie die nauwelijks meer te overzien is, ook niet door vakspecialisten (hoever ze ook gespecialiseerd zijn). Het wordt te veel om voor één of enkele mensen te overzien, en dus wordt het tijd de hulp van krachtige computers in te roepen.

In Nederland kennen we Gaston. Gaston is een computersysteem dat ontwikkeld is in samenwerking tussen de TU/e en het Catharina Ziekenhuis in Eindhoven. Spil in dit geheel is Erik Korsten, anesthesist en deeltijd hoogleraar. Hij werd op dat pad gezet door het Amerikaanse onderzoek naar vermijdbare fouten dat gepubliceerd werd in het BMJ van 1999 (in Amerika is het rapport 'To Err is Human' bekender; vergelijkbaar Nederlands onderzoek is het HARM Wrestling rapport). In onderstaande film wordt de reikwijdte van Gaston getoond.



In Amerika timmert IBM hard aan de weg om die rekenkracht via adviezen aan zowel artsen als zorgverzekeraars te kunnen leveren. Met Watson, de opvolger van Deep Blue, hebben zij een systeem ontworpen dat in 3 seconden in een stapel van 200 miljoen pagina's de juiste informatie te vinden en te presenteren.




Veel gegevens, en het worden er steeds meer, niet in de laatste plaats door het zelfmeten van mensen (al dan geen patiënten). Ik schreef al eerder over de Quantified Self, en in onderstaande video van The Economist komen QS en BigData bij elkaar. Dat zal niet vanzelf gaan, want veel gegevens kunnen nu nog niet op een eenvoudige wijze worden uitgewisseld.



Bedrijf ginger.io vindt je hier.

En dan praten we alleen nog maar over de gezondheidszorg. Dat is natuurlijk nog maar een fractie van alle data die over ons verzameld wordt, via organisaties als Google, Facebook en de telecom-providers, zoals de Wall Street Journal in dit artikel en onderstaande video laat zien. Alles afgestemd op het vinden van die ene naald in de hooiberg van BigData - op web naar BigMoney. Wie behoudt hierin het overzicht en stelt vragen over grenzen van het databeest?



Aanvulling op 11 maart 2012:
Firma Symcat laat zien wat er kan gebeuren als je verschillende informatiebronnen combineert: persoonlijke gegevens, algemene medische informatie en demografische gegevens.

Aanvulling op 21 mei 2012:
The Economist belicht het onderwerp BigData vanuit de bankenwereld, en wat blijkt: ook daar is Watson actief (en bedrijven als Igor (van PayPal), Palantir Technologies, en Xoom).

Geen opmerkingen:

Een reactie posten