Politie begint dikke data kat en muis met Criminaliteits Anticipatie Systeem

Wachten op boeven big data

Vanuit de politie zelf blijven geluiden komen dat het niet goed gaat met misdaadbestrijding. Maar met data loopt onze Hermandad mondiaal voorop. Een vlucht naar voren? Met welke effect?

Dit weekend doet agente ‘Marit’ in De Telegraaf haar beklag over beroerde organisatie: ‘Het team van Marit bestaat uit 180 tot 200 politiemensen. „Daarvan zijn er vijf STO’er, oftewel Senior Tactische Opsporing. Zij hebben het overzicht en zetten de lijnen uit. Maar ons werkgebied is te groot. Zij hebben geen idee wat er daadwerkelijk speelt.”…

Door capaciteitsgebrek wordt veel misdaad niet opgepikt. De inbreker of fietsendief van weleer houdt zich tegenwoordig veelal bezig met cybercriminaliteit of internetoplichting, waarvan de aangiftebereidheid veel lager is.’

Maar hulp is nabij. De politie voert - na testen in ondermeer Enschede, Groningen en Den Haag - een datasysteem om een verhoogd risico op criminaliteit te voorspellen nu landelijk in. Het Criminaliteits Anticipatie Systeem (CAS) analyseert en voorspelt plaatsen en tijdstippen met hoger risico van ‘high impact’ misdaden als zakkenrollen, straatroof, geweld, diefstal en (auto)inbraak; in fijnmazige gebieden van 125 bij 125 meter en binnen tijdslots van maximaal vier uur. Dat gebeurt aan de hand van tweewekelijkse misdaadstatistiek, gemengd met een trend van twee jaar.

Als de 168 politie-eenheden er eind dit jaar alle mee werken, dan is Nederland het eerste land waar ‘predictive policing’ in de gehele natie wordt toegepast. De politie past er de inzet op aan, met de werkroosters en met meer surveilleren op de plekken waar meer misdaad wordt verwacht. Ook kan preventie erop inspelen: bijvoorbeeld met woningcorporaties fysieke beveiliging van woningen met een verhoogd risico opvoeren.

Data Dicky Dik

Dikkedataspecialist Dick Willems van de politie Amsterdam ontwierp CAS met IBM SPSS Modeler waarin de datapreparatie en de modelleringsstappen van CAS zijn ondergebracht, ondersteund door een Oracle Database voor het wegschrijven en ophalen van data, en Mapinfo voor samenstelling van de geografische kaarten.

Indicatoren zijn behalve misdaden ook verdachten: de data geven het aantal reeds bekende verdachten weer binnen een straal van 500 meter en van 1.000 meter, maar ook de afstand tot de dichtstbij wonende verdachte. Kennelijk vanuit de ervaring dat de boef graag dicht bij huis actief is.

Ook de risico’s in de omliggende vakken tellen mee bij het oordeel. Slechts de top-3% van de vakjes wordt gekleurd, rood, oranje en geel naar gelang de extra hoogte van de risico’s ten opzichte van het gemiddelde. Als deze hoog-risicolocaties zijn geselecteerd wordt op een vergelijkbare manier bepaald op welke tijdstippen het risico op ‘een incident’ het grootst is.

‘Op deze manier kan ongeveer 40% van de woninginbraken en 60% van de straatroven in Amsterdam worden voorspeld. Niet gek voor een oppervlak van slechts 3%’, aldus Willems in het Tijdschrift voor de Politie.

De cijfers zijn gebaseerd op een studie van de Vrije Universiteit in 2014 onder leiding van Willems en enkele docenten. Daarin is vastgesteld dat in Amsterdamse testgebieden de juiste locatie en het tijdslot van 36 procent van de woninginbraken en 58 procent van de straatroven (bijna) juist werd voorspeld. Maar ook: ‘Een belangrijk resultaat is dat bij het verkleinen van de tijdsintervallen het aantal te voorspellen incidenten afneemt.’ Dus: over periodes van vier uur voorspellen gaat nog, maar voor nauwkeurige tijdstippen niet.

Volgens Willems zijn de resultaten goed, want er hebben ‘minder incidenten’ plaatsgevonden. Dat is niet alleen te danken aan CAS, maar ook aan andere maatregelen om misdaad terug te dringen. Of die daadwerkelijk is teruggedrongen, is niet duidelijk.

Real-time en persoonlijke profilering

Behalve met data van aangiftes en criminaliteit van de politie zelf wordt het systeem gevoed met de sociale data van het Centraal Bureau voor de Statistiek (CBS) per wijk, zoals het percentage uitkeringen, leeftijden, geslacht en gezinssamenstelling. Algoritmen bepalen de kansen op criminaliteit. De inbreng van CBS-data levert tot nu toe weinig op

Van zware, maar minder voorkomende misdaden als verkrachting en moord zijn data per locatie niet valide om voorspellingen te doen. Wel is het systeem uiteraard ‘zelflerend’: hoe langer actief met  meer data, des te nauwkeuriger moet de voorspelling worden.

Dit is nog maar een begin. Speurend Nederland heeft nog veel grotere mogelijkheden in analyse en voorspelling. Met real-time analyse en inzet in plaats van met louter inzet voor werkroosters voor de komende twee weken zou het effect van CAS kunnen toenemen. Dan zouden weersinvloeden kunnen meespelen, net als incidentele gebeurtenissen zoals uitslagen van voetbalwedstrijden. En zowel het mobiel voeden als raadplegen van CAS door dienders onderweg. ‘Om dit te realiseren zullen een flink aantal hordes genomen moeten worden, maar het is duidelijk dat dit de moeite zal lonen’, aldus Willems.

Verdacht vanuit netwerken

Vermindering van misdaad zal iedereen toejuichen en is het doel van de inmiddels niet minder dan 700 ‘intelligenceprofessionals’ tellende Community of Intelligence van de politie. Dat aantal wordt genoemd in de inleiding van het eerste Nederlandse boek over voorspellend speuren, ‘Predictive policing : kansen voor een veiligere toekomst’, van Rutger Rienks, afdelingshoofd business intelligence en kwaliteit bij de landelijke politie.

Er staan aardige voorbeelden in, met gebruik van termen die iedereen anders zal interpreteren, bijvoorbeeld Fluïde Netwerken Aanpak (FNA). Daarmee kunnen aangehouden personen op straat veel sneller dan voorheen met bepaalde misdaad in verband worden gebracht. Ook als ze niet zelf verdacht zijn, maar banden hebben met drugshandelaren, af te leiden uit Sociale Netwerk Analyse algoritmen. Zo kon een persoon met een blanco blazoen worden gevolgd en even later was hij betrokken bij een drugstransactie op een parkeerplaats achter een supermarkt. ‘Hebbes’ en een paar kilo drugs in beslag genomen.

Rienks filosofeert vrolijk door over profilering, niet alleen met informatie van verdachten in politiesystemen – inclusief DNA – maar ook uit ‘talloze andere bronnen…Dit varieert van informatie van verzekeraars, reisorganisaties en de belastingdienst tot internetdata en social-media feeds.’

Deze gebruik je voor voorspellende modellen die je ‘integreert in systemen’ die ‘triggers in de vorm van verhoogde kansen, hits of matches afgeven om voor een passende reactie te zorgen.’ Dit soort methoden biedt de mogelijkheid om ‘naar de verdachten toe te redeneren’. Ook kun je met sociale media analyse van personen die hun straf achter de rug hebben recidive voorspellen en proberen voortijdig in te grijpen.

De BraafBurger Coëfficiënt

Het stoplichtmodel, dat ook de belastingdienst hanteert, gaat uit van controleren (rood), niet lastigvallen (groen) en oranje. Zo maakt de Belastingdienst van elk risico op verkeerde aangifte of gebruikmaking van een toeslag met succes gebruik van data-analyse. Daaruit volgt ook voor elke burger een profiel in hoeverre er kans op overtredingen is. Het kan ook positief worden ingezet, om mensen erop te wijzen dat ze waarschijnlijk recht hebben op een toeslag.

Vooral het oranje, maar ook het rood en groen, zal meer en meer gespecificeerd kunnen worden. Dan ontstaan er geen schalen met drie variaties, maar met tien, of wellicht honderd; of meer. Op medisch gebied kun je de kans op kanker, hartfalen of Parkinson voorspellen, en qua afwijkend gedrag de kansen op criminaliteit, verzekeringsfraude, verkeersovertredingen, scheiding. Elke burger heeft dan een braafheidsfactor. Het koppelen van bestanden, zoals genoemd, helpt dit voorspellend justitiewerk vooruit.

Hoe meer we ons laten kennen, des te veiliger wordt het leven. Fair deal? Rienks besteedt uitgebreid aandacht aan ethische vraagstukken. Een deel van de volgende zes vraagtekens bij het voorspelen van criminaliteit vanuit data is gebaseerd op het boek:

1) Groeiende afhankelijkheid van machines als black boxes die besluiten nemen zonder dat mensen nog weten hoe die besluiten zijn genomen noch er invloed op kunnen uitoefenen of kunnen corrigeren.

2) Het risico op het stigmatiseren van personen en groepen maar ook van wijken. Frank Bovenkerk wees al op het risico op het ‘contraire effect: hele bevolkingsgroepen tegen je in het harnas jagen.

3) En welke betrouwbaarheidsmarges moet je hanteren: 50, 75 of 95 procent? Dan nog: de vooroordelen bij de data, vermenigvuldigd met de onderbuikgevoelens van de speurders leiden tot bijvoorbeeld ‘etnisch profileren’. Waar ligt de grens bij het hanteren van indicatoren qua leeftijd, geslacht, vervoermiddel etc. bij preventief fouilleren en met verkeerscontroles?

4) De ‘valse positieven’; onterecht aanwijzen van mensen als verdachten. Met wie de speurders vervolgens geen enkele voorzichtigheid of twijfel meer hebben en tonen. Het exemplarisch geval met de klem gereden ‘dame met een poedel’ die niet de verwachte zware drugscrimineel was. (Rienks merkt op dat tijdens deze actie wel een taxi met twee kilo cocaïne werd aangehouden, dus zo slecht was het systeem niet.)

5) Big data als ultieme middel om het rendementsdenken te optimaliseren. Oftewel: de middelen worden geoptimaliseerd om tekortkomingen in de opsporing elders te compenseren.

6) Boeven spelen in op Het Model en het handelen van de politie op grond van Het Model en kiezen voor andere plekken en vormen van misdaad met minder pakkans.

Boevenantwoord verwacht

Dat laatste vormde ook de kern van kritiek recent geuit bij een recent congres in Utrecht van Kerkebosch over inzet van big data voor fraudebestrijding. Het CAS kwam in een aantal presentaties aan de orde. De rode draad was er een van optimisme maar ook van scepsis: misdaad kun je wel beter bestrijden, maar zal er waarschijnlijk niet door verminderen, maar zich verplaatsen.

Zo is het een kwestie van tijd alvorens boeven hun eigen risicoanalyse zullen optuigen, iets van een Pakkans Antipicipatie Syteem. Wellicht niet één twee drie met een big data systeem waarmee criminelen politie-inzet en hun pakkans berekenen, ofschoon criminelen technologie steeds hoogwaardiger inzetten. Zo had het beruchte Mexicaanse Zeta drugskartel zelfs een heel eigen mobiele telefoonnetwerk opgetuigd. De boeven ontvoerden technische experts en dwongen hen het netwerk te bouwen en onderhouden. Zo bezien mogen dataexperts zich ook extra gaan beveiligen.

Toepassing van big data of ‘little data’ – de simpele analyse in het boevenbrein – zullen, aldus de deskundigen gedurende dit congres (van ondermeer PwC, Deloitte, Europol, de Belastingdienst) leiden tot aanpassing van gedrag door criminelen. En dan wordt ook dit heel ouderwets een kwestie van kat en muis. Tom van Engers, specialist in juridisch kennismanagement van de Universiteit van Amsterdam, heeft er helemaal een hard hoofd in of het systeem maatschappelijk nut zal opleveren: ‘Als na de proef al wordt gesteld dat er geen effect is op de misdaad, welk doel dient het dan?’

Wijsheid in debat

Het vereist nogal wat wijsheid en onbevangenheid om het debat over het voorspellen van (crimineel) gedrag, te voeren: wijsheid vooral van degenen die louter voordelen zien en onbevangenheid en relativering van de privacyvoorvechters.

Privacyverdedigers kunnen zich afvragen of er soms ook hogere doelen zijn dan privacy, zeker nu zoveel mensen voor kiezen om hun leven te delen met machines en mensen. Als je ernstig ziek bent, slachtoffer, bedreigd of anderszins in acute nood, dan is het redden van het vege lijf soms net wat belangrijker dan tijdelijk verlies van privacy. Bovendien gebruikte de veldwachter altijd al de onderbuik.

De wijsheid van de dataspecialisten kan beginnen met de vraag: hoeveel gelukkiger zal de mensheid worden van de verzameling en inzet van al die data? Hoe perfect willen we de samenleving inrichten ten koste van individuele grilligheid die haar juist zo kleurrijk maakt? Dat is een technologisch gezien domme vraag, maar zelfs bij de geneugten van smartphonegebruik worden momenteel vraagtekens gezet. ‘Minder, minder…’ kan ook, of wat datagebruik betreft: niet alles wat kan, hoeft ook.

De grote vraag: kun je met een aantal beperkende voorwaarden en met privacy by design dikke data nuttig inzetten zonder een Grote Broer te creëren die de individuele vrijheid uiteindelijk onomkeerbaar zal aantasten?

 

Wachten op boeven big dataWachten op boeven big data

Gepubliceerd

28 mei 2017
Netkwesties
Netkwesties is een webuitgave over internet, ict, media en samenleving met achtergrondartikelen, beschouwingen, columns en commentaren van een panel van deskundigen.
Colofon Nieuwsbrief RSS Feed Twitter

Nieuwsbrief ontvangen?

De Netkwesties nieuwsbrief bevat boeiende achtergrondartikelen, beschouwingen, columns en commentaren van een panel van deskundigen o.g.v. internet, ict, media en samenleving.

De nieuwsbrief is gratis. We gaan zorgvuldig met je gegevens om, we sturen nooit spam.

Abonneren Preview bekijken?

Netkwesties © 1999/2024. Alle rechten voorbehouden. Privacyverklaring

1
0