Sidste år kørte mange medier et stort kriminologisk tema (f.eks. her en
artikel i Politiken), som tog fat i et fænomen vi utvivlsomt kommer til at se meget mere til i fremtiden: politiarbejde baseret på statistik og algoritmer.
Ideen er kort fortalt den, at politiet indsamler data om personer på en lang række forskellige parametre, for eksempel køn, alder, hvor de bor, tidligere domfældelser, beskæftigelse, uddannelse, ægteskabelig status, børn, og så videre. Statistiske analyser forsøger så at finde mønstre i disse data, for at identificere hvilke faktorer, som giver en særlig høj sandsynlighed for at begå kriminalitet.
I udgangspunktet er sådanne analyser relativt ukontroversielle - kriminologer har lavet den type arbejde i årtier, for at finde ud af hvilke faktorer man kan forsøge at ændre på, for at forhindre at potentielle kriminelle faktisk begår kriminalitet. Resultaterne er da også på mange områder velkendte: det vigtigste er at få uddannelse og arbejde, ligesom gode familierelationer kan hjælpe, og det er en fordel hvis man bor et fredeligt sted, og ikke har for mange kontakter til aktive kriminelle.
Det nye ved den type analyser som benyttes i dag er, at de kigger på mange flere faktorer end man tidligere har kunnet, og at de kan lave langt mere individualiserede analyser. Det skyldes dels at de statistiske værktøjer er blevet bedre, dels at politiet har bedre data til rådighed, og endelig at den rå maskinkraft, computeres evne til at analysere enorme mængder data, er blevet dramatisk forøget.
Hvor man tidligere har kunnet sige noget på et generelt niveau, om hvilke sociale faktorer som i almindelighed påvirkede kriminalitet, så kan man med moderne analyser lave en individuel risikoprofil, så at hver enkelt person groft sagt kan bedømmes som enten "ufarlig" eller "potentielt kriminel". Og politiet kan anvende sådanne analyser til at fokusere deres arbejde på de personer som analyserne vurderer har den største risiko for at begå kriminalitet (eller for at have begået en forbrydelse).
Fordelen ved såkaldt "intelligent politiarbejde" ("intelligent policing" på engelsk), som på denne måde er fokuseret gennem statistiske analyser, er indlysende: den giver politiet mulighed for at bruge deres ressourcer der, hvor de gør størst gavn. I stedet for (for eksempel) at spilde en masse tid på at holde øje med personer, som alligevel ikke ville have begået en forbrydelse, så kan de holde endnu bedre øje med netop de personer, som faktisk kunne finde på, at begå en forbrydelse. Med lidt held kan det både styrke den forebyggende indsats, således at forbrydelser slet ikke bliver bliver begået, og den opklarende indsats, således at flere gerningsmænd kan straffes, hvilket plausibelt har en afskrækkende præventiv effekt (som jeg
tidligere har skrevet om, så peger empirien på at øget sandsynlighed for at blive straffet virker afskrækkende; det gør strengere straffe derimod ikke).
Ikke desto mindre er intelligent politiarbejde blevet mødt med en byge af kritik, som også dukker op i beslægtede tiltag, f.eks.
Gladsaxe kommunes brug af statistiske værktøjer til at forudsige, hvilke børnefamilier der kan opstå problemer i, og
regeringens forslag om at udvide metoden til hele landet.
Når man skræller den dramatiske retorik af, så er det imidlertid ret uklart præcist hvad problemet med intelligent politiarbejde mere præcist skulle være. Jeg kan forestille mig i hvert fald fire mulige indvendinger mod denne praksis: 1) det kan være at politiet slet ikke bør have adgang til sådanne data; 2) det kan være at politiet ikke bør lade sådanne data danne grundlag for forskelsbehandling; 3) det kan være at statistisk analyse ikke er et acceptabelt grundlag for forskelsbehandling; og 4) det kan være, at den konkrete handling politiet foretager på baggrund af analysen er forkert.
For at fokusere diskussionen
kan vi vurdere mulighederne i tilknytning til et konkret eksempel, som minder om den
amerikanske praksis der har været omdiskuteret:
Algoritmisk advarsel.
Politiets software indsamler løbende data fra offentlige registre om
bl.a. personers køn, alder, etnicitet, helbred, jobsituation,
familiesituation, bopæl, uddannelse, og straffeattest. En algoritme
udpeger derpå personer, som har statistisk høj sandsynlighed for at begå
en forbrydelse. En politipatrulje opsøger disse personer, og advarer
dem.
Et oplagt problem med debatten har også været, at de fire mulige problemer ikke blev skilt ad, og vurderet individuelt. Det giver sig selv, at dette er nødvendigt, for at kunne sige præcist hvad som eventuelt er galt med algoritmisk advarsel. Så vi kigger på dem en for en.
Politiet bør ikke have adgang til personlige data
Den første mulighed er som nævnt, at politiet slet ikke bør have adgang til sådanne data. Det kan virke intuitivt, at personlige data ikke bør være tilgængelige for myndighederne, fordi de er private. Der er imidlertid flere udfordringer for denne indvending.
For det første, så stipulerer eksemplet, at politiet anvender data, som i forvejen findes i offentlige registre. Der er ikke tale om, at de indsamler data, som offentlige myndigheder ellers ikke ville have. Hvis vi i andre sammenhænge mener, at det er legitimt for offentlige myndigheder, at ligge inde med data af denne type, men mener at det netop i denne er problematisk, så er vi nødt til at forklare hvad forskellen på de to situationer er.
For det andet, så er der tale om data som politiet i alle mulige andre sammenhænge ville have adgang til og basere deres beslutninger på. Når for eksempel politiet vurderer et vidnes troværdighed eller træffer en beslutning om hvor vidt de skal arrestere en person, så kan de uden videre foretage en vurdering af den type data som algoritmisk advarsel nævner. Faktisk er man som borger forpligtet til at oplyse mange af disse data, når politiet beder om det. De fleste mener at det ikke eller kun i meget begrænset omfang er problematisk, at politiet i andre praksisser vurderer og baserer deres beslutninger på sådanne data, så hvis det skulle være problematisk her er man igen nødt til at forklare hvorfor der findes en sådan forskel.
For det tredje, så skubber påstanden forklaringsproblemet foran sig. Vi er nødt til at vide både hvilke data som offentlige myndigheder må og ikke må have adgang til (jeg antager at der er sammenhænge hvor offentlige myndigheder legitimt har adgang til nogle data), og
hvorfor det kan være problematisk, at offentlige myndigheder har adgang til sådanne data. De mest lovende forklaringer er imidlertid varianter over de andre muligheder vi har nævnt - for eksempel, at offentlige myndigheder ikke bør have sådanne data, fordi det vil føre til at de forskelsbehandler på baggrund af dem, og en sådan forskelsbehandling er forkert. Men i så fald ender problemet med adgang til data med at være en anden problematik i forklædning.
Politiet bør ikke forskelsbehandle på baggrund af denne type data
En anden mulighed er, at det ikke er adgangen til data, men dét, at personer forskelsbehandles på baggrund af bestemte data, som er problematisk. Vi fordømmer i mange sammenhænge forskelsbehandling, og især på baggrund af nogle af de involverede data, for eksempel køn og etnicitet.
Det umiddelbare problem for denne forklaring er, at der er masser af sammenhænge hvor vi accepterer forskelsbehandling. Det er helt oplagt tilfældet med for eksempel uddannelse og straffeattest, hvor mange job udelukker personer som ikke har den rette uddannelse, og mange arbejdsgivere frasorterer ansøgere med plettet straffeattest. Men det findes også i nogle sammenhænge på baggrund af de karakteristika, som vi i andre sammenhænge mener er problematiske. Vi accepterer for eksempel forskelsbehandling på baggrund af køn i adgangen til omklædningsrum og indskrivningen på sportshold, og selvom det ikke er ukontroversielt vil mange også acceptere såkaldt positiv særbehandling på baggrund af etnicitet, hvis der er tale om en udsat eller underpriviligeret gruppe.
Den bedste forklaring er, at det ikke er det karakteristika, som forskelsbehandlingen er baseret på, men effekten af forskelsbehandlingen, som afgør, om den er rigtig eller forkert (for de nørdede: det har jeg for efterhånden lang tid siden skrevet
en mere detaljeret artikel om). Men i så fald er det for det første et åbent spørgsmål, om en given type intelligent politiarbejde er god eller dårlig, og for det andet en variant af den fjerde mulighed, som vi kigger på senere.
Politiet bør slet ikke basere deres handlinger på algoritmer
Den tredje mulighed er, at det er selve dét, at politiet baserer deres handlinger på algoritmer, i stedet for på den type personlige og subjektive vurderinger som politifolk traditionelt har anvendt, som udgør et problem i algoritmisk advarsel. Den forklaring kan umiddelbart virke tiltalende, fordi det er dette som er den væsentligste ændring i forhold til tidligere praksis, og fordi den synes at pege på en intuitiv forskel. Overvej følgende variant:
Ikke-algoritmisk advarsel. En politibetjent med godt kendskab til et lokalmiljø vurderer at en ung mand er på vej ud i uføre, og opsøger ham, for at advare ham imod at rode sig ud i kriminalitet.
De fleste vil antageligt mene, at politibetjenten handler fornuftigt, og måske endda rose, at politiet i dette eksempel er aktivt involveret i lokalmiljøet med opsøgende og forebyggende arbejde. Men situationen er i store træk den samme som i algoritmisk advarsel: politibetjenten har (kan vi forestille os) adgang til de samme typer data, og baserer sin forskelsbehandling af den unge mand på en intuitiv vurdering af disse data. Den væsentlige forskel er altså, at betjenten baserer sin advarsel på en ikke-algoritmisk og intuitiv vurdering.
Hvorfor skulle det gøre en forskel, om politiet handler på baggrund af en algoritme? Jeg tror der kan være to forskellige bud, som betragter algoritmer som henholdsvis for præcise og for upræcise. For det første kan man forestille sig, at nogen ville sige, at der skal være plads til at begå menneskelige fejl, og at et algoritmisk system bliver for klinisk, koldt og fjerner det rum som tilfældigheder og usikkerheder skaber. Det ville imidlertid være en mærkelig påstand, når man tænker den lidt efter. Hvis politiets handlen - i dette tilfælde en advarsel - i almindelighed er en god brug af deres ressourcer, så ville det være besynderligt at påstå, at vi skal foretrække et mindre effektivt system, hvor ressourcerne ofte bruges forkert, frem for et mere effektivt system, hvor de oftere bruges rigtigt.
Det andet bud kan formuleres som påstanden om, at vi alle har "ret til at blive behandlet som individer". Dette udtryk kan betyde lidt forskellige ting (se
Kasper Lippert-Rasmussens suveræne diskussion, og afvisning, af andre centrale betydninger), men den mest gavmilde læsning af det er, at en algoritmisk beslutning ikke i tilstrækkelig grad kan tage hensyn til relevante faktorer som optræder i den enkelte situation. Påstanden er altså her, at mens en politibetjents intuitive beslutning kan tage hensyn til alle de faktorer som påvirker situationen, så vil en algoritmisk beslutning nødvendigvis være baseret på en langt mere grovkornet vurdering af de brede data, som softwaren har adgang til. Påstanden her er derfor den stik modsatte af den ovenfor: algoritmer er ikke præcise nok, fordi de ikke kan tage hensyn til en masse individuelle faktorer.
Den variant er et langt bedre bud, fordi det faktisk er meget plausibelt, at vi ikke bør bruge algoritmer, hvis vi træffer bedre beslutninger, når vi lader være. Men den løber durk ind i det problem, at det er empirisk meget tvivlsomt, om mennesker er bedre til at træffe beslutninger, end de relevante algoritmer. Der findes naturligvis masser af algoritmer, som er så primitive, at de ikke kan matche menneskelige vurderinger, men netop derfor testes algoritmer som anvendes i intelligent politiarbejde grundigt, og tages typisk kun i brug, hvis de er mindst lige så gode som menneskelige vurderinger.
Der kan være undtagelser - hvis omkostningen ved fejl er lav, og det er billigere at få algoritmen til at træffe beslutningerne, så kan det naturligvis give mening at bruge algoritmen vel vidende, at den laver flere fejl end mennesker. I algoritmisk advarsel er det imidlertid ikke dette som er på spil, og faktisk er der ikke meget grund til at tro, at mennesker er specielt gode til intuitivt at træffe den type beslutninger, som algoritmisk advarsel handler om. Kort fortalt er det for det første overordentlig vanskeligt, at sammenholde forskellige faktorer på en præcis måde, og resultaterne er ofte meget kontraintuitive. Oveni kommer at vi som mennesker typisk ligger under for en lang række kognitive og emotionelle bias, som ofte påvirker vores vurderinger uden at vi er klar over det (for de nørdede: det har jeg skrevet om
i forbindelse med politiprofilering)
Politiet bør ikke handle på denne måde baseret på algoritmer
Den fjerde og sidste mulighed er, at den handling som politiet udfører i sig selv er problematisk. Som ikke-algoritmisk advarsel illustrerer, så er vi tilbøjelige til at mene, at det ikke er problematisk for politiet at advare personer, men det kunne jo være at vi tog fejl. Det kan også være, at der er en kvalitetsforskel på en algoritmisk baseret advarsel og en ikke-algoritmisk baseret advarsel. Det kan for eksempel være, at personer som modtager en algoritmisk baseret advarsel er mere tilbøjelige til at ignorere den, eller betragte den som en provokation, hvis de er klar over, at advarslen er baseret på en algoritmisk vurdering af deres sandsynlighed for at begå en forbrydelse.
En sådan reaktion er nok irrationel, hvis der reelt ikke er gode grunde imod algoritmisk advarsel (udover de som her er på spil, og følger af den negative reaktion). Men det ændrer ikke ved, at en sådan forskel i effekten af de to typer advarsler kan tale imod at bruge algoritmisk advarsel.
Denne mulighed er den mest plausible af de fire. Den peger på en reel og relevant problematik, som bør vurderes i forbindelse med intelligent politiarbejde. Udfordringen for denne type indvending er, at ikke som sådan er intelligent politiarbejde som der er noget galt med. Det er enten dét, at den form for politiarbejde som laves - intelligent eller ej - er kontraproduktiv, eller dét, at intelligent politiarbejde i en bestemt kontekst viser sig at have utilsigtede sideeffekter. Begge dele udgør gode indvendinger mod en given praksis, men ikke mod intelligent politiarbejde som hele.
Samlet set må man nok konkludere, at problemerne ved intelligent politiarbejde er voldsomt overvurderede. De reele udfordringer ligner dem som traditionelt politiarbejde møder, med at sikre at politiets indsats er effektiv og hensigtsmæssig. Meget af modstanden forekommer mig at være motiveret af status quo bias. Hvis det er rigtigt, så kræver det blot, at vi vænner os til brugen af algoritmer, at vi bliver mindre bekymrede. Og helt ærligt - hvem har også i sidste ende lyst til at forsvare det, som vi vel retteligt fremover bør kalde "uintelligent politiarbejde"?