Big data, big questions

Big data can potentially solve most of our problems, from diseases, traffic jams to environmental challenges. However, we also need to ask some hard difficult questions before we turn the big data hose on. I’ve written an article for the Norwegian weekly Morgenbladet about an academic article written by danah boyd and Kate Crawford, Critical Questions for Big Data in the journal Information, Communication and Society.

Morgenbladet

Hva: Alt fra terrorisme, trafikkaos eller sykdomsbekjempelse blir spådd løst ved hjelp av «big data», ifølge evangelistene. Men ekspertene roper varsko.

Hvem: Danah Boyd og Kate Crawford, forskere ved Microsoft Research.

Hvorfor: Hvordan beholde et sterkt personvern samtidig som vi drar fordeler ved store data? Boyd og Crawford reiser viktige spørsmål nå som store data gjør at lover og etiske regelverk må oppdateres og nye akademiske praksiser utvikles.

Hva er egentlig Big Data, eller store data som jeg velger å kalle det? Og er det egentlig så stort med store data når de kan brukes til massiv overvåkning, slik vi har sett i saken om amerikanske myndigheters overvåkning av kommunikasjonsteknologi, avslørt av Edward Snowden?

Alle fordelene ved store data – betaler vi for dem ved å ofre personvernet? Forskerne danah boyd og Kate Crawford har skrevet om mange av disse problemstilllingene i artikkelen «Critical Questions For Big Data», for tiden en av de mest leste artiklene i tidsskriftet Information, Communication & Society, og fritt tilgjengelig på nett via open access.

Egentlig er store data et dårlig begrep, men det har vært brukt i forskningen til å beskrive datasett som var så store at man måtte ha superdatamaskiner for å håndtere dem. Men nå har selv små laptoper så stor prosesseringskraft at de kan behandle digre datasett. boyd og Crawford hevder at store data dreier seg mindre om «stor», og mer om «kapasiteten til å søke, aggregere og kryss-referere store datasett».

Hensikten med store data er å avdekke mønstre i dataene, utvikle innsikt og forutsi svar på komplekse spørsmål. Eksempelvis prøver man i tjenesten Google Flu Trends å forutse utbrudd av influensa-epidemier i ulike land basert på folks søk på influensarelevante ord. Flu Trends har fått rett noen ganger, og har feilet kraftig andre ganger.

boyd og Crawford stiller seks kritiske spørsmål ved store data som ikke bare akademikere bør bruke noen minutter på, men også dere som er interessert i den norske samfunnsdebatten:

1. Store data endrer definisjonen av kunnskap.

2. Påstander om objektivitet og nøyaktighet er villedende.

3. Større data er ikke alltid bedre data.

4. Tatt ut av sin kontekst mister store data sin mening.

5. Bare fordi data er tilgjengelig, er det ikke nødvendigvis etisk riktig å bruke dem.

6. Begrenset adgang til store data skaper nye skillelinjer.

Jeg har personlig snakket varmt om og brukt store data i flere år, men jeg har også erfart at alle datasett har sine begrensninger, akkurat som teknologien har det. Som Melvin Kranzberg skriver: «Teknologi er hverken god eller ond, men heller ikke nøytral». Ulike teknologier har ulike kvaliteter, noe som også får konsekvenser for hvordan de store dataene kan brukes. Eksempelvis har Twitter og Facebook dårlige arkiv- og søkefunksjoner, noe som gjør at forskere primært fokuserer på nåtidshendelser, slik som folks reaksjoner på politiske valg, naturkatastrofer eller tv-begivenheter.

Det er verdt å merke seg at store data skaper nye klasseskiller. boyd og Crawford henviser til Lev Manovich, som har definert tre nye klasser:

1. De som skaper dataene (bevisst og ubevisst ved å etterlate seg digitale fotavtrykk).

2. De som har ressursene og tilgangen til å samle dataene.

3. De som har ekspertisen til å analysere dataene.

Den siste klassen er minst, mest priviligert og har stor definisjonsmakt over hvordan store data blir brukt i fremtiden.

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Google photo

You are commenting using your Google account. Log Out /  Change )

Twitter picture

You are commenting using your Twitter account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s