Dokumentasjon · Krimdata
Metodikk
Kanonisk kilde for dataarkitektur, kilderangering og klassifiseringsregler. Alle fremtidige oppdateringer av databasen skal følge denne metodikken.
1. To separate datalag
Krimdata skiller strengt mellom to typer data som aldri blandes i samme analyse. Lag 1 er offisiell aggregatstatistikk som representerer faktisk registrert kriminalitet. Lag 2 er individuelle dokumenterte hendelser — et utvalg, ikke en fullstendig statistikk.
Aggregerte nasjonale tall fra SSB, Kripos og Politiets årsrapporter. Representerer faktisk registrert kriminalitet i Norge. Brukes til KPI-er, trendgrafer og nasjonal sammenligning. Oppdateres ikke manuelt — hentes via SSB PxWebApi og Kripos publikasjoner.
Strukturerte case-data for individuelle, identifiserbare hendelser med kildesporing. Representerer ikke total kriminalitet — kun saker med tilstrekkelig dokumentasjon til geografisk stedfesting og klassifisering.
Eksempel: «83 registrerte voldtektssaker» ≠ «83 voldtekter i 2025»
Kritisk forbehold: Media dekker kun en liten andel av faktisk kriminalitet — særlig for voldtekt, familievold og seksuallovbrudd. Urbane områder (Oslo, Bergen) er kraftig overrepresentert i mediedekning. Høy tetthet i kartet reflekterer delvis bedre pressedekning, ikke nødvendigvis høyere kriminalitet.
2. Hendelsesdatabasen — omfang og dekning
Databasen dekker perioden 2000–mai 2026 med dokumenterte enkelhendelser. Alle saker har minst én kildebelegg og en tilhørende confidence-score.
ID-format: Alle hendelser har IDen NO-YYYY-NNNNNN (sekvensiell innen år). Koordinater varieres per bydel — ikke identisk lat/lng for samme område.
3. Kilderangering — firnivå-hierarki
Alle hendelser i Lag 2 knyttes til minst én kilde. Confidence-nivå beregnes automatisk basert på kildesammensetning. Følg alltid dette hierarkiet ved nye oppføringer.
Offisielle primærkilder
Gir automatisk HIGHÉn offisiell kilde er tilstrekkelig for HIGH confidence. Overtrumfer alle mediekilder.
Tier 1 — Nasjonale riksmedier
2+ = HIGH · 1 alene = MEDIUMGullstandard for norsk krimjournalistikk. Uavhengig redaksjon, faktasjekk, nasjonal dekning.
Tier 2 — Regionale medier
1 Tier 1 + 1 Tier 2 = HIGH · 1 alene = MEDIUMHøy troverdighet innen sitt dekningsområde. Lokalkjennskap gir ofte bedre detaljer enn riksmedia.
Tier 3 — Lokale medier
Alene = MEDIUM · Bruk med forbeholdTroverdig lokal dekning, men begrensede ressurser for faktasjekk. Brukes som supplement til Tier 1/2.
Tier 4 — Aldri alene: Rett24 (juridisk nisje, høy kvalitet), Document.no, Resett, Filter Nyheter. Disse har redaksjonell bias eller varierende faktasjekk. Kan kun brukes som korroborering av funn fra Tier 1–3, og inkluderes ikke alene i databasen.
4. Confidence-regler
Confidence-score tildeles basert på kildesammensetning. Reglene er absolutte — følg dem nøyaktig ved alle nye oppføringer.
Bekreftet av offisiell kilde eller minimum to uavhengige Tier 1/2-medier. Dato, sted og type er verifisert.
Rapportert av én pålitelig mediekilde. Grunnfakta er sannsynlig korrekte, men detaljer kan mangle.
Kun én lokal kilde, motstridende info, eller eldre sak der originalkilder ikke er tilgjengelig.
5. Kanonisk krimtaksonomi
Alle hendelser mappes mot standardiserte lovbruddskategorier. Synonymer og juridiske betegnelser konverteres alltid til nærmeste kanoniske type.
Inkl.: forsettlig drap, overlagt drap, terrorangrep med dødelig utfall
Inkl.: terrorisme, politisk motivert angrep, massedrep
Inkl.: skuddveksling, skutt, skyteepisode
Inkl.: stikkvåpen, knivstukket, egge- og stikkvåpen
Inkl.: organisert kriminalitet, MC-kriminalitet, klanvold
Inkl.: vold blant mindreårige, tenåringsvold, gjengvold unge
Inkl.: partnervold, intim partnervold, husstandsvold
Inkl.: seksuelt overgrep, seksuell omgang, misbruk
Inkl.: tyveri med vold, væpnet ran, utpressing
Inkl.: legemsvold, kroppsskade, grov kroppskrenkelse
Inkl.: trusler med våpen, livstruende trusler
Inkl.: forsøk på drap, overfall med drapsforsett
6. Kildetype og kildeformat
Alle kilder i Lag 2 lagres med kildetype, navn, URL og hentet-dato. Kildetype bestemmer visuell prioritering i grensesnittet.
Nåværende status: De fleste hendelser i databasen er dokumentert med type: "NYHETER". Offisielle kilder (POLITI, RETTSVESEN, REGJERING) legges til for landmark-hendelser og saker der rettsdokumenter er offentlig tilgjengelige. Oppgradering av kildetype til POLITI/RETTSVESEN øker automatisk confidence for de berørte hendelsene.
7. Must-have landemerke-hendelser
Disse hendelsene skal alltid være i databasen med HIGH confidence og korrekte data. De er ankerpunkter for dataintegritetssjekk.
8. Status-livssyklus
Status følger sakens rettslige utvikling fra hendelse til rettskraftig dom.
9. Nasjonalitet og demografi
Nasjonalitet registreres kun der dette er eksplisitt publisert i offisielle kilder (politiets pressemeldinger, domstolsdokumenter). Informasjon som ikke er offentliggjort registreres ikke — aldri spekulert basert på navn eller utseende.
Statsborgerskap er ikke det samme som etnisitet eller landbakgrunn. Disse feltene oppdateres kun via NATIONALITY_MAP i src/pipeline/incidents/nationality-map.ts.
10. Makrostatistikk (Lag 1) — datakilder
Offisiell statistikk hentes fra SSB og Kripos via pipeline. Oppdateres ikke manuelt.