Finne og definere datasett

Sist oppdatert: 18.12.2024

Før du kan søke må du finne ut hvilke datakilder som har den dataen du trenger for prosjektet ditt. Det er viktig å bruke god tid på å velge riktig variabler for at saksbehandlingen skal gå så raskt som mulig. 

Hvordan bruke variabelutforskeren?

Det primære formålet med variabelutforskeren er at forskere enkelt skal få oversikt over hvilke helsedata som finnes tilgjengelig, samt gjøre dem mest mulig selvhjulpne når det gjelder å definere hvilke variabler fra hvilke helsedatakilder de ønsker å søke om tilgang til.

Definer de variablene du ønsker

Vi anbefaler at du bruker variabelnavnene slik de er beskrevet hos datakilden når du setter opp variabellisten. På den måten blir det enklere for saksbehandlere å finne frem til opplysningene du er ute etter, som igjen vil bidra til raskere saksgang.

De fleste beskrivelsene av datakildene har lenker til variabellister. I tillegg finner du beskrivelser av variabler fra utvalgte datakilder på helsedata.no. Har du laget variabelliste på helsedata.no får du valget om å laste opp denne i søknadsskjemaet. Du kan også velge å laste opp en fil som inneholder variabellisten din. 

Ved å redusere mengden variabler du søker om så mye som mulig øker sannsynligheten for at søknaden blir godkjent.

Tydelig beskrivelse

Beskriv tydelig hvilke opplysninger du er ute etter og kontakt forvalter av datakilden dersom det ikke finnes noen variabelliste åpent tilgjengelig.

Vær oppmerksom på at ulike aktører har ulike behov med tanke på spesifiseringsnivå når det gjelder variabler. Det er for eksempel ikke nødvendig å laste opp fullstendig variabelliste til REK. Beskriv heller variablene på et overordnet nivå. Det vil gjøre det lettere om du må gjøre små justeringer senere.

Eksempel på variabler på overordnet nivå:

"Alder" "krefttype" "medisin" "bosted"

Mer spesifiserte variabler:

"60-70 år", "lungekreft", "smertestillende", "Bergen"

Sensitive opplysninger

Det finnes noen opplysninger som er spesielt sensitive. Eksempler på slike ser du under. Har du behov for denne typen opplysninger må du vurdere grupperte eller aggregert nivå på opplysningen. Dette er i tråd med prinsippet om dataminimering.

  • Geografisk bosted, for eksempel kommune
  • Diagnose- og prosedyrekoder, for eksempel ICD10 og NCMP/NCSP/NCRP på laveste tegnnivå
  • Datoer og tidspunkter for hendelser, for eksempel fødsels- og dødsdato, dato for diagnose, for kontakt med helsevesenet osv.
  • Behandlingssteder, for eksempel sykehusavdeling eller sykehus
  • Indekser, for eksempel sykelighet

Vurderer du at ditt prosjekt har behov for denne type opplysninger på høyeste identifiseringsnivå/størst detaljnivå, må du redegjøre for det i søknaden din.

Ulike detaljnivåer for spesielt sensitive opplysinger

Geografisk bosted

  1. Størst detaljnivå: Kommune
  2. Gruppert 1: Fylke
  3. Gruppert 2: Landsdel
  4. Fravær av sensitivt innhold: Kommunestørrelse

Diagnose/prosedyrekoder

  • Størst detaljnivå: S62.6 (brudd i annen finger enn tommel) – ICD-10
  • Gruppert 1: S62 – Brudd i håndledds- og håndregionen – ICD-10
  • Gruppert 2: S6 – Skader på håndledd og hånd – ICD-10
  • Fravær av sensitivt innhold: Gruppert på annen måte, f.eks. CCI (Canadian Classification of Health Interventions) eller andre sykelighetsindekser som Charlson Comorbidity Index

Datoer

  1. Størst detaljnivå: dd.mm.åååå
  2. Gruppert 1: mm.åååå
  3. Gruppert 2: åååå
  4. Fravær av sensitivt innhold: Dager mellom hendelser

Behandlingssteder

  1. Størst detaljnivå: Sykehuset
  2. Gruppert 1: Helseforetak
  3. Gruppert 2: Regionalt helseforetak
  4. Fravær av sensitivt innhold: Store vs. mindre behandlingssted