Mulig eller faktisk årsak?

Mulig årsak eller faktisk årsak? Om kausalitet i forskning og klinikk

Fagkronikk i Fysioterapeuten 9/2014.

Fagartikkel

Karin Magnusson, fysioterapeut MSc, stipendiat ved Nasjonal kompetansetjeneste for revmatologisk rehabilitering, Diakonhjemmet sykehus og Avdeling for helsefag, Institutt for samfunn og helse, Universitetet i Oslo. Tilknyttet EPINOR (Den nasjonale forskerskolen i populasjonsbasert epidemiologi). karin.magnusson@diakonsyk.no.

Kåre Birger Hagen, fysioterapeut, professor og enhetsleder ved Nasjonal kompetansetjeneste for revmatologisk rehabilitering, Diakonhjemmet sykehus og Avdeling for helsefag, Institutt for samfunn og helse, Universitetet i Oslo.

Denne fagkronikken ble akseptert 14.8.2014. Fagkronikker vurderes av fagredaktør. Ingen interessekonflikter oppgitt.

Kausalitet: Årsakssammenheng, forholdet mellom årsak og virkning.

Innledning

Du står i kassa i butikken og skal til å betale dagens innkjøp, og avisoverskriften «Slik unngår du knesmertene» lyser mot deg. Kanskje har knepasienten du møter i morgen faktisk lest den avisen, og du tenker du kommer til å bli svar skyldig da du har følelsen av at overskriften er for god til å være sann. Medieoverskriftene handler ofte om hvordan man selv kan påvirke egen helse gjennom livsstil. En økende forekomst av livsstilssykdommer i befolkningen og informasjonssøkende pasienter vil merkes i primærhelsetjenesten. Det vil stilles økende krav til at klinikere kan forstå og forklare forskningen som ligger bak overskriftene. Denne teksten handler om årsak og virkning i helseforskning og hvordan vi kan vite at en potensiell risikofaktor faktisk forårsaker en sykdom eller et helseutfall.

Hva er en årsak?             

En årsak defineres som «det som fremkaller en forandring, bevegelse eller en annen virkning» (1). Vi lærer automatisk om årsaker og virkninger fra vi er nyfødte, og skjønner fort hva som er nødvendig og tilstrekkelig av egen handling for å oppnå en ønsket virkning. Når vi har observert en virkning tilstrekkelig mange ganger tar vi det for gitt at den alltid vil finne sted, og vi tilpasser oss den nye kunnskapen og implementerer den i hverdagen. Vi vet for eksempel at hver gang vi slår på lysbryteren går lyset på øyeblikkelig. Det er en kausal sammenheng, det vil si en observerbar årsak-virkning-sammenheng mellom lysbryteren og lyset. Men vi må ha en lyspære som fungerer, en energikilde, og et ubrutt ledningsnettverk for at lyset skal gå på. Kun når alle komponentene er til stede og er koblet sammen vil vi observere en virkning. Alle faktorene utgjør til sammen en kausal mekanisme (2).

Tenk deg at du slår på lysbryteren, og at det kan bli lyst en eller annen gang om 15-20 år. I det du observer at lyset går på vet du ikke lenger om lyspæren fungerte, om det fantes en energikilde eller om ledningsnettet var intakt den gangen for 15-20 år siden. Tenk deg videre at det kun var 20 prosent økt sannsynlighet for at lyset ville gått på om 15-20 år, sammenlignet med hvis du ikke hadde slått på lysbryteren. Hadde da å slå på lysbryteren en kausal virkning? Det er slike usikre sammenhenger vi studerer i helseforskning.

Randomiserte forsøk versus observasjonsstudier

Et grunnleggende aspekt i å forstå årsaksforskningen i medisin er å forstå forskjellen mellom observasjonsstudier og randomiserte forsøk, slik Hernan og Robins beskriver (3, 4). Randomiserte forsøk blir ofte sett på som gullstandarden i hvorvidt man kan si at en eksponering eller behandling (å skru på lysbryteren) påvirker helsen. Randomisering betyr at det er helt tilfeldig hvem som behandles og hvem som ikke behandles. En virkning i det man ønsker å studere tilskrives derfor kun behandlingen eller tilfeldige variasjoner som uansett ville funnet sted. I mange tilfeller er det derimot ikke virkningen av en behandling vi ønsker å undersøke, men virkningene av en mulig helsefare. Å bevisst utsette noen for helsefare i et randomisert forsøk er ikke etisk forsvarlig. I slike tilfeller kan vi gjøre observasjonsstudier der vi observerer årsaker og virkninger i en befolkning uten intervensjon. 

Ulempen når deltagerne ikke er randomisert til det vi ønsker å studere virkningen av, er at det blir vanskeligere å si at den mulige årsaken faktisk påvirker sykdommen. Grunnen til at vi har «svakere bevis» i observasjonsforskningen, er at det i motsetning til i randomiserte forsøk, ikke er tilfeldig hvem som eksponeres og hvem som ikke gjør det. En typisk overskrift kan være «flere lightere i hjemmet gir økt risiko for lungekreft». I en studie av denne sammenhengen vil antall lightere i hjemmet og hvem som har lungekreft ikke være tilfeldig og jevnt fordelt mellom røykere og ikke-røykere (slik det ville vært i et randomisert forsøk), men systematisk skjevt fordelt. Denne skjevfordelingen kalles konfounding og er definert som en variabel som påvirker både helsefaren man ønsker å se på, nemlig lightere i hjemmet, og sykdommen man ønsker å se på, nemlig lungekreft (3).

Konfounding er uønsket i observasjonsforskningen da den hindrer oss i å kunne trekke årsak-virkning konklusjoner (3). I en statistisk analyse kan vi redusere konfoundingen ved å rette opp skjevfordelingen på forskjellige måter, for eksempel stratifisering der vi deler inn hele studiepopulasjonen i en gruppe som røyker og en gruppe som ikke røyker, og undersøker om den samme sammenhengen mellom lightere i hjemmet og lungekreft finnes i hver enkelt gruppe (5). En annen mulighet når vi har mange konfoundere er å kontrollere eller justere for dem alle i en regresjonsmodell (5).

Når er en sammenheng kausal?

På grunn av blant annet problemene med konfouding, er en signifikant sammenheng i en studie ikke det samme som en kausal sammenheng. To variabler kan samvariere helt tilfeldig eller på grunn av andre faktorer, og vi kan finne en sammenheng uten at det automatisk betyr at den ene variabelen forårsaker den andre. For at vi skal kunne si at en sammenheng er kausal må studien tilfredsstille en rekke krav og antagelser (6), og vi skal her ta for oss de viktigste. I forskningen sies det at en sammenheng er kausal når personene som får en intervensjon/er eksponert kan byttes ut med personene som ikke får en intervensjon/ikke er eksponert, med samme studieresultat. Hvis hver inkluderte person randomiseres til intervensjon eller kontrollintervensjon vil vi få to like store grupper. Ved en vellykket randomisering sier vi at gruppene er utskiftbare, som vil si at de kunne byttet plass og vi ville observert samme virkning (6). Utskiftbare grupper er nødvendig for å finne kausale sammenhenger.

I observasjonsstudier derimot, er ikke gruppene utskiftbare fordi vi ikke har randomisert, og derfor er sammenhengen vi finner i utgangspunktet heller ikke kausal. I eksempelet med lightere i hjemmet og lungekreft må vi derfor sørge for at gruppene kunne byttet plass og gitt samme resultater, og vi setter da konfunderende variabler til å være konstante. Det er dette som gjøres ved stratifisering og kontrollering for variabler, og studier som har tatt hensyn til alle mulige konfoundere er derfor nærmere å finne en kausal sammenheng enn studier som ikke har tatt hensyn til dem. Problemet i observasjonsstudier er bare at vi ikke kan vite at alle konfounderene er målt eller at de er korrekt målt og det er derfor vanskelig å få helt utskiftbare grupper (6). Det kan også tenkes at vi ikke finner noen hjem med lightere der ingen røyker, og vi kan da umulig finne en kausal effekt fordi antall lightere fullt og helt kan forklares av røyking (6).

Det er flere utfordringer med å trekke kausale slutninger i observasjonsstudier. For at vi skal kunne si at en sammenheng er kausal, må også virkningen vi studerer komme av en veldefinert intervensjon, og ikke en status en person kan ha av forskjellige årsaker (6,7). Overvekt som risikofaktor er et eksempel på en dårlig definert intervensjon, da en person vil ha sin kroppsvekt av forskjellige grunner (7). Det er for eksempel mulig å ha en BMI på 27 kg/m2 på grunn av mye stillesitting, men det er også mulig å ha samme BMI på grunn av et dårlig kosthold. En observasjonsstudie av overvekt som risikofaktor for artrose kan derfor ikke si om det er aktivitetsnivå og konsekvensen vekt, eller om det er kosthold og konsekvensen vekt, som vil ha en virkning på senere artrose. I et randomisert forsøk ville vi ikke randomisert til en viss BMI, men til enten aktivitetsøkning og/eller kostendring og kanskje en kontrollgruppe uten intervensjon. Siden aktivitetsøkningen og kostendringen er veldefinerte intervensjoner som gruppene var randomisert til, vet vi akkurat hva som førte til en virkning, og hvis vi repeterer nøyaktig den samme intervensjonen vil vi i teorien få nøyaktig samme virkning (7). Men hvis intervensjonen er dårlig definert vet vi ikke hva vi skal repetere for å oppnå den samme virkningen.

For at en intervensjon skal være veldefinert kan en testpersons utfall ikke være avhengig av andre testpersoners utfall (6). Dette vil ofte være et problem i randomiserte forsøk i fysioterapi, der vi for eksempel trener testpersoner i grupper. I slike tilfeller vil antagelsen om null interaksjon mellom testpersoner overkjøres, og man vil kunne oppleve en positiv behandlingseffekt av gruppesamhold som ikke er relatert til den behandlingen vi ønsker å undersøke effekten av (trening). Så også randomiserte forsøk kan ha sine trusler mot hvorvidt man kan trekke kausale konklusjoner (4).

For hvem kan vi finne en kausal sammenheng, og hvordan?

Medieoverskriftene kan være forvirrende, fordi de ofte blander individ- og befolk-ningsnivå. Da klinikere må basere seg på studier gjort på befolkningsnivå, men ofte arbeider med enkelte individer, er det viktig å være klar over forskjellen i forståelsen av kausale sammenhenger på de to nivåene. For et enkelt individ er det svært vanskelig å vite hva som forårsaker sykdom da vi ikke kan observere virkningen av hva som ville ha skjedd dersom årsaken som faktisk var tilstede, ikke hadde vært tilstede (6,8,9). Vi kan med andre ord ikke studere individuelle kausale effekter fordi én person ikke kan være både forsøksperson og kontroll samtidig. For noen helserisikoer og sykdomsutfall med antatte umiddelbare virkninger (for eksempel smerte) kan vi komme nærmere en individuell kausal effekt ved hjelp av visse studiedesign, for eksempel randomiserte cross-over design der pasienten er sin egen kontroll over tid (6).

For sykdommer med langsom utvikling vil det i teorien være umulig å finne individuelle kausale effekter på grunn av lang induksjonstid. Induksjonstid er tiden fra en eksponering eller helsefare er til stede til og med sykdommen forekommer (2). Akkurat som beskrevet i eksempelet med kausale mekanismer for lys, antas det at hvert individ har sin egen unike kausale mekanisme der flere komponenter er nødvendige for å forårsake en sykdom. Hver av komponentene vil interagere med hverandre og har sin egen induksjonstid (2). Artrose er for eksempel en kompleks, langsomt utviklende sykdom med mange ulike forklaringsmekanismer i forskjellige personer (10). For noen vil overvekt være den viktigste årsaken, mens det for andre kan være tidligere leddskade. Det er umulig å avdekke en persons kausale mekanisme for artrose på individnivå da vi ikke kan observere om personen som faktisk fikk artrose, ikke hadde fått artrose dersom hans/hennes risikofaktorprofil tilbake i tid hadde vært annerledes (4,9).

På befolkningsnivå er det derimot lettere å finne kausale sammenhenger. Noen som er eksponerte for en mulig risikofaktor vil bli syke mens andre eksponerte ikke vil bli det, og vi kan regne ut gjennomsnittlige kausale effekter for risikofaktoren (6). De gjennomsnittlige effektene kan vi finne i randomiserte forsøk, og i sterke observasjonsstudier kombinert med visse statistiske analysemetoder (4,6,11). På 1960-tallet ble det satt opp retningslinjer til hjelp i å avgjøre om en sammenheng er kausal, som vist i tabell 1 (12). Retningslinjene er blitt kalt kriterier og brukes som sjekkliste for kausalitet, men dette bør unngås da et årsak-virkning-forhold kan finnes selv om flere av kriteriene ikke tilfredsstilles. Blant annet vil en sammenhengs styrke bestemmes av forekomsten av risikofaktorene i den gitte pasientgruppen, vi kan finne ulike årsaks-virkning forhold i forskjellige pasientgrupper og én årsak kan gi flere effekter. Dette er i strid med kriteriene (tabell 1, punkt 1-3) (2,12).

Som et eksempel på at en sammenheng ikke trenger å være sterk for å være kausal kan vi ta røyking, støvfylt arbeid og lungekreft. Røyking er en sterk risikofaktor for lungekreft fordi en stor andel av de med lungekreft har fått det på grunn av røyking. Men det finnes personer som har storrøyket hele livet uten å få lungekreft. Disse skulle kanskje i tillegg til å røyke, også være eksponert for støv i arbeidet før de fikk lungekreft. For de enkelte storrøykerne uten lungekreft hadde ikke røyking noen virkning selv om det er funnet sterke sammenhenger på befolkningsnivå. På samme måte ville støvfylt arbeid være en sterkere risikofaktor på befolkningsnivå dersom all røyking var eliminert i befolkningen. Røyking og støvfylt arbeid vil altså uansett være risikofaktorer for alle, men kun for noen vil hver av dem ha en kausal virkning og faktisk gi lungekreft (2). En sterk risikofaktor funnet i en studie har derfor ikke nødvendigvis relevans på individnivå, men bidrar til å øke den samlede kunnskapen om årsaker og virkninger, og vil være del av en kausal mekanisme for mange. Andre grunner til at en sammenhengs styrke ikke bør være et kriterium for kausalitet er at de i blant også kan forklares av umålt konfounding (2).

Mens mange av de resterende kritierene for kausalitet er blitt kritisert for å være for vage og subjektive (punkt 6-9), anses tidsrelasjonen mellom eksponeringen og sykdommen å være det viktigste av Hills kriterier (punkt 4) (2,12). For å si at en sammenheng er kausal må vi vite at helserisikoen vi studerer kommer før sykdommen, og ikke er et resultat av sykdommen. Dette kan være en utfordring særlig for pasientgruppen vi møter i primærhelsetjenesten som ofte har komorbiditet av for eksempel smerte, nedsatt funksjon, overvekt og nedstemthet som kan henge sammen i en nedadgående sirkel som det er vanskelig å etablere årsak og virkning for (13-16).

Når vet vi nok?

Litteraturen om kausalitet er filosofisk og preget av forskjellige meninger (2,6,8,9). Vi har på et grunnleggende nivå kort beskrevet mulighetene intervensjons- og observasjonsstudier gir for å trekke kausale slutninger. Evidensnivået og muligheten for kausal inferens vil videre avhenge av design og analysemetoder. I teorien har meta-analyser av randomiserte studier best evidens, fulgt av enkeltstående randomiserte forsøk, cohort-studier og case-control studier (17,18). I praksis kan dårlig kvalitet finnes på alle nivåene i evidenshierarkiet (4), og feilkilder i en studie er trusler mot muligheten for å trekke kausale konklusjoner uansett evidensnivå.

På grunn av feilkilder i de fleste studier er det vanskelig å vite på hvilket tidspunkt man vet nok til å implementere kunnskapen om kausale sammenhenger i klinikken. Dette må derfor vurderes på bakgrunn av den samlede bevismengden. Jamtvedt og medarbeidere har beskrevet styrker og svakheter for hvert av studiedesignene innen observasjonsforskning og eksperimentelle forsøk nøyere, samt tolkning av resultatene og hvordan man kan avgjøre om forskning er til å stole på (19). Kunnskapssenteret har også utarbeidet sjekklister til bruk for klinikere i vurderingen av studier med forskjellig design (20). Disse har som mål å underlette vurderingen av kvaliteten av enkeltstudier. Sjekklistene er ikke de samme som sjekklistene for kausalitet, men dersom studien scorer høyt både i evidenshierarkiet og har høy kvalitet i følge listen, er sannsynligheten for at studien har funnet en gjennomsnittlig kausal effekt, større.

Konklusjon

I mye av helseforskningen er målet å undersøke årsaker til sykdom eller forskjellige helseutfall. En observert sammenheng i en studie er ikke det samme som en kausal sammenheng i befolkningen, og enda mindre det samme som en kausal sammenheng for individet. Likevel kan vi implementere kunnskap om kausale sammenhenger funnet på gruppe- og befolkningsnivå på individinivå i klinikken dersom evidensen er overbevisende nok, men det er diskutabelt på hvilket punkt i forskningen dette er tilfellet. Klinikere bør ha en sunn skepsis til store overskrifter og nye forskningsfunn og kunne formidle forskjellen på en statistisk assosiasjon og en årsak-virkning-sammenheng til pasientene.

Referanser

1. Store norske leksikon, http://snl.no/årsak. Besøkt 25.07.2014.

2. Rothman KJ. Epidemiology: An introduction. Oxford University Press, 2nd edition. 2012:1-268.

3. Hernan MA, Robins JM. Estimating causal effects from epidemiological data. J Epidemiol Community Health 2006;60:578-86.

4. Hernan MA. A definition of causal effect for epidemiological research. J Epidemiol Community Health 2004;58:265-71.

5. Rothman KJ, Greenland S, Lash T.L. Modern Epidemiology. Lippincott Williams & Wilkins, 3rd edition. 2008:1-758.

6. Hernan MA, Robin JM. Causal inference – Part I, http://www.hsph.harvard.edu/wp-content/uploads/sites/1268/2014/05/hernanrobins_v1.10.25.pdf.  Versjon 14.05.2014.

7. Hernan MA, Taubman SL. Does obesity shorten life? The importance of well-defined interventions to answer causal questions. Int J Obes (Lond) 2008;32 Suppl 3:S8-14.

8. Maldonado G, Greenland S. Estimating causal effects. Int J Epidemiol 2002;31:422-9.

9. Elwert F, Winship C. Population versus individual level causal effects. Int J Epidemiol 2002;31:432-4.