Helseøkonomisk evaluering i fysioterapi

Fagartikkel i Fysioterapeuten 10/2015. 

Fredrik Salvesen Haukaas , M.Phil., vitenskapelig assistent, avdeling for helsefag, Universitetet i Oslo. fredrikhaukaas@gmail.com 

Nina Køpke Vøllestad, Dr.scient., instituttleder avdeling for helsefag, Universitetet i Oslo

Hilde Stendal Robinson, PhD., førsteamanuensis, avdeling for helsefag, Universitetet i Oslo

Eline Aas, Dr.polit., førsteamanuensis, avdeling for helseledelse og helseøkonomi, Universitetet i Oslo

Denne fagartikkelen er fagfellevurdert etter Fysioterapeutens retningslinjer, og ble akseptert 13.8.2015. Ingen interessekonflikter oppgitt. 

Last ned lese-PDF fra vårt eblad

Sammendrag

Innledning: Helseøkonomisk evaluering er en metode for å synliggjøre konsekvenser for ressursbruk og helse når nye helsetiltak vurderes. I kjølvannet av den nylige offentlige utredningen om prioriteringer i helsevesenet er metoden aktuell og viktig å forstå.

Hoveddel: Artikkelen gjennomgår en tenkt helseøkonomisk evaluering av to ulike fysioterapitiltak for pasienter med meniskskade. Oppbygningen av artikkelen er
basert på hvordan slike evalueringer gjøres trinn for trinn. Vi gjennomgår planleggingen av en studie, innhenting og estimering av kostnader, evaluering av effekt, sensitivitetsanalyse og presentasjon av resultater.

Avslutning: Vi oppsummerer og gir råd om videre lesning.

Nøkkelord: Helseøkonomisk evaluering, fysioterapi, nytte-kostnadsanalyse. 

Health Economic Evaluation in Physiotherapy

Abstract

Introduction: Health economic evaluation is a method used to show the consequences for both costs and health outcomes when considering new health technologies. In the wake of the latest official report on priorities in the health services this method is relevant and important to understand.

Main part: The article goes through a hypothetical health economic evaluation of two physiotherapeutic treatments for meniscal injury. The structure of the article is based on how such evaluations are conducted, step by step. We describe the planning of a study, collecting data, estimating costs and health outcomes, sensitivity analysis, and presentation of results. 

Conclusion: We sum up and provide suggestions for further reading.

Keywords: Health economic evaluation, physiotherapy, cost-effectiveness analysis.

Innledning

I de siste tiårene har det blitt et økt fokus på kostnadskontroll og kutt i helsesektoren, noe som kan henge sammen med helsesektorens økende kostnader og en forventning om store fremtidige behov ved den kommende eldrebølgen. Det stilles derfor stadig høyere krav om å dokumentere effektene og kostnadene av nye helsetiltak, ofte i form av helseøkonomiske evalueringer. Slike helseøkonomiske evalueringer, kalt nytte-kostnadsanalyser på folkemunne, forsøker å gi svar på hvor mye helse vi får for pengene vi investerer i tiltaket.

Et offentlig utvalg leverte nylig en rapport om prioriteringer i det norske helsevesenet. Ved siden av ressursbruk og helsegevinster, trekker de frem helsetap som et mulig kriterium for prioritering. Helsetap er definert ved tapte gode leveår, og muskel- og skjelettplager ligger på topp i Norge (1). Siden ressursbruk, helsegevinster og helsetap foreslås å være kriterier for prioritering, kan det være av særlig interesse for fysioterapeuter å lære mer om metodene, selv om helsetap så langt ikke har fått tilslutning fra den sittende regjeringen som et kriterium for prioriteringsbeslutninger. 

Hensikt og spørsmål

Hensikten med denne artikkelen er å gi en enkel innføring i hvordan en helseøkonomisk evaluering med relevans for fysioterapi kan gjennomføres. Vi vil begynne med å se på hva en helseøkonomisk evaluering er og hvorfor den bør gjennomføres. Deretter vil vi gå gjennom en evaluering, trinn for trinn, ved å anvende et tenkt eksempel som sammenligner to forskjellige måter å behandle meniskskader med fysioterapi. Avslutningsvis vil vi kort diskutere hvordan vi skal tolke resultatene av en slik analyse. Vi håper at innføringen kan være et grunnlag for å forstå denne type analyser, vekke nysgjerrighet og kanskje bidra til at flere kan tenke seg å gjennomføre analyser innen fysioterapiområdet. 

Hoveddel

Hva er en helseøkonomisk evaluering?

En helseøkonomisk evaluering er en systematisk evaluering av kostnadene og helseeffektene av to eller flere helsetiltak. Tiltakene som sammenlignes kan for eksempel være ulike behandlingsmetoder eller legemidler, og hensikten er å vurdere om nye tiltak skal erstatte gamle. Det overordnede målet med helseøkonomisk evaluering er best mulig bruk av de ressursene vi har tilgjengelig. Siden ressursene er begrensede må vi prioritere mellom tiltak, det vil si at man må sette noen tiltak foran andre. Prioritering gjøres kontinuerlig på alle nivåer i helsevesenet. For eksempel kan en fysioterapeut bruke mer tid på en pasient enn en annen fordi fysioterapeuten vurderer at den ene pasienten har større behov og nytte av trening og oppfølging, og det kan ende med at den andre pasienten får mindre behandlingstid. Et sykehus kan bevilge mer penger til en avdeling på bekostning av en annen, fordi det vil bedre behandlingslinjen for en pasientgruppe. Prioritering av helsetiltak innebærer at de tiltakene som ikke blir prioritert blir utsatt eller aldri innført. For at prioriteringsbeslutninger skal gjøres på en ryddig og oversiktlig måte, er det viktig at gode og oversiktlige analyser legges til grunn for beslutninger og ikke bare anekdotisk kunnskap. Helseøkonomisk evaluering er et verktøy til støtte for slike beslutninger. 

Planlegging av en helseøkonomisk evaluering

Utgangspunktet for en helseøkonomisk evaluering er å definere hvilke tiltak som skal sammenliknes, det vil si identifisere problemstillingen. Hvilke tiltak som velges kan baseres på egen praksis og erfaring, eller være basert på funn i litteraturen. I noen tilfeller ønsker man å prøve ut noe som ingen andre har prøvd før, mens andre ganger kan det være gjort tilsvarende studier i en annen klinisk setting eller i et annet land. Alle disse situasjonene kan være utgangspunkt for en studie. I denne artikkelen vil vi ta for oss et tenkt eksempel med behandling av meniskskader med fysioterapi, hvor gruppebehandling har vært en vanlig måte å behandle på. Nå ønsker vi å se om individuell behandling er et bedre alternativ. Pasientgruppen er personer over 50 år som ikke er spesielt fysisk aktive, og som har blitt vurdert til at de ikke skal opereres.

Med dette som utgangspunkt blir problemstillingen: «Er individuellbehandling med fysioterapi en kostnadseffektiv behandling av meniskskader hos pasienter over 50 år sammenlignet med gruppebehandling?». Gruppebehandling er referansebehandling, det vil si at vi betrakter gruppebehandling som standard behandling i dag og vi ser på kostnader og effekter av individuell behandling i forhold til gruppebehandling. I noen helseøkonomiske evalueringer vil «ingen behandling» være naturlig referansebehandling, men i vårt tilfelle er ikke det et relevant alternativ. Etter at vi har definert tiltakene som skal sammenliknes, starter arbeidet med å beskrive hvilken type studie vi skal gjøre og hvordan den skal utføres. 

Metode

I en helseøkonomisk evaluering skal vi samtidig vurdere kostnader og effekter av to eller flere tiltak, og det må derfor innhentes relevante data. I vårt eksempel diskuterer vi en evaluering i sammenheng med en effektstudie hvor helseøkonomisk evaluering er et av delprosjektene. Gullstandarden for å måle effekter av nye tiltak er randomiserte kontrollerte studier (RCT). I eksempelet vårt vil pasientene randomiseres til enten individuell behandling eller til gruppebehandling. Både individuell behandling og gruppebehandling omfatter øvelser under veiledning av en fysioterapeut to ganger i uka i 12 uker. Valg av tidsperiode som studien skal foregå i er viktig, og vi må sikre at alle relevante endringer fanges opp. I vår tenkte studie har vi valgt oppfølging på ett år. Når vi har definert hvilke tiltak som skal sammenlignes og beskrevet hvordan studien skal utføres, må vi ta stilling til hvordan data for kostnader og helseeffekter skal innhentes og hvordan de skal estimeres. 

Kostnader

Kostnadsestimeringen består av tre deler: Identifisering, kvantifisering og verdsetting, hvor identifisering omhandler hvilke kostnadsfaktorer som skal inkluderes i analysene, kvantifisering om hvordan de skal telles opp og samles inn, mens verdsetting består i hvordan vi skal prissette de enkelte kostnadskomponentene. I Tabell 1 har vi samlet de kostnadene vi har identifisert, kvantifisert og verdsatt for behandling av meniskskader, fordelt etter de to typene behandling. Siden dette er et eksempel, har vi valgt få kostnadskomponenter for å gjøre fremstillingen enklere.

 

For å identifisere kostnadene kartlegger vi først hvilke komponenter som inngår i selve behandlingen og oppfølgingen for både individuell behandling og gruppebehandling, gjerne ved hjelp av flytskjema over behandlingsforløpet. For eksempel vet vi at pasienter må til MR og fastlege for å få vurdert at meniskskaden ikke skal opereres. Hva som er relevante kostnader vil variere avhengig av studiens perspektiv: Sykehuset, primærhelsetjenesten, helsesektoren eller samfunnet. Helsedirektoratet anbefaler at helseøkonomiske evalueringer gjennomføres ut fra et samfunnsperspektiv (2). I et samfunnsperspektiv inkluderes alle kostnader uansett hvor de tilfaller, enten det er i helsetjenesten, andre sektorer eller om det er kostnader for pasienten og pårørende. I et slikt perspektiv vil vi blant annet inkludere kostnaden ved sykefravær, ofte omtalt som produksjonsvirkning. Dette er kostnader som inntreffer når pasienten eller pårørende enten ikke har anledning til å arbeide, i betalt eller ubetalt arbeid, men kan også være positive virkninger ved at pasienter kommer raskere tilbake i arbeid eller får redusert behov for hjelp fra pårørende. Vi kan være spesielt oppmerksomme på produksjonsvirkninger innenfor behandling av muskel- og skjelettplager da for eksempel korsryggplager er den vanligste årsaken til sykefravær (3). Kostnadene vi har identifisert i behandling av meniskskader er definert i den første kolonnen i Tabell 1. Vi har valgt å ha like kostnadskomponenter for de to gruppene, med unntak av typen behandling hos fysioterapeut.

Etter at kostnadene er identifisert går vi over til kvantifisering, det vil si å finne en relevant enhet og måle mengden brukt for hver identifisert kostnad. For fysioterapi bruker vi antall undersøkelser og behandlinger som måleenhet. For sykefravær (produksjonsvirkninger) bruker vi antall tapte arbeidsdager, og for transportkostnader antall kilometer. Kvantifisering av de ulike kostnadskomponentene kan registreres underveis i studien, hentes ut fra journaler etter endt studie, via spørreskjema til pasientene, via intervjuer, ut fra pasientdagbøker og/eller fra registre. Tallene i tredje og fjerde kolonne i Tabell 1 viser pasientenes gjennomsnittlige bruk per enhet for hver behandling. Disse tallene er gjennomsnittet for hele observasjonsperioden etter behandlingsgruppe.

Deretter går vi over til å sette en pengeverdi på kostnadene, verdsetting. Ideelt sett skal verdien vi setter på ressursene gjenspeile ressursenes alternativkostnad, det vil si den verdien vi kunne fått av å bruke ressursene i deres nest beste anvendelse. Det kan imidlertid være vanskelig å finne et estimat på alternativkostnaden, og vi benytter ofte mer praktiske tilnærminger som observerte priser og gjennomsnittskostnader, eksempelvis takster og DRG-vekter. Ved bruk av takster må man ofte multiplisere honoraret med to for å ta hensyn til driftstilskudd og egenandeler (2). Sykefraværet verdsettes ofte ved gjennomsnittlig brutto lønn pluss sosiale kostnader (+40%). Sosiale kostnader inkluderer blant annet arbeidsgiveravgift og trygdeutgifter. Informasjon om bruttolønn kan man finne hos Statistisk sentralbyrå. Alle priser skal justeres slik at de er for samme år, det vil si vi korrigerer for prisstigning.

For å estimere gjennomsnittlige kostnader, multipliserer vi først prisen (verdien av hver kostnadskomponent) med kvantum (antall konsultasjoner, behandlinger, antall sykedager) for hver kostnadskomponent. Deretter estimerer vi gjennomsnittlig kostnad per pasient ved å summere kostnaden for hver kostnadskomponent etter behandlingsgruppe, se siste rad i Tabell 1. Vi er nå ferdig med kostnadsestimeringen, og vil gå over til å beskrive hvordan vi måler helseeffekten. 

Helseeffekt

Det finnes flere metoder for å måle effekter i en helseøkonomisk evaluering, men i vårt eksempel med meniskskader bruker vi kvalitetsjusterte leveår (quality-adjusted life years, QALYs). For å estimere QALYs, multipliseres helserelatert livskvalitet (health related quality of life, HRQoL) med antall år i helsetilstanden. HRQoL er en vekt mellom 0 og 1, hvor 0 er en tilstand tilsvarende «død» og 1 er «perfekt helse». Måling gjøres med generiske eller sykdomsspesifikke instrumenter (spørreskjemaer) som definerer en helsetilstand ut fra ulike dimensjoner. I vårt tenkte eksempel med meniskskader måler vi HRQoL med det generiske instrumentet EQ-5D. EQ-5D har vist seg å være et egnet instrument for evaluering av tiltak innen fysioterapi (4). EQ-5D har fem helsedimensjoner med fem nivåer innenfor hver dimensjon. To eksempler på dimensjoner er smerte og gangfunksjon, og nivåene går fra «ingen problemer» til «ekstreme problemer». Svarene på alle de fem helsetilstandene settes sammen til en samlet helsetilstand som er beskrevet av en kombinasjon av de fem helsedimensjonene. Helsetilstandene i EQ-5D har tidligere blitt verdsatt (hvor «ønskelig» tilstanden er) av et representativt utvalg av befolkningen. Verdsetting av helsetilstander fører til at noen dimensjoner i skjemaet teller mer enn andre, avhengig av preferansene til de som verdsetter. Det betyr for eksempel at smerte kan redusere HRQoL mer enn mobilitet. En vekting av helsetilstander skiller seg fra ikke-preferansebaserte instrumenter hvor man summerer dimensjonene og alle dimensjoner teller likt. I løpet av en studie fyller pasienten alltid ut skjemaet ved inklusjon og en eller flere ganger i løpet av forløpet. I vår tenkte studie ble pasientene spurt om å fylle ut EQ-5D ved inklusjon, etter 12 uker (endt behandling) og etter ett år. 

 

EQ-5D er ett av flere generiske instrumenter, og kan derfor brukes til sammenligninger på tvers av sykdommer, populasjoner og tiltak (5). Dette er avgjørende siden resultatene skal brukes i diskusjon om prioriteringer av ressurser i hele helsesektoren. I tillegg kan generiske instrumenter fange opp komorbiditet og bivirkninger (6). Ulemper med de generiske instrumentene er at de kan være mindre sensitive for, eller totalt utelate visse dimensjoner av helse som er relevante for enkelte tilstander (6). EQ-5D, SF-6D og 15D er blant de mest brukte generiske instrumentene, og informasjon om disse finnes i Tabell 2 (4). Instrumentene bruker ulike verdsettingsmetoder, og varierer i antall spørsmål og nivåer, og dermed antall helsetilstander de kan produsere. Det er likevel de samme prinsippene som gjelder for alle. Det finnes ingen norsk anbefaling om hvilket instrument som skal anvendes i en helseøkonomisk evaluering. Valg av instrument vil ofte være relatert til hvilket instrument man tenker passer best til den sykdommen eller tilstanden som analyseres, siden instrumentene varierer med hensyn til hvilke dimensjoner av helse de inkluderer. De varierer også i hvor sensitive de er for endringer og hvor enkle de er å administrere. Så lenge det ikke er definert et foretrukket instrument, må vi sette oss inn i styrker og svakheter med de ulike instrumentene for å finne det som passer best i en spesifikk setting.

 

Figur 1 viser gjennomsnittlig HRQoL for pasientene i studien under behandlingen, målt ved inklusjon, etter 12 uker og etter ett år. Ved oppstart har pasientene lik HRQoL, men de med individuell behandling får noe større forbedring enn de med gruppebehandling etter 12 uker. Forskjellen vedvarer til studiens ende. Gevinsten av individuell behandling i forhold til gruppebehandling er målt ved arealet mellom de to kurvene, mens det totale antallet QALYs for hver pasientgruppe er arealet mellom pasientgruppens kurve og tidsaksen.

 

I Tabell 3 er resultatene av behandlingene etter 1 år, oppgitt i QALYs.

Tallene beskriver gjennomsnittlige QALYs for de to ulike behandlingsgruppene. Forskjellen er mereffekten av individuell behandling i forhold til gruppebehandling. Tallene er gjennomsnittlige, dermed kan det være slik at noen pasienter opplever en større helseeffekt enn gjennomsnittet, mens andre opplever enn mindre helseeffekt enn gjennomsnittet.

Helsedirektoratet anbefaler å måle effekten av helsetiltak med QALYs slik vi har gjort her, men de trekker også fram at det finnes svakheter (2). De konkluderer likevel med at nytten av å ha et mål på helsegevinst som kan brukes på tvers av helsetiltak veier opp for at det er et usikkert mål. Et eksempel på at QALYs kan være problematisk er at ulike generiske instrumenter kan resultere i ulik helserelatert livskvalitet for samme pasientgruppe, blant annet fordi de bruker forskjellige verdsettingsmetoder (4). Dersom det resulterer i at opplevd helsegevinst varierer kan det bli problematisk å sammenligne på tvers av studier. 

Hva blir kost-effekten?

Nå har vi samlet inn både kostnadene og effektene av gruppebehandling og individuell behandling. Siden helseeffekt er målt i QALYs, har vi en kostnad-per-QALY analyse eller cost-utility analysis (CUA). Det finnes også andre effektmål som kan benyttes i en helseøkonomisk evaluering. Hvis vi for eksempel hadde anvendt et funksjonsmål, som Knee Injury and Osterarthritis Outcome Score (KOOS) som mål på helse, ville vi hatt en kostnad-effekt analyse (cost-effectiveness analysis, CEA), mens en analyse hvor helsegevinsten måles ved betalingsvilje, kalles en nytte-kostnadsanalyse (cost-benefit analysis, CBA).

Kostnaden per QALY finner vi ved å dele endringen i kostnader på endringen i QALYs.  

Dette kalles en inkrementell kostnadseffektivitetsbrøk (incremental cost-effectiveness ratio, ICER) og uttrykker forholdet mellom forskjell i kostnad og forskjell i effekt. Et tiltak regnes som kostnadseffektivt dersom det faller under en grenseverdi. Denne grenseverdien kan være bestemt på flere måter. For eksempel kan grenseverdien være bestemt av ICER av det sist inkluderte tiltaket, basert på betalingsvilje til pasienter eller den generelle befolkningen, eller den kan være basert på BNP per innbygger. Beslutningsforum, som vurderer nye tiltak i spesialisthelsetjenesten, har benyttet en uformell grense på 500.000 kroner. En ICER uttrykker ekstra kostnad per vunnet QALY, men sier ikke hva budsjettvirkningene blir. Budsjettvirkninger må det lages egne estimater på.

Resultater

I Tabell 4 har vi samlet de gjennomsnittlige kostnadene og QALYs per pasient etter tiltak og kalkulert ICER til 57.600 kroner.

 

ICER kan også illustreres i en kostnadseffektivitetsfigur som i Figur 2.

 

Referansebehandlingen (gruppebehandling) ligger i origo (hvor linjene krysser). Vi bruker den vertikale linjen til å representere forskjell i kostnader (i forhold til referansebehandling) og den horisontale linjen til å representere forskjell i effekter. Individuell behandling har høyere kostnader og bedre effekt enn referansebehandlingen, og er dermed lokalisert i A. Hvis individuell behandling hadde kostet mindre og hatt mindre effekt ville den vært lokalisert i C. Når et alternativ havner i enten A eller C vil det være en avveining om vi skal innføre tiltaket. Når kostnadene og effektene gjør at tiltaket havner i B koster det mindre og har bedre effekt enn referansebehandlingen (gruppebehandling). Vi sier da at individuell behandling er en dominerende strategi. Hvis individuell behandling hadde vært mindre effektiv og kostet mer (lokalisert i D), ville vi sagt at individuell behandling var dominert av gruppebehandling. De alternativene som dominerer ønsker vi sannsynligvis å innføre eller beholde fordi de er bedre både på effekt og kostnader. 

Sensitivitetsanalyse og diskusjon

Det neste steget er å ta høyde for usikkerhet. Dette kan for eksempel gjøres ved å endre på estimatene av kostnader og effekter. Som et eksempel kan vi tenke oss at andre studier indikerer at pasienter med individuell behandling kommer raskere tilbake i arbeid enn i vår studie. Vi må da forsøke å ta hensyn til dette ved å redusere estimatet på antall dager med sykefravær i en sensitivitetsanalyse, og se hvilken effekt det får på ICER. Hvis små endringer fører til endring i hvilke alternativer som dominerer, eller øker/reduserer ICER betraktelig tyder det på at resultatene er usikre. Det er viktig å være tydelig på usikkerheten i helseøkonomiske evalueringer.

I diskusjonen må vi diskutere implikasjonene av studien, trekke frem usikkerhet, fordeling, budsjettkonsekvenser, og andre effekter. Usikkerheten kan være omfattende, fordi estimatene av ICER blant annet påvirkes av valg av kostnader, hvordan man estimerer dem, hvordan man måler HRQoL og hvilken tidshorisont man velger. I tillegg er det vanskelig å få gode estimater for effekten av tiltak. En helseøkonomisk evaluering bør ikke alene brukes som grunnlag for valg av tiltak, men heller inngå som en del av et bredere beslutningsgrunnlag. For eksempel kan det tenkes at å bruke gruppebehandling fører til at flere får tilgang til fysioterapi som ellers ikke ville fått det. Da kan det likevel hende at det blir større helsegevinst av gruppebehandling enn individuell behandling totalt sett.   

Avslutning

I denne artikkelen har vi gjennomgått en tenkt helseøkonomisk evaluering med fokus på behandling av meniskskader med fysioterapi. Vi har gått gjennom planlegging av en studie, kostnadsestimering, måling av effekt, utregning av en kostnadseffektivitetsbrøk og sensitivitetsanalyse. I artikkelen har vi vært innom de mest brukte termene i helseøkonomiske evalueringer, og forhåpentligvis har det lagt et grunnlag for å kunne forstå og gjennomgå helseøkonomiske evalueringer kritisk. Vi håper at leseren kan bruke artikkelen som et grunnlag for videre læring. To gode lærebøker som kan anbefales er Drummond et al. og Hunink et al. (7, 8) Den første går mer i detalj mens den siste nok er mer tilgjengelig for leseren. 

Referanser

1. NOU 2014:12. Åpent og rettferdig - prioriteringer i helsetjenesten. Helse- og omsorgsdepartementet,; 2014.

2. Helsedirektoratet. Økonomisk evaluering av helsetiltak – en veileder. Oslo: Helsedirektoratet; 2012.

3. Lærum E, Brage, Søren., Ihlebæk, Camilla., Johnsen, Kjetil., Natvig, Bård., Aas, Eline. Et muskel- og skjelettregnskap: Forekomst og kostnader knyttet til skader, sykdommer og plager i muskel- og skjelettsystemet. Oslo: Oslo universitetssykehus – Ullevål, 2013.

4. Holm I. Helseøkonomisk evaluering av fysioterapibehandling i primærhelsetjenesten – En metodestudie. Oslo: Universitetet i Oslo; 2013.

5. Coons SJ, Rao S, Keininger DL, Hays RD. A comparative review of generic quality-of-life instruments. PharmacoEconomics. 2000;17(1):13-35.

6. Brazier J, Ratcliffe, J., Salomon, J.A., Tsuchiya, A.,. Measuring and Valuing Health Benefits for Economic Evaluation. Oxford: Oxford University Press; 2007.

7. Hunink M, Glasziou P, Siegel J, Weeks J, Pliskin J, Elstein A, et al. Decision making in health and medicine: Intergrating evidence and values. Cambridge: Cambridge University Press; 2001.

8. Drummond M, Sculpher MJ, Torrance GW, O’Brien BJ, Stoddart GL. Methods for the Economic Evaluation of Health Care Programmes. 3 ed. New York: Oxford University Press; 2005. 379 p.

Powered by Labrador CMS