Vilka funktionella tester är de bästa för att mäta fysisk funktion hos patienter med ländryggssmärta? – en systematisk litteraturöversikt

Sammendrag i Fysioterapeuten 7/2019. 

Max Jakobsson, fysioterapeut, ph.d., Avdelningen för ortopedi, Institutionen för kliniska vetenskaper, Sahlgrenska akademin, Göteborgs universitet. Arbetsterapi och fysioterapi Högsbo, Sahlgrenska universitetssjukhuset, Göteborg. max.jakobsson@gu.se.  

Fulltekst artikkel: Max Jakobsson, Annelie Gutke, Lidwine B Mokkink, Rob Smeets, Mari Lundberg (2019). Level of Evidence for Reliability, Validity, and Responsiveness of Physical Capacity Tasks Designed to Assess Functioning in Patients With Low Back Pain: A Systematic Review Using the COSMIN Standards. Physical Therapy (99): 457–477, https://doi.org/10.1093/ptj/pzy159.  

Ländryggsmärta är ett mycket vanligt problem och är den diagnos som bidrar till flest år levda med funktionsnedsättning (1). Funktionsnedsättning skattas vanligen med frågeformulär såsom Roland-Morris Disability Questionnaire och Oswestry Disability Index (2). Fördelen med frågeformulär är att de är lättadministrerade, billiga och inkluderar patientens perspektiv. Forskning pekar emellertid på att funktionella tester som mäter fysisk funktion kan komplettera användandet av frågeformulär för att bättre förstå patientens hälsa (3, 4). I ett funktionellt test utför patienten en standardiserad aktivitet, såsom att gå eller att resa sig upp från en stol, som utvärderas av en testledare genom vissa kriterier. Ett exempel på ett funktionellt test är timed up-and-go (3). Som fysioterapeuter använder vi ofta av funktionella tester i att bedöma och utvärdera funktion. Vi vet dock relativt lite om mätkvaliteten (reliabilitet, validitet och responsivitet) hos dessa tester. Syftet med den aktuella studien var att systematiskt summera tidigare forskning gällande mätkvaliteten hos funktionella tester som används för att mäta fysisk funktion hos patienter med ländryggssmärta. 

Systematisk litteratursökning och datasyntes

Vi genomförde en systematisk litteraturöversikt enligt den metodologi som rekommenderats av COnsensus-based Standards for the selection of health Measurement INstruments (COSMIN) (5). Enligt vår vetskap är COSMINs metodologi den mest beforskade för systematiska litteratur om mätegenskaper.

Fem elektroniska databaserna och referenslistor i artiklar genomsöktes med en sökstrategi som var skräddarsydd för respektive databas. Vi sökte efter artiklar som undersökte mätegenskaper (dvs reliabilitet, validitet och responsivitet) hos funktionella tester för patienter som var minst 18 år och hade haft ländryggssmärta i minst 6 veckor. De artiklar som innehöll patienter som var gravida eller hade fibromyalgi, reumatiska sjukdomar, infektioner, malignitet, osteoporos, vertebrala frakturer, skolios eller cauda equina-syndromet exkluderades. Artiklar som endast undersökte testbatterier och inte presenterade resultat gällande mätegenskaper för enskilda funktionella test exkluderades också. Alla abstrakts och artiklar i fulltext granskades av två författare och eventuella meningsskiljaktigheter diskuterades med en tredje författare.

När artiklarna valts ut granskade två författare artiklarnas metodologiska kvalitet med hjälp av COSMINs 4-poängschecklista som är specifikt utformad för studier om mätegenskaper (6, 7). Efter detta samlades alla författare för att bestämma evidensgraden för reliabilitet, validitet och responsivitet hos de funktionella testen (5, 8). Metoden för datasyntesen liknar Grading of Recommendations Assessment, Development, and Evaluation (GRADE) men skiljer sig i att datasyntesen innefattar resultat gällande reliabilitet, validitet och responsivitet och inte resultat från behandlingsstudier. Resultaten från artiklarna kombinerades bara om studiepopulationerna var jämförbara med varandra. Detta medförde att resultat från studier med patienter med ryggdiagnoser som vanligtvis påverkar gångförmågan i hög grad (exempelvis lumbal spinal stenos) inte kombinerades med studier med patienter som inte hade sådana diagnoser. 

Flera tester uppvisade god evidens för reliabilitet och validitet

Sökningarna gav 7 900 artiklar som efter den ovan beskrivna granskningen reducerades till 25. Dessa artiklar berörde 18 funktionella tester, varav ett urval presenteras i Tabell 1.

Five-repetition sit-to-stand var det enda funktionella testet som hade positiva resultat för mer än två mätegenskaper: test-retest reliabilitet (stark evidens), begreppsvaliditet (måttlig evidens) och responsivitet (begränsad evidens). Fifty-foot walk, five-minute walk, progressive isoinertial lifting evaluation (PILE) och timed up-and-go hade måttlig till stark evidens för test-retest reliabilitet and begreppsvaliditet. De ovanstående funktionella testerna hade emellertid negativa resultat gällande mätfelet (mätfelet är en del av begreppet reliabilitet) och responsivitet. One-minute stair climbing och shuttle walking test hade positiva resultat för responsivitet (begränsad evidens) samt för test-retest reliabilitet (måttlig evidens för one-minute stair climbing och begränsad evidens för shuttle walking test). Av de funktionella tester som undersökts för patienter med ryggdiagnoser som vanligen begränsar gångförmågan var det bara timed up-and-go och shuttle walking test som uppvisade positiva resultat för mer än en mätegenskap. Evidensgraden för dessa resultat var dock begränsad. 

Nytta och klinisk betydelse

Enligt vår vetskap är detta den första systematiska litteraturöversikten som summerat forskning gällande evidensgraden för reliabilitet, validitet och responsivitet hos funktionella tester för patienter med ländryggssmärta. Five-repetition sit-to-stand, 50-foot walk, 5-minute walk, progressive isoinertial lifting evaluation, och timed up-and-go uppvisade måttlig till stark evidens för positiva resultat för test-retest reliabilitet och begreppsvaliditet. Resultatet tyder på att kliniker och forskare kan vara säkra på att dessa funktionella tester har en hög grad av reliabilitet och att testen troligtvis mäter det de är utformade att mäta.

One-minute stair climbing, timed up-and-go, 5-repetition sit-to-stand och shuttle walking uppvisade postiva resultat för responsivitet. Dessa resultat tyder på att dessa tester har förmågan upptäcka förändringar i fysisk funktion efter en intervention, även om evidensgraden för detta är begränsad. De flesta av de inkluderade testerna uppvisade dock negativa resultat för responsivitet. Dessa resultat skulle kunna tolkas som att testerna inte har förmågan upptäcka förändringar i fysisk funktion. Emellertid kan de negativa resultaten också bero på att många av studierna använde metoder som på senare år har kritiserats för att vara ge en missvisande bild av responsiviteten (6). Vi föreslår att framtida studier undersöker repsonsivitet med på förhand definierade hypoteser, något som också rekommenderats av forskargruppen bakom COSMIN  (6).

Vi menar att resultaten är generaliserbara till de flesta patienter med ländryggssmärta som uppfyller inklusionskriterierna. En mindre del av resultaten är dock främst generaliserbara till patienter med patienter med ryggdiagnoser som vanligen begränsar gångförmågan i stor omfattning. Bland dessa tester var det bara timed up-and-go och shuttle walking test som hade positiva resultat för mer än en mätegenskap. 

Slutsats

Baserat på resultaten för reliabilitet, validitet och responsivitet är five-repetition sit-to-stand, 5-minute walk, 50-foot walk, progressive isoinertial lifting evaluation, timed up-and-go och 1-minute stair climbing de mest lovande funktionella testen för att mäta fysisk funktion hos patienter med långvarig ländryggssmärta. 

Referenser

1. Hoy D, March L, Brooks P, Blyth F, Woolf A, Bain C, et al. The global burden of low back pain: estimates from the Global Burden of Disease 2010 study. Ann Rheum Dis. 2014;73(6):968-74.

2. Grotle M, Brox JI, Vollestad NK. Functional status and disability questionnaires: what do they assess? A systematic review of back-specific outcome questionnaires. Spine (Phila Pa 1976). 2005;30(1):130-40.

3. Simmonds MJ, Olson SL, Jones S, Hussein T, Lee CE, Novy D, et al. Psychometric characteristics and clinical usefulness of physical performance tests in patients with low back pain. Spine (Phila Pa 1976). 1998;23(22):2412-21.

4. Lee CE, Simmonds MJ, Novy DM, Jones S. Self-reports and clinician-measured physical function among patients with low back pain: a comparison. Arch Phys Med Rehabil. 2001;82(2):227-31.

5. de Vet HC, Terwee CB, Mokkink LB, Knol DL. Measurement in medicine: a practical guide. Cambridge: Cambridge University Press; 2011.

6. Mokkink LB, Terwee CB, Patrick DL, Alonso J, Stratford PW, Knol DL, et al. The COSMIN checklist for assessing the methodological quality of studies on measurement properties of health status measurement instruments: an international Delphi study. Qual Life Res. 2010;19(4):539-49.

7. Terwee C, Mokkink L, Knol D, Ostelo RJG, Bouter L, de Vet HW. Rating the methodological quality in systematic reviews of studies on measurement properties: a scoring system for the COSMIN checklist. Qual Life Res. 2012;21(4):651-7.

8. Kroman SL, Roos EM, Bennell KL, Hinman RS, Dobson F. Measurement properties of performance-based outcome measures to assess physical function in young and middle-aged people known to be at high risk of hip and/or knee osteoarthritis: a systematic review. Osteoarthritis Cartilage. 2014;22(1):26-39. 

Powered by Labrador CMS