Hvor fullstendig rapporteres treningsintervensjoner for subacromialt smertesyndrom? Kritisk gjennomgang ved bruk av sjekklistene Consensus on Exercise Reporting Template (CERT), og Template for Intervention Description and Replication (TIDieR)
Charlotte Wilsgård Olsen, spesialfysioterapeut, MSc., Universitetssykehuset Nord-Norge og Tromsø Fysioterapi. charlotteolsen2@gmail.com.
Bård Bogen, førsteamanuensis, ph.d., Høgskulen på Vestlandet.
Denne vitenskapelige artikkelen er fagfellevurdert etter Fysioterapeutens retningslinjer, og ble akseptert 9.desember 2020. Ingen interessekonflikter oppgitt.
Hensikt: Vurdere fullstendigheten av rapporteringen av treningsintervensjoner som behandling for subacromialt smertesyndrom, ut fra sjekklistene Consensus on Exercise Reporting Template (CERT), og Template for Intervention Description and Replication (TIDieR). Det skal også undersøkes om publiseringsår og journal impact factor har betydning for rapporteringsgrad, og om CERT og TIDieR korrelerer i en slik grad at kun en av sjekklistene er nødvendig.
Foskningsdesign: Kritisk gjennomgang med systematisk evaluering.
Materiale: 12 RCT-studier ble inkludert i studien.
Metode: Det ble gjort et søk i Cochrane Library etter relevante systematiske oversikter, og screening av deres primærstudier dannet bakgrunnen for inklusjon av RCT-studier. Screening av titler, sammendrag og fulltekster ble utført av en person i to omganger, mens dataekstraksjonen ble utført av to personer individuelt ut fra CERT og TIDieR. Datamaterialet ble analysert i narrative synteser og med korrelasjonsanalyser. Interrater-reliabiliteten mellom forskernes vurderinger ble beregnet med prosent enighet og Cohen's kappa.
Resultater: CERT hadde en median score på 6/19 poeng med interkvartilbredde på 4,25, og TIDieR hadde en median score på 4/12 poeng med interkvartilbredde 2,25. Enigheten mellom forskerne var moderat. Spearman's korrelasjon ble benyttet for korrelasjonsanalyser med resultatene fra vurderingene ut fra sjekklistene, og variablene publikasjonsår og journal impact factor. Det var bare korrelasjonsanalysen for CERT og TIDieR som var statistisk signifikant og viste en betydelig sammenheng (r=0,85, p=0,001).
Konklusjon: Rapporteringen av treningsintervensjoner for personer med subacromialt smertesyndrom er svært mangelfull, og intervensjonene kan ikke replikeres fullstendig. Ved fremtidig rapportering av treningsintervensjoner anbefales bruk av sjekklisten CERT.
How completely are exercise interventions for subacromial pain syndrome reported? Critical appraisal using the Consensus on Exercise Reporting Template (CERT), and Template for Intervention Description and Replication (TIDieR)
Objective: To assess completeness of content reporting of exercise interventions as treatment for subacromial pain syndrome, by using the Consensus on Exercise Reporting Template (CERT), and Template for Intervention Description and Replication (TIDieR). We will also investigate whether the year of publication and the journal impact factor affect the degree of reporting, and whether CERT and TIDieR correlate to such an extent that only one of the checklists is necessary.
Design: Critical appraisal with systematic evaluation.
Material: 12 RCT-studies were included.
Methods: A search was made in the Cochrane Library to find systematic reviews, and screening of their primary studies formed the basis for the inclusion of RCT-studies. Screening of titles, abstracts and full text was done by one person in two sessions, while data extraction was performed by two people individually by applying the CERT and TIDieR.
The data material was analysed in narrative syntheses and with correlation analyses. The interrater reliability between the researchers in evaluation of the scores was calculated with percent agreement and Cohen's kappa.
Results: CERT had a median score of 6/19 points with interquartile range of 4.25, and TIDieR had a median score of 4/12 points with interquartile range 2.25. The agreement between the researchers was moderate. Spearman's correlation was used to analyse the correlation between the results from the evaluation of the checklists, and the variables publication year and journal impact factor. Only the correlation analysis for CERT and TIDieR was statistically significant and showed substantial correlation (r=0.85, p=0.001).
Conclusion: The reporting of exercise interventions for people with subacromial pain syndrome is markedly deficient, and the interventions cannot be fully replicated. When reporting on exercise interventions in the future it is recommended to use the checklist CERT.
Samvariasjonen mellom CERT og TIDieR tyder på at bruk av kun én sjekkliste vil være tilstrekkelig, og da CERT er rettet mot treningsintervensjoner kan den være særlig relevant for fysioterapiforskning.
Tidsskrifter burde kreve bruk av standardiserte rapporteringsverktøy for å publisere forskning, samt muliggjøre publisering av vedlegg med tilleggsinformasjon.
Forbedret rapportering av treningsintervensjoner kan bedre overføring av forskning til klinisk praksis.
Innledning
Skuldersmerter er den tredje hyppigste muskel- og skjelettplagen, og subacromialt smertesyndrom (SASS) er den vanligste skulderlidelsen (1). Diagnosen omtales under flere navn, for eksempel rotatorcuff-syndrom og impingementsyndrom (2). Typiske symptomer ved SASS er smerte og svakhet, ofte i forbindelse med utadrotasjon og elevasjon (3).
Treningsterapi er et førstevalg for pasienter med SASS, noe som ser ut til å bli viktigere fremover da kirurgi ikke lengre anbefales som behandling for SASS (1). Flere studier har undersøkt effekten av ulike typer treningsintervensjoner, og for at studienes resultater skal kunne implementeres til klinisk praksis er det avgjørende at intervensjonene er fullstendig beskrevet. De siste årene har det imidlertid blitt avdekket mangelfull rapportering på flere områder innen helseforskning, noe som har ført til utvikling av flere sjekklister for rapportering av intervensjoner. Sjekklisten TIDieR ble utviklet i 2014 for å forbedre fullstendigheten av rapporteringen av alle typer intervensjoner (4), og i 2016 ble sjekklisten CERT utviklet for å få en veileder spesifikt rettet mot rapportering av treningsintervensjoner (5). Vurdering av rapportering av forskning er et dagsaktuelt tema det har blitt publisert flere studier på de siste årene (6-8).
Potensielle årsaker til mangelfull rapportering kan tenkes å være lite oppmerksomhet rundt viktigheten av dette, og at fagfelleprosessen ikke er grundig nok. Det kan derfor være interessant å undersøke om rapporteringsgraden har endret seg (blitt bedre) over tid, og om artikler i tidsskrifter med antatt høy kvalitet (høy journal impact factor (JIF)) har en bedre rapporteringsgrad enn tidsskrifter av lavere kvalitet.
Hensikten med studien er å vurdere fullstendigheten av rapporteringen av treningsintervensjonene i randomiserte kontrollerte studier (RCT-studier) som sammenligner trening med alle andre intervensjoner for personer med SASS. Vurderingene vil bli gjort med utgangspunkt i de to sjekklistene CERT og TIDieR. Vi vil også vurdere om det er noen sammenheng mellom resultatene for de to sjekklistene, samt mellom resultatene for sjekklistene og variablene publiseringsår og JIF.
Materiale og metode
Søket
Det ble utarbeidet et søk for å finne frem til flere aktuelle systematiske oversikter som kunne gi gode primærstudier. For å avgrense søkeprosessen og datautvelgelsen ble søket kun gjort i Cochrane Library (9). Søket inneholdt ulike ord for populasjonen «subacromialt smertesyndrom» og intervensjonen «trening». I tillegg ble «MeSH-ord», «fritekst-ord», «wildcards», samt de boolske operatorene AND og OR benyttet i søket (10).
Seleksjonskriterier
Populasjonen som ble inkludert var personer diagnostisert med SASS, mens deltakere med fulltykkelsesrupturer ble ekskludert. Andre inklusjonskriterier var at studien inneholdt en form for treningsintervensjon utført som eneste intervensjon, eller i kombinasjon med rådgivning. Når det gjaldt sammenligningsintervensjon ble alle andre typer behandlinger inkludert. Eksklusjonskriterier var studier som sammenlignet ulike treningsintervensjoner (utført som eneste intervensjon) med hverandre, eller som sammenlignet trening med en kontrollgruppe. Studier ble likevel inkludert dersom det ble gitt ulike typer tilleggsbehandlinger på likt grunnlag i alle intervensjonene i den aktuelle studien, men ble ekskludert dersom det viste seg at de hadde fått for eksempel kortisoninjeksjoner som en fast behandling i kombinasjon med treningsprogrammet. Det var også et inklusjonskriterium at studiene var designet som en RCT-studie, samt at studien var skrevet på enten skandinavisk eller engelsk språk.
Studieutvalg
Studieutvelgelsen ble gjort av en person i to omganger, med ca. 4 ukers mellomrom. De systematiske oversiktenes titler og sammendrag ble vurdert for inklusjon ut fra seleksjonskriteriene. Deretter ble alle de inkluderte systematiske oversiktenes primærstudier lastet opp i Endnote for en ny gjennomgang. Først ble duplikater tatt bort, deretter ble alle primærstudienes titler og sammendrag lest gjennom og vurdert opp mot seleksjonskriteriene. For å ikke miste relevante artikler ble studiene inkludert dersom det oppsto usikkerhet angående inklusjon. Videre ble alle de inkluderte referansene lest i fulltekst, og igjen vurdert opp mot seleksjonskriteriene. De gjenværende referansene ble inkludert i studien.
Datainnsamling
Til dataekstraksjonen ble de inkluderte artiklene benyttet, i tillegg til eventuell(e) tilleggsmateriale(r) referert til i artikkelen. I forkant av datainnsamlingen ble det utformet en tabell for å samle studiekarakteristikk (tabell 1), samt to ulike skjemaer for dataekstraksjon ut fra de to sjekklistene CERT og TIDieR (4, 5). Dataekstraksjonen til tabell 1 ble gjort av kun den ene forfatteren, mens dataekstraksjonen til de to sjekklistene ble gjennomført individuelt av to personer. For hver av de inkluderte studiene ble det fylt ut en sjekkliste for både CERT og TIDieR. For å standardisere informasjonen som ble hentet ut fra hver av de inkluderte studiene ble det benyttet to artikler som beskrev hvordan hver av de to sjekklistene skulle benyttes ved rapportering av forskning (4, 5). Med utgangspunkt i retningslinjene til disse to artiklene ble det utarbeidet egne «veiledere» for dataekstraksjon for både CERT og TIDieR, som inneholdt veiledende kriterier for hvordan poenggivningen skulle gjøres. Ved eventuelle uenigheter i vurderingene skulle disse diskuteres og forsøkes løses dem imellom. Dersom det skulle bli aktuelt var også en tredjeperson tilgjengelig for å løse eventuell uenighet. I forkant av dataekstraksjonen ble det gjort en pilot-test med tre av de inkluderte studiene (9).
Poenggivning
Hvert punkt i sjekklistene ble scoret enten «1» (kriteriet ble oppfylt, indikerte at punktet var tydelig rapportert) eller «0» (kriteriet ble ikke oppfylt, indikerte at punktet ikke var tydelig rapportert). Poenggivningen var avhengig av informasjonen som ble hentet ut av studien for hvert av spørsmålene. Kriteriet for å få poeng var at punktet var utvetydig og ble beskrevet tydelig nok – og i så stor grad at det er mulig å gjenta det. Hver studie fikk til slutt en samlet poengsum mellom 0-12 for TIDieR, og mellom 0-19 for CERT. Poengsummen 0 indikerte at ingen punkter var tydelig beskrevet, og en score på 12 eller 19 indikerte at alle punktene i henholdsvis TIDieR/CERT var tydelig beskrevet.
Etter at begge forskerne hadde gjennomført dataekstraksjonen ble resultatene diskutert. Ulike vurderinger ble drøftet mellom forfatterne, før de kom frem til et samlet resultat. Deretter ble det laget en felles tabell med resultatene for vurderinger av alle studiene ut fra CERT og TIDieR (henholdsvis tabell 2 og 3).
Kvalitetsvurdering
Kvalitetsvurderinger gjort av forfatterne av de systematiske oversiktene ble benyttet i denne studien. Vurderingen av de inkluderte studiene var basert på Cochrane Risk of Bias Tool, hvor åtte ulike punkter for mulige systematiske feil ble vurdert kritisk (11). I tilfeller hvor flere av de systematiske oversiktene hadde inkludert samme studie ble kvalitetsvurderingen fra den senest publiserte systematiske oversikten benyttet. Det ble laget en figur for risk of bias ved bruk av dataprogrammet RevMan 5.3. (12).
Analyser
Deskriptive data
Resultatene fra vurderingene ved bruk av sjekklistene ble benyttet til å beregne median og interkvartilbredde (9).
Interrater-reliabilitet
Enigheten mellom forskerne som vurderte artiklene ble beregnet både med prosent enighet og Cohen's kappa for hver av punktene i CERT og TIDieR (9, 13). Det ble også beregnet konfidensintervall tilhørende hver kappakoeffisient (14). Kappa-verdiene rangeres fra -1 til 1, hvor 1 indikerer perfekt enighet, 0 indikerer fullstendig tilfeldig enighet, og -1 indikerer perfekt uenighet (13). Statistisk signifikans ble satt til et alfa-nivå på 0,05 (9).
Korrelasjon mellom sjekklistene, publiseringsår og JIF
Resultatene fra vurderingene ved bruk av sjekklistene ble også benyttet til å beregne styrke og retning på forhold mellom variablene; publiseringsår for artikkelen og tidsskriftets innflytelse vurdert ved bruk av JIF (10), hvor de seneste publiserte JIF-verdiene knyttet til hver av artiklene ble hentet fra tidsskriftenes hjemmesider. Det ble også beregnet sammenheng mellom resultatene for de to sjekklistene CERT og TIDieR. Sammenhengene ble beregnet ved Spearman's korrelasjon.
Korrelasjonen ble tolket slik; ±0,10=svak til ikke-eksisterende, ±0,30=moderat, ±0,50=betydelig (15). Statistisk signifikans ble satt til et alfa-nivå på 0,05 (9). Alle analyser ble utført med IBM SPSS Statistics for Macintosh, versjon 26.0.
Etikk
Da studien er basert på tidligere gjennomførte studier var den ikke søkepliktig for hverken Regionale komiteer for medisinsk og helsefaglig forskningsetikk, eller Norsk senter for forskningsdata.
Resultat
Studieutvelgelse
Det ble gjort et søk i Cochrane Library 12.12.19 med 77 treff på systematiske oversikter. Etter gjennomgang av studienes titler og sammendrag ble det inkludert tre systematiske oversikter som til sammen inneholdt 115 primærstudier (16-18). Etter en ny gjennomgang av disse studienes titler og sammendrag ble 29 studier inkludert til en videre vurdering i fulltekst. Her ble 17 studier ekskludert; en hadde inkludert pasienter med fulltykkelsesruptur, en var skrevet på tysk, to sammenlignet trening med en annen type trening, og 13 hadde gjort treningsprogrammet i kombinasjon med en eller flere behandlingsteknikker. Etter disse prosessene var gjennomgått ble tolv RCT-studier inkludert i studien.
Studiekarakteristikk
Studiene ble utført i åtte land. Antall deltakere i de ulike studiene varierte fra 20 til 193, og det var til sammen 954 deltakere. Studiene hadde et samlet aldersgjennomsnitt på 49 år. Treningsintervensjoner ble sammenlignet med intervensjoner som inneholdt blant annet manuellterapi, kirurgi, mobilisering med bevegelse, kinesiotaping, laserbehandling og ultralyd. Inklusjons- og eksklusjonskriteriene for de tolv inkluderte studiene var sammenlignbare. Alle studiene hadde deltakere som var over 18 år, og ekskluderte deltakere med skuldertilstander som eksempelvis fraktur og adhesiv kapsulitt. Rotatorcuff-ruptur og var rapportert som eksklusjonskriterium for sju av tolv studier (19-25). De resterende fem studiene hadde ikke nevnt noe angående ruptur i sine seleksjonskriterier, men tre av disse studiene rapporterte skuldertraume som eksklusjonskriterium (26-28).
Kvalitetsvurdering
En samlet vurdering av total risiko for systematiske skjevheter for hver av studiene viser at en studie har lav risiko (25), en annen studie har noe risiko (21), og de ti resterende studiene har høy risiko for systematiske feil (figur 1) (11).
Resultater for vurderinger ved bruk av CERT
Samlet poengsum for CERT varierte mellom 1-14 poeng (av 19). Resultatene viste en median score på 6 poeng, med interkvartilbredde på 4,25. Kun to av studiene fikk en score på over 50%, der begge scoret 14 poeng hver (19, 29). De gjenværende 83% (10/12) av studiene scoret alle under 50%.
Bare sju punkter i CERT var tydelig beskrevet av minst 50% av studiene. Det gjaldt punktene; 1 (treningsutstyr, åtte studier), 7b (hvordan progrediere, seks studier), 9 (hjemmeprogram-komponent, ti studier), 10 (ikke-treningskomponent, seks studier), 12 (setting, seks studier), 14a (tilpasning eller generelle øvelser, sju studier), 14b (hvordan tilpasse, seks studier). Tre av punktene var særlig dårlig beskrevet; 6 (motivasjonsstrategi, en studie), 15 (utgangsnivå, ingen studier), 16b (rapportering av etterlevelse, en studie).
Resultater for vurderinger ved bruk av TIDieR
Samlet poengsum for TIDieR varierte mellom 1-9 poeng (av 12). Sjekklisten hadde en median score på 4 poeng, med interkvartilbredde 2,25. Kun tre av studiene fikk en score over 50% (19, 24, 29). De resterende 75% (9/12) av studiene scoret alle under 50%.
Bare fem punkter i TIDieR var tydelig beskrevet av minst 50% av studiene, og inkluderte punktene; 1 (navn, åtte studier), 2 (mål eller teori, ni studier), 3 (materiale benyttet, sju studier), 7 (setting, seks studier), og 9 (tilpasning med beskrivelser, sju studier). To av punktene var særlig dårlig beskrevet; 10 (modifikasjoner, ingen studier), og 11 (strategier og måling av etterlevelse, en studie).
Interrater-reliabilitet
Beregningene for Cohen's kappa for CERT viste at enigheten var betydelig for tre punkter, og ett punkt hadde nesten perfekt til perfekt enighet. For prosent enighet var 11/19 punkter over 75%. Enigheten for TIDieR var noe bedre, hvor to punkter hadde betydelig enighet, og tre punkter hadde nesten perfekt til perfekt enighet. For prosent enighet var enigheten her over 75% for 10/12 punkter.
I CERT var det punkt 2 (instruktør(er)s kvalifikasjoner), punkt 15 (utgangsnivå), samt punkt 16b (rapportering av etterlevelse) som hadde dårligst enighet og ble vurdert til «ingen». For TIDieR var det punkt 19 (modifikasjoner) som hadde dårligst enighet og ble vurdert til «perfekt uenig». Best enighet hadde punkt 11 (uønskede hendelser) i CERT, og for TIDieR var det best enighet for punkt 3 (materiale benyttet), 5 (instruktør(er)s kvalifikasjoner), og 8 (detaljer om intervensjonen), som alle fikk nesten perfekt til perfekt enighet. Forskerne kom til enighet for alle punktene i sjekklistene uten behov for hjelp fra en tredjeperson. Ulike vurderinger skyldtes blant annet årsaker som; den ene forskeren hadde en strengere oppfatning av veilederne til sjekklistene enn den andre, forskerfeil hvor det enten var tastet feil eller at forskeren ikke hadde fått med seg all informasjonen fra studien.
Sammenhenger
Det var ikke statistisk signifikant sammenheng mellom noen av sjekklistene og JIF eller publiseringsår: Mellom CERT og publiseringsår var r=0,26 (p=0,42), og mellom TIDieR og publiseringsår var r=0,14 (p=0,68). Mellom CERT og JIF var r=0,32 (p=0,31), og mellom TIDieR og JIF var r=0,11 (p=0,74). For korrelasjonen mellom CERT og TIDieR var r=0,85 (p=0,001), og dette funnet var dermed statistisk signifikant og indikerte en betydelig sammenheng.
Diskusjon
Resultatene fra vurderingene av fullstendigheten av rapporteringen av treningsintervensjoner som behandling for SASS viste at studiene hadde mangelfulle beskrivelser for flertallet av punktene i sjekklistene CERT og TIDieR. Ingen av studiene rapporterte treningsprogrammet detaljert nok til at andre skal kunne gjennomføre det på nøyaktig samme måte. Funnene indikerer dermed at det eksisterer en barriere for implementering av forskning på trening som behandling for SASS, til klinisk praksis.
Sammenligning med andre studier
Resultatene for fullstendighet av rapportering av treningsintervensjoner for SASS er sammenlignbare med lignende studier som har vurdert treningsintervensjoner ved bruk av både CERT og TIDieR. Det gjelder blant annet for en studie som har sett på hypertensjon ved bruk av CERT og TIDieR (7), en annen studie som hadde sett på rotatorcuff-syndrom ved bruk av CERT (8), og en tredje studie som hadde sett på patellofemoralt smertesyndrom ved bruk av blant annet sjekklisten TIDieR (6). På bakgrunn av dette kan det tenkes at resultatene er representative for et utbredt problem ved rapportering av treningsintervensjoner innen helseforskning.
Til tross for at andre studier hadde sammenlignbare resultater for fullstendighet av rapportering, viste resultatene at vurderingen av de enkelte punktene i sjekklistene var noe ulike mellom studiene. Eksempelvis hadde Major med kollegaer (8) undersøkt samme pasientgruppe som denne studien, kun ved bruk av CERT. I deres studie hadde de vurdert ikke-treningskomponent (pkt. 10) som det mest rapporterte punktet, noe som i denne studien var på delt fjerdeplass med fire andre punkter. Deres minst rapporterte punkter var strategier og måling av etterlevelse (pkt. 16a) og rapporterte målinger av etterlevelse (pkt. 16b), som delvis stemte overens med denne studien (tabell 2). Forfatterne i studien til Major med kollegaer (8) hadde inkludert fem av de samme studiene benyttet i denne studien (20, 21, 23, 26, 29). En sammenligning av vurderingene for disse studiene viste at de hadde fått tilnærmet lik samlet poengsum, men at det var ulike vurderinger for 4 punkter for fire studier (21, 23, 26, 29) og for 5 punkter for én studie (20). Mulige årsaker til ulike vurderinger for de samme studiene kan være at forskerne hadde ulike tolkninger av hvordan sjekklistene skulle benyttes, eller at forskerne var mer eller mindre strenge ved vurderingene.
Interrater-reliabilitet
Resultatene for interrarater-reliabilitet beregnet med prosent enighet og Cohen's kappa viste generelt moderat enighet for både CERT og TIDieR. TIDieR viste seg å ha noe bedre interrater-reliabilitet enn CERT, noe som kan tenkes å være påvirket av at CERT ble diskutert før TIDieR, samt at CERT hadde flere punkter til vurdering enn TIDieR. Reliabiliteten kan også være påvirket av ulike tolkninger for bruken av veilederne for de to sjekklistene, da punktene i sjekklistene hadde rom for tolkning (4, 5). Resultatene for interrater-reliabiliteten var noe lavere sammenlignet med andre studier som har vurdert enigheten mellom forskerne (8, 30). Funnene understreker viktigheten av at forskerne er grundig samkjørte i forkant av dataekstraksjonen, samt at det kan være utfordrende å benytte sjekklistene til å vurdere publiserte studier grunnet mangelfulle kriterier.
Sammenhenger
For å belyse funnene valgte vi å gjennomføre korrelasjonsanalyser for å se om JIF og publiseringsår hadde noen sammenheng med hvordan intervensjonene ble rapportert. Her fant vi ingen statistisk signifikante sammenhenger, men det er usikkerhet rundt resultatene da det kun ble inkludert tolv studier. Vi synes likevel det er verdt å legge vekt på sammenhengen mellom JIF og CERT (r=0,32, p=0,31), da korrelasjonskoeffisienten tilsier at det kan være en assosiasjon mellom disse variablene. Funnet kan tolkes slik at intervensjoner rapporteres grundigere i tidsskrifter med høy JIF. Dette kan tenkes å være påvirket av at fremtredende tidsskrifter har bedre kvalitetssikring og strengere fagfelleprosesser. Det kreves imidlertid studier med høyere deltakerantall for å bekrefte dette. Videre fant vi betydelig korrelasjon mellom CERT og TIDieR, og resultatet var statistisk signifikant på 0,001-nivå. Det kan tyde på at det er nok å bruke kun én av sjekklistene, og CERT fremstår som et mer relevant valg for fysioterapi-studier hvor trening ofte er en av intervensjonene.
To lignende studier har undersøkt sammenhenger mellom fullstendighet av rapportering av sjekklistene CERT og TIDieR, og variablene publiseringsår og JIF (6, 7). Kun Hacke med kollegaer (7) fant statistisk signifikant sammenheng for en av korrelasjonsanalysene, TIDieR og publiseringsår (r =0,549, p=0,007).
Svakheter ved studien
I denne kritiske gjennomgangen ble kun tolv studier inkludert. Dette medfører begrenset statistisk styrke for å kunne tolke sammenhengene med sikkerhet. Ved et bredere søk, utover Cochrane Library, ville det antakeligvis ha blitt inkludert flere studier, som kunne gitt sikrere resultater. Likevel er inklusjon i systematiske oversikter fra Cochrane et kvalitetsstempel i seg selv, da disse oversiktene blir laget med strenge kriterier og oppdateres jevnlig (9). Videre er det en svakhet at forfatterne ikke fikk opplæring i bruken av de to sjekklistene, og at de ikke diskuterte bruken av sjekklistene før de gikk i gang med pilot-testen, noe som kunne styrket interrater-reliabiliteten. Hensikten med pilot-testen var imidlertid at forskerne skulle samkjøre seg, og da forskerne drøftet bruken av sjekklistene før endelig poenggiving har dette sannsynligvis liten betydning for de endelige resultatene.
Implikasjoner for forskning og klinisk praksis
Forbedret rapportering av treningsintervensjoner med fullstendige og presise beskrivelser av hva som har blitt gjort vil potensielt kunne bedre overføringen av forskning til klinisk praksis ved at det blir lettere å vite hva som har blitt gjort i studiene. Det kan også potensielt sett føre til større fremgang i forskningen ved at funnene i større grad kan benyttes av andre. For å bidra til forbedret rapportering av studier kan det være fordelaktig om tidsskrifter krever bruk av standardiserte rapporteringsverktøy for å publisere forskning. Tidsskriftene burde også muliggjøre publisering av tilleggsinformasjon i vedlegg, eksempelvis med mulighet til å legge ved linker til nettsider som inneholder treningsprogrammer eller filmer.
Konklusjon
Resultatene viste at rapporteringen av treningsintervensjoner for personer med SASS er svært mangelfull, og ingen av studiene kan replikeres i fullstendig grad. Det var ingen statistisk signifikante sammenhenger mellom rapporteringsgrad, og publiseringsår og JIF. Sammenhengen mellom CERT og TIDieR var derimot statistisk signifikant og betydelig. Ved fremtidig forskning på treningsintervensjoner anbefales bruk av rapporterende sjekklister, og CERT virker å være tilstrekkelig.
Referanser
1. Vandvik PO, Lähdeoja T, Ardern C, et al. Subacromial decompression surgery for adults with shoulder pain: a clinical practice guideline. BMJ. 2019;364. https://doi.org/10.1136/bmj.l294
2. Cools AM, Michener LA. Shoulder pain: can one label satisfy everyone and everything? British Journal of Sports Medicine. 2017;51:416-7. https://doi.org/10.1136/bjsports-2016-096772
3. Lewis J, McCreesh K, Roy J-S, et al. Rotator Cuff Tendinopathy: Navigating the Diagnosis-Management Conundrum. The Journal of Orthopaedic and Sports Physical Therapy. 2015;45(11):923-37. https://doi.org/10.2519/jospt.2015.5941
4. Hoffmann TC, Glasziou PP, Boutron I, et al. Better reporting of interventions: template for intervention description and replication (TIDieR) checklist and guide. BMJ: British Medical Journal. 2014;348. https://doi.org/10.1136/bmj.g1687
5. Slade SC, Dionne CE, Underwood M, et al. Consensus on Exercise Reporting Template (CERT): Explanation and Elaboration Statement. 2016;50:1428-37. https://doi.org/10.1136/bjsports-2016-096651
6. Holden S, Rathleff MS, Jensen MB, et al. How can we implement exercise therapy for patellofemoral pain if we don’t know what was prescribed? A systematic review. British Journal of Sports Medicine. 2018;52:385. https://doi.org/10.1136/bjsports-2017-097547
7. Hacke C, Nunan D, Weisser B. Do Exercise Trials for Hypertension Adequately Report Interventions? A Reporting Quality Study. International Journal of Sports Medicine. 2018;39(12):902-8. https://doi.org/10.1055/a-0649-1040
8. Major DH, Røe Y, Grotle M, et al. Content reporting of exercise interventions in rotator cuff disease trials: results from application of the Consensus on Exercise Reporting Template (CERT). BMJ Open Sport & Exercise Medicine. 2019;5. https://doi.org/10.1136/bmjsem-2019-000656
9. Polit DF, Beck CT. NURSING RESEARCH: Generating and Assessing Evidence for Nursing Practice. 10 ed. Philadelphia: Wolters Kluwer; 2017 cop. 2017. XIV, 784 s. p.
10. Jamtvedt G, Hagen KB, Bjørndal A. KUNNSKAPSBASERT FYSIOTERAPI: Metoder og arbeidsmåter. 2 ed. Oslo: Gyldendal akademisk; 2015.
11. Higgins J, Savović J, Page MJ, et al. Chapter 8: Assessing risk of bias in a randomized trial. 2019 13.05.20. In: Cochrane Handbook for Systematic Reviews of Interventions [Internet]. Cochrane. Available from: https://training.cochrane.org/handbook/current/chapter-08.
12. Review Manager (RevMan) [Computer Program]. 5.3. ed. Copenhagen: The Nordic Cochrane Centre, The Cochrane Collaboration, 2014.
13. Hallgren K. Computing Inter-Rater Reliability for Observational Data: An Overview and Tutorial. Tutorials in quantitative methods for psychology. 2012;8(1):23-34. https://doi.org/10.20982/tqmp.08.1.p023
16. Karjalainen TV, Jain NB, Page CM, et al. Subacromial decompression surgery for rotator cuff disease. Cochrane Database Of Systematic Reviews. 2019;1. https://doi.org/10.1002/14651858.CD005619.pub3
17. Page M, Green S, McBain B, et al. Manual therapy and exercise for rotator cuff disease. The Cochrane database of systematic reviews 2016. 2016(6). https://doi.org/10.1002/14651858.CD012224
18. Page M, Green S, Mrocki M, et al. Electrotherapy modalities for rotator cuff disease. The Cochrane database of systematic reviews 2016. 2016(6). https://doi.org/10.1002/14651858.CD012225
19. Bang MD, Deyle GD. Comparison of Supervised Exercise With and Without Manual Physical Therapy for Patients With Shoulder Impingement Syndrome. The Journal of Orthopaedic and Sports Physical Therapy. 2000;30(3):126-37. https://doi.org/10.2519/jospt.2000.30.3.126
20. Brox JI, Staff PH, Ljunggren AE, et al. Arthroscopic surgery compared with supervised exercises in patients with rotator cuff disease (stage II impingement syndrome). BMJ. 1993;307(6909):899‐903. https://doi.org/10.1136/bmj.307.6909.899
21. Djordjevic OC, Vukicevic D, Katunac L, et al. Mobilization With Movement and Kinesiotaping Compared With a Supervised Exercise Program for Painful Shoulder: Results of a Clinical Trial. Journal of manipulative and physiological therapeutics. 2012;35(6):454‐63. https://doi.org/10.1016/j.jmpt.2012.07.006
22. Farfaras S, Sernert N, Hallström E, et al. Comparison of open acromioplasty, arthroscopic acromioplasty and physiotherapy in patients with subacromial impingement syndrome: a prospective randomised study. Knee surgery, sports traumatology, arthroscopy. 2016;24(7):2181‐91. https://doi.org/10.1007/s00167-014-3416-4
23. Giombini A, Di Cesare A, Safran MR, et al. Short-term Effectiveness of Hyperthermia for Supraspinatus Tendinopathy in Athletes: A Short-term Randomized Controlled Study. The American Journal of Sports Medicine. 2006;34(8):1247-53. https://doi.org/10.1177/0363546506287827
24. Ketola S, Lehtinen J, Arnala I, et al. Does arthroscopic acromioplasty provide any additional value in the treatment of shoulder impingement syndrome?: A TWO-YEAR RANDOMISED CONTROLLED TRIAL. Journal of bone and joint surgery British volume. 2009;91(10):1326‐34. https://doi.org/10.1302/0301-620X.91B10.22094
25. Paavola M, Malmivaara A, Taimela S, et al. Subacromial decompression versus diagnostic arthroscopy for shoulder impingement: randomised, placebo surgery controlled clinical trial. BMJ. 2018;362. https://doi.org/10.1136/bmj.k2860
26. Ginn KA, Cohen ML. EXERCISE THERAPY FOR SHOULDER PAIN AIMED AT RESTORING NEUROMUSCULAR CONTROL: A RANDOMIZED COMPARATIVE CLINICAL TRIAL. Journal of rehabilitation medicine. 2005;37(2):115‐22. https://doi.org/10.1080/16501970410023443
27. Senbursa G, Baltaci G, Atay A. Comparison of conservative treatment with and without manual physical therapy for patients with shoulder impingement syndrome: a prospective, randomized clinical trial. Knee surgery, sports traumatology, arthroscopy. 2007;15:915‐21. https://doi.org/10.1007/s00167-007-0288-x
28. Yiasemides R, Halaki M, Cathers I, et al. Does Passive Mobilization of Shoulder Region Joints Provide Additional Benefit Over Advice and Exercise Alone for People Who Have Shoulder Pain and Minimal Movement Restriction? A Randomized Controlled Trial. Physical Therapy. 2011;91(2):178‐89. https://doi.org/10.2522/ptj.20100111
29. Littlewood C, Malliaras P, Mawson S, et al. Self-managed loaded exercise versus usual physiotherapy treatment for rotator cuff tendinopathy: a pilot randomised controlled trial. ELSEVIER Physiotherapy. 2014;100(1):54-60. https://doi.org/10.1016/j.physio.2013.06.001
30. Yamato TP, Maher CG, Saragiotto BT, et al. How completely are physiotherapy interventions described in reports of randomised trials? Physiotherapy. 2016;102(2):121-6. https://doi.org/10.1016/j.physio.2016.03.001